讓工作化繁為簡:用Python實現辦公自動化
作 者: 李杰臣 著
出版時間: 2021
內容簡介
本書是一本案例驅動型的Python編程指南,將語法知識和編程思路融入大量的典型案例,帶領讀者一步步學會將Python打造成自動化辦公的利器。全書共10章,可劃分為4個部分。第1部分包括第1章和第2章,主要講解Python編程環境的搭建方法和Python的基礎語法知識。第2部分包括第3~7章,通過大量案例講解如何用Python自動化處理計算機文件、PDF文件和Office文件。第3部分包括第8章和第9章,主要講解如何利用Python編寫爬蟲程序,自動從網頁上爬取數據。第4部分為第10章,主要講解如何利用Python自動發送電子郵件。本書案例典型實用,講解淺顯易懂,適合具備一定的Office軟件操作基礎又想進一步提高工作效率的辦公人員,如從事文秘、行政、人事、營銷、財務等職業的人士閱讀,也可供Python編程初學者參考。
目錄
第1章 Python快速上手1.1??Python編程環境的搭建
1.1.1 安裝與配置Anaconda
1.1.2 安裝與配置PyCharm
1.2??Python的模塊
1.2.1 初識模塊
1.2.2 模塊的安裝
1.3??常見問題和解決辦法
第2章 Python的基礎語法知識
2.1??變量
2.2??數據類型:數字與字符串
2.2.1 數字
2.2.2 字符串
2.2.3 數據類型的查詢
2.2.4 數據類型的轉換
2.3??數據類型:列表、字典、元組與集合
2.3.1 列表
2.3.2 字典
2.3.3 元組和集合
2.4??運算符
2.4.1 算術運算符和字符串運算符
2.4.2 比較運算符
2.4.3 賦值運算符
2.4.4 邏輯運算符
2.5??編碼基本規范
2.5.1 縮進
2.5.2 注釋
2.6 控制語句
2.6.1 if語句
2.6.2 for語句
2.6.3 while語句
2.6.4 控制語句的嵌套
2.7 函數
2.7.1 內置函數
2.7.2 自定義函數
2.8 模塊的導入
2.8.1 import語句導入法
2.8.2 from語句導入法
第3章 自動化整理計算機文件
3.1??文件的自動分類
3.2??文件和文件夾的快速查找
3.3??自動清理重復文件
3.4??批量轉換圖片的格式
3.5??按照日期自動分類圖片
第4章 自動化處理PDF文件
4.1??批量下載PDF文件
4.1.1 使用Selenium模塊爬取多頁內容
4.1.2 使用Selenium模塊批量下載PDF文件
4.2??批量合并PDF文件
4.3??批量拆分PDF文件
4.4??批量加密PDF文件
4.5??批量為PDF文件添加水印
4.5.1 自定義函數創建水印文件
4.5.2 自定義函數添加水印
4.5.3 使用循環為每個PDF文件添加水印
第5章 自動化處理Word文檔
5.1??批量生成Word合同
5.1.1 讀取文件并進行查找和替換
5.1.2 使用循環套用模板生成合同
5.2??將Word文檔批量轉換為PDF文件
5.3??在Word文檔中批量標記關鍵詞
5.4??在Word文檔中批量替換關鍵詞
第6章 自動化處理Excel工作簿
6.1??批量生成產品出貨清單
6.1.1 提取出貨統計表中的數據
6.1.2 使用for語句創建產品出貨清單
6.2??批量替換工作簿的單元格數據
6.3??將多個工作表合并為一個工作表
6.3.1 使用xlwings模塊讀取多個工作表中的數據
6.3.2 新建工作簿存放合并后的數據
6.4??將一個工作表拆分為多個工作簿
6.5??批量拆分列數據
6.6??批量分類匯總數據
第7章 自動化處理PowerPoint演示文稿
7.1??批量提取演示文稿中的文本內容
7.2??將演示文稿批量導出為圖片和PDF文件
7.3??自動讀取圖文素材制作演示文稿
7.4??批量提取演示文稿中的圖片素材
第8章 爬蟲技術基礎
8.1??認識網頁結構
8.1.1 查看網頁的源代碼
8.1.2 初步了解網頁結構
8.1.3 網頁結構的組成
8.1.4 百度新聞頁面結構剖析
8.2??Requests模塊
8.3??正則表達式
8.3.1 正則表達式基礎知識
8.3.2 使用正則表達式提取數據
8.4??Selenium模塊
8.4.1 網頁數據爬取的難點
8.4.2 瀏覽器驅動程序的下載與安裝
8.4.3 使用Selenium模塊獲取網頁真正的源代碼
8.4.4 使用Selenium模塊模擬鼠標和鍵盤操作
第9章 爬蟲實戰演練
9.1??爬取圖書數據—當當網
9.1.1 使用Requests模塊獲取網頁源代碼
9.1.2 編寫正則表達式提取圖書數據
9.1.3 批量爬取多頁數據
9.2??爬取新聞數據—新浪新聞
9.2.1 使用Selenium模塊獲取網頁源代碼
9.2.2 編寫正則表達式提取新聞數據
9.2.3 自定義函數完成多個關鍵詞的批量爬取
9.3??爬取價格數據—農業農村部網站
9.3.1 使用Selenium模塊獲取網頁源代碼
9.3.2 使用pandas模塊獲取網頁中的表格數據
9.3.3 批量爬取多頁數據
9.4??爬取職位數據—前程無憂網
9.4.1 使用Selenium模塊搜索職位
9.4.2 編寫正則表達式提取數據并保存
9.4.3 批量爬取多頁數據
9.5??爬取財務報表—東方財富網
9.5.1 使用Selenium模塊爬取單頁財務報表
9.5.2 使用Selenium模塊爬取多頁財務報表
9.5.3 爬取指定時期和指定種類的財務數據
第10章 自動化處理電子郵件
10.1??自動發送電子郵件
10.1.1 獲取SMTP授權碼
10.1.2 自動發送文本格式的電子郵件
10.1.3 自動發送HTML格式的電子郵件
10.1.4 自動發送帶附件的電子郵件
10.2??批量發送電子郵件
10.3??定時發送電子郵件
10.3.1 自動爬取數據并通過電子郵件發送
10.3.2 利用while True循環實現定時發送電子郵件
10.3.3 利用Schedule模塊實現定時發送電子郵件