大家好,我是菜鳥哥!今天跟大家分享一個非常實用的Python程式。
許多小夥伴不管在學校還是在工作當中,都會遇到一個問題,就是將PPT中的文字提取出來保存到word當中,這樣可以方便自己的閱讀或是將文字印出來。 但是很多時候,小夥伴們只能將PPT中的文字通過複製貼上的方式,來一張張的提取出來。這樣的操作方式無疑非常的低效,今天菜鳥哥就帶給大家新的方法,利用程式來批量的提取PPT中的文字,並保存到word文檔中,一起來看看吧 。
#例如我有這麼一個PPT的內容,裡面有很多的文字和圖片,其中的文字我是比較有興趣的,尤其是在論文或是一些重要的學術的報告的ppt中,很多的文字都需要提取分析。下面我舉例一個簡單的PPT頁面:
#可以看到,上圖的PPT中包含了一些文字和圖片的內容訊息,但是我只想提取文字,其實這個用Python就可以輕鬆搞定,看一下最後的效果:
#效果還不錯吧,其實非常簡單的,一起看一下怎麼做的。
我們主要是用到的是python-pptx函式庫以及python-docx函式庫。分別用於PPT檔案以及word檔案的處理。用pip3即可直接安裝,整個程式非常短小精悍,這其核心程式碼僅只需要六行,程式如下圖:
##程式碼其實很簡短的,為了讓大家更好的理解這個程序,可以結合下面這張圖來給大家一一解釋。
在程式中,我們一共用了3層迴圈來處理:
1).第一層的for迴圈 用來循環每一頁的投影片頁slide;
2) .第二個循環中判斷投影片中的每一個形狀,然後判斷該頁中是否含有文字框,如果有文字框,則取得文字框,並命名為text_frame。
3).第三個for迴圈則遍歷了文字方塊中的所有段落內容,提取其中的文字儲存到word當中。
當遍歷完整個的PPT檔案後,將所有擷取的文字資訊儲存到本機的word文件當中。 效果如下圖所示:
上圖的PPT檔案當中,包含了四張帶有文字的slide投影片。當執行程式後,其文字的擷取結果如下圖所示。
以上就是菜鳥今天為大家帶來的自動化案例分享,透過短短的幾行程式碼,可以大大的提升大家的工作效率,大家也利用程序,進行快速的提取吧。
以上是提取PPT文字並將其轉移到Word變得輕而易舉,只需要20行Python程式碼!的詳細內容。更多資訊請關注PHP中文網其他相關文章!