主要受到Python腳本的啟發,用於新聞解析、文本切分統計分析和詞雲生成,並在CSDN平台的專案中實現。我還編寫了自己的腳本,以更準確地對與人工智慧和機器學習方面相關的複雜新聞進行分類。我嘗試過,但工作量太大了,結果發現使用新聞入口網站Chita.ru中現有的分類會更容易。鑑於上述文章中的原始程式碼難以閱讀,並且其中包含詞雲等額外庫,很難使其跨平台,所以我決定編寫自己的腳本。
此腳本可讓您從網站 Chita.ru 中提取新聞並將其保存在 Excel 中。
使用的函式庫:requests、BeautifulSoup 用來解析,openpyxl 用於 Excel 工作。
您可以使用以下命令直接從終端機執行腳本。
此命令下載並執行 Python 腳本以接收來自 Chita.ru 的新聞:
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Python 腳本(可在 GitHub 上取得):
在 GitHub 上查看
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- 我。 V. Sokolova,A. V. Kuznetsova - “基於搜尋引擎中熱門新聞查詢提取社會風險的研究”(俄羅斯科學院系統分析研究所,系統與網絡,第39 卷,第1 期) 2020 年1月1 日)
- D. I. Fedorov - “大數據背景下社交網絡 VKontakte 中新聞服務的功能分析”(莫斯科國立大學新聞學院,2017 年)
- V. A. 巴甫洛夫 - “俄羅斯線上新聞閱讀趨勢:流行搜尋查詢範例”(莫斯科國立大學,現代媒體,2013 年,第 9 期)
- 我。 N. Gusev - “大數據分析背景下俄羅斯社會思想的社會氛圍和結構特徵”(RSU,RSU Journal,2013年,第5期)
以上是[Python] 用於從 Chita.ru 網站接收新聞的腳本的詳細內容。更多資訊請關注PHP中文網其他相關文章!