CSDN 플랫폼의 프로젝트에서 구현된 뉴스 구문 분석, 텍스트 분할 통계 분석 및 단어 클라우드 생성을 위한 Python 스크립트에서 주로 영감을 받았습니다. 또한 인공 지능 및 기계 학습 측면과 관련된 복잡한 뉴스 항목을 보다 정확하게 분류하기 위해 스크립트를 직접 작성했습니다. 시도해 보았는데 작업량이 너무 많아 뉴스 포털 Chita.ru의 기존 분류를 사용하는 것이 더 쉬운 것으로 나타났습니다. 언급된 기사의 소스 코드는 읽기 어렵고, 워드 클라우드 등의 추가 라이브러리가 포함되어 있어 크로스 플랫폼으로 만들기가 어려워 스크립트를 직접 작성하기로 결정했습니다.
이 스크립트를 사용하면 Chita.ru 사이트에서 뉴스를 추출하여 Excel에 저장할 수 있습니다.
사용된 라이브러리: 구문 분석을 위한 request, BeautifulSoup 및 Excel 작업을 위한 openpyxl
다음 명령을 사용하여 터미널에서 직접 스크립트를 실행할 수 있습니다.
이 명령은 Python 스크립트를 다운로드하고 실행하여 Chita.ru에서 뉴스를 수신합니다.
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
Python 스크립트(GitHub에서 사용 가능):
GitHub에서 보기
python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
- 나. V. Sokolova, A. V. Kuznetsova - "검색 엔진의 인기 뉴스 쿼리를 기반으로 한 사회적 위험 추출에 대한 연구"(러시아 과학 아카데미 시스템 분석 연구소, 시스템 및 네트워크, Vol. 39, No. 2020년 1월 1일)
- 디. I. Fedorov - "빅 데이터 맥락에서 소셜 네트워크 VKontakte의 뉴스 서비스 기능 분석"(모스크바 주립 대학교 저널리즘 학부, 2017)
- 브이. A. 파블로프 - “러시아 온라인 뉴스 읽기 동향: 인기 검색어의 예”(모스크바 주립대학교, 현대 미디어, 2013, No. 9)
- 나. N. Gusev - “빅데이터 분석의 맥락에서 본 러시아 사회 사상의 사회적 분위기와 구조적 특징”(RSU, RSU Journal, 2013, No. 5)
위 내용은 [Python] Chita.ru 사이트에서 뉴스를 수신하기 위한 스크립트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!