> 백엔드 개발 > 파이썬 튜토리얼 > [Python] Chita.ru 사이트에서 뉴스를 수신하기 위한 스크립트

[Python] Chita.ru 사이트에서 뉴스를 수신하기 위한 스크립트

Patricia Arquette
풀어 주다: 2024-11-27 17:34:12
원래의
701명이 탐색했습니다.

[Python] Скрипт для получения новостей с сайта Chita.ru

Python을 사용하여 Chita.ru에서 뉴스 수신

CSDN 플랫폼의 프로젝트에서 구현된 뉴스 구문 분석, 텍스트 분할 통계 분석 및 단어 클라우드 생성을 위한 Python 스크립트에서 주로 영감을 받았습니다. 또한 인공 지능 및 기계 학습 측면과 관련된 복잡한 뉴스 항목을 보다 정확하게 분류하기 위해 스크립트를 직접 작성했습니다. 시도해 보았는데 작업량이 너무 많아 뉴스 포털 Chita.ru의 기존 분류를 사용하는 것이 더 쉬운 것으로 나타났습니다. 언급된 기사의 소스 코드는 읽기 어렵고, 워드 클라우드 등의 추가 라이브러리가 포함되어 있어 크로스 플랫폼으로 만들기가 어려워 스크립트를 직접 작성하기로 결정했습니다.

이 스크립트를 사용하면 Chita.ru 사이트에서 뉴스를 추출하여 Excel에 저장할 수 있습니다.

사용된 라이브러리: 구문 분석을 위한 request, BeautifulSoup 및 Excel 작업을 위한 openpyxl

스크립트를 실행하는 편리한 방법

다음 명령을 사용하여 터미널에서 직접 스크립트를 실행할 수 있습니다.

이 명령은 Python 스크립트를 다운로드하고 실행하여 Chita.ru에서 뉴스를 수신합니다.

python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
로그인 후 복사
로그인 후 복사

Python 스크립트(GitHub에서 사용 가능):

GitHub에서 보기

python -c "$(curl -fsSL https://ghp.ci/https://raw.githubusercontent.com/Excalibra/scripts/main/d-python/get_chita_news.py)"
로그인 후 복사
로그인 후 복사

빅 데이터 분석에 관한 다양한 과학 기사와 함께 사용하면 가장 좋습니다.

  • 나. V. Sokolova, A. V. Kuznetsova - "검색 엔진의 인기 뉴스 쿼리를 기반으로 한 사회적 위험 추출에 대한 연구"(러시아 과학 아카데미 시스템 분석 연구소, 시스템 및 네트워크, Vol. 39, No. 2020년 1월 1일)
  • 디. I. Fedorov - "빅 데이터 맥락에서 소셜 네트워크 VKontakte의 뉴스 서비스 기능 분석"(모스크바 주립 대학교 저널리즘 학부, 2017)
  • 브이. A. 파블로프 - “러시아 온라인 뉴스 읽기 동향: 인기 검색어의 예”(모스크바 주립대학교, 현대 미디어, 2013, No. 9)
  • 나. N. Gusev - “빅데이터 분석의 맥락에서 본 러시아 사회 사상의 사회적 분위기와 구조적 특징”(RSU, RSU Journal, 2013, No. 5)

위 내용은 [Python] Chita.ru 사이트에서 뉴스를 수신하기 위한 스크립트의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:dev.to
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
저자별 최신 기사
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿