java - 데이터 수집 및 분석을 위한 PHP 또는 Python, 더 성숙한 프레임워크는 무엇입니까?
이제 웹사이트의 기사 목록과 목록의 실제 콘텐츠에서 데이터를 자동으로 수집해야 합니다. 각 기사의 ID는 목록에서 얻을 수 있으며, 각 기사는 통합 인터페이스를 통해 수집됩니다(매개변수는 해당 기사를 가져옵니다). 해당 json은 id로 얻을 수 있습니다.) 그 안에는 수집하고 분석해야 할 일부 데이터가 있습니다.
내 요구사항을 충족할 수 있는 성숙한 프레임워크나 휠이 있나요? (멀티스레딩이 필요하며, 컬렉션 수가 많아 연중무휴 안정적으로 실행 가능합니다)
그리고 수집된 컨텐츠(수백만~수천만)를 어떻게 저장하는지 문의드리고 싶습니다. 통계분석이 필요한 데이터 중에 수치적인 데이터가 있는데, mysql을 사용할 수 있나요? 아니면 사용할 수 있는 더 성숙하고 단순한 다른 바퀴가 있습니까?
답글 내용:
이제 웹사이트의 기사 목록과 목록의 실제 콘텐츠에서 데이터를 자동으로 수집해야 합니다. 각 기사의 ID는 목록에서 얻을 수 있으며, 각 기사는 통합 인터페이스를 통해 수집됩니다(매개변수는 해당 기사를 가져옵니다). 해당 json은 id로 얻을 수 있습니다.) 그 안에는 수집하고 분석해야 할 일부 데이터가 있습니다.
내 요구사항을 충족할 수 있는 성숙한 프레임워크나 휠이 있나요? (멀티스레딩이 필요하며, 컬렉션 수가 많아 연중무휴 안정적으로 실행 가능합니다)
그리고 수집된 컨텐츠(수백만~수백만)를 어떻게 저장하는지 묻고 싶습니다. 통계적인 분석이 필요한 데이터 중에 수치적인 데이터가 있는데, mysql을 사용할 수 있나요? 아니면 사용할 수 있는 더 성숙하고 단순한 다른 바퀴가 있습니까?
데이터 분석이라면.
map-reduce는 로그 분석을 합니다
Dpark는 PV 및 UV 분석을 해결할 수 있습니다
Spark도 좋습니다.
데이터 보고서를 생성한 후 Pandas를 사용하여 분석하고 표시할 수 있습니다. .
데이터 수집이라면. 많은 도구가 있습니다.
왜 검색엔진을 만들고 싶다고 생각하시나요? . . 양이 비교적 많습니다. 분산된 콘텐츠를 권장합니다.
MYSQL을 사용하는 것은 실용적이지 않습니다. . .
젊은이여, 이것이 파충류에게 바라는 것이 아닌가?
크롤러 프레임워크: scrapy
데이터베이스 선택: MySQL을 사용하여 귀하의 수준에 맞게 색인을 생성하면 확실히 500년 더 지속될 수 있습니다.
MongoDB를 사용해 볼 수도 있습니다
언어나 환경에 대해서는 언급하지 않으셨는데요. 멀티스레딩의 경우 현재 일반적으로 nodejs와 Python이 사용됩니다. 둘 다 mysql 등을 사용하여 데이터를 저장할 수 있습니다. 수백만, 수천만은 문제가 되지 않습니다.
Python Selenium + PhantomJ를 사용해 본 적이 있나요?
파이썬 언어로 된 이 scrapy 또는

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

Video Face Swap
완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











PHP는 주로 절차 적 프로그래밍이지만 객체 지향 프로그래밍 (OOP)도 지원합니다. Python은 OOP, 기능 및 절차 프로그래밍을 포함한 다양한 패러다임을 지원합니다. PHP는 웹 개발에 적합하며 Python은 데이터 분석 및 기계 학습과 같은 다양한 응용 프로그램에 적합합니다.

PHP는 동적 웹 개발 및 서버 측 응용 프로그램에 사용되는 서버 측 스크립팅 언어입니다. 1.PHP는 편집이 필요하지 않으며 빠른 발전에 적합한 해석 된 언어입니다. 2. PHP 코드는 HTML에 포함되어 웹 페이지를 쉽게 개발할 수 있습니다. 3. PHP는 서버 측 로직을 처리하고 HTML 출력을 생성하며 사용자 상호 작용 및 데이터 처리를 지원합니다. 4. PHP는 데이터베이스와 상호 작용하고 프로세스 양식 제출 및 서버 측 작업을 실행할 수 있습니다.

PHP는 웹 개발 및 빠른 프로토 타이핑에 적합하며 Python은 데이터 과학 및 기계 학습에 적합합니다. 1.PHP는 간단한 구문과 함께 동적 웹 개발에 사용되며 빠른 개발에 적합합니다. 2. Python은 간결한 구문을 가지고 있으며 여러 분야에 적합하며 강력한 라이브러리 생태계가 있습니다.

PHP는 웹 개발 및 컨텐츠 관리 시스템에 적합하며 Python은 데이터 과학, 기계 학습 및 자동화 스크립트에 적합합니다. 1.PHP는 빠르고 확장 가능한 웹 사이트 및 응용 프로그램을 구축하는 데 잘 작동하며 WordPress와 같은 CMS에서 일반적으로 사용됩니다. 2. Python은 Numpy 및 Tensorflow와 같은 풍부한 라이브러리를 통해 데이터 과학 및 기계 학습 분야에서 뛰어난 공연을했습니다.

PHP의 핵심 이점에는 학습 용이성, 강력한 웹 개발 지원, 풍부한 라이브러리 및 프레임 워크, 고성능 및 확장 성, 크로스 플랫폼 호환성 및 비용 효율성이 포함됩니다. 1) 배우고 사용하기 쉽고 초보자에게 적합합니다. 2) 웹 서버와 우수한 통합 및 여러 데이터베이스를 지원합니다. 3) Laravel과 같은 강력한 프레임 워크가 있습니다. 4) 최적화를 통해 고성능을 달성 할 수 있습니다. 5) 여러 운영 체제 지원; 6) 개발 비용을 줄이기위한 오픈 소스.

Python은 부드러운 학습 곡선과 간결한 구문으로 초보자에게 더 적합합니다. JavaScript는 가파른 학습 곡선과 유연한 구문으로 프론트 엔드 개발에 적합합니다. 1. Python Syntax는 직관적이며 데이터 과학 및 백엔드 개발에 적합합니다. 2. JavaScript는 유연하며 프론트 엔드 및 서버 측 프로그래밍에서 널리 사용됩니다.

Golang과 C는 각각 공연 경쟁에서 고유 한 장점을 가지고 있습니다. 1) Golang은 높은 동시성과 빠른 발전에 적합하며 2) C는 더 높은 성능과 세밀한 제어를 제공합니다. 선택은 프로젝트 요구 사항 및 팀 기술 스택을 기반으로해야합니다.

PHP는 1994 년에 시작되었으며 Rasmuslerdorf에 의해 개발되었습니다. 원래 웹 사이트 방문자를 추적하는 데 사용되었으며 점차 서버 측 스크립팅 언어로 진화했으며 웹 개발에 널리 사용되었습니다. Python은 1980 년대 후반 Guidovan Rossum에 의해 개발되었으며 1991 년에 처음 출시되었습니다. 코드 가독성과 단순성을 강조하며 과학 컴퓨팅, 데이터 분석 및 기타 분야에 적합합니다.
