웹 프론트엔드 JS 튜토리얼 GitHub에서 AI 기반 JavaScript 저장소를 검색하기 위해 Node.js에서 웹 크롤러 구축

GitHub에서 AI 기반 JavaScript 저장소를 검색하기 위해 Node.js에서 웹 크롤러 구축

Nov 27, 2024 pm 08:30 PM

Building a Web Crawler in Node.js to Discover AI-Powered JavaScript Repos on GitHub

GitHub는 특히 끊임없이 진화하는 인공 지능 세계에서 혁신적인 프로젝트의 보고입니다. 하지만 AI와 JavaScript를 결합한 저장소를 찾기 위해 수많은 저장소를 조사하고 계십니까? 이는 마치 광대한 코드의 바다에서 보석을 찾는 것과 같습니다. 검색을 자동화하고 이름, URL, 설명과 같은 저장소 세부 정보를 추출하는 스크립트인 Node.js 웹 크롤러를 입력하세요.

이 튜토리얼에서는 GitHub를 활용하여 AI 및 JavaScript와 함께 작동하는 저장소를 찾는 크롤러를 구축합니다. 코드를 자세히 살펴보고 보석 채굴을 시작해 보세요.


1부: 프로젝트 설정

Node.js 프로젝트 초기화

프로젝트를 위한 새 디렉토리를 생성하고 npm으로 초기화하는 것으로 시작하세요.

mkdir github-ai-crawler
cd github-ai-crawler
npm init -y

로그인 후 복사
로그인 후 복사

다음으로 필요한 종속성을 설치합니다.

npm install axios cheerio

로그인 후 복사
로그인 후 복사
  • axios : GitHub에 HTTP 요청을 하기 위한 것입니다.
  • cheerio : jQuery와 유사하게 HTML을 구문 분석하고 조작하는 데 사용됩니다.

2부: GitHub 검색 이해하기

GitHub는 URL 쿼리를 통해 액세스할 수 있는 강력한 검색 기능을 제공합니다. 예를 들어 다음 쿼리를 사용하여 AI와 관련된 JavaScript 저장소를 검색할 수 있습니다.

https://github.com/search?q=ai+language:javascript&type=repositories

로그인 후 복사
로그인 후 복사

Google 크롤러는 이 검색을 모방하여 결과를 분석하고 관련 세부정보를 추출합니다.


3부: 크롤러 스크립트 작성

프로젝트 디렉토리에crawler.js라는 파일을 만들고 코딩을 시작하세요.

1단계: 종속성 가져오기

const axios = require('axios');
const cheerio = require('cheerio');

로그인 후 복사

우리는 GitHub의 검색 결과를 가져오는 데 axios를 사용하고 HTML을 구문 분석하는 데 Cherio를 사용하고 있습니다.


2단계: 검색 URL 정의

const SEARCH_URL = 'https://github.com/search?q=ai+language:javascript&type=repositories';

로그인 후 복사

이 URL은 JavaScript로 작성된 AI 관련 저장소를 대상으로 합니다.


2220 무료 리소스 개발자를 위한!! ❤️ ?? (매일 업데이트)

1400개의 무료 HTML 템플릿

351개의 무료 뉴스 기사

67가지 무료 AI 프롬프트

315개의 무료 코드 라이브러리

Node, Nuxt, Vue 등을 위한 52개의 무료 코드 조각 및 상용구!

25개의 무료 오픈 소스 아이콘 라이브러리

dailysandbox.pro를 방문하여 보물 창고에 무료로 액세스하세요!


3단계: HTML 가져오기 및 구문 분석

const fetchRepositories = async () => {
    try {
        // Fetch the search results page
        const { data } = await axios.get(SEARCH_URL);
        const $ = cheerio.load(data); // Load the HTML into cheerio

        // Extract repository details
        const repositories = [];
        $('.repo-list-item').each((_, element) => {
            const repoName = $(element).find('a').text().trim();
            const repoUrl = `https://github.com${$(element).find('a').attr('href')}`;
            const repoDescription = $(element).find('.mb-1').text().trim();

            repositories.push({
                name: repoName,
                url: repoUrl,
                description: repoDescription,
            });
        });

        return repositories;
    } catch (error) {
        console.error('Error fetching repositories:', error.message);
        return [];
    }
};

로그인 후 복사

현재 상황은 다음과 같습니다.

  • HTML 가져오기 : axios.get 메소드는 검색 결과 페이지를 가져옵니다.
  • Cheerio로 구문 분석 : Cheerio를 사용하여 DOM을 탐색하고 .repo-list-item과 같은 클래스가 있는 요소를 타겟팅합니다.
  • 세부정보 추출 : 각 저장소에 대해 이름, URL 및 설명을 추출합니다.

4단계: 결과 표시

마지막으로 함수를 호출하고 결과를 기록합니다.

mkdir github-ai-crawler
cd github-ai-crawler
npm init -y

로그인 후 복사
로그인 후 복사

4부: 크롤러 실행

스크립트를 저장하고 Node.js로 실행하세요.

npm install axios cheerio

로그인 후 복사
로그인 후 복사

AI 관련 JavaScript 저장소 목록이 각각 이름, URL 및 설명과 함께 터미널에 깔끔하게 표시됩니다.


5부: 크롤러 개선

더 자세히 알고 싶으십니까? 몇 가지 아이디어는 다음과 같습니다.

  1. 페이지 매김 : &p=2, &p=3 등으로 URL을 수정하여 검색 결과의 여러 페이지를 가져오는 지원을 추가합니다.
  2. 필터링: 인기 프로젝트의 우선순위를 지정하기 위해 저장소를 별표 또는 분기별로 필터링합니다.
  3. 데이터 저장 : 추가 분석을 위해 결과를 파일이나 데이터베이스에 저장합니다.

JSON 파일로 저장하는 예:

https://github.com/search?q=ai+language:javascript&type=repositories

로그인 후 복사
로그인 후 복사

자동화의 아름다움

이 크롤러를 사용하면 GitHub에서 관련 저장소를 찾는 지루한 작업을 자동화했습니다. 더 이상 수동으로 탐색하거나 끝없이 클릭할 필요가 없습니다. 스크립트가 어려운 작업을 수행하고 몇 초 만에 결과를 표시합니다.

웹 개발에 대한 더 많은 팁을 보려면 DailySandbox를 확인하고 무료 뉴스레터에 가입하여 앞서 나가세요!

위 내용은 GitHub에서 AI 기반 JavaScript 저장소를 검색하기 위해 Node.js에서 웹 크롤러 구축의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

인기 기사

<gum> : Bubble Gum Simulator Infinity- 로얄 키를 얻고 사용하는 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Nordhold : Fusion System, 설명
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora : 마녀 트리의 속삭임 - Grappling Hook 잠금 해제 방법
3 몇 주 전 By 尊渡假赌尊渡假赌尊渡假赌

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

JavaScript 엔진 : 구현 비교 JavaScript 엔진 : 구현 비교 Apr 13, 2025 am 12:05 AM

각각의 엔진의 구현 원리 및 최적화 전략이 다르기 때문에 JavaScript 엔진은 JavaScript 코드를 구문 분석하고 실행할 때 다른 영향을 미칩니다. 1. 어휘 분석 : 소스 코드를 어휘 단위로 변환합니다. 2. 문법 분석 : 추상 구문 트리를 생성합니다. 3. 최적화 및 컴파일 : JIT 컴파일러를 통해 기계 코드를 생성합니다. 4. 실행 : 기계 코드를 실행하십시오. V8 엔진은 즉각적인 컴파일 및 숨겨진 클래스를 통해 최적화하여 Spidermonkey는 유형 추론 시스템을 사용하여 동일한 코드에서 성능이 다른 성능을 제공합니다.

Python vs. JavaScript : 학습 곡선 및 사용 편의성 Python vs. JavaScript : 학습 곡선 및 사용 편의성 Apr 16, 2025 am 12:12 AM

Python은 부드러운 학습 곡선과 간결한 구문으로 초보자에게 더 적합합니다. JavaScript는 가파른 학습 곡선과 유연한 구문으로 프론트 엔드 개발에 적합합니다. 1. Python Syntax는 직관적이며 데이터 과학 및 백엔드 개발에 적합합니다. 2. JavaScript는 유연하며 프론트 엔드 및 서버 측 프로그래밍에서 널리 사용됩니다.

C/C에서 JavaScript까지 : 모든 것이 어떻게 작동하는지 C/C에서 JavaScript까지 : 모든 것이 어떻게 작동하는지 Apr 14, 2025 am 12:05 AM

C/C에서 JavaScript로 전환하려면 동적 타이핑, 쓰레기 수집 및 비동기 프로그래밍으로 적응해야합니다. 1) C/C는 수동 메모리 관리가 필요한 정적으로 입력 한 언어이며 JavaScript는 동적으로 입력하고 쓰레기 수집이 자동으로 처리됩니다. 2) C/C를 기계 코드로 컴파일 해야하는 반면 JavaScript는 해석 된 언어입니다. 3) JavaScript는 폐쇄, 프로토 타입 체인 및 약속과 같은 개념을 소개하여 유연성과 비동기 프로그래밍 기능을 향상시킵니다.

JavaScript 및 웹 : 핵심 기능 및 사용 사례 JavaScript 및 웹 : 핵심 기능 및 사용 사례 Apr 18, 2025 am 12:19 AM

웹 개발에서 JavaScript의 주요 용도에는 클라이언트 상호 작용, 양식 검증 및 비동기 통신이 포함됩니다. 1) DOM 운영을 통한 동적 컨텐츠 업데이트 및 사용자 상호 작용; 2) 사용자가 사용자 경험을 향상시키기 위해 데이터를 제출하기 전에 클라이언트 확인이 수행됩니다. 3) 서버와의 진실한 통신은 Ajax 기술을 통해 달성됩니다.

자바 스크립트 행동 : 실제 예제 및 프로젝트 자바 스크립트 행동 : 실제 예제 및 프로젝트 Apr 19, 2025 am 12:13 AM

실제 세계에서 JavaScript의 응용 프로그램에는 프론트 엔드 및 백엔드 개발이 포함됩니다. 1) DOM 운영 및 이벤트 처리와 관련된 TODO 목록 응용 프로그램을 구축하여 프론트 엔드 애플리케이션을 표시합니다. 2) Node.js를 통해 RESTFULAPI를 구축하고 Express를 통해 백엔드 응용 프로그램을 시연하십시오.

JavaScript 엔진 이해 : 구현 세부 사항 JavaScript 엔진 이해 : 구현 세부 사항 Apr 17, 2025 am 12:05 AM

보다 효율적인 코드를 작성하고 성능 병목 현상 및 최적화 전략을 이해하는 데 도움이되기 때문에 JavaScript 엔진이 내부적으로 작동하는 방식을 이해하는 것은 개발자에게 중요합니다. 1) 엔진의 워크 플로에는 구문 분석, 컴파일 및 실행; 2) 실행 프로세스 중에 엔진은 인라인 캐시 및 숨겨진 클래스와 같은 동적 최적화를 수행합니다. 3) 모범 사례에는 글로벌 변수를 피하고 루프 최적화, Const 및 Lets 사용 및 과도한 폐쇄 사용을 피하는 것이 포함됩니다.

Python vs. JavaScript : 커뮤니티, 라이브러리 및 리소스 Python vs. JavaScript : 커뮤니티, 라이브러리 및 리소스 Apr 15, 2025 am 12:16 AM

Python과 JavaScript는 커뮤니티, 라이브러리 및 리소스 측면에서 고유 한 장점과 단점이 있습니다. 1) Python 커뮤니티는 친절하고 초보자에게 적합하지만 프론트 엔드 개발 리소스는 JavaScript만큼 풍부하지 않습니다. 2) Python은 데이터 과학 및 기계 학습 라이브러리에서 강력하며 JavaScript는 프론트 엔드 개발 라이브러리 및 프레임 워크에서 더 좋습니다. 3) 둘 다 풍부한 학습 리소스를 가지고 있지만 Python은 공식 문서로 시작하는 데 적합하지만 JavaScript는 MDNWebDocs에서 더 좋습니다. 선택은 프로젝트 요구와 개인적인 이익을 기반으로해야합니다.

Python vs. JavaScript : 개발 환경 및 도구 Python vs. JavaScript : 개발 환경 및 도구 Apr 26, 2025 am 12:09 AM

개발 환경에서 Python과 JavaScript의 선택이 모두 중요합니다. 1) Python의 개발 환경에는 Pycharm, Jupyternotebook 및 Anaconda가 포함되어 있으며 데이터 과학 및 빠른 프로토 타이핑에 적합합니다. 2) JavaScript의 개발 환경에는 Node.js, VScode 및 Webpack이 포함되어 있으며 프론트 엔드 및 백엔드 개발에 적합합니다. 프로젝트 요구에 따라 올바른 도구를 선택하면 개발 효율성과 프로젝트 성공률이 향상 될 수 있습니다.

See all articles