Rumah > hujung hadapan web > tutorial js > Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python

Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python

WBOY
Lepaskan: 2023-09-26 13:04:48
asal
1070 orang telah melayarinya

Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python

Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python

Pengenalan:
Perangkak web ialah program automatik yang digunakan untuk merangkak data web melalui Internet. Dengan pembangunan Internet yang berterusan dan pertumbuhan data yang pesat, perangkak web menjadi semakin popular. Artikel ini akan memperkenalkan cara menggunakan React dan Python, dua teknologi popular, untuk membina aplikasi perangkak web yang berkuasa. Kami akan meneroka kelebihan React sebagai rangka kerja hadapan dan Python sebagai enjin perangkak, dan memberikan contoh kod khusus.

1. Mengapa memilih React dan Python:

  1. Sebagai rangka kerja hadapan, React mempunyai kelebihan berikut:
  2. Pembangunan berasaskan komponen: React mengguna pakai idea pembangunan berasaskan komponen untuk menjadikan kod lebih mudah dibaca , boleh diselenggara dan Kebolehgunaan Semula.
  3. Virtual DOM: React menggunakan mekanisme DOM maya untuk meningkatkan prestasi melalui operasi DOM yang diminimumkan.
  4. Aliran data sehala: React menggunakan mekanisme aliran data sehala untuk menjadikan kod lebih boleh diramal dan dikawal.
  5. Python, sebagai enjin perangkak, mempunyai kelebihan berikut:
  6. Mudah digunakan: Python ialah bahasa yang ringkas dan mudah dipelajari dengan keluk pembelajaran yang rendah.
  7. Berkuasa: Python mempunyai banyak perpustakaan pihak ketiga, seperti Permintaan, BeautifulSoup, Scrapy, dll., yang boleh mengendalikan permintaan rangkaian, menghuraikan halaman web dan tugas lain dengan mudah.
  8. Prestasi Concurrency: Python mempunyai perpustakaan pengaturcaraan serentak yang kaya, seperti Gevent, Threading, dll., yang boleh meningkatkan prestasi concurrency perangkak web.

2. Bina aplikasi bahagian hadapan React:

  1. Buat projek React:
    Mula-mula, kita perlu menggunakan alat Create React App untuk mencipta projek React. Buka terminal dan laksanakan arahan berikut:

    npx create-react-app web-crawler
    cd web-crawler
    Salin selepas log masuk
  2. Komponen penulisan:
    Buat fail bernama Crawler.js dalam direktori src dan tulis kod berikut:

    import React, { useState } from 'react';
    
    const Crawler = () => {
      const [url, setUrl] = useState('');
      const [data, setData] = useState(null);
    
      const handleClick = async () => {
     const response = await fetch(`/crawl?url=${url}`);
     const result = await response.json();
     setData(result);
      };
    
      return (
     <div>
       <input type="text" value={url} onChange={(e) => setUrl(e.target.value)} />
       <button onClick={handleClick}>开始爬取</button>
       {data && <pre class="brush:php;toolbar:false">{JSON.stringify(data, null, 2)}
    Salin selepas log masuk
    }
); }; export default Crawler;
  • Konfigurasi penghalaan bernama Crawler.js:
    js dalam direktori src Untuk fail App.js, tulis kod berikut:

    import React from 'react';
    import { BrowserRouter as Router, Route } from 'react-router-dom';
    import Crawler from './Crawler';
    
    const App = () => {
      return (
     <Router>
       <Route exact path="/" component={Crawler} />
     </Router>
      );
    };
    
    export default App;
    Salin selepas log masuk
  • Mulakan aplikasi:
    Buka terminal dan laksanakan arahan berikut untuk memulakan aplikasi:

    npm start
    Salin selepas log masuk
  • 3. Tulis Python enjin perangkak:

    1. Pasang kebergantungan:
      Dalam Buat fail bernama requirements.txt dalam direktori akar projek, tambah kandungan berikut:

      flask
      requests
      beautifulsoup4
      Salin selepas log masuk

      Kemudian laksanakan arahan berikut untuk memasang kebergantungan:

      pip install -r requirements.txt
      Salin selepas log masuk
    2. Tulis a

      skrip crawler:
      Buat fail bernama crawler.py dalam fail direktori akar projek, tulis kod berikut:

      from flask import Flask, request, jsonify
      import requests
      from bs4 import BeautifulSoup
      
      app = Flask(__name__)
      
      @app.route('/crawl')
      def crawl():
       url = request.args.get('url')
       response = requests.get(url)
       soup = BeautifulSoup(response.text, 'html.parser')
       
       # 解析网页,获取需要的数据
      
       return jsonify({'data': '爬取的数据'})
      
      if __name__ == '__main__':
       app.run()
      Salin selepas log masuk

    4. Uji aplikasi:

    1. Jalankan aplikasi:
      Buka terminal berikut dan laksanakan arahan untuk memulakan enjin perangkak Python:

      python crawler.py
      Salin selepas log masuk
    2. Lawati aplikasi:
      Buka penyemak imbas dan lawati http ://localhost:3000, masukkan URL untuk dirangkak dalam kotak input, dan klik butang "Mulakan Rangkakan" untuk lihat data yang dirangkak.

    Kesimpulan:
    Artikel ini memperkenalkan cara menggunakan React dan Python untuk membina aplikasi perangkak web yang berkuasa. Dengan menggabungkan rangka kerja bahagian hadapan React dan enjin perangkak Python yang berkuasa, kami boleh mencapai antara muka mesra pengguna dan rangkak data yang cekap. Saya harap artikel ini akan membantu anda mempelajari dan mengamalkan aplikasi perangkak web.

    Atas ialah kandungan terperinci Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

    Label berkaitan:
    sumber:php.cn
    Kenyataan Laman Web ini
    Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
    Cadangan popular
    Tutorial Popular
    Lagi>
    Muat turun terkini
    Lagi>
    kesan web
    Kod sumber laman web
    Bahan laman web
    Templat hujung hadapan