Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python
Pengenalan:
Perangkak web ialah program automatik yang digunakan untuk merangkak data web melalui Internet. Dengan pembangunan Internet yang berterusan dan pertumbuhan data yang pesat, perangkak web menjadi semakin popular. Artikel ini akan memperkenalkan cara menggunakan React dan Python, dua teknologi popular, untuk membina aplikasi perangkak web yang berkuasa. Kami akan meneroka kelebihan React sebagai rangka kerja hadapan dan Python sebagai enjin perangkak, dan memberikan contoh kod khusus.
1. Mengapa memilih React dan Python:
2. Bina aplikasi bahagian hadapan React:
Buat projek React:
Mula-mula, kita perlu menggunakan alat Create React App untuk mencipta projek React. Buka terminal dan laksanakan arahan berikut:
npx create-react-app web-crawler cd web-crawler
Komponen penulisan:
Buat fail bernama Crawler.js dalam direktori src dan tulis kod berikut:
import React, { useState } from 'react'; const Crawler = () => { const [url, setUrl] = useState(''); const [data, setData] = useState(null); const handleClick = async () => { const response = await fetch(`/crawl?url=${url}`); const result = await response.json(); setData(result); }; return ( <div> <input type="text" value={url} onChange={(e) => setUrl(e.target.value)} /> <button onClick={handleClick}>开始爬取</button> {data && <pre class="brush:php;toolbar:false">{JSON.stringify(data, null, 2)}
Konfigurasi penghalaan bernama Crawler.js:
js dalam direktori src Untuk fail App.js, tulis kod berikut:
import React from 'react'; import { BrowserRouter as Router, Route } from 'react-router-dom'; import Crawler from './Crawler'; const App = () => { return ( <Router> <Route exact path="/" component={Crawler} /> </Router> ); }; export default App;
Mulakan aplikasi:
Buka terminal dan laksanakan arahan berikut untuk memulakan aplikasi:
npm start
3. Tulis Python enjin perangkak:
Pasang kebergantungan:
Dalam Buat fail bernama requirements.txt dalam direktori akar projek, tambah kandungan berikut:
flask requests beautifulsoup4
Kemudian laksanakan arahan berikut untuk memasang kebergantungan:
pip install -r requirements.txt
skrip crawler:
Buat fail bernama crawler.py dalam fail direktori akar projek, tulis kod berikut:
from flask import Flask, request, jsonify import requests from bs4 import BeautifulSoup app = Flask(__name__) @app.route('/crawl') def crawl(): url = request.args.get('url') response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser') # 解析网页,获取需要的数据 return jsonify({'data': '爬取的数据'}) if __name__ == '__main__': app.run()
4. Uji aplikasi:
Jalankan aplikasi:
Buka terminal berikut dan laksanakan arahan untuk memulakan enjin perangkak Python:
python crawler.py
Kesimpulan:
Artikel ini memperkenalkan cara menggunakan React dan Python untuk membina aplikasi perangkak web yang berkuasa. Dengan menggabungkan rangka kerja bahagian hadapan React dan enjin perangkak Python yang berkuasa, kami boleh mencapai antara muka mesra pengguna dan rangkak data yang cekap. Saya harap artikel ini akan membantu anda mempelajari dan mengamalkan aplikasi perangkak web.
Atas ialah kandungan terperinci Cara membina aplikasi perangkak web yang berkuasa menggunakan React dan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!