由於提供工作穩定性、可觀的薪水和其他幾項優勢,政府工作在全球範圍內需求量很高。然而,找到並管理這些通知可能是一個困難的過程。本文將教你如何使用Python來爬取最新的政府就業公告。
在開始之前,我們需要先安裝所需的 Python 套件。我們將使用的兩個套件是 requests 和 BeautifulSoup。我們可以使用 pip 安裝這些套件。
這是安裝它們的指令:
pip install requests pip install beautifulsoup4
一旦我們安裝了所需的套件,我們就可以開始將它們匯入到我們的 Python 程式碼中:
import requests from bs4 import BeautifulSoup
首先,我們需要找到列出政府工作通知的網站。
然後,我們將使用Python中的requests套件向網站發送請求。
接下來,我們將使用回應物件的content屬性來提取網站的HTML內容。
我們將使用BeautifulSoup套件解析HTML內容。
最後,我們將從解析的HTML內容中提取相關的工作通知細節。
現在讓我們透過從印度政府網站(https://www.sarkariresult.com/latestjob)上爬取職位公告的資訊來使用上述演算法。
import requests from bs4 import BeautifulSoup # Define the URL to scrape url = "https://www.sarkariresult.com/latestjob.php" # Function to get the HTML content of the website def get_html(url): response = requests.get(url) return response.text # Get the HTML content of the website html_data = get_html(url) # Parse the HTML content using BeautifulSoup soup = BeautifulSoup(html_data, 'html.parser') # Find the job notification details job_details = soup.find_all("div", id="post") # to store the scraped data job_notifications = [] # Loop through each job notification and extract the details for job in job_details: job_notification = job.get_text() job_notifications.append(job_notification) # Print the job notifications for notification in job_notifications: print(notification)
UKPSC Jail Warden Online Form 2022 Last Date : 18/01/2023 NTA UGC NET December 2022 Online Form Last Date : 17/01/2023 Central Silk Board Various Post Online Form 2023 Last Date : 16/01/2023 MPESB High School TET Online Form 2023 Last Date : 27/01/2023 DSSSB PGT Economics Online Form 2023 Last Date : 01/02/2023 CRPF HC Ministerial and ASI Steno Online Form 2023 Last Date : 25/01/2023 AAI Junior Executives Online Form 2022 Last Date : 21/01/2023
匯入 requests 模組以向給定 URL 發出 HTTP 請求。
匯入BeautifulSoup模組來解析網頁的HTML內容。
要爬取的網站的URL被定義為https://www.sarkariresult.com/latestjob.php。
透過使用requests.get()方法發送HTTP請求並將結果作為文字傳送,開發了get html函數來取得網站的HTML內容。
呼叫get html方法時以URL作為輸入,即可取得網站的HTML內容。
使用 BeautifulSoup 和指定的解析器 html.parser 來解析 HTML 內容。
透過尋找所有 id="post" 的 div 標籤來取得職位通知詳細資訊。
初始化一個空列表 job_notifications 以儲存抓取的資料。
循環用於透過在每個 div 標記上呼叫 get_text() 方法並將其附加到 job_notifications 清單來從每個作業通知中提取文字。
最後,透過循環遍歷job_notifications清單並列印每個通知來列印工作通知。
它還可以進一步擴展,從其他政府職位入口網站上獲取工作通知。此外,抓取的資料可以儲存在資料庫或CSV檔案中,以供將來參考或透過添加經紀費來將聚合資料製作成職位入口網站並實現盈利。
在本教程中,我們學習如何使用 Python 從網路上抓取政府工作通知。我們首先安裝了必要的軟體包,然後詳細介紹了演算法。然後,我們透過從印度政府的求職入口網站抓取職位通知詳細信息,將演算法付諸實踐。我們也討論了程式碼的可能應用。
以上是使用Python獲取最新的政府工作信息的詳細內容。更多資訊請關注PHP中文網其他相關文章!