抓取“全球 IC 采购网”供应商程序_PHP教程
/**
* 抓取“全球 IC 采购网(http://www.qic.com.cn/)”供应商主程序
* author Lee.
* Last modify $Date: 2012-2-7 09:35:21 $
*/
require_once './config.inc.php';
class qic{
private $startId;
private $endId;
public function __construct() {
$this->startId = 27688;
$this->endId = 55185;
}
public function go() {
for ($i=$this->startId; $iendId; $i++) {
$infoArr = $this->getInfoByUrl($this->getUrl($i));
if (emptyempty($infoArr['company'])) continue;
$m = new Model();
if ($m->isExists('qic', "company='{$infoArr['company']}'")) {
echo 'Data Exists!!'; continue;
} else {
if ($this->addInfoInDB($m, $infoArr)) {
echo 'Add Success!!';
} else {
echo 'Add Faild!!';
}
}
}
}
/**
* 添加数据进数据库
* @param Object $m
* @param array $infoArr
* @return Number
*/
private function addInfoInDB($m ,$infoArr) {
$num = null;
$num = $m->insert('qic', array('company', 'person', 'phone', 'mobile', 'fax', 'qq', 'msn', 'email', 'address', 'website', 'shopUrl'), array($infoArr['company'], $infoArr['person'], $infoArr['phone'], $infoArr['mobile'], $infoArr['fax'], $infoArr['qq'], $infoArr['msn'], $infoArr['email'], $infoArr['address'], $infoArr['website'], $infoArr['shopUrl']));
return $num;
}
/**
* 根据供应商地址获取信息
* @param string $re
* @return ArrayObject
*/
private function getInfoByUrl($url) {
$re = file_get_contents($url);
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/
preg_match_all('/公司地址:(.*)/Usi', $re, $addressArr);
preg_match_all('/公司网址:(.*)/Usi', $re, $websiteArr);
$infoArr = array(
'company'=>$this->formatString($companyArr[1][0]),
'person'=>$this->formatString($personArr[1][0]),
'phone'=>$this->formatString($phoneArr[1][0]),
'mobile'=>$this->formatString($mobileArr[1][0]),
'fax'=>$this->formatString($faxArr[1][0]),
'qq'=>$this->formatString($qqArr[1][0], 'qm'),
'msn'=>$this->formatString($msnArr[1][0], 'qm'),
'email'=>$this->formatString($emailArr[1][0]),
'address'=>$this->formatString($addressArr[1][0]),
'website'=>$this->formatString($websiteArr[1][0], 'a'),
'shopUrl'=>$url
);
return $infoArr;
}
/**
* 获取页面内容
* @param string $url
* @return string
*/
private function getContent($url) {
$re = file_get_contents($url);
return $re;
}
/**
* 格式化字符串
* @param string $str
* @param string $type 类型
* @return string
*/
private function formatString($str, $type='default') {
$str = trim($str);
switch ($type) {
case 'default':
return emptyempty($str) ? '' : $str;
break;
case 'qm': # 处理QQ
if (emptyempty($str)) return '';
preg_match_all('/\'(.+)\'/si', $str, $arr);
return trim($arr[1][0]);
break;
case 'a':
$str = preg_replace('/
return $str;
break;
default:
return '';
break;
}
}
/**
* 获取供应商页面地址 www.2cto.com
* @param int $shopId
* @return string
*/
private function getUrl($shopId) {
return "http://www.qic.com.cn/specialstore/tsh_{$shopId}.html";
}
}
/*
* 表结构
CREATE TABLE `qic` (
`id` mediumint(8) unsigned NOT NULL auto_increment,
`company` varchar(500) NOT NULL,
`person` varchar(500) NOT NULL,
`phone` varchar(300) NOT NULL,
`mobile` varchar(300) NOT NULL,
`fax` varchar(300) NOT NULL,
`qq` varchar(300) NOT NULL,
`msn` varchar(500) NOT NULL,
`email` varchar(500) NOT NULL,
`address` varchar(500) NOT NULL,
`website` varchar(500) NOT NULL,
`shopUrl` varchar(200) NOT NULL,
PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8
* */
$q = new qic();
$q->go();
?>
摘自 Lee.的专栏

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

PHP和Python各有優勢,選擇依據項目需求。 1.PHP適合web開發,尤其快速開發和維護網站。 2.Python適用於數據科學、機器學習和人工智能,語法簡潔,適合初學者。

PHP在電子商務、內容管理系統和API開發中廣泛應用。 1)電子商務:用於購物車功能和支付處理。 2)內容管理系統:用於動態內容生成和用戶管理。 3)API開發:用於RESTfulAPI開發和API安全性。通過性能優化和最佳實踐,PHP應用的效率和可維護性得以提升。

PHP是一種廣泛應用於服務器端的腳本語言,特別適合web開發。 1.PHP可以嵌入HTML,處理HTTP請求和響應,支持多種數據庫。 2.PHP用於生成動態網頁內容,處理表單數據,訪問數據庫等,具有強大的社區支持和開源資源。 3.PHP是解釋型語言,執行過程包括詞法分析、語法分析、編譯和執行。 4.PHP可以與MySQL結合用於用戶註冊系統等高級應用。 5.調試PHP時,可使用error_reporting()和var_dump()等函數。 6.優化PHP代碼可通過緩存機制、優化數據庫查詢和使用內置函數。 7

PHP仍然具有活力,其在現代編程領域中依然佔據重要地位。 1)PHP的簡單易學和強大社區支持使其在Web開發中廣泛應用;2)其靈活性和穩定性使其在處理Web表單、數據庫操作和文件處理等方面表現出色;3)PHP不斷進化和優化,適用於初學者和經驗豐富的開發者。

PHP和Python各有優勢,選擇應基於項目需求。 1.PHP適合web開發,語法簡單,執行效率高。 2.Python適用於數據科學和機器學習,語法簡潔,庫豐富。

PHP和Python各有優劣,選擇取決於項目需求和個人偏好。 1.PHP適合快速開發和維護大型Web應用。 2.Python在數據科學和機器學習領域佔據主導地位。

PHP適合web開發,特別是在快速開發和處理動態內容方面表現出色,但不擅長數據科學和企業級應用。與Python相比,PHP在web開發中更具優勢,但在數據科學領域不如Python;與Java相比,PHP在企業級應用中表現較差,但在web開發中更靈活;與JavaScript相比,PHP在後端開發中更簡潔,但在前端開發中不如JavaScript。

PHP主要是過程式編程,但也支持面向對象編程(OOP);Python支持多種範式,包括OOP、函數式和過程式編程。 PHP適合web開發,Python適用於多種應用,如數據分析和機器學習。
