目次
ディスカッションに返信 (解決策)
ホームページ バックエンド開発 PHPチュートリアル crul を使用してコンテンツをクロールする場合。

crul を使用してコンテンツをクロールする場合。

Jun 23, 2016 pm 02:18 PM

crul を使用してコンテンツをクロールする場合。傍受されたコンテンツが少ない場合がわかりました。普通に入力できる。大量のコンテンツが傍受された場合。 Array(); のみが表示されます。 。何故ですか。 。あと、捉えたいのは形です。アイテムの一つ。特徴はありません。 。アイデアを探しています~~~


ディスカッションに返信 (解決策)

分析のためにコードを投稿することをお勧めします

<html>	<head>		<title></title><link href="/css/newcss/project.css" rel="stylesheet" type="text/css">	</head>	<body leftmargin="0" topmargin="0" marginwidth="0" marginheight="0" style="overflow:auto;">		<form name="form" method="post"><table width="100%" border="0" align="center" cellpadding="0" cellspacing="0"><tr><td class="Linetop"></td></tr></table><table width="100%"  border="0" cellpadding="0" cellspacing="0" class="title" id="tblHead"><tr>					<td width="80%" >					<table border="0" align="left" cellpadding="0" cellspacing="0" >										<tr>					<td> </td>					<td valign="middle"> <b>本学期成绩查询列表</b>					 </td>					</tr>					</table>					</td>					<td width="20%" >											<table border="0" align="left" cellpadding="0" cellspacing="0" width="100%" >												<tr>						<td> </td>											<td width="5"></td>					</tr>					</table>					</td>					</tr></table><table width="100%" border="0" align="center" cellpadding="0" cellspacing="0"><tr><td class="Linetop"></td></tr></table>			<table width="100%" border="0" cellpadding="0" cellspacing="0" class="titleTop2">					 <tr>					  <td class="pageAlign">					   <table cellpadding="0" width="100%" class="displayTag" cellspacing="1" border="0" id="user">					    <thead>							<tr>					<th align="center" width="10%" class="sortable">						课程号					</th>					<th align="center" width="10%" class="sortable">						课序号					</th>					<th align="center" width="20%" class="sortable">						课程名					</th>					<th align="center" width="20%" class="sortable">						英文课程名					</th>					<th align="center" width="10%" class="sortable">						学分					</th>					<th align="center" width="10%" class="sortable">						课程属性					</th>					<th align="center" width="10%" class="sortable">成绩					</th>				</tr>															<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00002473							</td>							<td align="center">								26								</td>							<td align="center">								形势与政策(六)							</td>							<td align="center">								Situation and Policy (Ⅵ)							</td>							<td align="center">								0							</td>							<td align="center">								综合必修							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00002435							</td>							<td align="center">								09								</td>							<td align="center">								文献检索与利用A							</td>							<td align="center">								Literature Retrieval and Utilization A							</td>							<td align="center">								2							</td>							<td align="center">								综合必修							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00000406							</td>							<td align="center">								09								</td>							<td align="center">								软件工程导论							</td>							<td align="center">								Introduction to Software Engineering							</td>							<td align="center">								3							</td>							<td align="center">								专业必修							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00001017							</td>							<td align="center">								01								</td>							<td align="center">								软件代码开发技术							</td>							<td align="center">								Development Technology for Software Coding							</td>							<td align="center">								2.5							</td>							<td align="center">								专业选修							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00000995							</td>							<td align="center">								01								</td>							<td align="center">								编译原理A							</td>							<td align="center">								The Principle of Compiler A							</td>							<td align="center">								3							</td>							<td align="center">								专业选修							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00000998							</td>							<td align="center">								02								</td>							<td align="center">								大型数据库系统							</td>							<td align="center">								Oracle database system							</td>							<td align="center">								2.5							</td>							<td align="center">								学科选修							</td>							<td align="center">																88													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								SJ000195							</td>							<td align="center">								07								</td>							<td align="center">								综合实训(二)							</td>							<td align="center">								Comprehensive Practical Training(Ⅱ)							</td>							<td align="center">								2							</td>							<td align="center">								实践环节							</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00005054							</td>							<td align="center">								02								</td>							<td align="center">								信息安全技术B							</td>							<td align="center">								Information Security Technology B							</td>							<td align="center">								2.5							</td>							<td align="center">															</td>							<td align="center">													 	    </td>						</tr>											<tr class="odd" onMouseOut="this.className='even';" onMouseOver="this.className='evenfocus';">							<td align="center">								00004773							</td>							<td align="center">								01								</td>							<td align="center">								软件项目管理B							</td>							<td align="center">								Project Managenent for Software B							</td>							<td align="center">								2.5							</td>							<td align="center">															</td>							<td align="center">													 	    </td>						</tr>												</TABLE>			<div align="right">			<table width="100%" border="0" cellpadding="0" cellspacing="0" ><tr><td align="right">共9项  第1/1页  <img title="第一页" src="/img/icon/noDownDM2.gif"style="vertical-align:center;" width="11" height="11" /> <img title="前一页" src="/img/icon/noDownDM_2.gif"style="vertical-align:center;" width="11" height="11" /><img title="下一页" src="/img/icon/noUpDM_2.gif"style="vertical-align:center;" width="11" height="11" /> <img title="最后一页" src="/img/icon/noUpDM2.gif"style="vertical-align:center;" width="11" height="11" />  每页显示的记录数 <select name="pageSize" onchange="pageSizeChange()"><option value="10" >10项</option><option value="20" selected='selected'>20项</option><option value="30" >30项</option><option value="40" >40项</option><option value="50" >50项</option><option value="100" >100项</option><option value="200" >200项</option><option value="300" >300项</option></select><input   name="page"   type="hidden"   id="page" value="1"> <input   name="currentPage"   type="hidden"   id="currentPage" value="1"> <input   name="pageNo"   type="text"   id="pageNo"   size="3"   onKeyPress="return   handleEnterOnPageNo();"> <img src="/img/icon/go.gif"  name="goto"  id="goto" style="cursor:hand;" title="跳转到" onClick="forward();"><script   type   =   'text/javaScript'>function   forward(){     if(!(/^([1-9])(\d{0,})(\d{0,})$/.test(document.all.pageNo.value))){         alert("请输入合法的页号!");         document.all.pageNo.focus();         return false;     }     if(document.all.pageNo.value>1     ){     alert("输入的页数超过了总页数,请重新输入!");         document.all.pageNo.focus();         return false;     }         window.location.href="/bxqcjcxAction.do?totalrows=9&page="+   document.all.pageNo.value +"&pageSize="+document.all.pageSize.value;}function   handleEnterOnPageNo(){     if(event.keyCode   ==   13)     {         forward();         return   false;     }     return   true;}function pageSizeChange(){ window.location.href="/bxqcjcxAction.do?totalrows=9&pageSize="+document.all.pageSize.value;}function pagination(value){ window.location.href="/bxqcjcxAction.do?totalrows=9&page="+value+"&pageSize="+document.all.pageSize.value;}</script></td></tr></table>			</div>		</form>	</body></html>
ログイン後にコピー

必要なのはコースの名前とスコアだけです。 。

分析と回答のためにコードを投稿することをお勧めします。、、

$s=your string
preg_match_all('#s*.+s*.+ s*(.+).+([^<]+)s* < /tr>#isU',$s,$m);
print_r($m); // $m[1] は名前配列、$m[2] はスコア配列です

ウェブサイトと一致しますか?クロール防止ルールについてはどうですか?

$s=your string

preg_match_all('#s*.+s*.+s*(.+).+([^<]+)s*#isU',$s ,$m);
print_r($m); // $m[1] は名前配列、$m[2] は小数配列です
これはすごいですね。 。 。私のアイドル! ! ! !

$s=あなたの文字列

preg_match_all('#s*< ; td align="center">.+s*

.+s*(.+ ) .+([^<]+)s*#isU',$s,$m);
print_r ($m); // $m[1] は名前配列、$m[2] はスコア配列
Master... ([^
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

セッションのハイジャックはどのように機能し、どのようにPHPでそれを軽減できますか? セッションのハイジャックはどのように機能し、どのようにPHPでそれを軽減できますか? Apr 06, 2025 am 12:02 AM

セッションハイジャックは、次の手順で達成できます。1。セッションIDを取得します。2。セッションIDを使用します。3。セッションをアクティブに保ちます。 PHPでのセッションハイジャックを防ぐための方法には次のものが含まれます。1。セッション_regenerate_id()関数を使用して、セッションIDを再生します。2。データベースを介してストアセッションデータを3。

JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 JSON Web Tokens(JWT)とPHP APIでのユースケースを説明してください。 Apr 05, 2025 am 12:04 AM

JWTは、JSONに基づくオープン標準であり、主にアイデンティティ認証と情報交換のために、当事者間で情報を安全に送信するために使用されます。 1。JWTは、ヘッダー、ペイロード、署名の3つの部分で構成されています。 2。JWTの実用的な原則には、JWTの生成、JWTの検証、ペイロードの解析という3つのステップが含まれます。 3. PHPでの認証にJWTを使用する場合、JWTを生成および検証でき、ユーザーの役割と許可情報を高度な使用に含めることができます。 4.一般的なエラーには、署名検証障害、トークンの有効期限、およびペイロードが大きくなります。デバッグスキルには、デバッグツールの使用とロギングが含まれます。 5.パフォーマンスの最適化とベストプラクティスには、適切な署名アルゴリズムの使用、有効期間を合理的に設定することが含まれます。

確固たる原則と、それらがPHP開発にどのように適用されるかを説明してください。 確固たる原則と、それらがPHP開発にどのように適用されるかを説明してください。 Apr 03, 2025 am 12:04 AM

PHP開発における固体原理の適用には、次のものが含まれます。1。単一責任原則(SRP):各クラスは1つの機能のみを担当します。 2。オープンおよびクローズ原理(OCP):変更は、変更ではなく拡張によって達成されます。 3。Lischの代替原則(LSP):サブクラスは、プログラムの精度に影響を与えることなく、基本クラスを置き換えることができます。 4。インターフェイス分離原理(ISP):依存関係や未使用の方法を避けるために、細粒インターフェイスを使用します。 5。依存関係の反転原理(DIP):高レベルのモジュールと低レベルのモジュールは抽象化に依存し、依存関係噴射を通じて実装されます。

phpstormでCLIモードをデバッグする方法は? phpstormでCLIモードをデバッグする方法は? Apr 01, 2025 pm 02:57 PM

phpstormでCLIモードをデバッグする方法は? PHPStormで開発するときは、PHPをコマンドラインインターフェイス(CLI)モードでデバッグする必要がある場合があります。

システムの再起動後にUnixSocketの権限を自動的に設定する方法は? システムの再起動後にUnixSocketの権限を自動的に設定する方法は? Mar 31, 2025 pm 11:54 PM

システムが再起動した後、UnixSocketの権限を自動的に設定する方法。システムが再起動するたびに、UnixSocketの許可を変更するために次のコマンドを実行する必要があります:sudo ...

PHPでの後期静的結合を説明します(静的::)。 PHPでの後期静的結合を説明します(静的::)。 Apr 03, 2025 am 12:04 AM

静的結合(静的::) PHPで後期静的結合(LSB)を実装し、クラスを定義するのではなく、静的コンテキストで呼び出しクラスを参照できるようにします。 1)解析プロセスは実行時に実行されます。2)継承関係のコールクラスを検索します。3)パフォーマンスオーバーヘッドをもたらす可能性があります。

PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? PHPのCurlライブラリを使用してJSONデータを含むPOSTリクエストを送信する方法は? Apr 01, 2025 pm 03:12 PM

PHP開発でPHPのCurlライブラリを使用してJSONデータを送信すると、外部APIと対話する必要があることがよくあります。一般的な方法の1つは、Curlライブラリを使用して投稿を送信することです。

See all articles