Cheerioで異なるHTMLタグで区切られたテキストを抽出する方法
P粉141911244
2023-08-13 17:01:06
<p>たとえば、次の特定のテキスト文字列を別の出力として抽出しようとしています (以下の HTML から取得します)。 </p>
<pre class="brush:js;toolbar:false;">let text = "これが最初に必要なテキストです";
let text2 = "これは必要な 2 番目のテキストです";
let text3 = "これは必要な 3 番目のテキストです";
</pre>
<p>さまざまな HTML タグで区切られたテキストを取得する方法がわかりません。 </p>
<pre class="brush:html;toolbar:false;"><p>
<span class="hidden-text"><span class="ft-semi">数:</span>31<br></span>
<span class="ft-semi">何か:</span> これは私が必要とする最初のテキストです
<span class="hidden-text"><span class="ft-semi">Something2:</span> </span>これは必要な 2 番目のテキストです
<br><span class="ft-semi">Something3:</span> これは必要な 3 番目のテキストです
</p>
</pre>
<p><br /></p>
次のようなことを試して、うまくいくかどうかを確認してください:
リーリーサンプル HTML を使用すると、出力は次のようになります:
リーリー
を取得できます。<p>
の子ノードを反復処理して、空でないコンテンツのnodeType === Node.TEXT_NODE
: