正则表达式如何匹配网页里面的汉字?
python做的爬虫,需要提取html中Apple iPhone 5s (A1530) 16GB 金色 移动联通4G手机 这里面的手机名,因为初学怎么都不能匹配完全, 其中用.*只能匹配到Apple iPhone 5s (A1 请各位指点一下!已经困住两天了!回复内容:
谢邀。
我又来安利xpath了,放弃正则表达式吧少年。//span[@class="pro-title"]/text()
(?<=>).*?(?=<)
如果实际情况中有许多不同的“<>”对,就请自行填充前后向断言的内容
你应该看看汉字编码,网页的编码很可能是GBK,然而python是用的utf8,所以绝对匹配不了
怒答,看到不懂正则的还瞎BB,为你感到悲哀!上图!---------------代码区----------------
# coding:utf-8
import re
x='<span class="pro-title">Apple iPhone 5s (A1530) 16GB 金色 移动联通4G手机</span> <span class="pro-price">'
xre=r'(<span class="pro-title">)(.+)(</span> <span class="pro-price">)'
z=re.search(xre,x).group(2)
print z
----------输出区-----------------------
C:\Python27\python.exe D:/PycharmProjects/爬虫/test.py
Apple iPhone 5s (A1530) 16GB 金色 移动联通4G手机
进程已结束,退出代码0
先用靓汤或正则找到这个节点,再用上面的字符组匹配。
假设这个节点只有一个,用法如下:<span class="kn">import</span> <span class="nn">re</span>
<span class="kn">import</span> <span class="nn">requests</span> <span class="k">as</span> <span class="nn">req</span>
<span class="kn">from</span> <span class="nn">bs4</span> <span class="k">import</span> <span class="n">BeautifulSoup</span>
<span class="n">url</span> <span class="o">=</span> <span class="s">'xxx'</span>
<span class="n">html</span> <span class="o">=</span> <span class="n">req</span><span class="o">.</span><span class="n">get</span><span class="p">(</span><span class="n">url</span><span class="p">)</span><span class="o">.</span><span class="n">text</span>
<span class="n">bs</span> <span class="o">=</span> <span class="n">BeautifulSoup</span><span class="p">(</span><span class="n">html</span><span class="p">)</span>
<span class="n">span</span> <span class="o">=</span> <span class="n">bs</span><span class="o">.</span><span class="n">find_all</span><span class="p">(</span><span class="s">'span'</span><span class="p">,</span> <span class="s">'pro-title'</span><span class="p">)</span>
<span class="sd">'''</span>
<span class="sd">span = re.findall('<span\sclass="pro-title">[^<]+</span>', html)</span>
<span class="sd">s = span[0]</span>
<span class="sd">m = re.findall('[\u4e00-\u9fa5]+', s)</span>
<span class="sd">'''</span>
<span class="n">s</span> <span class="o">=</span> <span class="nb">str</span><span class="p">(</span><span class="n">span</span><span class="p">)</span>
<span class="n">m</span> <span class="o">=</span> <span class="n">re</span><span class="o">.</span><span class="n">findall</span><span class="p">(</span><span class="s">'[</span><span class="se">\u4e00</span><span class="s">-</span><span class="se">\u9fa5</span><span class="s">]+'</span><span class="p">,</span> <span class="n">s</span><span class="p">)</span>
<span class="nb">print</span><span class="p">(</span><span class="n">m</span><span class="p">)</span>

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











統合スクリーンを備えた Apple の HomePod に似たデバイスの新たな詳細が明らかになり、「Home Accessories」と呼ばれるこのデバイスの全体像がより明確に描かれています。発売されれば、それはGoogleのNest Hub Maxに対するAppleの答えとなるだろう。

この記事では、gate.ioの公式Webサイトに最新のアプリを登録およびダウンロードする手順について詳しく説明しています。まず、登録情報の記入、電子メール/携帯電話番号の確認、登録の完了など、登録プロセスが導入されます。第二に、iOSデバイスとAndroidデバイスでgate.ioアプリをダウンロードする方法について説明します。最後に、公式ウェブサイトの信頼性を検証し、2段階の検証を可能にすること、ユーザーアカウントと資産の安全性を確保するためのリスクのフィッシングに注意を払うなど、セキュリティのヒントが強調されています。

OUYIは、ユーザーに便利で安全なデジタル資産管理エクスペリエンスを提供する公式のiOSアプリとの世界をリードする暗号通貨取引所です。ユーザーは、この記事で提供されているダウンロードリンクからOUYI IOSバージョンのインストールパッケージを無料でダウンロードし、次の主な機能をお勧めします。 。安全で信頼できるストレージ:OUYIは、高度なセキュリティテクノロジーを採用して、ユーザーに安全で信頼性の高いデジタル資産ストレージを提供します。 2FA、生体認証およびその他のセキュリティ対策により、ユーザー資産が侵害されないようにします。リアルタイム市場データ:OUYI iOSアプリはリアルタイムの市場データとチャートを提供し、ユーザーはいつでも暗号化を把握できるようにします

Binance Appの公式インストール手順:Androidは、ダウンロードリンクを見つけるために公式Webサイトにアクセスする必要があります。すべては、公式チャネルを通じて契約に注意を払う必要があります。

要約:この記事は、Appleデバイスに仮想通貨取引アプリケーションをインストールおよび登録する方法についてユーザーをガイドすることを目的としています。 Appleは仮想通貨アプリケーションに関する厳格な規制を持っているため、ユーザーはインストールプロセスを完了するために特別な措置を講じる必要があります。この記事では、アプリケーションのダウンロード、アカウントの作成、身元の確認など、必要な手順について詳しく説明します。この記事のガイドに従って、ユーザーはAppleデバイスに仮想通貨取引アプリを簡単に設定して取引を開始できます。

Apple の iPhone 16 ラインナップのデバイス (具体的には 16 Pro/Pro Max) をすでに入手している場合は、最近タッチスクリーンに関する何らかの問題に直面している可能性があります。希望の光は、あなたは一人ではないということです - レポート

問題の説明公式コードに従ってパラメーターを記入した後、PHPを使用してAlipay EasySDKを呼び出すとき、操作中にエラーメッセージが報告されました。

Honor MagicBook Pro14は驚くほどリリースされ、AIPCの新しい時代をリードしています! MWCのオープニングの前夜、Honorは中国で新しいMagicBook Pro14ノートブックを最初にリリースし、同時にAIテクノロジーでラップトップエクスペリエンスを包括的に革新するためのAIPC 2.0戦略を開始しました。 Honor AIPC2.0戦略は、AIコア駆動型のインテリジェントハードウェア、AIエージェント対応のヒューマンコンピューター相互作用、およびAIサービスフローのクロスエンドエコシステムをカバーしています。高度に賞賛されている「One Sents Things」AI Interactive Experience of Honor携帯電話もMagicBook Pro14に実装され、ユーザーは音声コマンドだけで操作を完了することができます。新しいHonorturboxテクノロジー、Magicboを装備しています
