python - L'analyse de la page XPath Scrapy est introuvable
PHP中文网
PHP中文网 2017-06-14 10:51:10
0
2
1098

Ce qui suit est le html des catégories de page

<p id="a144e40e-56c4-4984-b404-1a0230194b42" class="house-item clearfix house-item-curr">
                <p class="item-photo fl">
                    <a href="/zufang/shbs12427828.html" target="_blank">
                        <img class="lazy" src="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" src="//imgsh.centanet.com/ctpostimage/a4/d5/4e4da3a2496299b2b26243565af6_220x165.jpg" alt="采菊苑租房2800元/月" title="采菊苑租房2800元/月" style="display: inline-block;"></a>
                </p>
                <p class="item-info fl">
                    <h4 class="house-title">
                        <a href="/zufang/shbs12427828.html" title="采菊苑,77平两房出租,毛坯3千,好谈价!" target="_blank" class="cBlueB">采菊苑,77平两房出租,毛坯3千,好谈价!</a>
                    </h4>
                    <p class="f14 f000 mb_10">
                        <a href="/xiaoqu/xq-pedpwawows/" class="f000 mr_10" target="_blank" title="采菊苑二手房">采菊苑</a><span class="f000 mr_10">2室2厅</span><span class="f000">77平</span>
                    </p>
                    <p class="f7b mb_10">
                        南北<em class="mrl_6">|</em>高层<em class="mrl_6">|</em>毛坯<em class="mrl_6">|</em>2008年<em class="mrl_6">|</em>整租
                    </p>
                    <p class="f7b mb_15">
                        宝山-顾村 菊联路68弄
                        <a style="cursor: pointer" href="javascript:void(0)" value="/page/v1/common/maputil.aspx?x=121.372168&amp;y=31.354713" class=" icons_map jsmapicon  "></a>
                        
                    </p>                    
                </p>
                 <p class="item-pricearea fr">
                    <p class="price-nub cRed">2800元/月</p>
                     <p class="f14 f000 mb_15 fsm">&nbsp;</p> 
                </p>
                <p class="clear"></p>
            </p>

J'utilise XPath pour extraire du texte. Mon code est

.
class itcast(scrapy.Spider):
    name = 'SH'
    allowd_domains = ["http://sh.centanet.com/"]
    start_urls = ["http://sh.centanet.com/zufang/p2/"]

    def parse(self,response):
        
        list = response.xpath("//p[@class='//p[@class='ouse-item clearfix house-item-curr']")
        
        for i in list:
            name = i.xpath("//a[@class='cBlueB'.text()]")
            print name[0]

Je peux trouver cette catégorie
L'erreur est dans la ligne pour i dans la liste :
name =f.xpath(), le texte ne peut pas être extrait.
Le code d'exécution est introuvable. S'il vous plaît, aidez-moi à découvrir ce qui ne va pas chez moi. J'ai essayé des choses similaires à plusieurs reprises, je n'ai pas d'autre choix que de poser une question, j'espère que vous pourrez y répondre.

PHP中文网
PHP中文网

认证高级PHP讲师

répondre à tous(2)
代言
def parse(response):
    list = response.xpath("//p[@class='house-item clearfix house-item-curr']")

    for i in list:
        name = i.xpath("//a[@class='cBlueB']")
        print name[0].text

C'est peut-être ce que tu veux dire ?

習慣沉默

name = i.xpath("//a[@class='cBlueB'.text()]") est faux. Comment placer du texte à l'intérieur de []

.
Derniers téléchargements
Plus>
effets Web
Code source du site Web
Matériel du site Web
Modèle frontal