python - Scrapy utilise XPath pour signaler les erreurs en chinois

Question

Description du problème {Code...} Erreur : ValueError : Toutes les chaînes doivent être compatibles XML : Unicode ou ASCII, pas d'octets NULL ni de caractères de contrôle.

学习ing · Answer

Voir l'article : Résoudre le problème du rapport d'erreurs chinois lorsque XPath est utilisé dans Scrapy

Solution

Méthode 1 : convertir l'intégralité de l'instruction XPath en Unicode

links = sel.xpath(u'//i[contains(@title,"置顶")]/following-sibling::a/@href').extract()

Méthode 2 : utilisez la variable de titre qui a été convertie en Unicode dans l'instruction XPath

title = u"置顶"
links = sel.xpath('//i[contains(@title,"%s")]/following-sibling::a/@href' %(title)).extract()

Méthode 3 : Utiliser directement la syntaxe des variables dans XPath ($符号加变量名)$title, passez simplement le titre du paramètre

links = sel.xpath('//i[contains(@title,$title)]/following-sibling::a/@href', title="置顶").extract()

ringa_lee · Answer

Essayez d'ajouter un u avant toute la chaîne