csv - python多列存取爬蟲網頁?
天蓬老师
天蓬老师 2017-04-18 10:25:51
0
1
597

爬虫抓取的资料想分列存取在tsv上,试过很多方式都没有办法成功存存取成两列资讯。
想存取为数字爬取的资料一列,底下类型在第二列

from urllib.request import urlopen
from bs4 import BeautifulSoup
import re
import csv

html = urlopen("http://www.app12345.com/?area=tw&store=Apple%20Store")
bs0bj = BeautifulSoup (html)


def GPname():
    GPnameList = bs0bj.find_all("dd",{"class":re.compile("ddappname")})
    str = ''
    for name in GPnameList:
        str += name.get_text()
        str += '\n'
        print(name.get_text())

    return str


def GPcompany():

    GPcompanyname = bs0bj.find_all("dd",{"style":re.compile("color")})
    str = ''
    for cpa in GPcompanyname:
        str += cpa.get_text()
        str += '\n'
        print(cpa.get_text())
    return str




with open('0217.tsv','w',newline='',encoding='utf-8') as f:
    f.write(GPname())
    f.write(GPcompany())

f.close()

可能对zip不熟悉,存取下来之后变成一个字一格
也找到这篇参考,但怎么尝试都没有办法成功
https://segmentfault.com/q/10...

天蓬老师
天蓬老师

欢迎选择我的课程,让我们一起见证您的进步~~

모든 응답(1)
刘奇

csv 파일을 작성하는 것은 쉽습니다. 구조적 데이터는 [["1. Dongsen News Cloud", "News"], ["2. Dawn of world(세계의 새벽)", "Game"]과 같아야 합니다. ]

으아악
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿