Pythonで顧客データを保存する方法

coldplay.xixi
リリース: 2020-08-29 11:33:43
オリジナル
2267 人が閲覧しました

Python で顧客データを保存する方法: 1. [with open()] を使用して新しいオブジェクトを作成し、データを書き込みます; 2. pandas パッケージを使用して保存します、コードは [import pandas as pd] です#パンダをインポート]。

Pythonで顧客データを保存する方法

関連する学習の推奨事項: Python チュートリアル ]

Python で常に顧客データを保存するためのメソッド:

1. open 関数で保存

open() とともに使用して新しいオブジェクトを作成します

データの書き込み (ここでは例として、Douban Reading の本の Douban の短いレビューを使用します)

import requests
from lxml import etree
 
#发送Request请求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在写代码的时候可以将读取的内容打印一下
 
#保存数据open函数
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f
    for i in comments:
        print(i)
        f.write(i+'\n')#写入数据,文件保存在上面指定的目录,加\n为了换行更方便阅读
ログイン後にコピー

ここで参照しているのは、open 関数のオープン モードです

パラメータの使用法

  • #r 読み取り読み取り専用。ファイルが存在しない場合は、エラーが報告されます。

  • #w 書き込みは書き込みのみです。ファイルが存在しない場合は、自動的に作成されます。

  • 追加はファイルの末尾に追加されます。

  • #rb、wb、ab はバイナリで動作します
  • r オープン読み取りおよび書き込みモード
# #2. pandas パッケージの保存

Pandas と言えば、それに関連する 2 つのデータ分析ツール パッケージについて話さなければなりません (注: pandas、numpy、matplotlib はすべて事前にインストールする必要があります。インストールの詳細については、前のブログ投稿を参照してください。 pip インストール パッケージについて)

    numpy: (Numerical Python の略) は、高性能科学計算およびデータ分析のための基本パッケージです
  • pandas: データ分析を容易にする高度なデータ構造と操作ツールを含む Numpy ベースの Python パッケージ
  • matplotlib: プロット パッケージです出版品質のグラフ (主に 2D) を作成するための
  • import pandas as pd #导入pandas
    import numpy as np #导入numpy
    import matplotlib.pypolt as plt #导入matplotlib  
    ログイン後にコピー
  • 次に、パンダが CSV と Excel にデータを保存する方法を示します
#导入包
import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(10,4))#创建随机值
 
#print(df.head(2))#查看数据框的头部数据,默认不写为前5行,小于5行时全部显示;也可以自定义查看几行
print(df.tail())##查看数据框的尾部数据,默认不写为倒数5行,小于5行时全部显示;也可以自定义查看倒数几行
 
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpy.csv')#存储到CSV中
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpy.xlsx')#存储到Excel中(需要提前导入库 pip install openpyxl)
实例中保存豆瓣读书的短评代码如下:
import requests
from lxml import etree
 
#发送Request请求
url = 'https://book.douban.com/subject/1054917/comments/'
head = {'User-Agent':'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.94 Safari/537.36'}
 
#解析HTML
r = requests.get(url, headers=head)
s = etree.HTML(r.text)
comments = s.xpath('//div[@class="comment"]/p/text()')
#print(str(comments))#在写代码的时候可以将读取的内容打印一下
 
'''
#保存数据open函数
with open('D:/PythonWorkSpace/TestData/pinglun.txt','w',encoding='utf-8') as f:#使用with open()新建对象f
    for i in comments:
        print(i)
        f.write(i+'\n')#写入数据,文件保存在上面指定的目录,加\n为了换行更方便阅读
'''
 
#保存数据pandas函数   到CSV 和Excel
import pandas as pd
df = pd.DataFrame(comments)
#print(df.head())#head()默认为前5行
df.to_csv('D:/PythonWorkSpace/TestData/PandasNumpyCSV.csv')
#df.to_excel('D:/PythonWorkSpace/TestData/PandasNumpyEx.xlsx')
ログイン後にコピー

関連する学習については、
php トレーニング

列に注目してください。

以上がPythonで顧客データを保存する方法の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:php.cn
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート