ホームページ > バックエンド開発 > Python チュートリアル > Python ファイルデータの分析、管理、抽出について話しましょう

Python ファイルデータの分析、管理、抽出について話しましょう

WBOY
リリース: 2022-08-25 19:11:18
転載
1752 人が閲覧しました

[関連する推奨事項: Python3 ビデオ チュートリアル ]

前提条件の概要

Python2.0 は直接読み取ることができません中国語のパスを選択する場合の問題には、別の関数を作成する必要があります。 python3.0 は 2018 では直接読み込むことができません。

今使ってみると、python3.0は中国語のパスを直接読み込めるようになっています。

複数の txt ファイルを持参または作成する必要があります。その中に何らかのデータ (名前、携帯電話番号、住所) を書き込んでおくとよいでしょう

必須

コードを書く いくつかの要件を自分で設定し、次の目標を明確にするのが最善の方法です。

  • 対応するディレクトリ パス内の対応するすべてのファイルを読み取る必要がある
  • 対応する各ファイルを読み取るファイルを 1 行ずつ txt ファイル レコードにします
  • 正規表現を使用して各行の携帯電話番号を取得します
  • 携帯電話番号を Excel に保存します

アイデア

  • 1) ファイルの読み取り
  • 2) データの読み取り
  • 3) データの並べ替え
  • 4) 正規表現のマッチング
  • 5) データの再実行
  • #6) データのエクスポートと保存
  • #コード
import glob
import re
import xlwt
filearray=[]
data=[]
phone=[]
filelocation=glob.glob(r'课堂实训/*.txt')
print(filelocation)
for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)
combine_data=sum(data,[])

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')
ログイン後にコピー

実行結果

#Excel ファイルを生成します

分析

import glob
import re
import xlwt
ログイン後にコピー

globe は正規表現でファイルを見つけるために使用されます。 xlwt は Excel に使用されます

1) ファイルの読み取り

filelocation=glob.glob(r'课堂实训/*.txt')
ログイン後にコピー

指定されたディレクトリ内のすべての txt ファイル

2) データの読み取り

for i in range(len(filelocation)):
file =open(filelocation[i])
file_data=file.readlines()
data.append(file_data)
print(data)
ログイン後にコピー

txt ファイルの読み取りループ内のパスで、シリアル番号順にファイルを読み取ります

各サイクルに対応するファイルを開きます

各サイクルの txt ファイルのデータを 1 行ずつ読み取ります

append() メソッドを使用して、各行のデータを data に追加します。
リストに出力すると、同じリスト内に複数の txt ファイルのデータが文字列の形式で存在することがわかります。

3) データの並べ替え

combine_data=sum(data,[])
ログイン後にコピー

リストは 1 つのリストにマージされます

4) 正規表現マッチングとデータ重複排除

print(combine_data)
for a in combine_data:
data1=re.search(r'[0-9]{11}',a)
phone.append(data1[0])
phone=list(set(phone))
print(phone)
print(len(phone))
ログイン後にコピー

set() 関数:

順序なし重複排除、順序なしの非順序セットを作成します。 -繰り返し要素

6) データのエクスポートと保存

#存到excel中
f=xlwt.Workbook('encoding=utf-8')
sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True)
for i in range(len(phone)):
sheet1.write(i,0,phone[i])
f.save('phonenumber.xls')
ログイン後にコピー

##Workbook('encoding=utf-8'):

ワークブックのエンコーディングを設定します
  • add_sheet('sheet1',cell_overwrite_ok=True): 対応するワークシートを作成します
  • write(x,y,z):パラメータは行に対応します、列、および値
  • 【関連する推奨事項: Python3 ビデオ チュートリアル
  • ]

以上がPython ファイルデータの分析、管理、抽出について話しましょうの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

関連ラベル:
ソース:jb51.net
このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。
最新の問題
人気のチュートリアル
詳細>
最新のダウンロード
詳細>
ウェブエフェクト
公式サイト
サイト素材
フロントエンドテンプレート