


Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python
[Cadangan berkaitan: Tutorial video Python3]
Ringkasan prasyarat
Python 2.0 tidak boleh dibaca secara langsung masalah mengambil jalan Cina memerlukan penulisan fungsi lain. python3.0 tidak boleh dibaca secara langsung pada tahun 2018.
Apabila saya menggunakannya sekarang, saya mendapati bahawa python3.0 boleh terus membaca laluan Cina.
Anda perlu membawa atau mencipta beberapa fail txt Adalah lebih baik untuk menulis beberapa data di dalamnya (nama, nombor telefon mudah alih, alamat)
Keperluan
Tulis kod Masa terbaik ialah menetapkan sendiri beberapa keperluan dan jelaskan matlamat berikut:
- Perlu membaca semua fail yang sepadan dalam laluan direktori yang sepadan
- Baca setiap satu rekod fail txt baris demi baris yang sepadan
- Gunakan ungkapan biasa untuk mendapatkan nombor telefon mudah alih setiap baris
- Simpan nombor telefon mudah alih dalam excel
Idea
- 1) Baca fail
- 2) Baca data
- 3) Pengisihan data
- 4) Pemadanan ungkapan biasa
- 5) Pembuangan data Semula-
- 6) Eksport dan simpan data
Kod
import glob import re import xlwt filearray=[] data=[] phone=[] filelocation=glob.glob(r'课堂实训/*.txt') print(filelocation) for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data) combine_data=sum(data,[]) print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone)) #存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')
Hasil berjalan
akan dijana Fail excel
analisis
import glob import re import xlwt
glob digunakan untuk mencari fail, ungkapan biasa semula, xlwt digunakan Dalam excel
1) Baca fail
filelocation=glob.glob(r'课堂实训/*.txt')
Semua fail txt dalam direktori yang ditentukan
2) Baca data
for i in range(len(filelocation)): file =open(filelocation[i]) file_data=file.readlines() data.append(file_data) print(data)
Fail txt di bawah laluan dibaca dalam gelung dan fail dibaca mengikut urutan mengikut nombor siri
Buka fail yang sepadan dengan setiap kitaran
Baca data fail txt dalam setiap kitaran baris demi baris
Gunakan kaedah append() Tambahkan data setiap baris pada senarai data
Outputnya, anda boleh melihat beberapa data fail txt disimpan dalam senarai yang sama dalam bentuk lajur aksara
3) Pengisihan data
combine_data=sum(data,[])
Senarai digabungkan menjadi satu senarai
4) Pemadanan ungkapan biasa ditambah penyahduplikasian data
print(combine_data) for a in combine_data: data1=re.search(r'[0-9]{11}',a) phone.append(data1[0]) phone=list(set(phone)) print(phone) print(len(phone))
set() fungsi: Penyahduplikasi tidak tertib, cipta Set elemen tidak berulang yang tidak tertib
6) Eksport data dan simpan
#存到excel中 f=xlwt.Workbook('encoding=utf-8') sheet1=f.add_sheet('sheet1',cell_overwrite_ok=True) for i in range(len(phone)): sheet1.write(i,0,phone[i]) f.save('phonenumber.xls')
- Buku kerja(' encoding=utf-8'): Tetapkan Pengekodan buku kerja
- add_sheet('sheet1',cell_overwrite_ok=True):Buat lembaran kerja yang sepadan
- write(x,y,z):Parameter sepadan dengan baris, lajur dan nilai
[Cadangan berkaitan: Tutorial video Python3]
Atas ialah kandungan terperinci Mari bercakap tentang analisis, pengurusan dan pengekstrakan data fail python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Anda boleh mempelajari konsep pengaturcaraan asas dan kemahiran Python dalam masa 2 jam. 1. Belajar Pembolehubah dan Jenis Data, 2.

Python digunakan secara meluas dalam bidang pembangunan web, sains data, pembelajaran mesin, automasi dan skrip. 1) Dalam pembangunan web, kerangka Django dan Flask memudahkan proses pembangunan. 2) Dalam bidang sains data dan pembelajaran mesin, numpy, panda, scikit-learn dan perpustakaan tensorflow memberikan sokongan yang kuat. 3) Dari segi automasi dan skrip, Python sesuai untuk tugas -tugas seperti ujian automatik dan pengurusan sistem.

Tidak mustahil untuk melihat kata laluan MongoDB secara langsung melalui Navicat kerana ia disimpan sebagai nilai hash. Cara mendapatkan kata laluan yang hilang: 1. Tetapkan semula kata laluan; 2. Periksa fail konfigurasi (mungkin mengandungi nilai hash); 3. Semak Kod (boleh kata laluan Hardcode).

Sebagai profesional data, anda perlu memproses sejumlah besar data dari pelbagai sumber. Ini boleh menimbulkan cabaran kepada pengurusan data dan analisis. Nasib baik, dua perkhidmatan AWS dapat membantu: AWS Glue dan Amazon Athena.

Langkah -langkah untuk memulakan pelayan Redis termasuk: Pasang Redis mengikut sistem operasi. Mulakan perkhidmatan Redis melalui Redis-server (Linux/macOS) atau redis-server.exe (Windows). Gunakan redis-cli ping (linux/macOS) atau redis-cli.exe ping (windows) perintah untuk memeriksa status perkhidmatan. Gunakan klien Redis, seperti redis-cli, python, atau node.js untuk mengakses pelayan.

Untuk membaca giliran dari Redis, anda perlu mendapatkan nama giliran, membaca unsur -unsur menggunakan arahan LPOP, dan memproses barisan kosong. Langkah-langkah khusus adalah seperti berikut: Dapatkan nama giliran: Namakannya dengan awalan "giliran:" seperti "giliran: my-queue". Gunakan arahan LPOP: Keluarkan elemen dari kepala barisan dan kembalikan nilainya, seperti LPOP Queue: My-Queue. Memproses Baris kosong: Jika barisan kosong, LPOP mengembalikan nihil, dan anda boleh menyemak sama ada barisan wujud sebelum membaca elemen.

Soalan: Bagaimana untuk melihat versi pelayan Redis? Gunakan alat perintah Redis-cli -version untuk melihat versi pelayan yang disambungkan. Gunakan arahan pelayan INFO untuk melihat versi dalaman pelayan dan perlu menghuraikan dan mengembalikan maklumat. Dalam persekitaran kluster, periksa konsistensi versi setiap nod dan boleh diperiksa secara automatik menggunakan skrip. Gunakan skrip untuk mengautomasikan versi tontonan, seperti menyambung dengan skrip Python dan maklumat versi percetakan.

Keselamatan kata laluan Navicat bergantung pada gabungan penyulitan simetri, kekuatan kata laluan dan langkah -langkah keselamatan. Langkah -langkah khusus termasuk: menggunakan sambungan SSL (dengan syarat bahawa pelayan pangkalan data menyokong dan mengkonfigurasi sijil dengan betul), mengemas kini Navicat, menggunakan kaedah yang lebih selamat (seperti terowong SSH), menyekat hak akses, dan yang paling penting, tidak pernah merakam kata laluan.
