Jadual Kandungan
Kaedah 1: Kaedah brute force cracking
Algoritma
Tatabahasa
Contoh
Output
Kaedah 2: Gunakan kaedah terbina dalam
输出
结论
Rumah pembangunan bahagian belakang Tutorial Python Dapatkan bilangan aksara, perkataan, ruang dan baris dalam fail menggunakan Python

Dapatkan bilangan aksara, perkataan, ruang dan baris dalam fail menggunakan Python

Sep 02, 2023 pm 12:33 PM
dokumen Bilangan aksara bilangan perkataan

Dapatkan bilangan aksara, perkataan, ruang dan baris dalam fail menggunakan Python

Analisis fail teks ialah tugas penting dalam pelbagai pemprosesan data dan aplikasi pemprosesan bahasa semula jadi. Python ialah bahasa pengaturcaraan yang serba boleh dan berkuasa yang menyediakan pelbagai ciri terbina dalam dan perpustakaan untuk melaksanakan tugas tersebut dengan cekap. Dalam artikel ini, kami akan meneroka cara mengira bilangan aksara, perkataan, ruang dan baris dalam fail teks menggunakan Python.

Kaedah 1: Kaedah brute force cracking

Dalam kaedah ini, kami akan membangunkan logik kami sendiri secara brute force dan mengambil fail teks sebagai input dan mengira bilangan aksara, perkataan, ruang dan baris dalam fail. Dalam kaedah ini kami tidak akan menggunakan sebarang kaedah terbina dalam.

Algoritma

  • Gunakan fungsi open() untuk membuka fail dalam mod baca.

  • Mulakan pembolehubah untuk menjejaki bilangan aksara, perkataan, ruang dan baris.

  • Baca fail baris demi baris menggunakan gelung.

  • Untuk setiap baris, tambah bilangan baris.

  • Tingkatkan bilangan aksara mengikut panjang baris.

  • Pisah baris menjadi perkataan menggunakan kaedah split().

  • Tingkatkan bilangan perkataan dengan bilangan perkataan dalam baris.

  • Kira bilangan ruang dengan menolak bilangan perkataan daripada panjang baris dengan satu.

  • Tutup fail.

  • Cetak hasilnya.

Tatabahasa

string.split(separator, maxsplit)
Salin selepas log masuk

Rentetan di sini ialah rentetan untuk dibelah. pembatas (pilihan) ialah pembatas yang digunakan untuk membelah rentetan. Lalai kepada ruang jika tidak dinyatakan, maxsplit (pilihan) ialah bilangan maksimum pemisahan untuk dilakukan. Jika tidak dinyatakan, semua kejadian pembatas akan digunakan.

len(sequence)
Salin selepas log masuk

Jujukan di sini ialah urutan (rentetan, senarai, tuple, dll.) yang anda ingin cari panjangnya.

Contoh

Dalam contoh di bawah, fungsi analyze_text_file() mengambil laluan fail sebagai parameter. Di dalam fungsi, fungsi open() digunakan untuk membuka pengurus fail dalam mod baca (dengan pernyataan) menggunakan konteks untuk memastikan fail ditutup dengan betul selepas diproses. Empat pembolehubah (kira_huruf, kiraan_kata, kiraan_ruang, kiraan_baris) dimulakan kepada sifar untuk menjejaki kiraan masing-masing. Gelung melalui setiap baris dalam fail. Untuk setiap baris, kiraan baris ditambah. Panjang baris ditambah pada kiraan aksara. Pisahkan baris kepada perkataan menggunakan kaedah split(), yang memisahkan baris pada aksara ruang putih. Tambahkan bilangan perkataan dalam baris pada kiraan perkataan. Kiraan ruang dikira dengan menolak satu daripada bilangan perkataan dalam baris, kerana ruang adalah kurang satu daripada bilangan perkataan. Selepas semua baris telah diproses, fail akan ditutup secara automatik oleh pengurus konteks. Akhirnya, keputusan dicetak, menunjukkan bilangan aksara, perkataan, ruang dan baris.

def analyze_text_file(file_path):
    try:
        with open(file_path, 'r') as file:
            char_count = 0
            word_count = 0
            space_count = 0
            line_count = 0

            for line in file:
                line_count += 1
                char_count += len(line)
                words = line.split()
                word_count += len(words)
                space_count += len(words) - 1

            print("File analysis summary:")
            print("Character count:", char_count)
            print("Word count:", word_count)
            print("Space count:", space_count)
            print("Line count:", line_count)

    except FileNotFoundError:
        print("File not found!")

# Usage
file_path = "sample.txt"  # Replace with your file path
analyze_text_file(file_path)
Salin selepas log masuk

Output

File not found!
Salin selepas log masuk
Salin selepas log masuk

Kaedah 2: Gunakan kaedah terbina dalam

Dalam kaedah ini, kita boleh menggunakan beberapa fungsi terbina dalam dan modul sistem pengendalian untuk mengira bilangan aksara, perkataan, ruang dan baris dalam fail.

Algoritma

  • Tentukan fungsi yang dipanggil analysis_text_file(file_path) yang mengambil laluan fail sebagai parameter.

  • Dalam fungsi, gunakan percubaan− kecuali blok untuk mengendalikan kemungkinan FileNotFoundError.

  • Dalam blok cuba, gunakan fungsi open() untuk membuka fail menggunakan fail_path dalam mod baca.

  • Gunakan pengurus konteks (dengan pernyataan) untuk memastikan pengendalian fail yang betul dan menutup fail secara automatik.

  • Gunakan kaedah read() untuk membaca keseluruhan kandungan fail dan menyimpannya dalam pembolehubah yang dipanggil kandungan.

  • Kira kiraan aksara dengan menggunakan fungsi len() pada rentetan kandungan dan tetapkan ia kepada char_count.

  • Kira bilangan perkataan dengan membelah rentetan kandungan pada aksara ruang putih menggunakan kaedah split(), kemudian gunakan fungsi len() pada senarai yang terhasil. Tetapkan keputusan kepada word_count.

  • Kira bilangan ruang dalam rentetan kandungan menggunakan kaedah count() dengan parameter " ". Tetapkan hasilnya kepada space_count.

  • Gunakan kaedah count() dengan parameter "n" untuk mengira bilangan baris baharu dalam rentetan kandungan. Tetapkan keputusan kepada line_count.

  • Cetak ringkasan analisis dengan memaparkan bilangan aksara, perkataan, ruang dan baris.

  • Dalam blok kecuali, tangkap FileNotFoundError dan cetak mesej "Fail tidak dijumpai

  • Tamat fungsi.

  • Di luar fungsi, tentukan pembolehubah laluan_fail yang mengandungi laluan ke fail untuk dianalisis.

  • Panggil fungsi analysis_text_file(file_path) dan lulus file_path sebagai parameter.

Contoh

Dalam contoh di bawah, fungsi analyze_text_file() mengambil laluan fail sebagai parameter. Di dalam fungsi, fungsi open() digunakan untuk membuka fail dalam mod baca menggunakan pengurus konteks.

在文件对象上调用 read() 方法,将文件的全部内容读取到名为 content 的字符串变量中。使用内置函数和方法:len(content) 计算通过确定内容的长度来计算字符数 string.len(content.split()) 通过在空白字符处拆分内容字符串并计算结果列表的 length.content 来计算字数。 count(' ') 使用 count() 方法计算内容字符串中空格的数量。content.count('\n') 计算内容中换行符的数量字符串,对应行数。打印结果,显示字符数、字数、空格数和行数。

def analyze_text_file(file_path):
    try:
        with open(file_path, 'r') as file:
            content = file.read()

            char_count = len(content)
            word_count = len(content.split())
            space_count = content.count(' ')
            line_count = content.count('\n')

            print("File analysis summary:")
            print("Character count:", char_count)
            print("Word count:", word_count)
            print("Space count:", space_count)
            print("Line count:", line_count)

    except FileNotFoundError:
        print("File not found!")

# Usage
file_path = "sample.txt"  # Replace with your file path
analyze_text_file(file_path)
Salin selepas log masuk

输出

File not found!
Salin selepas log masuk
Salin selepas log masuk

结论

在本文中,我们讨论了如何使用 Python 强力方法以及内置方法来计算文件中的单词数、空格数和行数。通过利用这些内置函数和方法,您可以实现相同的任务以简洁有效的方式分析文本文件。请记住将 file_path 变量中的“sample.txt”替换为您所需的文本文件的路径。本文中描述的两种方法都提供了使用 Python 分析和提取文本文件信息的有效方法,使您可以执行进一步的数据处理和分析基于获得的计数。

Atas ialah kandungan terperinci Dapatkan bilangan aksara, perkataan, ruang dan baris dalam fail menggunakan Python. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
2 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Repo: Cara menghidupkan semula rakan sepasukan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Adventure: Cara mendapatkan biji gergasi
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana untuk memulihkan fail WeChat yang telah tamat tempoh Bolehkah fail WeChat yang telah tamat tempoh dipulihkan? Bagaimana untuk memulihkan fail WeChat yang telah tamat tempoh Bolehkah fail WeChat yang telah tamat tempoh dipulihkan? Feb 22, 2024 pm 02:46 PM

Buka WeChat, pilih Tetapan dalam Saya, pilih Umum dan kemudian pilih Ruang Storan, pilih Pengurusan dalam Ruang Storan, pilih perbualan di mana anda ingin memulihkan fail dan pilih ikon tanda seru. Tutorial Model Berkenaan: iPhone13 Sistem: iOS15.3 Versi: WeChat 8.0.24 Analisis 1 Mula-mula buka WeChat dan klik pilihan Tetapan pada halaman Saya. 2 Kemudian cari dan klik Pilihan Umum pada halaman tetapan. 3Kemudian klik Ruang Storan pada halaman umum. 4 Seterusnya, klik Urus pada halaman ruang storan. 5Akhir sekali, pilih perbualan di mana anda ingin memulihkan fail dan klik ikon tanda seru di sebelah kanan. Tambahan: Fail WeChat biasanya tamat tempoh dalam beberapa hari Jika fail yang diterima oleh WeChat belum diklik, sistem WeChat akan mengosongkannya selepas 72 jam Jika fail WeChat telah dilihat.

Persediaan untuk penyingkiran mengambil masa yang lama dalam Windows 11/10 Persediaan untuk penyingkiran mengambil masa yang lama dalam Windows 11/10 Feb 19, 2024 pm 07:42 PM

Dalam artikel ini, kami akan memperkenalkan cara menyelesaikan masalah gesaan "Bersedia untuk memadam" apabila memadam fail atau folder dalam sistem Windows. Gesaan ini bermakna sistem sedang menjalankan beberapa operasi latar belakang, seperti menyemak kebenaran fail, mengesahkan sama ada fail itu diduduki oleh program lain, mengira saiz item yang akan dipadamkan, dsb. Kami akan memberikan anda beberapa penyelesaian untuk memastikan anda berjaya memadamkan fail anda tanpa menunggu terlalu lama. Mengapakah Windows mengambil masa yang lama untuk memadam fail? Masa yang diperlukan Windows untuk menyediakan fail untuk pemadaman dipengaruhi oleh pelbagai faktor, termasuk saiz fail, kelajuan peranti storan dan proses latar belakang. Gesaan "Bersedia untuk memadam" yang panjang atau tersekat mungkin menunjukkan sumber sistem yang tidak mencukupi, ralat cakera atau isu sistem fail. wujud

Foto tidak boleh membuka fail ini kerana format tidak disokong atau fail rosak Foto tidak boleh membuka fail ini kerana format tidak disokong atau fail rosak Feb 22, 2024 am 09:49 AM

Di Windows, apl Photos ialah cara yang mudah untuk melihat dan mengurus foto dan video. Melalui aplikasi ini, pengguna boleh mengakses fail multimedia mereka dengan mudah tanpa memasang perisian tambahan. Walau bagaimanapun, kadangkala pengguna mungkin menghadapi beberapa masalah, seperti menghadapi mesej ralat "Fail ini tidak boleh dibuka kerana format tidak disokong" semasa menggunakan apl Foto atau kerosakan fail semasa cuba membuka foto atau video. Keadaan ini boleh mengelirukan dan menyusahkan pengguna, memerlukan beberapa penyiasatan dan pembetulan untuk menyelesaikan isu tersebut. Pengguna melihat ralat berikut apabila mereka cuba membuka foto atau video pada apl Foto. Maaf, Foto tidak boleh membuka fail ini kerana format tidak disokong atau fail pada masa ini

Bolehkah fail format Tmp dipadamkan? Bolehkah fail format Tmp dipadamkan? Feb 24, 2024 pm 04:33 PM

Fail format Tmp ialah format fail sementara yang biasanya dihasilkan oleh sistem atau program komputer semasa pelaksanaan. Tujuan fail ini adalah untuk menyimpan data sementara untuk membantu program berjalan dengan betul atau meningkatkan prestasi. Sebaik sahaja pelaksanaan program selesai atau komputer dimulakan semula, fail tmp ini selalunya tidak diperlukan lagi. Oleh itu, untuk fail format Tmp, ia pada asasnya boleh dipadam. Selain itu, pemadaman fail tmp ini boleh mengosongkan ruang cakera keras dan memastikan operasi normal komputer. Walau bagaimanapun, sebelum memadam fail format Tmp, kita perlu

Bagaimana untuk memindahkan fail dari Cakera Awan Quark ke Cakera Awan Baidu? Bagaimana untuk memindahkan fail dari Cakera Awan Quark ke Cakera Awan Baidu? Mar 14, 2024 pm 02:07 PM

Quark Netdisk dan Baidu Netdisk pada masa ini merupakan perisian Netdisk yang paling biasa digunakan untuk menyimpan fail Jika anda ingin menyimpan fail dalam Quark Netdisk ke Baidu Netdisk, bagaimana anda melakukannya? Dalam isu ini, editor telah menyusun langkah tutorial untuk memindahkan fail dari komputer Quark Network Disk ke Baidu Network Disk Mari kita lihat cara mengendalikannya. Bagaimana untuk menyimpan fail dari Cakera Rangkaian Quark ke Cakera Rangkaian Baidu? Untuk memindahkan fail daripada Cakera Rangkaian Quark ke Cakera Rangkaian Baidu, anda perlu memuat turun fail yang diperlukan terlebih dahulu daripada Cakera Rangkaian Quark, kemudian pilih folder sasaran dalam klien Cakera Rangkaian Baidu dan bukanya. Kemudian, seret dan lepaskan fail yang dimuat turun daripada Cakera Awan Quark ke dalam folder yang dibuka oleh klien Cakera Awan Baidu, atau gunakan fungsi muat naik untuk menambah fail pada Cakera Awan Baidu. Pastikan anda menyemak sama ada fail telah berjaya dipindahkan dalam Cakera Awan Baidu selepas muat naik selesai. Itu sahaja

Apa yang perlu dilakukan jika kod ralat 0x80004005 muncul Editor akan mengajar anda cara menyelesaikan kod ralat 0x80004005. Apa yang perlu dilakukan jika kod ralat 0x80004005 muncul Editor akan mengajar anda cara menyelesaikan kod ralat 0x80004005. Mar 21, 2024 pm 09:17 PM

Apabila memadam atau menyahmampat folder pada komputer anda, kadangkala kotak dialog segera "Ralat 0x80004005: Ralat Tidak Ditentukan" akan muncul Bagaimana anda harus menyelesaikan situasi ini? Sebenarnya terdapat banyak sebab mengapa kod ralat 0x80004005 digesa, tetapi kebanyakannya disebabkan oleh virus. Kami boleh mendaftarkan semula dll untuk menyelesaikan masalah tersebut . Sesetengah pengguna digesa dengan kod ralat 0X80004005 apabila menggunakan komputer mereka Ralat 0x80004005 disebabkan terutamanya oleh komputer tidak mendaftarkan fail perpustakaan pautan dinamik tertentu dengan betul, atau oleh tembok api yang tidak membenarkan sambungan HTTPS antara komputer dan Internet. Jadi bagaimana pula

Muat naik gagal, fail tidak boleh kosong, ralat tidak konsisten Muat naik gagal, fail tidak boleh kosong, ralat tidak konsisten Feb 19, 2024 pm 01:21 PM

Discorde ialah platform perkongsian fail yang popular, tetapi pengguna mungkin menghadapi ralat seperti kegagalan muat naik dan fail tidak boleh kosong semasa memuat naik fail. Walaupun belum ada penjelasan yang jelas, ralat ini mungkin muncul secara rawak, menghalang fail tertentu daripada dimuat naik, malah menghalang muat naik semula fail yang dihantar sebelum ini. Muat Naik Tetap Gagal, Fail Tidak Boleh Kosong Ralat Ketidakkonsistenan Ia boleh mengecewakan untuk mendapat ralat Fail Tidak Boleh Kosong apabila muat naik gagal. Berikut adalah beberapa cadangan penyelesaian yang kami harap dapat membantu. Berfungsi untuk pengguna iOS dan Android Sahkan fail Mampatkan fail sebelum berkongsinya Kemas Kini/Pasang Semula Ketidakkonsistenan 1] Berfungsi untuk pengguna iOS dan Android Dalam pengguna iPhone dan Android, kerana muat naik fail gagal dengan ralat

Apakah fail hiberfil.sys? Bolehkah hiberfil.sys dipadamkan? Apakah fail hiberfil.sys? Bolehkah hiberfil.sys dipadamkan? Mar 15, 2024 am 09:49 AM

Baru-baru ini, ramai netizen bertanya kepada editor, apakah itu fail hiberfil.sys? Bolehkah hiberfil.sys mengambil banyak ruang pemacu C dan dipadamkan? Editor boleh memberitahu anda bahawa fail hiberfil.sys boleh dipadamkan. Mari kita lihat butiran di bawah. hiberfil.sys ialah fail tersembunyi dalam sistem Windows dan juga fail hibernasi sistem. Ia biasanya disimpan dalam direktori akar pemacu C, dan saiznya bersamaan dengan saiz memori yang dipasang sistem. Fail ini digunakan apabila komputer sedang hibernasi dan mengandungi data memori sistem semasa supaya ia boleh dipulihkan dengan cepat kepada keadaan sebelumnya semasa pemulihan. Oleh kerana saiznya adalah sama dengan kapasiti memori, ia mungkin mengambil jumlah ruang cakera keras yang lebih besar. hiber

See all articles