Heim > Backend-Entwicklung > Python-Tutorial > Erhalten Sie das gesamte Wissen über das Lesen von Dateien in Python in einem Artikel

Erhalten Sie das gesamte Wissen über das Lesen von Dateien in Python in einem Artikel

WBOY
Freigeben: 2023-04-11 23:22:07
nach vorne
1282 Leute haben es durchsucht

Erhalten Sie das gesamte Wissen über das Lesen von Dateien in Python in einem Artikel

Dateien sind überall, egal welche Programmiersprache wir verwenden, die Verarbeitung von Dateien ist für jeden Programmierer unerlässlich.

Die Dateiverarbeitung ist eine Methode zum Erstellen von Dateien, zum Schreiben von Daten und zum Lesen aus ihnen. Beim Abrufen von Daten hat Python die Möglichkeit, Dateien zu erstellen eine Fülle von Paketen für die Verarbeitung verschiedener Dateitypen, die es uns ermöglichen, die Dateiverarbeitung einfacher und bequemer abzuschließen

Überblick über diesen Artikel:

  • Verwenden Sie den Kontextmanager, um Dateien zu öffnen
  • Im Python-Dateilesemodus
  • Textdatei lesen
  • CSV-Datei lesen
  • JSON-Datei lesen

Datei öffnen

Bevor wir auf den Inhalt der Datei zugreifen können, müssen wir die Datei öffnen. Python bietet eine integrierte Funktion, die uns hilft, Dateien in verschiedenen Modi zu öffnen. Die open()-Funktion akzeptiert zwei grundlegende Parameter: Dateiname und Modus

Der Standardmodus ist „r“, wodurch die Datei im schreibgeschützten Modus geöffnet wird. Diese Modi definieren, wie wir auf eine Datei zugreifen und wie wir ihren Inhalt bearbeiten. Die open()-Funktion bietet mehrere verschiedene Modi, wir werden sie später einzeln besprechen

Jetzt verwenden wir die Datei „Zen of Python“, um sie später zu diskutieren und zu lernen

f = open('zen_of_python.txt', 'r')
print(f.read())
f.close()
Nach dem Login kopieren

Ausgabe:

The Zen of Python, by Tim Peters
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
...
Nach dem Login kopieren
Nach dem Login kopieren

Öffnen Sie im obigen Code Die Funktion () öffnet eine Textdatei im schreibgeschützten Modus, sodass wir Informationen aus der Datei abrufen können, ohne sie zu ändern. In der ersten Zeile wird die Ausgabe der open()-Funktion einem Objekt f zugewiesen, das die Textdatei darstellt. In der zweiten Zeile verwenden wir die read()-Methode, um die gesamte Datei zu lesen und ihren Inhalt auszugeben. )-Methode steht in der letzten Zeile. Es ist wichtig zu beachten, dass wir offene Dateien nach der Verarbeitung immer schließen müssen, um unsere Computerressourcen freizugeben und das Auslösen von Ausnahmen zu vermeiden.

In Python können wir den Kontextmanager with verwenden, um sicherzustellen, dass das Programm die verwendeten Ressourcen freigibt, nachdem die Datei geöffnet wurde geschlossen, Dies gilt auch dann, wenn eine Ausnahme auftritt

with open('zen_of_python.txt') as f:
 print(f.read())
Nach dem Login kopieren

Ausgabe:

The Zen of Python, by Tim Peters
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
...
Nach dem Login kopieren
Nach dem Login kopieren

Der obige Code erstellt mithilfe der with-Anweisung einen Kontext und bindet ihn an die Variable f, über die alle Dateiobjektmethoden auf das Dateiobjekt zugreifen können. Die read()-Methode liest die gesamte Datei in der zweiten Zeile und verwendet dann die print()-Funktion, um den Dateiinhalt auszugeben.

Wenn das Programm das Ende des with-Anweisungsblockkontexts erreicht, schließt es die Datei, um Ressourcen freizugeben und sicherzustellen dass andere Programme sie normal aufrufen können. Wenn wir uns mit Objekten befassen, die nicht mehr verwendet werden müssen und sofort geschlossen werden müssen (z. B. Dateien, Datenbanken und Netzwerkverbindungen), wird die Verwendung der with-Anweisung dringend empfohlen

Was hier beachtet werden muss, ist, dass sogar Nach dem Verlassen des with context manager-Blocks können wir auch auf die f-Variable zugreifen, die Datei wird jedoch geschlossen. Probieren wir einige Dateiobjekteigenschaften aus und prüfen wir, ob die Variablen noch vorhanden und zugänglich sind:

print("Filename is '{}'.".format(f.name))
if f.closed:
 print("File is closed.")
else:
 print("File isn't closed.")
Nach dem Login kopieren

Ausgabe:

Filename is 'zen_of_python.txt'.
File is closed.
Nach dem Login kopieren

Aber zu diesem Zeitpunkt ist es nicht möglich, aus der Datei zu lesen oder in sie zu schreiben, kein Zugriff beim Schließen der Datei. Jeder Versuch mit Sein Inhalt führt zu folgendem Fehler:

f.read()
Nach dem Login kopieren

Ausgabe:

---------------------------------------------------------------------------
ValueErrorTraceback (most recent call last)
~AppDataLocalTemp/ipykernel_9828/3059900045.py in <module>
----> 1 f.read()
ValueError: I/O operation on closed file.
Nach dem Login kopieren

Dateilesemodus in Python

Wie bereits erwähnt, müssen wir beim Öffnen einer Datei den Modus angeben. Die folgende Tabelle zeigt die verschiedenen Dateimodi in Python:

Modusbeschreibung

  • 'r' öffnet eine schreibgeschützte Datei
  • 'w' öffnet eine Datei zum Schreiben. Wenn die Datei existiert, wird sie überschrieben, andernfalls wird eine neue Datei erstellt
  • 'a' öffnet eine Datei nur zum Anhängen. Wenn die Datei nicht existiert, wird sie erstellt
  • 'x' erstellt eine neue Datei. Fehler, wenn Datei vorhanden ist
  • '+' Öffnen Sie eine Datei zur Aktualisierung

Wir können auch angeben, dass die Datei im Textmodus „t“, im Standardmodus oder im Binärmodus „b“ geöffnet werden soll. Sehen wir uns an, wie man die Bilddatei dataquest_logo.png mit einer einfachen Anweisung kopiert:

with open('dataquest_logo.png', 'rb') as rf:
 with open('data_quest_logo_copy.png', 'wb') as wf:
 for b in rf:
 wf.write(b)
Nach dem Login kopieren

Der obige Code kopiert das Dataquest-Logobild und speichert es im selben Pfad. Der Modus „rb“ öffnet die Datei im Binärmodus zum Lesen, während der Modus „wb“ die Datei im Textmodus zum parallelen Schreiben öffnet.

Lesen von Textdateien

Es gibt mehrere Möglichkeiten, Textdateien in Python zu lesen. Nachfolgend stellen wir einige nützliche vor Methoden zum Lesen des Inhalts von Textdateien

Bisher haben wir gelernt, dass mit der Methode read() der gesamte Inhalt einer Datei gelesen werden kann. Wenn wir nur ein paar Bytes aus der Textdatei lesen möchten, können wir die Anzahl der Bytes in der Methode read() angeben. Probieren wir es aus:

with open('zen_of_python.txt') as f:
 print(f.read(17))
Nach dem Login kopieren

Ausgabe:

The Zen of Python
Nach dem Login kopieren

Der einfache Code oben liest die ersten 17 Bytes der Datei zen_of_python.txt und druckt sie aus

Manchmal ist es sinnvoller, den Inhalt einer Textdatei zeilenweise zu lesen einmal, in In diesem Fall können wir die Methode readline() verwenden

with open('zen_of_python.txt') as f:
 print(f.readline())
Nach dem Login kopieren

Ausgabe:

The Zen of Python, by Tim Peters
Nach dem Login kopieren

Der obige Code gibt die erste Zeile der Datei zurück, und wenn wir die Methode erneut aufrufen, wird die zweite Zeile zurückgegeben die Datei usw. wie folgt:

with open('zen_of_python.txt') as f:
 print(f.readline())
 print(f.readline())
 print(f.readline())
 print(f.readline())
Nach dem Login kopieren

Ausgabe:

The Zen of Python, by Tim Peters
Beautiful is better than ugly.
Explicit is better than implicit.
Nach dem Login kopieren

Diese nützliche Methode kann uns helfen, die gesamte Datei inkrementell zu lesen.

以下代码通过逐行迭代来输出整个文件,直到跟踪我们正在读取或写入文件的位置的文件指针到达文件末尾。当 readline() 方法到达文件末尾时,它返回一个空字符串

with open('zen_of_python.txt') as f:
 line = f.readline()
 while line:
 print(line, end='')
 line = f.readline()
Nach dem Login kopieren

Output:

The Zen of Python, by Tim Peters
Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
Nach dem Login kopieren

上面的代码在 while 循环之外读取文件的第一行并将其分配给 line 变量。在 while 循环中,它打印存储在 line 变量中的字符串,然后读取文件的下一行。while 循环迭代该过程,直到 readline() 方法返回一个空字符串。空字符串在 while 循环中的计算结果为 False,因此迭代过程终止

读取文本文件的另一个有用方法是 readlines() 方法,将此方法应用于文件对象会返回包含文件每一行的字符串列表

with open('zen_of_python.txt') as f:
 lines = f.readlines()
Nach dem Login kopieren

让我们检查 lines 变量的数据类型,然后打印它:

print(type(lines))
print(lines)
Nach dem Login kopieren

Output:

<class 'list'>
['The Zen of Python, by Tim Petersn', 'n', 'Beaut...]
Nach dem Login kopieren

它是一个字符串列表,其中列表中的每个项目都是文本文件的一行,``n` 转义字符表示文件中的新行。此外,我们可以通过索引或切片操作访问列表中的每个项目:

print(lines)
print(lines[3:5])
print(lines[-1])
Nach dem Login kopieren

Output:

['The Zen of Python, by Tim Petersn', 'n', 'Beautiful is better than ugly.n', ... -- let's do more of those!"]
['Explicit is better than implicit.n', 'Simple is better than complex.n']
Namespaces are one honking great idea -- let's do more of those!
Nach dem Login kopieren

读取 CSV 文件

到目前为止,我们已经学会了如何使用常规文本文件。但是有时数据采用 CSV 格式,数据专业人员通常会检索所需信息并操作 CSV 文件的内容

接下来我们将使用 CSV 模块,CSV 模块提供了有用的方法来读取存储在 CSV 文件中的逗号分隔值。我们现在就尝试一下

import csv
with open('chocolate.csv') as f:
 reader = csv.reader(f, delimiter=',')
 for row in reader:
 print(row)
Nach dem Login kopieren

Output:

['Company', 'Bean Origin or Bar Name', 'REF', 'Review Date', 'Cocoa Percent', 'Company Location', 'Rating', 'Bean Type', 'Country of Origin']
['A. Morin', 'Agua Grande', '1876', '2016', '63%', 'France', '3.75', 'Âxa0', 'Sao Tome']
['A. Morin', 'Kpime', '1676', '2015', '70%', 'France', '2.75', 'Âxa0', 'Togo']
['A. Morin', 'Atsane', '1676', '2015', '70%', 'France', '3', 'Âxa0', 'Togo']
['A. Morin', 'Akata', '1680', '2015', '70%', 'France', '3.5', 'Âxa0', 'Togo']
...
Nach dem Login kopieren

CSV 文件的每一行形成一个列表,其中每个项目都可以轻松的被访问,如下所示:

import csv
with open('chocolate.csv') as f:
 reader = csv.reader(f, delimiter=',')
 for row in reader:
 print("The {} company is located in {}.".format(row[0], row[5]))
Nach dem Login kopieren

Output:

The Company company is located in Company Location.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The Acalli company is located in U.S.A..
The Acalli company is located in U.S.A..
The Adi company is located in Fiji.
...
Nach dem Login kopieren

很多时候,使用列的名称而不是使用它们的索引,这通常对专业人员来说更方便。在这种情况下,我们不使用 reader() 方法,而是使用返回字典对象集合的 DictReader() 方法

import csv
with open('chocolate.csv') as f:
 dict_reader = csv.DictReader(f, delimiter=',')
 for row in dict_reader:
 print("The {} company is located in {}.".format(row['Company'], row['Company Location']))
Nach dem Login kopieren

Output:

The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The A. Morin company is located in France.
The Acalli company is located in U.S.A..
The Acalli company is located in U.S.A..
The Adi company is located in Fiji.
...
Nach dem Login kopieren

读取 JSON 文件

我们主要用于存储和交换数据的另一种流行文件格式是 JSON,JSON 代表 JavaScript Object Notation,允许我们使用逗号分隔的键值对存储数据

接下来我们将加载一个 JSON 文件并将其作为 JSON 对象使用,而不是作为文本文件,为此我们需要导入 JSON 模块。然后在 with 上下文管理器中,我们使用了属于 json 对象的 load() 方法,它加载文件的内容并将其作为字典存储在上下文变量中。

import json
with open('movie.json') as f:
 content = json.load(f)
 print(content)
Nach dem Login kopieren

Output:

{'Title': 'Bicentennial Man', 'Release Date': 'Dec 17 1999', 'MPAA Rating': 'PG', 'Running Time min': 132, 'Distributor': 'Walt Disney Pictures', 'Source': 'Based on Book/Short Story', 'Major Genre': 'Drama', 'Creative Type': 'Science Fiction', 'Director': 'Chris Columbus', 'Rotten Tomatoes Rating': 38, 'IMDB Rating': 6.4, 'IMDB Votes': 28827}
Nach dem Login kopieren

让我们检查内容变量的数据类型:

print(type(content))
Nach dem Login kopieren

Output:

<class 'dict'>
Nach dem Login kopieren

它的数据类型是字典,因此我们可以方便的从中提取数据

print('{} directed by {}'.format(content['Title'], content['Director']))
Nach dem Login kopieren

Output:

Bicentennial Man directed by Chris Columbus
Nach dem Login kopieren

总结

今天我们讨论了 Python 中的文件处理,重点是读取文件的内容。我们了解了 open() 内置函数、with 上下文管理器,以及如何读取文本、CSV 和 JSON 等常见文件类型。

好了,这就是今天分享的全部内容,喜欢就点个赞吧~

Das obige ist der detaillierte Inhalt vonErhalten Sie das gesamte Wissen über das Lesen von Dateien in Python in einem Artikel. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Verwandte Etiketten:
Quelle:51cto.com
Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn
Beliebte Tutorials
Mehr>
Neueste Downloads
Mehr>
Web-Effekte
Quellcode der Website
Website-Materialien
Frontend-Vorlage