Wie verarbeitet Python Excel-Dateien?-Python-Tutorial-php.cn

Inhaltsverzeichnis

#🎜🎜 #Ich dachte, ich hätte die entsprechende Lösung gefunden und war begeistert, aber als ich sah, wie die Datenstruktur im Datenrahmen über openpyxl gelesen wurde, war ich schockiert. Da der Header meiner Excel-Tabelle ein relativ komplexer zweistufiger Header ist und es Situationen gibt, in denen Zellen im Header zusammengeführt und geteilt werden, folgt ein solcher Header nicht dem mehrstufigen, nachdem er von openpyxl in den Datenrahmen eingelesen wurde Header von Pandas. Der Index wird verarbeitet, aber einfach in einen numerischen Index 0123 verarbeitet...

Heim

Backend-Entwicklung

Python-Tutorial

Wie verarbeitet Python Excel-Dateien?

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

May 08, 2023 pm 05:58 PM

excel python

『Problembeschreibung』

Das zu verarbeitende Excel hat dieses Mal zwei Blätter, und der Wert des anderen Blattes muss basierend auf den Daten eines Blattes berechnet werden. Das Problem besteht darin, dass das zu berechnende Blatt nicht nur Zahlenwerte, sondern auch Formeln enthält. Werfen wir einen Blick darauf:

Wie verarbeitet Python Excel-Dateien?

Wie im Bild oben gezeigt, hat dieses Excel insgesamt zwei Blätter: CP und DS. Wir müssen bestimmte Geschäfte befolgen Regeln berechnen die Daten der entsprechenden Zelle in DS basierend auf den Daten in CP. Die blauen Kästchen im Bild enthalten Formeln, während andere Bereiche numerische Werte enthalten.

Mal sehen, ob wir der zuvor erwähnten Verarbeitungslogik folgen, Excel stapelweise auf einmal in den Datenrahmen einlesen und es dann stapelweise auf einmal zurückschreiben. Dieser Teil des Codes lautet wie folgt:

import pandas as pd
import xlwings as xw
 
#要处理的文件路径
fpath = "data/DS_format.xlsm"
 
#把CP和DS两个sheet的数据分别读入pandas的dataframe
cp_df = pd.read_excel(fpath,sheet_name="CP",header=[0])
ds_df = pd.read_excel(fpath,sheet_name="DS",header=[0,1])
 
#计算过程省略......
 
#保存结果到excel       
app = xw.App(visible=False,add_book=False)
ds_format_workbook = app.books.open(fpath)
ds_worksheet = ds_format_workbook.sheets["DS"]
ds_worksheet.range("A1").expand().options(index=False).value = ds_df 
ds_format_workbook.save()
ds_format_workbook.close()
app.quit()

Nach dem Login kopieren

Das Problem mit dem obigen Code besteht darin, dass die Formeln dies tun, wenn die Methode pd.read_excel() Daten aus Excel in den Datenrahmen liest direkt lesen Das berechnete Ergebnis (wenn es kein Ergebnis gibt, wird Nan zurückgegeben), und wenn wir in Excel schreiben, schreiben wir den Datenrahmen direkt in Stapeln auf einmal zurück, sodass die Zellen mit der Formel zuvor mit dem berechneten Wert zurückgeschrieben werden oder Nan. Und die Formel verloren.

Okay, es ist ein Problem aufgetreten, wie sollen wir es lösen? Hier fallen mir zwei Ideen ein:

Wenn der Datenrahmen nach Excel zurückgeschrieben wird, schreiben Sie ihn nicht stapelweise auf einmal zurück, sondern schreiben Sie nur die Berechnung durch Iteration zurück Zeilen und Spalten Die Daten, Zellen mit Formeln werden nicht verschoben;
Gibt es beim Lesen von Excel eine Möglichkeit, Formeln für Zellen mit Formeln ohne zu lesen? Es ist nicht das Ergebnis Ich habe die beiden oben genannten Ideen einzeln ausprobiert.

Der folgende Code versucht, den Datenrahmen zu durchlaufen und den entsprechenden Wert pro Zelle zu schreiben.

#根据ds_df来写excel，只写该写的单元格
for row_idx,row in ds_df.iterrows():
    total_capabity_val = row[(&#39;Total&#39;,&#39;Capabity&#39;)].strip()
    total_capabity1_val = row[(&#39;Total&#39;,&#39;Capabity.1&#39;)].strip()
    #Total和1Gb  Eqv.所在的行不写
    if total_capabity_val!= &#39;Total&#39; and total_capabity_val != &#39;1Gb  Eqv.&#39;:
        #给Delta和LOI赋值
        if total_capabity1_val == &#39;LOI&#39; or total_capabity1_val == &#39;Delta&#39;:
            ds_worksheet.range((row_idx + 3 ,3)).value = row[(&#39;Current week&#39;,&#39;BOH&#39;)]
            print(f"ds_sheet的第{row_idx + 3}行第3列被设置为{row[(&#39;Current week&#39;,&#39;BOH&#39;)]}") 
        #给Demand和Supply赋值
        if total_capabity1_val == &#39;Demand&#39; or total_capabity1_val == &#39;Supply&#39;:
            cp_datetime_columns = cp_df.columns[53:]
            for col_idx in range(4,len(ds_df.columns)):
                ds_datetime = ds_df.columns.get_level_values(1)[col_idx]
                ds_month = ds_df.columns.get_level_values(0)[col_idx]
                if type(ds_datetime) == str and ds_datetime != &#39;TTL&#39; and ds_datetime != &#39;Total&#39; and (ds_datetime in cp_datetime_columns):
                    ds_worksheet.range((row_idx + 3,col_idx + 1)).value = row[(f&#39;{ds_month}&#39;,f&#39;{ds_datetime}&#39;)]
                    print(f"ds_sheet的第{row_idx + 3}行第{col_idx + 1}列被设置为{row[(f&#39;{ds_month}&#39;,f&#39;{ds_datetime}&#39;)]}") 
                elif type(ds_datetime) == datetime.datetime and (ds_datetime in cp_datetime_columns):
                    ds_worksheet.range((row_idx + 3,col_idx + 1)).value = row[(f&#39;{ds_month}&#39;,ds_datetime)]     
                    print(f"ds_sheet的第{row_idx + 3}行第{col_idx + 1}列被设置为{row[(f&#39;{ds_month}&#39;,ds_datetime)]}")

Nach dem Login kopieren

#🎜 🎜 #Der obige Code löst das Problem, das heißt, die Formeln von Zellen mit Formeln bleiben erhalten. Gemäß den am Anfang unseres Artikels erwähnten Hinweisen zur Python-Verarbeitung weist dieser Code jedoch schwerwiegende Leistungsprobleme auf, da er häufig Excel-Zellen über die API ausführt, was dazu führt, dass das Schreiben auf meinem alten Mac sehr langsam ist 40 Minuten, was einfach inakzeptabel war, sodass der Plan aufgegeben werden musste.

「Option 2」

Diese Lösung hofft, den Formelwert beim Lesen von Zellen mit Formelwerten in Excel beizubehalten. Dies kann nur über die API jeder Python-Excel-Bibliothek gefunden werden, um zu sehen, ob es eine entsprechende Methode gibt. Ich habe mir die read_excel()-Methode von Pandas genau angesehen und festgestellt, dass es keine entsprechende Parameterunterstützung gibt. Ich habe eine API gefunden, die Openpyxl unterstützen kann, wie folgt:

import openpyxl
ds_format_workbook = openpyxl.load_workbook(fpath,data_only=False)
ds_wooksheet = ds_format_workbook[&#39;DS&#39;]
ds_df =  pd.DataFrame(ds_wooksheet.values)

Nach dem Login kopieren

Der Schlüssel ist hier der data_only-Parameter. Wenn er „True“ ist, werden die Daten zurückgegeben. Wenn er „False“ ist, kann der Formelwert sein beibehalten

#🎜🎜 #Ich dachte, ich hätte die entsprechende Lösung gefunden und war begeistert, aber als ich sah, wie die Datenstruktur im Datenrahmen über openpyxl gelesen wurde, war ich schockiert. Da der Header meiner Excel-Tabelle ein relativ komplexer zweistufiger Header ist und es Situationen gibt, in denen Zellen im Header zusammengeführt und geteilt werden, folgt ein solcher Header nicht dem mehrstufigen, nachdem er von openpyxl in den Datenrahmen eingelesen wurde Header von Pandas. Der Index wird verarbeitet, aber einfach in einen numerischen Index 0123 verarbeitet...

Aber meine Berechnung des Datenrahmens basiert auf mehrstufigen Indizes, daher ist diese Verarbeitungsmethode von openpyxl geeignet Meine nachfolgenden Berechnungen sind unmöglich.

openpyxl funktioniert nicht, was ist mit xlwings? Nachdem ich die xlwings-API-Dokumentation durchgesehen hatte, habe ich sie tatsächlich gefunden, wie unten gezeigt:

Die Range-Klasse stellt eine Eigenschaft namens Formel bereit, die Get und abrufen kann Formel festlegen.

Als ich das sah, hatte ich das Gefühl, einen Schatz gefunden zu haben, und begann schnell, den Code zu üben. Vielleicht aus Trägheit, oder vielleicht hatte ich Angst vor der Effizienz, Excel in der Vergangenheit zeilen-, spalten- und zellenweise zu bedienen, war die erste Lösung, die mir in den Sinn kam, dies stapelweise auf einmal zu tun, also alle Formeln zu lesen in Excel auf einmal und schreibe sie dann alle auf einmal, also war mein ursprünglicher Code so:

#使用xlwings来读取formula
app = xw.App(visible=False,add_book=False)
ds_format_workbook = app.books.open(fpath)
ds_worksheet = ds_format_workbook.sheets["DS"]
#先把所有公式一次性读取并保存下来
formulas = ds_worksheet.used_range.formula
 
#中间计算过程省略...
 
#一次性把所有公式写回去
ds_worksheet.used_range.formula = formulas

Nach dem Login kopieren

Aber ich habe falsch gedacht, dass die Formel falsch ist In Excel werden nur Zellen mit Formeln zurückgegeben. Tatsächlich werden alle Zellen zurückgegeben, die Formeln werden jedoch nur für Zellen mit Formeln beibehalten. Wenn ich die Formel zurückschreibe, werden daher die anderen Werte überschrieben, die ich über den Datenrahmen berechnet und in Excel geschrieben habe.

In diesem Fall kann ich die Zellen mit Formeln nur einzeln und nicht alle auf einmal verarbeiten, daher muss der Code so geschrieben werden:

#使用xlwings来读取formula
app = xw.App(visible=False,add_book=False)
ds_format_workbook = app.books.open(fpath)
ds_worksheet = ds_format_workbook.sheets["DS"]
 
#保留excel中的formula
#找到DS中Total所在的行，Total之后的行都是formula
row = ds_df.loc[ds_df[(&#39;Total&#39;,&#39;Capabity&#39;)]==&#39;Total &#39;]
total_row_index = row.index.values[0]
#获取对应excel的行号(dataframe把两层表头当做索引，从数据行开始计数，而且从0开始计数。excel从表头就开始计数，而且从1开始计数)
excel_total_row_idx = int(total_row_index+2)
#获取excel最后一行的索引
excel_last_row_idx = ds_worksheet.used_range.rows.count
#保留按日期计算的各列的formula
I_col_formula = ds_worksheet.range(f&#39;I3:I{excel_total_row_idx}&#39;).formula
N_col_formula = ds_worksheet.range(f&#39;N3:N{excel_total_row_idx}&#39;).formula
T_col_formula = ds_worksheet.range(f&#39;T3:T{excel_total_row_idx}&#39;).formula
U_col_formula = ds_worksheet.range(f&#39;U3:U{excel_total_row_idx}&#39;).formula
Z_col_formula = ds_worksheet.range(f&#39;Z3:Z{excel_total_row_idx}&#39;).formula
AE_col_formula = ds_worksheet.range(f&#39;AE3:AE{excel_total_row_idx}&#39;).formula
AK_col_formula = ds_worksheet.range(f&#39;AK3:AK{excel_total_row_idx}&#39;).formula
AL_col_formula = ds_worksheet.range(f&#39;AL3:AL{excel_total_row_idx}&#39;).formula
#保留Total行开始一直到末尾所有行的formula
total_to_last_formula = ds_worksheet.range(f&#39;A{excel_total_row_idx+1}:AL{excel_last_row_idx}&#39;).formula
 
#中间计算过程省略...
 
#保存结果到excel                 
#直接把ds_df完整赋值给excel，会导致excel原有的公式被值覆盖
ds_worksheet.range("A1").expand().options(index=False).value = ds_df 
#用之前保留的formulas，重置公式
ds_worksheet.range(f&#39;I3:I{excel_total_row_idx}&#39;).formula = I_col_formula
ds_worksheet.range(f&#39;N3:N{excel_total_row_idx}&#39;).formula = N_col_formula
ds_worksheet.range(f&#39;T3:T{excel_total_row_idx}&#39;).formula = T_col_formula
ds_worksheet.range(f&#39;U3:U{excel_total_row_idx}&#39;).formula = U_col_formula
ds_worksheet.range(f&#39;Z3:Z{excel_total_row_idx}&#39;).formula = Z_col_formula
ds_worksheet.range(f&#39;AE3:AE{excel_total_row_idx}&#39;).formula = AE_col_formula
ds_worksheet.range(f&#39;AK3:AK{excel_total_row_idx}&#39;).formula = AK_col_formula
ds_worksheet.range(f&#39;AL3:AL{excel_total_row_idx}&#39;).formula = AL_col_formula
ds_worksheet.range(f&#39;A{excel_total_row_idx+1}:AL{excel_last_row_idx}&#39;).formula = total_to_last_formula
 
ds_format_workbook.save()
ds_format_workbook.close()
app.quit()

Nach dem Login kopieren

Nach dem Testen ist es ist wie oben. Der Code entspricht perfekt meinen Anforderungen und hat keine Probleme mit der Leistung.

Das obige ist der detaillierte Inhalt vonWie verarbeitet Python Excel-Dateien?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

2 Wochen vor By DDD

R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können

3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Wie man alles in Myrise freischaltet

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7494

CakePHP-Tutorial

1377

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Muss MySQL bezahlen? Apr 08, 2025 pm 05:36 PM

MySQL hat eine kostenlose Community -Version und eine kostenpflichtige Enterprise -Version. Die Community -Version kann kostenlos verwendet und geändert werden, die Unterstützung ist jedoch begrenzt und für Anwendungen mit geringen Stabilitätsanforderungen und starken technischen Funktionen geeignet. Die Enterprise Edition bietet umfassende kommerzielle Unterstützung für Anwendungen, die eine stabile, zuverlässige Hochleistungsdatenbank erfordern und bereit sind, Unterstützung zu bezahlen. Zu den Faktoren, die bei der Auswahl einer Version berücksichtigt werden, gehören Kritikalität, Budgetierung und technische Fähigkeiten von Anwendungen. Es gibt keine perfekte Option, nur die am besten geeignete Option, und Sie müssen die spezifische Situation sorgfältig auswählen.

Hadidb: Eine leichte, horizontal skalierbare Datenbank in Python Apr 08, 2025 pm 06:12 PM

Hadidb: Eine leichte, hochrangige skalierbare Python-Datenbank Hadidb (HadIDB) ist eine leichte Datenbank in Python mit einem hohen Maß an Skalierbarkeit. Installieren Sie HadIDB mithilfe der PIP -Installation: PipinstallHadIDB -Benutzerverwaltung erstellen Benutzer: createUser (), um einen neuen Benutzer zu erstellen. Die Authentication () -Methode authentifiziert die Identität des Benutzers. fromHadidb.operationImportUseruser_obj = user ("admin", "admin") user_obj.

Kann sich MySQL Workbench mit Mariadb verbinden? Apr 08, 2025 pm 02:33 PM

MySQL Workbench kann eine Verbindung zu MariADB herstellen, vorausgesetzt, die Konfiguration ist korrekt. Wählen Sie zuerst "Mariadb" als Anschlusstyp. Stellen Sie in der Verbindungskonfiguration Host, Port, Benutzer, Kennwort und Datenbank korrekt ein. Überprüfen Sie beim Testen der Verbindung, ob der Mariadb -Dienst gestartet wird, ob der Benutzername und das Passwort korrekt sind, ob die Portnummer korrekt ist, ob die Firewall Verbindungen zulässt und ob die Datenbank vorhanden ist. Verwenden Sie in fortschrittlicher Verwendung die Verbindungspooling -Technologie, um die Leistung zu optimieren. Zu den häufigen Fehlern gehören unzureichende Berechtigungen, Probleme mit Netzwerkverbindung usw. Bei Debugging -Fehlern, sorgfältige Analyse von Fehlerinformationen und verwenden Sie Debugging -Tools. Optimierung der Netzwerkkonfiguration kann die Leistung verbessern

Navicat -Methode zum Anzeigen von MongoDB -Datenbankkennwort Apr 08, 2025 pm 09:39 PM

Es ist unmöglich, das MongoDB -Passwort direkt über Navicat anzuzeigen, da es als Hash -Werte gespeichert ist. So rufen Sie verlorene Passwörter ab: 1. Passwörter zurücksetzen; 2. Überprüfen Sie die Konfigurationsdateien (können Hash -Werte enthalten). 3. Überprüfen Sie Codes (May Hardcode -Passwörter).

So lösen Sie MySQL können keine Verbindung zum lokalen Host herstellen Apr 08, 2025 pm 02:24 PM

Die MySQL -Verbindung kann auf die folgenden Gründe liegen: MySQL -Dienst wird nicht gestartet, die Firewall fängt die Verbindung ab, die Portnummer ist falsch, der Benutzername oder das Kennwort ist falsch, die Höradresse in my.cnf ist nicht ordnungsgemäß konfiguriert usw. Die Schritte zur Fehlerbehebung umfassen: 1. Überprüfen Sie, ob der MySQL -Dienst ausgeführt wird. 2. Passen Sie die Firewall -Einstellungen an, damit MySQL Port 3306 anhören kann. 3. Bestätigen Sie, dass die Portnummer mit der tatsächlichen Portnummer übereinstimmt. 4. Überprüfen Sie, ob der Benutzername und das Passwort korrekt sind. 5. Stellen Sie sicher, dass die Einstellungen für die Bindungsadresse in my.cnf korrekt sind.

Braucht MySQL das Internet? Apr 08, 2025 pm 02:18 PM

MySQL kann ohne Netzwerkverbindungen für die grundlegende Datenspeicherung und -verwaltung ausgeführt werden. Für die Interaktion mit anderen Systemen, Remotezugriff oder Verwendung erweiterte Funktionen wie Replikation und Clustering ist jedoch eine Netzwerkverbindung erforderlich. Darüber hinaus sind Sicherheitsmaßnahmen (wie Firewalls), Leistungsoptimierung (Wählen Sie die richtige Netzwerkverbindung) und die Datensicherung für die Verbindung zum Internet von entscheidender Bedeutung.

Wie optimieren Sie die MySQL-Leistung für Hochlastanwendungen? Apr 08, 2025 pm 06:03 PM

Die MySQL-Datenbankleistung Optimierungshandbuch In ressourcenintensiven Anwendungen spielt die MySQL-Datenbank eine entscheidende Rolle und ist für die Verwaltung massiver Transaktionen verantwortlich. Mit der Erweiterung der Anwendung werden jedoch die Datenbankleistung Engpässe häufig zu einer Einschränkung. In diesem Artikel werden eine Reihe effektiver Strategien zur Leistungsoptimierung von MySQL -Leistung untersucht, um sicherzustellen, dass Ihre Anwendung unter hohen Lasten effizient und reaktionsschnell bleibt. Wir werden tatsächliche Fälle kombinieren, um eingehende Schlüsseltechnologien wie Indexierung, Abfrageoptimierung, Datenbankdesign und Caching zu erklären. 1. Das Design der Datenbankarchitektur und die optimierte Datenbankarchitektur sind der Eckpfeiler der MySQL -Leistungsoptimierung. Hier sind einige Kernprinzipien: Die Auswahl des richtigen Datentyps und die Auswahl des kleinsten Datentyps, der den Anforderungen entspricht, kann nicht nur Speicherplatz speichern, sondern auch die Datenverarbeitungsgeschwindigkeit verbessern.

Wie man AWS -Kleber mit Amazon Athena verwendet Apr 09, 2025 pm 03:09 PM

Als Datenprofi müssen Sie große Datenmengen aus verschiedenen Quellen verarbeiten. Dies kann Herausforderungen für das Datenmanagement und die Analyse darstellen. Glücklicherweise können zwei AWS -Dienste helfen: AWS -Kleber und Amazon Athena.

See all articles