Tabellenkalkulationen sind „die dunkle Materie der Unternehmenssoftware“: Sie sind überall, sie sind unsichtbar und sie halten alles zusammen. Geschäft und Finanzen laufen über Tabellenkalkulationen; Kein anderes Softwaretool hat es so vielen Menschen ermöglicht, Lösungen für so viele verschiedene Probleme zu entwickeln. In diesem Zusammenhang muss man jede Behauptung, dass „Jupyter das neue Excel“ sei, als bewusste Sensation verstehen.
Jupyter-Notizbücher weisen jedoch einige wichtige Ähnlichkeiten mit Excel-Tabellen auf. Notizbücher sind in der wissenschaftlichen und statistischen Datenverarbeitung allgegenwärtig, genauso wie Tabellenkalkulationen den Geschäftsbetrieb und die Front-Office-Finanzierung dominieren. In diesem Beitrag werden wir einige philosophische und praktische Gemeinsamkeiten und Unterschiede zwischen den beiden Tools untersuchen, um zu erklären, warum beide so leidenschaftliche Fans und Kritiker haben.
Gemeinsamkeiten: das Positive
- Oberflächlich betrachtet verwenden sowohl Jupyter-Notizbücher als auch Excel-Tabellen „Zellen“ als visuelle Metapher für die Aufteilung einer Analyse in einzelne Schritte. Zellen in beiden Formaten enthalten Code und zeigen Ergebnisse an.
- Beide sind für interaktive, iterative, explorative Analysen konzipiert und kombinieren Berechnungen mit Datenvisualisierungen.
- Beide zielen auf eine flache Lernkurve für Anfänger ab.
- Beide sind eigenständig und einfach zu teilen konzipiert. Online-Umgebungen wie Google Colab und JupyterHub abstrahieren den oft komplexen Python-Einrichtungsprozess.
- Beide haben einen starken Einfluss auf die Hochschulbildung in ihren jeweiligen Fachgebieten. An Business Schools wird fast überall Finanzmodellierung mit Excel unterrichtet, und MINT-Abteilungen unterrichten in der Regel Datenanalyse mit Jupyter-Notebooks1. Neue Absolventen bringen ihre Vertrautheit mit diesen Werkzeugen an den Arbeitsplatz.
Gemeinsamkeiten: die Negative
Sowohl Excel-Tabellen als auch Jupyter-Notizbücher werden von Softwareentwicklern als keine „echte Software“ kritisiert. Abgesehen von der offensichtlichen Einschränkung, dass beide Artefakte ein anderes Programm zur Ausführung erfordern, erschweren sie auch die Einhaltung der Best Practices für die Softwareentwicklung:
- Da es sich um große, monolithische Dateien handelt, ist die Versionskontrolle mit Entwicklertools wie Git schwierig. Office OpenXML-Dokumente werden gezippt, wodurch der Dateiinhalt „verschlüsselt“ wird, sodass Git Änderungen an den zugrunde liegenden Daten nicht nachverfolgen kann. Jupyter-Notebooks sind eigentlich nur große JSON-Dateien, aber Änderungen an der Zellenausgabe und der Ausführungsanzahl führen zu überflüssigen Deltas2.
Sowohl Excel-Tabellen als auch Jupyter-Notizbücher sind
schwierig zu produzieren- , obwohl beide Tools in der Praxis in der Produktion eingesetzt werden. Excel und Jupyter sind umfangreiche Ausführungsumgebungen, die ihre eigenen Abhängigkeiten einführen und für Ingenieure, die es gewohnt sind, eigenständige Skripte zu schreiben, verschwenderisch erscheinen.
Beide sind
fehleranfällig- und schwer zu testen. Die Tatsache, dass sich beide Plattformen an Benutzer mit weniger Erfahrung im Schreiben von Code richten, verschafft ihnen den Ruf, fehlerbehaftete Lösungen zu entwickeln. In Wirklichkeit könnte es sein, dass Fehler in Tabellenkalkulationen und Notizbüchern ohne Tools wie Unit-Tests oder eine Kultur der Qualitätskontrolle eher in die Produktion gelangen.
Unterschiede
Excel erleichtert Nicht-Programmierern das Verständnis des Datenflusses zwischen Zellen.
- Das Raster von Excel bietet eine natürliche Möglichkeit, Daten über Zellkoordinaten zu referenzieren, während Jupyter auf benannte Variablen angewiesen ist, was Benutzer dazu zwingt, sich mit der Realität auseinanderzusetzen, dass die Benennung von Variablen schwierig ist.
- Es ist einfacher, Zwischenergebnisse mehrstufiger Berechnungen in Excel zu überprüfen, da sich die Zellen direkt vor Ihnen befinden. Druckanweisungen in Jupyter-Notizbüchern erfordern mehr Aufwand beim Einrichten und Ausführen.
-
Excel ist eigenständig; Der Wert von Jupyter liegt im Paket-Ökosystem von Python.
- Pythons Abhängigkeit von externen Bibliotheken macht es für IT-Abteilungen einfacher, die Verwendung von Jupyter einzuschränken.
- Sowohl die lokale Installation von Jupyter als auch die Ausführung von Notebooks über ein Netzwerk erfordern mehr Setup als das Öffnen von Excel.
- Die meisten Excel-Tabellen verwenden nur Funktionen, die im Lieferumfang von Excel enthalten sind. Das bedeutet, dass ein Geschäftskontakt Ihr Modell einfach öffnen, ändern und ausführen kann. Es ist schwierig, Notizbücher außerhalb und sogar innerhalb einer Organisation zu teilen, da sie stark an eine bestimmte Python-Umgebung gebunden sind und Python-Umgebungen schwierig einzurichten sind.
-
Excel kann als „Datenbank für arme Leute“ fungieren, tabellarische Daten über mehrere Blätter hinweg speichern und OLAP-ähnliche Funktionen über PivotTables bereitstellen. Jupyter-Notebooks laden Daten normalerweise von einer API oder einem freigegebenen Dateispeicherort, ein weiterer Grund, warum sie nicht so eigenständig sind.
- Das „Falschen der Zahlen“ ist in Excel einfacher als in Jupyter. Tabellen werden in Echtzeit aktualisiert, ohne dass Code erneut ausgeführt oder interaktive Widgets eingerichtet werden müssen. Einmalige Änderungen sind einfacher durchzuführen, was wichtig ist, wenn es auf Geschwindigkeit ankommt.
- Das Arbeiten mit Code ist in Jupyter unvermeidlich, aber Excel kann vollständig über eine grafische Benutzeroberfläche verwendet werden: Es gibt sogar Menüs zur Auswahl von Funktionen in Zellformeln.
- Jupyter ist offener und flexibler, erfordert jedoch mehr technisches Wissen, um es effektiv nutzen zu können.
- Jupyter legt einen stärkeren Schwerpunkt auf Erzählung und Geschichtenerzählen als Excel.
- Jupyter-Notizbücher sind für die kompetente Programmierung konzipiert, bei der Code und Prosa vermischt werden, um einen Erzählfluss zu erzeugen.
- Berichterstellung und Präsentation in Excel basieren normalerweise entweder auf Kopieren/Einfügen oder auf Integrationen mit PowerPoint.
Implikationen
Microsofts Bemühungen, Python in Excel zu integrieren, werden die Dominanz von Jupyter im wissenschaftlichen und technischen Rechnen nicht wesentlich untergraben. Tabellenkalkulationen fehlt eine natürliche Erzählstruktur, weshalb sie für die Ausbildung und reproduzierbare Forschung weniger geeignet sind. Darüber hinaus wird die „Open Science“-Community niemals ein Closed-Source-Tool übernehmen, das von einem amerikanischen Technologieriesen entwickelt wurde.
Es werden Tools und „Best Practices“ entstehen, um die betrieblichen Nachteile von Jupyter-Notebooks zu mildern3, genau wie bei Tabellenkalkulationen. Die meisten Front-Office-Benutzer werden solche Richtlinien ignorieren4, was zu anhaltenden Spannungen mit den IT-Abteilungen führt. Nachdem sie gesehen haben, wie sich die Dinge mit Excel entwickelt haben, betrachten viele IT-Abteilungen die Unterstützung von Jupyter als das Öffnen der Büchse der Pandora voller Sicherheitslücken und Wartungsproblemen.
Beide Plattformen werden auf absehbare Zeit überleben. Keiner von beiden wird den anderen ersetzen, da sie auf Benutzergruppen mit grundlegend unterschiedlichen Fähigkeiten abzielen. Personen, die an der Schnittstelle zwischen quantitativer Modellierung und Geschäftsentscheidungsfindung arbeiten, müssen weiterhin mit beiden Tools vertraut sein.
Abschluss
Verwenden Sie das Tool, das am besten zur Kultur der Organisation passt, in der Sie Probleme lösen. Es gibt Situationen, in denen technische Anforderungen Sie dazu zwingen, ein Tool einem anderen vorzuziehen, genau wie es in anderen Situationen der Fall ist Organisationen, die Ihnen nur die Verwendung des einen oder anderen Tools erlauben. Wenn Sie in einem von Excel dominierten Bereich arbeiten und die Funktionen von Python benötigen, meiner Erfahrung nach ist es einfacher, Excel-Tabellen aus Python-Code zu lesen und zu schreiben, als Excel-Benutzer dazu zu bringen, ein Jupyter-Notizbuch zu öffnen.
Softwareentwickler und IT-Abteilungen auf der ganzen Welt werden weiterhin auf Jupyter-Notebooks herabblicken, so wie sie es schon seit Jahrzehnten mit Tabellenkalkulationen tun. Die Tatsache, dass MBA-Studenten keine Jupyter-Notebooks verwenden, macht es für die IT einfacher, drakonische Beschränkungen für deren Nutzung durchzusetzen. Ironischerweise erhalten viele Front-Office-Benutzer möglicherweise erst Zugriff auf Python, wenn Microsoft die Integration in Excel abgeschlossen hat.
-
Einige Verweigerer verwenden immer noch MATLAB, R, SPSS oder SAS, aber hohe Lizenzgebühren werden Benutzer im Laufe der Zeit weiterhin dazu drängen, sich kostenlosen und Open-Source-Alternativen zuzuwenden. Für Firmen wie MathWorks ist die Eroberung des Bildungsmarktes ein zentraler Bestandteil der Geschäftsstrategie, aber es ist unwahrscheinlich, dass sie dauerhaft bestehen bleiben. ↩
-
Tools wie nbdime können bei der Versionskontrolle für Jupyter-Notebooks hilfreich sein, aber ihre Verwendung erhöht die Komplexität noch weiter. ↩
-
Tools wie Papermill zielen darauf ab, den Betrieb von Notebooks in Produktionsumgebungen zu optimieren. Cloud-Anbieter unterstützen auch die Erstellung von Pipelines mit Jupyter-Notebooks in der Produktion. ↩
-
Wie viele Menschen haben überhaupt vom FAST-Standard zum Erstellen von Tabellenkalkulationen gehört? ↩
Das obige ist der detaillierte Inhalt vonJupyter-Notizbücher sind wie Tabellenkalkulationen. Lernen Sie beides.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!