Viele Entwickler sagen, dass Excel seit der Einführung von Python/Pandas nicht mehr oft verwendet wird. Es ist sehr schnell, es zum Verarbeiten und Visualisieren von Tabellen zu verwenden. Dies weist jedoch immer noch einen großen Fehler auf. Die Operation ist keine visuelle Form und erfordert daher höhere Fähigkeiten. Kürzlich haben Entwickler ein Open-Source-Projekt namens Grid Studio erstellt, eine webbasierte Tabellenkalkulationsanwendung, die die Vorteile von Python und Excel vollständig vereint.
Ja, das gleichzeitige Anzeigen visueller Tabellen und Codes auf einer Schnittstelle und das gleichzeitige Ändern von Daten über Tabellen und Codes ist nicht die Kombination von Python und Excel?
Projektadresse: https://github.com/ricklamers/gridstudio
Werfen wir zunächst einen Blick auf die Wirkung von Grid Studio. Im Allgemeinen können wir Daten über Python laden und verarbeiten und Daten über Excel manipulieren.
Die Verarbeitung von Daten in einer Tabelle ist tatsächlich der von Excel sehr ähnlich. Schreiben Sie eine Summierungsformel.
Vielleicht ändern wir einige Daten in der Tabelle, dann können wir sie auch in ein NumPy-Array importieren und weitere Operationen durchführen.
Verwandte Empfehlungen: „Python-Video-Tutorial“
Warum dieses Tool erstellen?
Der Autor sagte, dass er Grid Studio hauptsächlich entwickelt habe, um das Problem des verstreuten Workflows in Data-Science-Projekten zu lösen. Bei dieser Art von Projekten muss er zwischen mehreren Tools wie R Studio und Excel arbeiten. Tauschen Sie sich aus.
Beim millionenfachen Export einer CSV-Datei friert das Anwendungsfenster ein, wenn die Anzahl der Zeilen zu hoch ist. Selbst etwas so Einfaches wie das Lesen einer JSON-Datei kann jemanden in den Wahnsinn treiben. Bestehende Tools bieten nicht die Umgebung und die damit verbundenen Arbeitsabläufe, die für ein effizientes Arbeiten erforderlich sind. Aus diesem Grund hat sich der Autor für die Entwicklung dieses Tools entschieden. Er wollte eine benutzerfreundliche Anwendung erstellen, die datenwissenschaftliche Arbeitsabläufe integrieren kann.
Was sind die Highlights dieses Tools?
Grid Studio ist eine webbasierte Anwendung, die Google Sheets und Microsoft Excel ähnelt. Sein Killerfeature ist jedoch die Integration der Python-Sprache.
Die Verwendung von Tabellen zum Anzeigen und Bearbeiten von Daten ist für fast jeden, der einen Computer verwendet hat, eine Selbstverständlichkeit. Die Kombination dieser einfachen Benutzeroberfläche mit einer ausgereiften Programmiersprache wie Python ist einfach nicht einfach zu verwenden.
Das Schreiben von Skripten in Python ist einfach: Schreiben Sie einfach ein paar Zeilen Code und führen Sie ihn aus.
Kernintegration: Lesen und Schreiben
Der Kern dieser Python-Integration ist die Lese- und Schreibschnittstelle für Tabellenkalkulationen, die das kann Stellen Sie eine leistungsstarke Verbindung zwischen Daten in einer Tabellenkalkulation und Daten in einem Python-Prozess her.
Sie können Daten auf folgende Weise in die Tabelle schreiben:
Blatt("A1:A3", [1, 2, 3])
Verwenden Sie die folgende Methode Daten aus der Tabelle lesen:
my_matrix = sheet("A1:A3")
Auf diese einfache und effiziente Weise können Sie Daten direkt in der Tabelle lesen oder schreiben, um die Dateneingabe zu automatisieren, Extraktion, Visualisierung und andere Prozesse.
Benutzerdefinierte Tabellenfunktionen schreiben
Obwohl das Lesen und Schreiben über eine einfache Schnittstelle sehr flexibel ist, ist es manchmal auch wichtig, benutzerdefinierte Funktionen zu schreiben, die direkt aufgerufen werden können.
Zusätzlich zu den Standardfunktionen wie AVERAGE, SUM und IF benötigen Sie möglicherweise auch andere Funktionen, also schreiben Sie sie einfach auf!
def UPPERCASE(a):
return str(a).uppercase()
Nachdem Sie diese Codezeile geschrieben haben, rufen Sie die Funktion in der Tabelle auf, z. B. Genau wie Aufruf einer regulären Funktion.
Nutzung des Python-Ökosystems
Durch die Nutzung verschiedener leistungsstarker Softwarepakete im Python-Ökosystem können wir sofort auf die derzeit besten Data-Science-Tools zugreifen und so schnell auf leistungsstarke zugreifen Modelle wie lineare Regression, Support-Vektor-Maschinen und mehr.
Da Grid Studio selbst hauptsächlich tabellarische Daten verarbeitet, können diese als Features verwendet werden, um schnell Modelle wie SVM aufzurufen, um die hinter diesen Daten verborgenen Features zu erkunden.
Datenvisualisierung
In der Datenwissenschaft besteht eine sehr häufige Aufgabe darin, Daten zu visualisieren, um „Vorwissen“ über die Daten zu erlangen. Durch die Integration der interaktiven Plotbibliothek Plotly.js und der Python-Standardvisualisierungsbibliothek Matplotlib verfügt Grid Studio jetzt über integrierte erweiterte Plotfunktionen. Wir können erweiterte Zeichenfunktionen für Vektortabellenformate verwenden, wie unten gezeigt:
Um weiter zu erklären, wie die Funktionen von Grid Studio zum Erstellen visueller Symbole verwendet werden, zeigt der Projektautor auch Zwei Es gibt zwei Fälle, nämlich das Crawlen von Webseiten und das Visualisieren der Datenverteilung. Hier zeigen wir jedoch hauptsächlich den ersten Fall.
Fall: Schätzung der Normalverteilung
Der folgende Fall zeigt die Leistungsfähigkeit von Grid Studio. Es visualisiert die Normalverteilung mit höherer Genauigkeit Ist die interaktive Zuordnung abgeschlossen?
Verwenden und installieren
Es wurden schon so viele Funktionen eingeführt, wie nutzen wir sie also? Grid Studio ist sehr einfach zu installieren und zu verwenden und kann über eine einfache Befehlszeile ausgeführt werden.
git clone https://github.com/ricklamers/gridstudio
cd gridstudio && ./run.sh
Laden Sie wie oben das Projekt herunter und führen Sie das Installationsskript aus In zwei Schritten können wir den lokalen Port im Browser öffnen und ihn problemlos verwenden.
Das obige ist der detaillierte Inhalt vonBenötigen Sie noch Excel, wenn Sie Python haben?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!