


1 MB magische KI erkennt Millionen von Dateien mit einer Genauigkeit von 99 %!
Bei der Webentwicklung ist die Erkennung des Dateityps vor dem Hochladen von Dateien auf den Server von entscheidender Bedeutung. Dieser Schritt kann nicht nur die Sicherheit des Servers und der Benutzer gewährleisten, mögliche schädliche Dateien abfangen, sondern auch sicherstellen, dass die hochgeladenen Dateien vollständig sind und den Erwartungen entsprechen, wodurch die Datenkonformität verbessert wird. Gleichzeitig kann es durch die Bereitstellung von zeitnahem Feedback und Anleitung für Benutzer auch die Benutzererfahrung verbessern und unnötige Verwirrung vermeiden.
Bruder A Bao hat zuvor vorgestellt: „Wie erkennt JavaScript den Dateityp?“ Jetzt, da wir in die KI-Ära eingetreten sind, müssen wir mit der Zeit gehen. Als nächstes stellt Bruder Abao vor, wie man das Open-Source-Tool Magika[1] von Google verwendet, um eine genaue Dateityperkennung zu erreichen.
Bilder
Magika-Einführung
Magika+ ist ein neuartiges Tool zur Dateiklassifizierung mit künstlicher Intelligenz, das auf der neuesten Deep-Learning-Technologie basiert, um eine genaue Erkennung zu ermöglichen. Es verwendet ein hochoptimiertes benutzerdefiniertes Keras-Modell, das nur etwa 1 MB wiegt und eine genaue Dateiidentifizierung in Millisekunden ermöglicht, selbst wenn es auf einer einzelnen CPU ausgeführt wird.
Bei Auswertungen von über 1 Million Dateien und über 100 Inhaltstypen (die Binär- und Textdateiformate abdecken) erreichte Magika eine Präzision und einen Rückruf von über 99 %. Magika wird in großem Umfang eingesetzt, um die Sicherheit von Google-Nutzern zu gewährleisten, indem Gmail-, Drive- und Safe Browsing-Dateien an die entsprechenden Sicherheits- und Inhaltsrichtlinienscanner weitergeleitet werden.
Funktionen von Magika
- Unterstützt die Erkennung von mehr als 100 Dateitypen.
- Unterstützt mehrere Verwendungsmethoden wie Python-Befehlszeile, Python-API und experimentelle TFJS-Version.
- Nachdem das Modell geladen wurde (dies ist ein einmaliger Mehraufwand), beträgt die Inferenzzeit ca. 5 ms pro Datei.
- Nahezu konstante Inferenzzeit, unabhängig von der Dateigröße. Magika verwendet nur eine begrenzte Teilmenge der Dateibytes.
- Unterstützt Stapelverarbeitung: Unterstützt das gleichzeitige Senden mehrerer Dateien an die Befehlszeile und API. Magika verwendet Stapelverarbeitung, um die Inferenzzeit zu beschleunigen.
- Geschult anhand eines Datensatzes von über 25 Millionen Dateien in über 100 Inhaltstypen.
- Nach einer umfassenden Evaluierung erreichten Magikas durchschnittliche Präzision und Erinnerung über 99 % und übertrafen damit bestehende Methoden.
- Magika verwendet für jeden Inhaltstyp ein Schwellenwertsystem, um zu bestimmen, ob den Vorhersagen eines Modells „vertrauen“ oder ob eine generische Bezeichnung wie „Generisches Textdokument“ oder „Unbekannte Binärdaten“ zurückgegeben werden soll.
- Unterstützt drei verschiedene Vorhersagemodi zur Anpassung der Fehlertoleranz: hohes Vertrauen, mittleres Vertrauen und beste Schätzung. Leistung von Magika liegen etwa 20 % höher. Aufgeschlüsselt nach Dateityp sehen wir größere Leistungsverbesserungen für Textdateien, einschließlich Codedateien und Konfigurationsdateien, bei deren Verarbeitung andere Tools möglicherweise Probleme haben.
Magika Online-Beispiel
Bilder
[1]Magika: https://github.com/google/magika[2]Webdemo: https://google.github.io/magika/
[3]Magika: KI-gesteuert schnelle und effiziente Dateitypidentifizierung: https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-file-type-identification.html
Das obige ist der detaillierte Inhalt von1 MB magische KI erkennt Millionen von Dateien mit einer Genauigkeit von 99 %!. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Python zeichnet sich in Automatisierung, Skript und Aufgabenverwaltung aus. 1) Automatisierung: Die Sicherungssicherung wird durch Standardbibliotheken wie OS und Shutil realisiert. 2) Skriptschreiben: Verwenden Sie die PSUTIL -Bibliothek, um die Systemressourcen zu überwachen. 3) Aufgabenverwaltung: Verwenden Sie die Zeitplanbibliothek, um Aufgaben zu planen. Die Benutzerfreundlichkeit von Python und die Unterstützung der reichhaltigen Bibliothek machen es zum bevorzugten Werkzeug in diesen Bereichen.

Python eignet sich besser für Anfänger mit einer reibungslosen Lernkurve und einer kurzen Syntax. JavaScript ist für die Front-End-Entwicklung mit einer steilen Lernkurve und einer flexiblen Syntax geeignet. 1. Python-Syntax ist intuitiv und für die Entwicklung von Datenwissenschaften und Back-End-Entwicklung geeignet. 2. JavaScript ist flexibel und in Front-End- und serverseitiger Programmierung weit verbreitet.

Visual Studio Code (VSCODE) wurde von Microsoft entwickelt, das mit dem Elektronen -Framework erstellt wurde und hauptsächlich in JavaScript geschrieben wurde. Es unterstützt eine breite Palette von Programmiersprachen, einschließlich JavaScript, Python, C, Java, HTML, CSS usw., und kann durch Erweiterungen Unterstützung für andere Sprachen unterstützen.

Das Ausführen von Code in VS -Code dauert nur sechs Schritte: 1. Öffnen Sie das Projekt; 2. Erstellen und schreiben Sie die Codedatei; 3. Öffnen Sie das Terminal; 4. Navigieren Sie zum Projektverzeichnis; 5. Führen Sie den Code mit den entsprechenden Befehlen aus; 6. Die Ausgabe anzeigen.

Die Hauptunterschiede zwischen VS Code und Pycharm sind: 1. Erweiterbarkeit: VS-Code ist sehr skalierbar und verfügt über einen reichhaltigen Plug-in-Markt, während Pycharm standardmäßig größere Funktionen hat. 2. Preis: VS -Code ist kostenlos und Open Source, und Pycharm wird für die professionelle Version bezahlt. 3. Benutzeroberfläche: VS -Code ist modern und freundlich, und Pycharm ist komplexer. 4. Code Navigation: VS Code ist für kleine Projekte geeignet, und Pycharm eignet sich besser für große Projekte. 5. Debugging: VS Code ist grundlegend und Pycharm ist mächtiger; 6. Code Refactoring: VS Code ist grundlegend und Pycharm ist reicher; 7. Code

Visual Studio Code (VSCODE) ist ein plattformübergreifender, Open-Source-Editor und kostenloser Code-Editor, der von Microsoft entwickelt wurde. Es ist bekannt für seine leichte, Skalierbarkeit und Unterstützung für eine Vielzahl von Programmiersprachen. Um VSCODE zu installieren, besuchen Sie bitte die offizielle Website, um das Installateur herunterzuladen und auszuführen. Bei der Verwendung von VSCODE können Sie neue Projekte erstellen, Code bearbeiten, Code bearbeiten, Projekte navigieren, VSCODE erweitern und Einstellungen verwalten. VSCODE ist für Windows, MacOS und Linux verfügbar, unterstützt mehrere Programmiersprachen und bietet verschiedene Erweiterungen über den Marktplatz. Zu den Vorteilen zählen leicht, Skalierbarkeit, umfangreiche Sprachunterstützung, umfangreiche Funktionen und Versionen

Golang und Python haben jeweils ihre eigenen Vorteile: Golang ist für hohe Leistung und gleichzeitige Programmierung geeignet, während Python für Datenwissenschaft und Webentwicklung geeignet ist. Golang ist bekannt für sein Parallelitätsmodell und seine effiziente Leistung, während Python für sein Ökosystem für die kurze Syntax und sein reiches Bibliothek bekannt ist.

Um eine Sprache im Visual Studio -Code zu ändern: 1. Öffnen Sie die Sprachstatusleiste; 2. Klicken Sie auf die Sprachstatusleiste, um das Menü zu öffnen. 3. Wählen Sie die gewünschte Sprache aus; 4. Warten Sie, bis VSCODE nachgeladen wird. 5. Überprüfen Sie, ob die Sprache geändert wurde.
