1MB の魔法の AI が数百万のファイルを 99% の精度で検出します。
Web 開発では、ファイルをサーバーにアップロードする前のファイル タイプの検出が重要です。このステップにより、サーバーとユーザーのセキュリティを確保し、悪意のあるファイルの可能性を傍受できるだけでなく、アップロードされたファイルが完全で期待どおりであることを保証し、データ コンプライアンスを向上させることができます。同時に、ユーザーにタイムリーなフィードバックとガイダンスを提供することで、ユーザー エクスペリエンスを向上させ、不必要な混乱を回避することもできます。
以前、アバオ兄弟は「JavaScript はどのようにしてファイルの種類を検出するのでしょうか?」を紹介しましたが、AI 時代に入った今、私たちは時代に追いつく必要があります。次に、アバオ兄弟は、Google のオープンソース Magika[1] ツールを使用して正確なファイル タイプ検出を実現する方法を紹介します。
写真
Magika の紹介
Magika は、最新の深層学習テクノロジーに依存した新しい人工知能ファイル分類および検出ツールです。正確な検出を提供します。わずか約 1MB の高度に最適化されたカスタム Keras モデルを使用しており、単一の CPU で実行している場合でも、ミリ秒単位で正確なファイル識別を可能にします。
100 万を超えるファイルと 100 を超えるコンテンツ タイプ (バイナリ ファイル形式とテキスト ファイル形式を含む) の評価において、Magica は 99% 以上の精度と再現率を達成しました。 Magika は、Gmail、ドライブ、セーフ ブラウジング ファイルを適切なセキュリティ スキャナとコンテンツ ポリシー スキャナにルーティングすることで、Google ユーザーの安全を保つために大規模に使用されています。
Magica の機能
- 100 を超えるファイル タイプの検出をサポートします。
- Python コマンド ライン、Python API、実験的な TFJS バージョンなど、複数の使用方法をサポートします。
- モデルがロードされた後 (これは 1 回限りのオーバーヘッドです)、推論時間はファイルあたり約 5 ミリ秒です。
- ファイル サイズに関係なく、ほぼ一定の推論時間。 Magika は、ファイル バイトの限られたサブセットのみを使用します。
- サポート バッチ処理: コマンド ラインと API への複数のファイルの同時送信をサポートします。Magica はバッチ処理を使用して推論時間を短縮します。
- 100 を超えるコンテンツ タイプにわたる 2,500 万を超えるファイルのデータセットでトレーニングされました。
- 大規模評価の後、Magika の平均精度と再現率は 99% 以上に達し、既存の手法を上回りました。
- Magica は、コンテンツ タイプごとのしきい値システムを使用して、モデルの予測を「信頼する」かどうか、または「汎用テキスト ドキュメント」や「不明なバイナリ データ」などの汎用ラベルを返すかどうかを決定します。
- エラーの許容範囲を調整するための 3 つの異なる予測モード (高信頼度、中信頼度、最良推測) をサポートします。
Magica のパフォーマンス
写真
パフォーマンスの面では、AI モデルと大規模なトレーニング データセットを備えた Magika 100 を超えるファイル タイプの 1M ファイル ベンチマークで評価した場合、そのパフォーマンスは他の既存のツールよりも約 20% 高くなります。ファイルの種類別に見ると、他のツールでは処理が難しいコード ファイルや構成ファイルなどのテキスト ファイルのパフォーマンスが大幅に向上しています。
写真
Magika オンラインの例
Magika はブラウザと Node.js 環境をサポートしており、Web デモ[2] Web サイトにアクセスして次のことを行うことができます。その機能を体験してください。
写真
Magica をすぐに始めましょう
magika をインストールします
npm install magikaorpnpm add magika
使用方法ブラウザ magika
import { Magika } from "magika";const file = new File(["# Hello I am a markdown file"], "hello.md");const fileBytes = new Uint8Array(await file.arrayBuffer());const magika = new Magika();await magika.load();const prediction = await magika.identifyBytes(fileBytes);console.log(prediction);
Node.js での magika の使用
import { readFile } from "fs/promises";import { MagikaNode as Magika } from "magika";const data = await readFile("some file");const magika = new Magika();await magika.load();const prediction = await magika.identifyBytes(data);console.log(prediction);
ここでは Magika に関する関連コンテンツが紹介されています。 Magika については、この記事を読み続けてください。 Magika: AI を活用した高速かつ効率的なファイル タイプの識別[3]。
参考資料
[1]Magika: https://github.com/google/magika
[2]ウェブデモ: https://google.github. io/magika/
[3]Magika: AI を活用した高速かつ効率的なファイル タイプ識別: https://opensource.googleblog.com/2024/02/magika-ai-powered-fast-and-efficient-ファイルタイプ識別.html
以上が1MB の魔法の AI が数百万のファイルを 99% の精度で検出します。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Centos Shutdownコマンドはシャットダウンし、構文はシャットダウン[オプション]時間[情報]です。オプションは次のとおりです。-hシステムをすぐに停止します。 -pシャットダウン後に電源をオフにします。 -r再起動; -t待機時間。時間は、即時(現在)、数分(分)、または特定の時間(HH:mm)として指定できます。追加の情報をシステムメッセージに表示できます。

PHPとPythonには独自の利点と短所があり、選択はプロジェクトのニーズと個人的な好みに依存します。 1.PHPは、大規模なWebアプリケーションの迅速な開発とメンテナンスに適しています。 2。Pythonは、データサイエンスと機械学習の分野を支配しています。

DockerはLinuxカーネル機能を使用して、効率的で孤立したアプリケーションランニング環境を提供します。その作業原則は次のとおりです。1。ミラーは、アプリケーションを実行するために必要なすべてを含む読み取り専用テンプレートとして使用されます。 2。ユニオンファイルシステム(UnionFS)は、違いを保存するだけで、スペースを節約し、高速化する複数のファイルシステムをスタックします。 3.デーモンはミラーとコンテナを管理し、クライアントはそれらをインタラクションに使用します。 4。名前空間とcgroupsは、コンテナの分離とリソースの制限を実装します。 5.複数のネットワークモードは、コンテナの相互接続をサポートします。これらのコア概念を理解することによってのみ、Dockerをよりよく利用できます。

Pytorch GPUアクセラレーションを有効にすることで、CentOSシステムでは、PytorchのCUDA、CUDNN、およびGPUバージョンのインストールが必要です。次の手順では、プロセスをガイドします。CUDAおよびCUDNNのインストールでは、CUDAバージョンの互換性が決定されます。NVIDIA-SMIコマンドを使用して、NVIDIAグラフィックスカードでサポートされているCUDAバージョンを表示します。たとえば、MX450グラフィックカードはCUDA11.1以上をサポートする場合があります。 cudatoolkitのダウンロードとインストール:nvidiacudatoolkitの公式Webサイトにアクセスし、グラフィックカードでサポートされている最高のCUDAバージョンに従って、対応するバージョンをダウンロードしてインストールします。 cudnnライブラリをインストールする:

CENTOSシステムでHDFS構成をチェックするための完全なガイドこの記事では、CENTOSシステム上のHDFSの構成と実行ステータスを効果的に確認する方法をガイドします。次の手順は、HDFSのセットアップと操作を完全に理解するのに役立ちます。 Hadoop環境変数を確認します。最初に、Hadoop環境変数が正しく設定されていることを確認してください。端末では、次のコマンドを実行して、Hadoopが正しくインストールおよび構成されていることを確認します。HDFS構成をチェックするHDFSファイル:HDFSのコア構成ファイルは/etc/hadoop/conf/ディレクトリにあります。使用

PythonとJavaScriptには、コミュニティ、ライブラリ、リソースの観点から、独自の利点と短所があります。 1)Pythonコミュニティはフレンドリーで初心者に適していますが、フロントエンドの開発リソースはJavaScriptほど豊富ではありません。 2)Pythonはデータサイエンスおよび機械学習ライブラリで強力ですが、JavaScriptはフロントエンド開発ライブラリとフレームワークで優れています。 3)どちらも豊富な学習リソースを持っていますが、Pythonは公式文書から始めるのに適していますが、JavaScriptはMDNWebDocsにより優れています。選択は、プロジェクトのニーズと個人的な関心に基づいている必要があります。

Centosシステムの下でのGitlabのバックアップと回復ポリシーデータセキュリティと回復可能性を確保するために、Gitlab on Centosはさまざまなバックアップ方法を提供します。この記事では、いくつかの一般的なバックアップ方法、構成パラメーター、リカバリプロセスを詳細に紹介し、完全なGitLabバックアップと回復戦略を確立するのに役立ちます。 1.手動バックアップGitlab-RakeGitlabを使用:バックアップ:コマンドを作成して、マニュアルバックアップを実行します。このコマンドは、gitlabリポジトリ、データベース、ユーザー、ユーザーグループ、キー、アクセスなどのキー情報をバックアップします。デフォルトのバックアップファイルは、/var/opt/gitlab/backupsディレクトリに保存されます。 /etc /gitlabを変更できます

NGINXのインストールをインストールするには、次の手順に従う必要があります。開発ツール、PCRE-Devel、OpenSSL-Develなどの依存関係のインストール。 nginxソースコードパッケージをダウンロードし、それを解凍してコンパイルしてインストールし、/usr/local/nginxとしてインストールパスを指定します。 nginxユーザーとユーザーグループを作成し、アクセス許可を設定します。構成ファイルnginx.confを変更し、リスニングポートとドメイン名/IPアドレスを構成します。 nginxサービスを開始します。依存関係の問題、ポート競合、構成ファイルエラーなど、一般的なエラーに注意する必要があります。パフォーマンスの最適化は、キャッシュをオンにしたり、ワーカープロセスの数を調整するなど、特定の状況に応じて調整する必要があります。
