ホームページ テクノロジー周辺機器 AI 履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

Apr 12, 2023 pm 11:46 PM
グーグル モデル cv

過去 10 年間、基本的に ImageNet はコンピュータ ビジョン分野の「バロメーター」であり、精度が向上していれば、新しいテクノロジーが登場するかどうかがわかります。

「リストの磨き」は常にモデル革新の原動力であり、モデルのトップ 1 精度を人間よりも高い 90% に押し上げました。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

#しかし、ImageNet データセットは本当に私たちが思っているほど便利なのでしょうか?

多くの論文が、データ範囲、バイアスの問題、ラベルが完全かどうかなど、ImageNet に疑問を呈しています。

最も重要なことは、モデルの 90% の精度は本当に正確なのかということです。

最近、Google Brain チームとカリフォルニア大学バークレー校の研究者は、いくつかの sota モデルの予測結果を再調査し、モデルの実際の精度が過小評価されている可能性があることを発見しました。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

論文リンク: https://arxiv.org/pdf/2205.04596.pdf

研究者がいくつかの上位モデルをテストすることで犯すすべての間違い 手動レビューを実行し、ベンチマーク データセットのロングテール エラーに関する洞察を得るために分類します。

主な焦点は ImageNet のマルチラベル サブセット評価にあり、最良のモデルは 97% のトップ 1 精度を達成することができました。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗


研究の分析によると、いわゆる予測エラーのほぼ半数はまったくエラーではなく、画像内でも見つかった新しいマルチラベルが追加されました。これは、予測結果が手動でレビューされていない場合、これらのモデルのパフォーマンスが「過小評価」される可能性があることを意味します。

スキルの低いクラウドソースのデータ アノテーターはデータに誤ったラベルを付けることがよくあり、これはモデルの精度の信頼性に大きな影響を与えます。

ImageNet データセットを調整し、将来の良好な進歩を促進するために、研究者は記事内でマルチラベル評価セットの更新版を提供し、68 の例と SOTA モデルの明らかなエラーを組み合わせています。予測を新しいデータに変換する ImageNet-Major を収集して、将来の CV 研究者がこれらの悪いケースを克服できるようにします

「技術的負債」を返済する

記事のタイトルから始めてください。ベーグル?」 著者が主に歴史的な問題でもある ImageNet のラベル問題に焦点を当てていることがわかります。

下の図は、ラベルの曖昧さの非常に典型的な例です。図のラベルは「生地」ですが、モデルの予測結果は「ベーグル」です。これは間違っていますか?

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

理論的に言えば、このモデルには予測誤差はありません。生地は焼成中でベーグルになろうとしているため、生地とベーグルの両方であるからです。

モデルは実際にこの生地がベーグル「になる」ことを予測できたことがわかりますが、精度の点でこのスコアは得られませんでした。

実際には、標準の ImageNet データセットの分類タスクを評価基準として使用すると、複数のラベルの欠如、ラベルのノイズ、カテゴリの不特定などの問題が避けられません。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

このようなオブジェクトを識別する任務を負ったクラウドソースのアノテーターの観点から見ると、これは意味論的、さらには哲学的な難題であり、マルチラベル化によってのみ解決できます。 ImageNet 派生データ セットの改善は、ラベル付けの問題です。

ImageNet の設立から 16 年が経ちますが、当時のアノテーターやモデル開発者は、データに対する理解が現在ほど豊富ではなかったのは間違いなく、ImageNet は初期の大容量データであり、比較的よく注釈が付けられたデータセットであるため、ImageNet It は自然に CV ランキングの標準になっています。

しかし、データのラベル付けにかかる予算はモデル開発に比べて明らかに大きくないため、ラベル付けの問題の改善は一種の技術的負債となっています。

ImageNet の残りのエラーを見つけるために、研究者らは、事前トレーニング済みモデルとして JFT-3B を使用し、30 億のパラメーター (89.5% の精度を達成可能) を備えた標準 ViT-3B モデルを使用しました。 ImageNet-1Kで調整しました。

ImageNet2012_multilabel データ セットをテスト セットとして使用して、ViT-3B は最初に 96.3% の精度を達成しましたが、モデルは 676 枚の画像を明らかに誤って予測し、その後、これらの例について詳細な調査を実施しました。

データの再ラベル付けの際、作成者はクラウドソーシングを選択せず​​、5 人の専門レビュー担当者からなるチームを編成してラベル付けを実行しました。これは、この種のラベル付けエラーは専門家でないと特定するのが難しいためです。

たとえば、図 (a) では、通常のアノテーターは単に「テーブル」と書くかもしれませんが、実際には、画面、モニター、マグカップなど、画像内には他の多くのオブジェクトが含まれています。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

画像 (b) の被写体は 2 人ですが、ラベルはピケット フェンス (フェンス) であり、明らかに不完全です。考えられるラベルには、蝶ネクタイ、制服などが含まれます。 . .

写真 (c) もわかりやすい例ですが、「アフリカ象」のみがマークされている場合は、象牙は無視されてもよいでしょう。

写真 (d) は湖岸とラベル付けされていますが、実際には海岸とラベル付けしても何も問題はありません。

アノテーションの効率を高めるために、研究者らは、モデルによって予測されたカテゴリ、予測スコア、ラベル、画像を同時に表示できる専用ツールも開発しました。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

場合によっては、専門家グループ間でラベルに関する論争が依然として存在する可能性があり、現時点では、ラベル付けを支援するために画像が Google 検索に追加されます。

たとえば、ある例では、モデルの予測結果にタクシーが含まれていますが、写真には「少し黄色」を除いてタクシーのブランドがありません。

この画像の注釈は、主に Google 画像検索によって画像の背景が象徴的な橋であることが発見され、研究者らは画像が位置する都市を特定し、市内のタクシー画像を検索した後、この写真には普通車ではなくタクシーが含まれていることが認められています。また、ナンバープレートのデザインとの比較でも、モデルの予測が正しかったことが証明されました。

研究のいくつかの段階で発見されたエラーを予備的に検討した後、著者らはまず、その重大度に基づいてエラーを 2 つのカテゴリに分類しました:

1. 専攻: 人間ラベルの意味、およびモデルの予測はラベルとは何の関係もありません;

2. 軽度のエラー (軽度): ラベルが間違っているか不完全であるため、予測エラーが発生する可能性があります。修正には専門家によるデータのレビューが必要です。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

ViT-3B モデルによって発生した 155 件の重大なエラーについて、研究者らは、予測結果の多様性を高めるために一緒に予測するための他の 3 つのモデルを発見しました。

4 つのモデルすべてで予測できなかった重大なエラーが 68 件ありました。その後、これらの例に対するすべてのモデルの予測を分析し、どれも正しくないことを確認しました。新しいマルチラベル、つまり各モデルの予測結果は確かに重大な誤りです。

これらの 68 の例には、いくつかの共通の特徴があります。1 つ目は、さまざまな方法でトレーニングされた sota モデルがこのサブセットで間違いを犯しており、専門のレビュー担当者も予測結果がまったく無関係であると信じていることです。

68 枚の画像のデータセットも、後続の研究者による手動評価を容易にするのに十分なほど小さいため、将来これら 68 枚の画像が克服されれば、CV モデルは新たなブレークスルーを達成する可能性があります。

研究者らは、データを分析することにより、予測誤差を 4 つのタイプに分類しました:

1. 予測されたカテゴリが実際のラベルに似ていますが、まったく同じではない、きめの細かい誤差;

2. 語彙範囲外 (OOV) によるきめ細かさで、カテゴリは正しいが ImageNet 内のオブジェクトに存在しないクラスをモデルが識別します;

3.スプリアス相関 (予測されたラベルが画像のコンテキストから読み取られる場合);

4. 非プロトタイプ (ラベル内のオブジェクトは予測されたラベルに似ていますが、まったく同じではありません)。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

研究者らは、元の 676 件のエラーを検討した結果、そのうち 298 件が正しいはずであるか、元のラベルが間違っているか問題があると判断したことがわかりました。

履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗

一般に、この記事の研究結果から 4 つの結論が導き出されます:

1. 大規模で高精度のモデルが作成されると、その他 モデルに新しい予測がない場合、その約 50% は正しい新しいマルチラベルです。

##2. 精度の高いモデルでは、カテゴリとエラー重大度の間に明確な相関関係が示されません。

3. 人間が評価したマルチラベル サブセットに対する今日の SOTA モデルのパフォーマンスは、専門家による人間の最高のパフォーマンスとほぼ一致またはそれを上回っています;

4. ノイズの多いトレーニング データと不特定のクラスは、画像の効果的な測定を制限する要因になる可能性があります分類の改善。

おそらく、画像のラベル付けの問題は、自然言語処理テクノロジーが解決されるまで待たなければならないのでしょうか?

以上が履歴書の未来はこの68枚の写真にある? Google Brain が ImageNet を詳しく調査: トップモデルはすべて予測に失敗の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

セサミオープンドア交換Webページ登録リンクゲートトレーディングアプリ登録Webサイト最新 セサミオープンドア交換Webページ登録リンクゲートトレーディングアプリ登録Webサイト最新 Feb 28, 2025 am 11:06 AM

この記事では、SESAME Open Exchange(gate.io)Webバージョンの登録プロセスとGate Tradingアプリを詳細に紹介します。 Web登録であろうとアプリの登録であろうと、公式Webサイトまたはアプリストアにアクセスして、本物のアプリをダウンロードし、ユーザー名、パスワード、電子メール、携帯電話番号、その他の情報を入力し、電子メールまたは携帯電話の確認を完了する必要があります。

セサミオープンドアエクスチェンジウェブページログイン最新バージョンgateio公式ウェブサイトの入り口 セサミオープンドアエクスチェンジウェブページログイン最新バージョンgateio公式ウェブサイトの入り口 Mar 04, 2025 pm 11:48 PM

ログインステップやパスワード回復プロセスなど、セサミオープンエクスチェンジWebバージョンのログイン操作の詳細な紹介も、ログイン障害、ページを開くことができず、プラットフォームにスムーズにログインするのに役立つ検証コードを受信できません。

Bybit Exchangeリンクを直接ダウンロードしてインストールできないのはなぜですか? Bybit Exchangeリンクを直接ダウンロードしてインストールできないのはなぜですか? Feb 21, 2025 pm 10:57 PM

Bybit Exchangeリンクを直接ダウンロードしてインストールできないのはなぜですか? BYBITは、ユーザーにトレーディングサービスを提供する暗号通貨交換です。 Exchangeのモバイルアプリは、次の理由でAppStoreまたはGooglePlayを介して直接ダウンロードすることはできません。1。AppStoreポリシーは、AppleとGoogleがApp Storeで許可されているアプリケーションの種類について厳しい要件を持つことを制限しています。暗号通貨交換アプリケーションは、金融サービスを含み、特定の規制とセキュリティ基準を必要とするため、これらの要件を満たしていないことがよくあります。 2。法律と規制のコンプライアンス多くの国では、暗号通貨取引に関連する活動が規制または制限されています。これらの規制を遵守するために、BYBITアプリケーションは公式Webサイトまたはその他の認定チャネルを通じてのみ使用できます

Crypto Digital Asset Trading App(2025グローバルランキング)に推奨されるトップ10 Crypto Digital Asset Trading App(2025グローバルランキング)に推奨されるトップ10 Mar 18, 2025 pm 12:15 PM

この記事では、Binance、Okx、Gate.io、Bitflyer、Kucoin、Bybit、Coinbase Pro、Kraken、Bydfi、Xbit分散化された交換など、注意を払う価値のある上位10の暗号通貨取引プラットフォームを推奨しています。これらのプラットフォームには、トランザクションの数量、トランザクションの種類、セキュリティ、コンプライアンス、特別な機能の点で独自の利点があります。適切なプラットフォームを選択するには、あなた自身の取引体験、リスク許容度、投資の好みに基づいて包括的な検討が必要です。 この記事があなたがあなた自身に最適なスーツを見つけるのに役立つことを願っています

セサミオープンドアトレーディングプラットフォームダウンロードモバイルバージョンgateioトレーディングプラットフォームのダウンロードアドレス セサミオープンドアトレーディングプラットフォームダウンロードモバイルバージョンgateioトレーディングプラットフォームのダウンロードアドレス Feb 28, 2025 am 10:51 AM

アプリをダウンロードしてアカウントの安全を確保するために、正式なチャネルを選択することが重要です。

Binance Binance公式Webサイト最新バージョンログインポータル Binance Binance公式Webサイト最新バージョンログインポータル Feb 21, 2025 pm 05:42 PM

Binance Webサイトログインポータルの最新バージョンにアクセスするには、これらの簡単な手順に従ってください。公式ウェブサイトに移動し、右上隅の[ログイン]ボタンをクリックします。既存のログインメソッドを選択してください。「登録」してください。登録済みの携帯電話番号または電子メールとパスワードを入力し、認証を完了します(モバイル検証コードやGoogle Authenticatorなど)。検証が成功した後、Binance公式WebサイトLogin Portalの最新バージョンにアクセスできます。

ビットゲット取引プラットフォーム公式アプリのダウンロードとインストールアドレス ビットゲット取引プラットフォーム公式アプリのダウンロードとインストールアドレス Feb 25, 2025 pm 02:42 PM

このガイドは、AndroidおよびiOSシステムに適した公式Bitget Exchangeアプリの詳細なダウンロードとインストール手順を提供します。このガイドは、公式ウェブサイト、App Store、Google Playなど、複数の権威ある情報源からの情報を統合し、ダウンロードおよびアカウント管理中の考慮事項を強調しています。ユーザーは、App Store、公式WebサイトAPKダウンロード、公式Webサイトジャンプ、完全な登録、ID検証、セキュリティ設定など、公式チャネルからアプリをダウンロードできます。さらに、ガイドはよくある質問や考慮事項をカバーします。

2025年のBitgetの最新のダウンロードアドレス:公式アプリを取得する手順 2025年のBitgetの最新のダウンロードアドレス:公式アプリを取得する手順 Feb 25, 2025 pm 02:54 PM

このガイドは、AndroidおよびiOSシステムに適した公式Bitget Exchangeアプリの詳細なダウンロードとインストール手順を提供します。このガイドは、公式ウェブサイト、App Store、Google Playなど、複数の権威ある情報源からの情報を統合し、ダウンロードおよびアカウント管理中の考慮事項を強調しています。ユーザーは、App Store、公式WebサイトAPKダウンロード、公式Webサイトジャンプ、完全な登録、ID検証、セキュリティ設定など、公式チャネルからアプリをダウンロードできます。さらに、ガイドはよくある質問や考慮事項をカバーします。

See all articles