大規模モデルの信頼性はどの程度ですか? IBM と他の学者による「基本モデルの基本的な堅牢性」に関する最新のチュートリアル
NeurIPS は、世界で最も権威のある AI 学会の 1 つとして、毎年学術界で重要なイベントであり、正式名称は Neural Information Processing Systems で、通常 12 月に NeurIPS Foundation が主催します。毎年。 。
カンファレンスで議論される内容には、深層学習、コンピューター ビジョン、大規模機械学習、学習理論、最適化、スパース理論、その他多くの細分化が含まれます。
今年で 36 回目となる NeurIPS は、11 月 28 日から 12 月 9 日までの 2 週間開催されます。
最初の週は米国ニューオーリンズのアーネスト N. モリアル コンベンション センターでの対面会議、二週目はオンライン会議となります。
IBM Research Center の学者やその他の学者が大規模モデルの堅牢性について語っており、非常に注目に値します。
基本モデルは深層学習手法を採用し、大規模なラベルなしデータでの事前トレーニングと、特定のタスクの監視による微調整を行います。機械学習の主流テクノロジー。
基本モデルは、ドメインやデータ パターン全体で一般表現や少数/ゼロショットの一般化を学習する上で大いに期待できますが、使用されるデータ量が多すぎて複雑になるという問題もあります。ニューラル ネットワーク アーキテクチャは、堅牢性とプライバシーの点で前例のない課題と多大なリスクをもたらします。
このチュートリアルは、包括的な講義、実用的でインタラクティブな Jupyter/Colab リアルタイム コーディング デモンストレーション、および基本モデルの信頼性に関するチュートリアルを含む、Coursera のようなオンライン チュートリアルを提供することを目的としています。 . セクシュアリティのさまざまな側面についてのグループ ディスカッション。
https://sites.google.com/view/neurips2022-frfm-turotial
ディレクトリの内容:
- 基礎モデルと堅牢性の基本
- コンピューター ビジョンの基礎モデルの詳細
- 詳細コードの基礎モデル
- 実践的なコード ウォークスルー
- 結論のコメント
- Q&A
- パネルディスカッション
スピーカー:
実際の機械学習システムは、分布の変更に対して堅牢である必要があります。トレーニング分布とは異なるテスト分布でも適切に動作する必要があります。
資源不足国の貧困マップ [Xie et al. 2016; Jean et al. 2016]、自動運転車 [Yu et al. 2020a; Sun et al. 2016] など。 2020a]、医療診断などの高リスク アプリケーション [AlBadawy et al. 2018; Dai and Gool 2018] では、トレーニング データには見られない環境にモデルを十分に一般化する必要があります。たとえば、テスト サンプルはさまざまな国から来ており、環境、運転状況、病院の違いなど。
以前の研究では、これらの分布の変更は、現在の最先端モデルであっても大幅なパフォーマンスの低下につながる可能性があることを示しています [Blitzer et al. 2006; Daumé III 2007; Sugayama et al. al. 2007; Ganin and Lempitsky 2015; Peng et al. 2019; Kumar et al. 2020a; Arjovsky et al. 2019; Szegedy et al. 2014; Hendrycks and Dietterich 2019; Sakawa et al. 2020a; Recht et al. 2019 2019; Abney 2007; Ruder and Plank 2018; Geirhos et al. 2018; Kumar et al. 2020b; Yu et al. 2020b; Geirhos et al. 2020; Xie et al. 2021a; Koh et al. 2021]。
基本モデルは、ディストリビューション からサンプリングされた大規模で多様なラベルのないデータセットでトレーニングされ、多くの下流タスクに適応できます。
各下流タスク では、基本モデルはトレーニング分布からサンプリングされたラベル付き分布内にあります
トレーニング分布(ディストリビューション内、ID) トレーニング データを使用してから、ディストリビューション外 (OOD) テストディストリビューション
で評価します。
たとえば、貧困マップ予測モデル [Xie et al. 2016; Jean et al. 2016] では、世界中のラベルのない衛星データからすべての国にとって有用な特徴を学習できます。微調整はナイジェリアのラベル付きサンプルで実行され、最終的にラベル付きサンプルが不足しているマラウイで評価されます。
私たちは次のように考えています: 1) 基本モデルは堅牢性の点で特に有望なアプローチです。既存の研究では、限られた分布の変更に限定される多くのロバスト性介入とは対照的に、ラベルなしデータでの事前トレーニングが OOD テスト分布の精度を向上させる効果的かつ一般的な方法であることを示しています。
ただし、2) 偽の相関や時間の経過に伴う分布の変化などによる、基礎となるモデルが分布の変化に常に対応するとは限らない理由についても説明しました。
最後に、3) 基礎となるモデルの堅牢性を活用し、改善するいくつかの研究の方向性を概説します。
基本モデルが下流タスクのパフォーマンスを向上させる 1 つの方法は、下流トレーニング データの外にある適応モデルに (モデルの初期化を通じて) 帰納的バイアスを提供することであることに注意してください。 . さまざまなデータセットで学習されました。
ただし、同じ帰納的バイアスによって、事前トレーニング データからの有害な関連性がエンコードされ、分布の変化が存在する場合に表現や割り当てに悪影響を与える可能性があります。
#
以上が大規模モデルの信頼性はどの程度ですか? IBM と他の学者による「基本モデルの基本的な堅牢性」に関する最新のチュートリアルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック

従来のコンピューティングを超える能力を備えているだけでなく、より低コストでより効率的なパフォーマンスを実現する人工知能モデルを想像してみてください。これは SF ではありません。世界で最も強力なオープンソース MoE モデルである DeepSeek-V2[1] が登場しました。 DeepSeek-V2 は、経済的なトレーニングと効率的な推論の特徴を備えた強力な専門家混合 (MoE) 言語モデルです。これは 236B のパラメータで構成されており、そのうち 21B は各マーカーをアクティブにするために使用されます。 DeepSeek67B と比較して、DeepSeek-V2 はパフォーマンスが優れていると同時に、トレーニング コストを 42.5% 節約し、KV キャッシュを 93.3% 削減し、最大生成スループットを 5.76 倍に高めます。 DeepSeek は一般的な人工知能を研究する会社です

Boston Dynamics Atlas は正式に電動ロボットの時代に突入します!昨日、油圧式アトラスが歴史の舞台から「涙ながらに」撤退したばかりですが、今日、ボストン・ダイナミクスは電動式アトラスが稼働することを発表しました。ボストン・ダイナミクス社は商用人型ロボットの分野でテスラ社と競争する決意を持っているようだ。新しいビデオが公開されてから、わずか 10 時間ですでに 100 万人以上が視聴しました。古い人が去り、新しい役割が現れるのは歴史的な必然です。今年が人型ロボットの爆発的な年であることは間違いありません。ネットユーザーは「ロボットの進歩により、今年の開会式は人間のように見え、人間よりもはるかに自由度が高い。しかし、これは本当にホラー映画ではないのか?」とコメントした。ビデオの冒頭では、アトラスは仰向けに見えるように地面に静かに横たわっています。次に続くのは驚くべきことです

今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は

Google が推進する JAX のパフォーマンスは、最近のベンチマーク テストで Pytorch や TensorFlow のパフォーマンスを上回り、7 つの指標で 1 位にランクされました。また、テストは最高の JAX パフォーマンスを備えた TPU では行われませんでした。ただし、開発者の間では、依然として Tensorflow よりも Pytorch の方が人気があります。しかし、将来的には、おそらくより大規模なモデルが JAX プラットフォームに基づいてトレーニングされ、実行されるようになるでしょう。モデル 最近、Keras チームは、ネイティブ PyTorch 実装を使用して 3 つのバックエンド (TensorFlow、JAX、PyTorch) をベンチマークし、TensorFlow を使用して Keras2 をベンチマークしました。まず、主流のセットを選択します

AI は確かに数学を変えつつあります。最近、この問題に細心の注意を払っている陶哲軒氏が『米国数学協会会報』(米国数学協会会報)の最新号を送ってくれた。 「機械は数学を変えるのか?」というテーマを中心に、多くの数学者が意見を述べ、そのプロセス全体は火花に満ち、ハードコアで刺激的でした。著者には、フィールズ賞受賞者のアクシャイ・ベンカテシュ氏、中国の数学者鄭楽軍氏、ニューヨーク大学のコンピューター科学者アーネスト・デイビス氏、その他業界で著名な学者を含む強力な顔ぶれが揃っている。 AI の世界は劇的に変化しています。これらの記事の多くは 1 年前に投稿されたものです。

今日は、時系列予測のパフォーマンスを向上させるために、時系列データを潜在空間上の大規模な自然言語処理 (NLP) モデルと整合させる方法を提案するコネチカット大学の最近の研究成果を紹介したいと思います。この方法の鍵は、潜在的な空間ヒント (プロンプト) を使用して時系列予測の精度を高めることです。論文タイトル: S2IP-LLM: SemanticSpaceInformedPromptLearningwithLLMforTimeSeriesForecasting ダウンロードアドレス: https://arxiv.org/pdf/2403.05798v1.pdf 1. 大きな問題の背景モデル

テスラのロボット「オプティマス」の最新映像が公開され、すでに工場内で稼働可能となっている。通常の速度では、バッテリー(テスラの4680バッテリー)を次のように分類します:公式は、20倍の速度でどのように見えるかも公開しました - 小さな「ワークステーション」上で、ピッキング、ピッキング、ピッキング:今回は、それがリリースされたハイライトの1つビデオの内容は、オプティマスが工場内でこの作業を完全に自律的に行い、プロセス全体を通じて人間の介入なしに完了するというものです。そして、オプティマスの観点から見ると、自動エラー修正に重点を置いて、曲がったバッテリーを拾い上げたり配置したりすることもできます。オプティマスのハンドについては、NVIDIA の科学者ジム ファン氏が高く評価しました。オプティマスのハンドは、世界の 5 本指ロボットの 1 つです。最も器用。その手は触覚だけではありません

目標検出は自動運転システムにおいて比較的成熟した問題であり、その中でも歩行者検出は最も初期に導入されたアルゴリズムの 1 つです。ほとんどの論文では非常に包括的な研究が行われています。ただし、サラウンドビューに魚眼カメラを使用した距離認識については、あまり研究されていません。放射状の歪みが大きいため、標準のバウンディング ボックス表現を魚眼カメラに実装するのは困難です。上記の説明を軽減するために、拡張バウンディング ボックス、楕円、および一般的な多角形の設計を極/角度表現に探索し、これらの表現を分析するためのインスタンス セグメンテーション mIOU メトリックを定義します。提案された多角形モデルの FisheyeDetNet は、他のモデルよりも優れたパフォーマンスを示し、同時に自動運転用の Valeo 魚眼カメラ データセットで 49.5% の mAP を達成しました。
