ホームページ テクノロジー周辺機器 AI ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

Aug 11, 2024 pm 04:03 PM
業界

2024 年ですが、まだ Transformer の仕組みを理解していない人はいますか?ぜひこの対話型ツールを試してみてください。


2017 年、Google は論文「attention is all you need」で Transformer を提案し、これはディープラーニングの分野における大きな進歩となりました。この論文の引用数は 130,000 近くに達しました。GPT ファミリの後続モデルもすべて Transformer アーキテクチャに基づいており、その幅広い影響力が示されています。

ニューラル ネットワーク アーキテクチャとして、Transformer はテキストからビジョンまでのさまざまなタスク、特に現在注目されている AI チャットボットの分野で広く普及しています。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

しかし、多くの非専門家にとって、Transformer の内部の仕組みは依然として不透明であり、理解や参加の妨げとなっています。したがって、このアーキテクチャをわかりやすく理解することが特に必要です。しかし、多くのブログ、ビデオ チュートリアル、3D ビジュアライゼーションは数学的な複雑さとモデルの実装を強調する傾向があり、初心者にとっては混乱する可能性があります。 AI 実践者向けにも設計された視覚化の取り組みは、ニューロンおよび階層的な解釈可能性に焦点を当てており、専門家以外にとっては困難です。

そこで、ジョージア工科大学と IBM Research の数人の研究者が、専門家以外の人々がトランスフォーマーの高レベルのモデル構造と低レベルの数学を理解するのに役立つ、Web ベースのオープンソースのインタラクティブな視覚化ツール「Transformer Explainer」を開発しました。変圧器操作。以下の図 1 に示すように。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

Transformer Explainer は、動的システムとしての Transformer に関する最近の研究に触発された
サンキー図視覚化デザインを使用して、テキスト生成を通じて Transformer の内部動作を説明し、入力データがモデル コンポーネントをどのように流れるかを強調します。結果から、サンキー ダイアグラムは情報がどのようにモデルを通過するかを効果的に示し、Transformer 操作を通じて入力がどのように処理および変換されるかを示します。

コンテンツの面では、Transformer Explainer は Transformer の構造を要約するモデルの概要を緊密に統合し、ユーザーが複数の抽象化レベル間をスムーズに移行して、低レベルの数学的演算と高レベルのモデル構造の間の相互作用を視覚化できるようにします。 Transformer の複雑な概念を完全に理解できるようにします。

機能的には、Transformer Explainer は Web ベースの実装を提供するだけでなく、リアルタイム推論の機能も備えています。カスタム ソフトウェアのインストールが必要な、または推論機能が不足している多くの既存のツールとは異なり、最新のフロントエンド フレームワークを使用してブラウザーでネイティブに実行されるリアルタイム GPT-2 モデルが統合されています。ユーザーは入力テキストをインタラクティブに実験し、Transformer の内部コンポーネントとパラメータがどのように連携して次のトークンを予測するかをリアルタイムで観察できます。

Transformer Explainer は、高度なコンピューティング リソース、インストール、またはプログラミング スキルを必要とせずに、最新の生成 AI テクノロジーへのアクセスを拡張します。 GPT-2 が選択されたのは、このモデルがよく知られており、推論速度が速く、GPT-3 や GPT-4 などのより高度なモデルとアーキテクチャ的に似ているためです。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

  • 論文アドレス: https://arxiv.org/pdf/2408.04619
  • GitHub アドレス: http://poloclub.github.io/transformer-explainer/
  • オンライン体験アドレス: https:// t.co/jyBlJTMa7m
ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール
自分の入力をサポートしているため、このサイトでも「what a beautiful day」を試した結果が下の図に示されています。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

Transformer Explainerに対して、多くのネチズンが高い評価を与えています。これは非常にクールなインタラクティブ ツールだという人もいます。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

自己注意と位置エンコーディングを説明する直感的なツール、それが Transformer Explainer を待っていたという人もいます。それはゲームを変えるツールとなるだろう。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

中国語訳も作った人がいます。

ブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツール

T 表示アドレス: http://llm-diz-cn.iiiai.com/llm

科学普及業界の別の大きな牛カルパシーを思い出さずにはいられません。以前にたくさん書きました。現在の GPT-2 に関するチュートリアル (「
純粋な C 言語で手作りした GPT-2、元 OpenAI と Tesla 幹部による新プロジェクトが人気
)」、「
Karpathy の最新の 4 時間のビデオ チュートリアル: GPT-2 をゼロから再現する」など、一晩実行すれば完了です」など。今はTransformerの内部原理を可視化するツールがあるので、両者を併用するとより学習効果が高まると思われます。

Transformer Explainer システムの設計と実装
Transformer Explainer は、Transformer ベースの GPT-2 モデルがテキスト入力を処理し、次のトークンを予測するためにどのようにトレーニングされるかを視覚的に示します。フロントエンドは Svelte と D3 を使用してインタラクティブな視覚化を実装し、バックエンドは ONNX ランタイムと HuggingFace の Transformers ライブラリを使用してブラウザで GPT-2 モデルを実行します。
Transformer Explainer の設計プロセスでは、基礎となるアーキテクチャの複雑さをどのように管理するかが大きな課題でした。すべての詳細を同時に表示すると要点から逸れてしまうためです。この問題を解決するために、研究者は 2 つの重要な設計原則に細心の注意を払いました。
まず、研究者はマルチレベルの抽象化を通じて複雑さを軽減します。彼らは、さまざまな抽象化レベルで情報を提示するツールを構築します。これにより、ユーザーは概要から始めて、必要に応じて詳細に進むことができるため、情報過多が回避されます。最上位レベルでは、ツールは完全な処理フローを示します。つまり、ユーザーが指定したテキストを入力として受信し (図 1A)、それを埋め込み、複数の Transformer ブロックを介して処理し、処理されたデータを使用して最も可能性の高い次の A トークン予測を予測するまでです。並べ替えられています。
注意行列の計算 (図 1C) などの中間操作は、計算結果の重要性を視覚的に表示するためにデフォルトで折りたたまれていますが、ユーザーはアニメーションを通じてその導出プロセスを展開して表示することを選択できます。順序 。研究者らは、エンドツーエンドのデータ フローを維持しながら、ユーザーがアーキテクチャ内の繰り返しパターンを識別できるように、アテンション ヘッドを積み重ねたり、繰り返しの Transformer ブロックを折りたたんだりするなど、一貫した視覚言語を採用しました。
第二に、研究者は双方向性を通じて理解と参加を強化します。 温度パラメータは、Transformer の出力確率分布を制御する上で重要であり、次のトークン予測の確実性 (低温時) またはランダム性 (高温時) に影響します。しかし、トランスフォーマーに関する既存の教育リソースはこの側面を無視する傾向があります。ユーザーは、この新しいツールを使用して温度パラメータをリアルタイムで調整し (図 1B)、予測の確実性を制御する際の重要な役割を視覚化できるようになりました (図 2)。
さらに、ユーザーは提供された例から選択することも、独自のテキストを入力することもできます (図 1A)。カスタム入力テキストをサポートすると、さまざまな条件下でモデルの動作を分析し、さまざまなテキスト入力に基づいて独自の仮定を対話的にテストすることで、ユーザーがより深く参加できるようになり、ユーザーの参加意識が高まります。

それでは、実際の応用シナリオは何でしょうか?

ルソー教授は、生成型 AI の最近の進歩を強調するために、自然言語処理コースのコース内容を最新化しています。彼女は、一部の学生が Transformer ベースのモデルをとらえどころのない「魔法」と見なしている一方、モデルがどのように機能するかを理解したいと思っているものの、どこから始めればよいかわからない学生もいることに気づきました。

この問題を解決するために、彼女は学生に Transformer Explainer を使用するように指導しました。これは、Transformer のインタラクティブな概要を提供し (図 1)、学生が積極的に実験して学習することを奨励します。彼女のクラスには 300 人を超える学生がおり、Transformer Explainer はソフトウェアや特別なハードウェアをインストールする必要がなく、完全に学生のブラウザ内で実行できることが大きな利点であり、ソフトウェアやハードウェアのセットアップの管理に関する学生の心配がなくなりました。

このツールは、アニメーション化されたインタラクティブな可逆的抽象化を通じて、注意力の計算などの複雑な数学的操作を学生に紹介します (図 1C)。このアプローチは、学生が操作の高度な理解と、これらの結果を生み出す基礎となる詳細の両方を深く理解するのに役立ちます。

ルソー教授は、変圧器の技術的能力と限界が時々擬人化されていることにも気づいています(例えば、温度パラメータを「創造性」制御として見るなど)。彼女は、生徒に温度スライダー (図 1B) を実験するよう奨励することで、温度が実際に次のトークンの確率分布をどのように変更するのか (図 2)、それによって決定論的かつ創造的な方法で予測のランダム性を制御し、次のトークンとトークンのバランスを取る方法を示しました。出力。

さらに、システムがトークン処理プロセスを視覚化すると、学生はここにいわゆる「魔法」がないことがわかります。入力テキストが何であっても (図 1A)、モデルは適切な規則に従います。定義された一連の操作では、Transformer アーキテクチャを使用して、一度に 1 つのトークンのみをサンプリングし、そのプロセスを繰り返します。

今後の取り組み

研究者は、学習体験を向上させるためにツールのインタラクティブな説明を強化しています。同時に、WebGPUによる推論速度の向上や、圧縮技術によるモデルサイズの削減も行っている。また、Transformer Explainer の有効性と使いやすさを評価するためのユーザー調査を実施し、AI 初心者、学生、教育者、実践者がツールをどのように使用するかを観察し、サポートしたい追加機能に関するフィードバックを収集することも計画しています。

何を待っていますか? 試してみて、トランスフォーマーに関する「魔法」の幻想を打ち破り、その背後にある原理を真に理解してください。

以上がブラックボックスが開いてしまった!再生可能、ローカルで GPT-2 を実行、リアルタイム推論も実行できる Transformer のビジュアル説明ツールの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました Aug 09, 2024 pm 04:01 PM

でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用

初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した 初のメカニカルクロー!元羅宝は2024年の世界ロボット会議に登場し、家庭に入ることができる初のチェスロボットを発表した Aug 21, 2024 pm 07:33 PM

8月21日、2024年世界ロボット会議が北京で盛大に開催された。 SenseTimeのホームロボットブランド「Yuanluobot SenseRobot」は、全製品ファミリーを発表し、最近、世界初の家庭用チェスロボットとなるYuanluobot AIチェスプレイロボット - Chess Professional Edition(以下、「Yuanluobot SenseRobot」という)をリリースした。家。 Yuanluobo の 3 番目のチェス対局ロボット製品である新しい Guxiang ロボットは、AI およびエンジニアリング機械において多くの特別な技術アップグレードと革新を経て、初めて 3 次元のチェスの駒を拾う機能を実現しました。家庭用ロボットの機械的な爪を通して、チェスの対局、全員でのチェスの対局、記譜のレビューなどの人間と機械の機能を実行します。

クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう クロードも怠け者になってしまった!ネチズン: 自分に休日を与える方法を学びましょう Sep 02, 2024 pm 01:56 PM

もうすぐ学校が始まり、新学期を迎える生徒だけでなく、大型AIモデルも気を付けなければなりません。少し前、レディットはクロードが怠け者になったと不満を漏らすネチズンでいっぱいだった。 「レベルが大幅に低下し、頻繁に停止し、出力も非常に短くなりました。リリースの最初の週は、4 ページの文書全体を一度に翻訳できましたが、今では 0.5 ページの出力さえできません」 !」 https://www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/ というタイトルの投稿で、「クロードには完全に失望しました」という内容でいっぱいだった。

世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました 世界ロボット会議で「未来の高齢者介護の希望」を担う家庭用ロボットを囲みました Aug 22, 2024 pm 10:35 PM

北京で開催中の世界ロボット会議では、人型ロボットの展示が絶対的な注目となっているスターダストインテリジェントのブースでは、AIロボットアシスタントS1がダルシマー、武道、書道の3大パフォーマンスを披露した。文武両道を備えた 1 つの展示エリアには、多くの専門的な聴衆とメディアが集まりました。弾性ストリングのエレガントな演奏により、S1 は、スピード、強さ、正確さを備えた繊細な操作と絶対的なコントロールを発揮します。 CCTVニュースは、「書道」の背後にある模倣学習とインテリジェント制御に関する特別レポートを実施し、同社の創設者ライ・ジエ氏は、滑らかな動きの背後にあるハードウェア側が最高の力制御と最も人間らしい身体指標(速度、負荷)を追求していると説明した。など)、AI側では人の実際の動きのデータが収集され、強い状況に遭遇したときにロボットがより強くなり、急速に進化することを学習することができます。そしてアジャイル

ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award ACL 2024 賞の発表: HuaTech による Oracle 解読に関する最優秀論文の 1 つ、GloVe Time Test Award Aug 15, 2024 pm 04:37 PM

貢献者はこの ACL カンファレンスから多くのことを学びました。 6日間のACL2024がタイのバンコクで開催されています。 ACL は、計算言語学と自然言語処理の分野におけるトップの国際会議で、国際計算言語学協会が主催し、毎年開催されます。 ACL は NLP 分野における学術的影響力において常に第一位にランクされており、CCF-A 推奨会議でもあります。今年の ACL カンファレンスは 62 回目であり、NLP 分野における 400 以上の最先端の作品が寄せられました。昨日の午後、カンファレンスは最優秀論文およびその他の賞を発表しました。今回の優秀論文賞は7件(未発表2件)、最優秀テーマ論文賞1件、優秀論文賞35件です。このカンファレンスでは、3 つの Resource Paper Award (ResourceAward) と Social Impact Award (

Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Li Feifei 氏のチームは、ロボットに空間知能を与え、GPT-4o を統合する ReKep を提案しました Sep 03, 2024 pm 05:18 PM

ビジョンとロボット学習の緊密な統合。最近話題の1X人型ロボットNEOと合わせて、2つのロボットハンドがスムーズに連携して服をたたむ、お茶を入れる、靴を詰めるといった動作をしていると、いよいよロボットの時代が到来するのではないかと感じられるかもしれません。実際、これらの滑らかな動きは、高度なロボット技術 + 精緻なフレーム設計 + マルチモーダル大型モデルの成果です。有用なロボットは多くの場合、環境との複雑かつ絶妙な相互作用を必要とし、環境は空間領域および時間領域の制約として表現できることがわかっています。たとえば、ロボットにお茶を注いでもらいたい場合、ロボットはまずティーポットのハンドルを掴んで、お茶をこぼさないように垂直に保ち、次にポットの口がカップの口と揃うまでスムーズに動かす必要があります。 、そしてティーポットを一定の角度に傾けます。これ

分散型人工知能カンファレンス DAI 2024 論文募集: エージェント デイ、強化学習の父であるリチャード サットン氏が出席します。 Yan Shuicheng、Sergey Levine、DeepMind の科学者が基調講演を行います 分散型人工知能カンファレンス DAI 2024 論文募集: エージェント デイ、強化学習の父であるリチャード サットン氏が出席します。 Yan Shuicheng、Sergey Levine、DeepMind の科学者が基調講演を行います Aug 22, 2024 pm 08:02 PM

会議の紹介 科学技術の急速な発展に伴い、人工知能は社会の進歩を促進する重要な力となっています。この時代に、分散型人工知能 (DAI) の革新と応用を目撃し、参加できることは幸運です。分散型人工知能は人工知能分野の重要な分野であり、近年ますます注目を集めています。大規模言語モデル (LLM) に基づくエージェントは、大規模モデルの強力な言語理解機能と生成機能を組み合わせることで、自然言語対話、知識推論、タスク計画などにおいて大きな可能性を示しました。 AIAgent は大きな言語モデルを引き継ぎ、現在の AI 界隈で話題になっています。アウ

宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました 宏蒙スマートトラベルS9とフルシナリオ新製品発売カンファレンス、多数の大ヒット新製品が一緒にリリースされました Aug 08, 2024 am 07:02 AM

今日の午後、Hongmeng Zhixingは新しいブランドと新車を正式に歓迎しました。 8月6日、ファーウェイはHongmeng Smart Xingxing S9およびファーウェイのフルシナリオ新製品発表カンファレンスを開催し、パノラマスマートフラッグシップセダンXiangjie S9、新しいM7ProおよびHuawei novaFlip、MatePad Pro 12.2インチ、新しいMatePad Air、Huawei Bisheng Withを発表しました。レーザー プリンタ X1 シリーズ、FreeBuds6i、WATCHFIT3、スマート スクリーン S5Pro など、スマート トラベル、スマート オフィスからスマート ウェアに至るまで、多くの新しいオールシナリオ スマート製品を開発し、ファーウェイは消費者にスマートな体験を提供するフル シナリオのスマート エコシステムを構築し続けています。すべてのインターネット。宏孟志興氏:スマートカー業界のアップグレードを促進するための徹底的な権限付与 ファーウェイは中国の自動車業界パートナーと提携して、

See all articles