ChatGPT を支えるオープンソース AI フレームワークである Ray の価値は現在 10 億ドル
テキスト生成人工知能は、最近インターネットを席巻しています。ChatGPT は、考えられるほぼすべての質問に対して、非常に詳細で現実に近い回答を提供する機能で人気があります。大規模なモデル アプリケーションの出現により、人々は AI テクノロジーの画期的な進歩に自信を深めていますが、その背後で分散型機械学習フレームワークがこの生成 AI 革命を推進していることを知っている人はほとんどいません。
A16z が支援するスタートアップ Anyscale の分散コンピューティング フレームワーク Ray は、OpenAI が ChatGPT のようなトレーニング モデルを強化できるようにする鍵となります。 Ray は、OpenAI の最近の大規模言語モデルすべての背後にあり、OpenAI の待望の GPT-4 の背後にあるフレームワークでもある可能性があります。大型モデル技術の導入が進む中、人間に近いコンテンツを生成することで数十億ドル規模の産業が形成されつつあると業界関係者らは考えている。
この分野では、Ray が最も影響力のあるフレームワークです。 OpenAI が登場する前は、カスタム ツールのコレクションを使用して大規模なモデルを開発していました。しかし、OpenAIの社長グレッグ・ブロックマンは、今年初めのRayサミットで、同社が直面する課題が増大したためRayに頼ったと述べた。
ソフトウェア会社 Weights & Biases の CEO、Lukas Biewald 氏は、Ray はすでに AI 界の注目の新星であると信じています。 「新しいツールのおかげで、ラップトップと大規模な分散サーバーで同じコードを実行できるようになりました。これは大きな変化であり、モデルが大きくなるにつれてその重要性はさらに高まるでしょう」とビーワルド氏は語った。
10 億ドルの賭け
テクノロジーが成熟するにつれて、レイは資本市場の注目を集めています。事情に詳しい関係者によると、エニースケールの株式は希少商品となっており、ビジネス・インサイダーは、同社の価値を10億ドル以上としたシリーズCラウンドの延長である最新の資金調達ラウンドが数日以内に終了したと報じた。
一部の投資家は Anyscale を Horowitz の希望に満ちた「次の Databricks」であると表現しています。このスタートアップの共同創設者である Ion Stoica が Databricks の共同創設者であることを考えると、この説明は合理的だと思われます。時価総額310億ドルのデータ巨人。
「人工知能は信じられないほどのペースで発展しており、人々は常に新しいアプローチを試しています」と Anyscale の CEO、ロバート 西原氏は述べています。 「ChatGPT は、大規模な言語モデルに関する多くのこれまでの成果を組み合わせたものです。これに加えて、柔軟性、迅速なイノベーション、さまざまなアルゴリズムやメソッドの拡張を可能にするインフラストラクチャが必要です。」
ChatGPT のような注目の新ツールの背後にあるモデルがますます大規模になっているため、テクノロジー企業は AI の開発方法を根本から再考する必要があります。 Ray は、これらの大規模なモデルのトレーニングを容易にするために生まれました。Ray は、数千億のデータ ポイントを含めることができるため、それぞれの応答にまるで本物のような感覚を与えることができます。
Ray が機械学習に最適なツールになる仕組み
Ray は、メモリ共有に基づく分散コンピューティング フレームワークであり、きめ細かい並列コンピューティングとヘテロジニアス コンピューティングに適しています。これは、機械学習モデルのトレーニング作業を分散するという複雑なタスクを管理するための基盤となるインフラストラクチャを提供します。
2017 年、カリフォルニア大学バークレー校の研究者は、Ray の論文「Ray: A Distributed Framework for Emerging AI Applications」を初めて提出しました。
- 紙のリンク: https://arxiv.org/abs/1712.05889
- GitHub: https:// github.com/ray-project/ray
#この研究では、研究者たちは次世代の AI アプリケーションがどのようなものになるかを予測しています。つまり、継続的なインタラクションを伴うものです。環境とともに学び、インタラクティブなアクションから学びます。これらのアプリケーションは、長期的な目標を達成するために、動的環境でタスクを完了し、環境の変化に対応し、一連のアクションを実行する必要がますます高まっています。これらの特性により、動作環境のパフォーマンスと柔軟性に対する新しく厳しいシステム要件が求められるため、研究者は分散ベースの Ray フレームワークを提案しました。
Ray は、タスクの並列処理とアクターベースの計算を表現できる統合インターフェイスを実装しており、単一の動的実行エンジンによってサポートされています。パフォーマンス要件を満たすために、Ray は分散スケジューラと分散フォールト トレラント ストレージを使用してシステムの制御状態を管理します。トレーニング、シミュレーション、サービスを統合する初の分散コンピューティング フレームワークであり、動的タスク実行エンジンに基づいてロール並列 (アクター) とタスク並列 (タスク) の計算を統合し、フレームワークの高い拡張性と高性能を保証します。許容範囲。
Ray のアーキテクチャ。
この成果に基づいて、2019 年 12 月にカリフォルニア大学バークレー校のロバート 西原氏、フィリップ モリッツ氏、イオン ストイカ氏、およびバークレー教授のマイケル I. ジョーダン氏が Anyscale を設立しました。これまでに2億6000万ドルを調達しています。
#機械学習の実践者は、ユーザーがどの製品を購入するかを予測する単純なモデルなど、ラップトップ上の限られたデータセットを使用して小規模なモデルを実行できることがよくあります。ただし、ラップトップは、トレーニングに大規模なサーバーを必要とする ChatGPT のような非常に大規模なモデルには適していません。
多数のデバイスを使用してモデルをトレーニングする場合、さまざまなハードウェアでのトレーニングを調整するという重要な課題に直面します。 Ray はまさにこの問題を解決します。さまざまなハードウェアを 1 つの単位として管理して、どのデータがどこに送信されるかを決定し、障害に対処するためのメカニズムを実務者に提供します。ハードウェアの種類は、Google Cloud、AWS などにまたがります。同じ問題に対処する製品のポートフォリオです。 。さらに、レイは、他の言語では主要なプログラミング概念である「アクター」を、機械学習プログラムに最適な言語として知られる Python にも拡張しました。
分散コンピューティング フレームワークとして、Ray には 2 つの重要な利点があります。それは、位置認識 (Locality-aware) とタスク配置 (タスク配置) です。 。以下の図に示すように、Ray はシステムをスケールアウトして、フォールト トレランスと低遅延タスク スケジューリングを維持しながら、高スループットのきめ細かいタスクをサポートできます。
Ray は、OpenAI 用の大規模モデルのトレーニングから大幅な複雑さを取り除き、企業を解放してモデルの重要な機能に集中できるようにします。
次世代 AI には新しい開発ツールが必要ですが、Ray は、AI 開発方法を急速に破壊しつつある、急速に出現している次世代機械学習ツールの 1 つにすぎません。たとえば、Google の JAX フレームワークも大きな注目を集めており、JAX は Google の中核となる機械学習ツールのバックボーンとなることが期待されており、DeepMind や Google Brain で広く採用されています。
同様に、FirstMark Capital と Bessemer Venture Partners が支援するスタートアップ企業である Coinled は、Dask と呼ばれる並列コンピューティング フレームワークを開発しました。
大規模な言語モデルは最近、さらなる可能性を解き放ちつつあり、これらの新しい機械学習ツールは、業界の大手テクノロジー企業や新興企業向けに、より強力な言語モデルを構築することになります。
以上がChatGPT を支えるオープンソース AI フレームワークである Ray の価値は現在 10 億ドルの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック









Centos Shutdownコマンドはシャットダウンし、構文はシャットダウン[オプション]時間[情報]です。オプションは次のとおりです。-hシステムをすぐに停止します。 -pシャットダウン後に電源をオフにします。 -r再起動; -t待機時間。時間は、即時(現在)、数分(分)、または特定の時間(HH:mm)として指定できます。追加の情報をシステムメッセージに表示できます。

Centosシステムの下でのGitlabのバックアップと回復ポリシーデータセキュリティと回復可能性を確保するために、Gitlab on Centosはさまざまなバックアップ方法を提供します。この記事では、いくつかの一般的なバックアップ方法、構成パラメーター、リカバリプロセスを詳細に紹介し、完全なGitLabバックアップと回復戦略を確立するのに役立ちます。 1.手動バックアップGitlab-RakeGitlabを使用:バックアップ:コマンドを作成して、マニュアルバックアップを実行します。このコマンドは、gitlabリポジトリ、データベース、ユーザー、ユーザーグループ、キー、アクセスなどのキー情報をバックアップします。デフォルトのバックアップファイルは、/var/opt/gitlab/backupsディレクトリに保存されます。 /etc /gitlabを変更できます

CENTOSシステムでHDFS構成をチェックするための完全なガイドこの記事では、CENTOSシステム上のHDFSの構成と実行ステータスを効果的に確認する方法をガイドします。次の手順は、HDFSのセットアップと操作を完全に理解するのに役立ちます。 Hadoop環境変数を確認します。最初に、Hadoop環境変数が正しく設定されていることを確認してください。端末では、次のコマンドを実行して、Hadoopが正しくインストールおよび構成されていることを確認します。HDFS構成をチェックするHDFSファイル:HDFSのコア構成ファイルは/etc/hadoop/conf/ディレクトリにあります。使用

Pytorch GPUアクセラレーションを有効にすることで、CentOSシステムでは、PytorchのCUDA、CUDNN、およびGPUバージョンのインストールが必要です。次の手順では、プロセスをガイドします。CUDAおよびCUDNNのインストールでは、CUDAバージョンの互換性が決定されます。NVIDIA-SMIコマンドを使用して、NVIDIAグラフィックスカードでサポートされているCUDAバージョンを表示します。たとえば、MX450グラフィックカードはCUDA11.1以上をサポートする場合があります。 cudatoolkitのダウンロードとインストール:nvidiacudatoolkitの公式Webサイトにアクセスし、グラフィックカードでサポートされている最高のCUDAバージョンに従って、対応するバージョンをダウンロードしてインストールします。 cudnnライブラリをインストールする:

CentOSにMySQLをインストールするには、次の手順が含まれます。適切なMySQL Yumソースの追加。 yumを実行して、mysql-serverコマンドをインストールして、mysqlサーバーをインストールします。ルートユーザーパスワードの設定など、MySQL_SECURE_INSTALLATIONコマンドを使用して、セキュリティ設定を作成します。必要に応じてMySQL構成ファイルをカスタマイズします。 MySQLパラメーターを調整し、パフォーマンスのためにデータベースを最適化します。

DockerはLinuxカーネル機能を使用して、効率的で孤立したアプリケーションランニング環境を提供します。その作業原則は次のとおりです。1。ミラーは、アプリケーションを実行するために必要なすべてを含む読み取り専用テンプレートとして使用されます。 2。ユニオンファイルシステム(UnionFS)は、違いを保存するだけで、スペースを節約し、高速化する複数のファイルシステムをスタックします。 3.デーモンはミラーとコンテナを管理し、クライアントはそれらをインタラクションに使用します。 4。名前空間とcgroupsは、コンテナの分離とリソースの制限を実装します。 5.複数のネットワークモードは、コンテナの相互接続をサポートします。これらのコア概念を理解することによってのみ、Dockerをよりよく利用できます。

SSHサービスを再起動するコマンドは次のとおりです。SystemCTL再起動SSHD。詳細な手順:1。端子にアクセスし、サーバーに接続します。 2。コマンドを入力します:SystemCtl RestArt SSHD; 3.サービスステータスの確認:SystemCTLステータスSSHD。

Pytorchの分散トレーニングでは、Centosシステムでトレーニングには次の手順が必要です。Pytorchのインストール:PythonとPipがCentosシステムにインストールされていることです。 CUDAバージョンに応じて、Pytorchの公式Webサイトから適切なインストールコマンドを入手してください。 CPUのみのトレーニングには、次のコマンドを使用できます。PipinstalltorchtorchtorchvisionTorchaudioGPUサポートが必要な場合は、CUDAとCUDNNの対応するバージョンがインストールされ、インストールに対応するPytorchバージョンを使用してください。分散環境構成:分散トレーニングには、通常、複数のマシンまたは単一マシンの複数GPUが必要です。場所
