


数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきます
Alibaba Cloud は、10 月 31 日に数千億のパラメーターを備えた大規模モデルである Tongyi Qianwen 2.0 を正式にリリースしました。 10 件の信頼できる評価結果によると、Tongyi Qianwen 2.0 の総合パフォーマンスは GPT-3.5 を上回り、GPT-4 に急速に追いつきつつあります。同日、Tongyi Qianwen APP が主要なモバイル アプリケーション市場でリリースされ、誰でも APP を通じて最新モデルの機能を直接体験できます
過去 6 か月で、Tongyi Qianwen 2.0 は大きな進歩を遂げました。パフォーマンス 4 月にリリースされたバージョン 1.0 と比較して、Tongyi Qianwen 2.0 は、複雑なコマンドの理解、文学創作、一般数学、知識記憶、幻覚耐性の能力が大幅に向上しました。現在、Tongyi Qianwenの総合パフォーマンスはGPT-3.5を超え、GPT-4に追いつくべく加速しています。
#MMLU、C-Eval、GSM8K、HumanEval、MATH、およびその他の 10 の主流ベンチマーク評価セットにおいて、Tongyi Qianwen 2.0 のスコアは総合的に Meta の Llama-2-70B を上回り、OpenAI の Chat-3.5 と比較すると 9 勝 1 勝でしたGPT-4 と比較すると 4 勝 6 敗であり、GPT-4 との差はさらに縮まっています
中国語と英語の理解力は大規模言語モデルの基礎スキルです。英語のタスクに関しては、Tongyi Qianwen 2.0 は MMLU ベンチマークで 82.5 のスコアを獲得し、GPT-4 に次いで 2 番目でした。パラメータの数を大幅に増やすことにより、Tongyi Qianwen 2.0 は複雑な言語構造と概念をよりよく理解し、処理できるようになります。タスクに関しては、Tongyi Qianwen 2.0 が優れています。 , Tongyi Qianwen 2.0 は、C-Eval ベンチマークで明らかな優位性を持って最高スコアを達成しました。これは、モデルがトレーニング中により多くの中国語コーパスを学習し、中国語の理解と表現能力がさらに強化されたためです。
Tongyi Qianwen 2.0 は、数学的推論やコード理解などの分野で大きな進歩を遂げました。推論ベンチマーク テスト GSM8K では、Tongyi Qianwen が 2 位となり、強力なコンピューティング能力と論理的推論能力を実証しました。HumanEval テストでは、Tongyi Qianwen のスコアは、主に大規模なモデルの能力を測定する GPT-4 および GPT-3.5 にほぼ続きました。コード フラグメントを理解して実行することは、プログラミング支援や自動コード修復などのシナリオで使用される大規模モデルの基礎となります。
Tongyi Qianwen はより成熟し、使いやすくなりました。 Tongyi Qianwen 2.0 は、下流のアプリケーション シナリオにうまく統合できるように、指示への準拠、ツールの使用、洗練された作成などの点で技術的な最適化が行われています。 Tongyi Large Model の公式 Web サイトでは、画像入力や文書解析などの細分化されたタスクをサポートするマルチモーダル機能とプラグイン機能を開始しました。
同時に、Tongyi ラージ モデル トレーニングに基づく 8 つの主要なインダストリ モデル グループが立ち上げられました。それらは、Tongyi Lingma - インテリジェント コーディング アシスタント、Tongyi Zhiwen - AI リーディング アシスタント、Tongyi リスニング - 作業学習 AI アシスタントです。 Tongyi Stardust - パーソナライズされたキャラクター作成プラットフォーム、Tongyi Midianjin - インテリジェントな投資リサーチアシスタント、Tongyi Xiaomi - インテリジェントな顧客サービス、Tongyi Renxin - パーソナルヘルスアシスタント、Tongyi Farui - AI 法律コンサルタント。 8 つの主要なインダストリ モデルは、最も一般的な垂直シナリオ向けに設計されており、ドメイン データを使用して特別にトレーニングされています。ユーザーは公式 Web サイトでモデル機能を直接体験でき、開発者は Web ページの埋め込み、API/SDK 呼び出しなどを通じてモデル機能を独自の大規模モデル アプリケーションやサービスに統合できます。
現在10月、アリババクラウドは60以上の業界の主要パートナーと緊密な協力を実施し、オフィス、文化観光、電力、政務、医療保険、運輸、製造、金融の分野で前文将軍の実用化を推進した。 、ソフトウェア開発およびその他の分野
Zhou Jingren氏は、Alibaba Cloudが近い将来、Tongyi Qianwenの72Bバージョンをオープンソース化する計画であると述べた。以前、Alibaba Cloud はこのモデルの 7B および 14B バージョンをオープンソース化しており、これらのモデルの累計ダウンロード数は 100 万件を超えています。 Alibaba Cloud は、さまざまな業界の開発者が Tongyi Qianwen オープン ソース モデルを使用してモデルやアプリケーションを革新できるよう引き続きサポートしていきます
以上が数千億のパラメータを備えた Alibaba Cloud Tongyi Qianwen は 2.0 に進化しました。パフォーマンスは GPT-3.5 を超え、加速して GPT-4 に追いつきますの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

ホットAIツール

Undresser.AI Undress
リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover
写真から衣服を削除するオンライン AI ツール。

Undress AI Tool
脱衣画像を無料で

Clothoff.io
AI衣類リムーバー

AI Hentai Generator
AIヘンタイを無料で生成します。

人気の記事

ホットツール

メモ帳++7.3.1
使いやすく無料のコードエディター

SublimeText3 中国語版
中国語版、とても使いやすい

ゼンドスタジオ 13.0.1
強力な PHP 統合開発環境

ドリームウィーバー CS6
ビジュアル Web 開発ツール

SublimeText3 Mac版
神レベルのコード編集ソフト(SublimeText3)

ホットトピック











拡散はより良いものを模倣するだけでなく、「創造」することもできます。拡散モデル(DiffusionModel)は、画像生成モデルである。 AI 分野でよく知られている GAN や VAE などのアルゴリズムと比較すると、拡散モデルは異なるアプローチを採用しており、その主な考え方は、最初に画像にノイズを追加し、その後徐々にノイズを除去するプロセスです。ノイズを除去して元の画像を復元する方法は、アルゴリズムの中核部分です。最後のアルゴリズムは、ランダムなノイズを含む画像から画像を生成できます。近年、生成 AI の驚異的な成長により、テキストから画像への生成、ビデオ生成など、多くのエキサイティングなアプリケーションが可能になりました。これらの生成ツールの背後にある基本原理は、以前の方法の制限を克服する特別なサンプリング メカニズムである拡散の概念です。

キミ: たった 1 文の PPT がわずか 10 秒で完成します。 PPTはとても面倒です!会議を開催するには PPT が必要であり、週次報告書を作成するには PPT が必要であり、投資を勧誘するには PPT を提示する必要があり、不正行為を告発するには PPT を送信する必要があります。大学は、PPT 専攻を勉強するようなものです。授業中に PPT を見て、授業後に PPT を行います。おそらく、デニス オースティンが 37 年前に PPT を発明したとき、PPT がこれほど普及する日が来るとは予想していなかったでしょう。 PPT 作成の大変な経験を話すと涙が出ます。 「20 ページを超える PPT を作成するのに 3 か月かかり、何十回も修正しました。PPT を見ると吐きそうになりました。」 「ピーク時には 1 日に 5 枚の PPT を作成し、息をすることさえありました。」 PPTでした。」 即席の会議をするなら、そうすべきです

北京時間6月20日早朝、シアトルで開催されている最高の国際コンピュータビジョンカンファレンス「CVPR2024」が、最優秀論文やその他の賞を正式に発表した。今年は、最優秀論文 2 件と学生優秀論文 2 件を含む合計 10 件の論文が賞を受賞しました。また、最優秀論文ノミネートも 2 件、学生優秀論文ノミネートも 4 件ありました。コンピュータービジョン (CV) 分野のトップカンファレンスは CVPR で、毎年多数の研究機関や大学が集まります。統計によると、今年は合計 11,532 件の論文が投稿され、2,719 件が採択され、採択率は 23.6% でした。ジョージア工科大学による CVPR2024 データの統計分析によると、研究テーマの観点から最も論文数が多いのは画像とビデオの合成と生成です (Imageandvideosyn

C言語は広く使われているプログラミング言語であり、コンピュータプログラミングを志す人にとって必ず学ばなければならない基本的な言語の一つです。ただし、初心者にとって、特に関連する学習ツールや教材が不足しているため、新しいプログラミング言語を学習するのは難しい場合があります。この記事では、C言語初心者がすぐに始められるプログラミングソフトを5つ紹介します。最初のプログラミング ソフトウェアは Code::Blocks でした。 Code::Blocks は、無料のオープンソース統合開発環境 (IDE) です。

タイトル: 技術初心者必読: 具体的なコード例を必要とする C 言語と Python の難易度分析 今日のデジタル時代において、プログラミング技術はますます重要な能力となっています。ソフトウェア開発、データ分析、人工知能などの分野で働きたい場合でも、単に興味があってプログラミングを学びたい場合でも、適切なプログラミング言語を選択することが最初のステップです。数あるプログラミング言語の中でも、C言語とPythonは広く使われているプログラミング言語であり、それぞれに独自の特徴があります。この記事ではC言語とPythonの難易度を分析します。

PyCharm コミュニティ版のクイック スタート: 詳細なインストール チュートリアル 完全な分析 はじめに: PyCharm は、開発者が Python コードをより効率的に作成できるようにする包括的なツール セットを提供する強力な Python 統合開発環境 (IDE) です。この記事では、PyCharm Community Edition のインストール方法を詳しく紹介し、初心者がすぐに使い始めるのに役立つ具体的なコード例を示します。ステップ 1: PyCharm Community Edition をダウンロードしてインストールする PyCharm を使用するには、まず公式 Web サイトからダウンロードする必要があります

LLM が大量のデータを使用して大規模なコンピューター クラスターでトレーニングされていることはわかっています。このサイトでは、LLM トレーニング プロセスを支援および改善するために使用される多くの方法とテクノロジが紹介されています。今日、私たちが共有したいのは、基礎となるテクノロジーを深く掘り下げ、オペレーティング システムさえ持たない大量の「ベア メタル」を LLM のトレーニング用のコンピューター クラスターに変える方法を紹介する記事です。この記事は、機械がどのように考えるかを理解することで一般的な知能の実現に努めている AI スタートアップ企業 Imbue によるものです。もちろん、オペレーティング システムを持たない大量の「ベア メタル」を LLM をトレーニングするためのコンピューター クラスターに変換することは、探索と試行錯誤に満ちた簡単なプロセスではありませんが、Imbue は最終的に 700 億のパラメータを備えた LLM のトレーニングに成功しました。プロセスが蓄積する

検索拡張生成 (RAG) は、検索を使用して言語モデルを強化する手法です。具体的には、言語モデルは回答を生成する前に、広範な文書データベースから関連情報を取得し、この情報を使用して生成プロセスをガイドします。このテクノロジーにより、コンテンツの精度と関連性が大幅に向上し、幻覚の問題を効果的に軽減し、知識の更新速度が向上し、コンテンツ生成の追跡可能性が向上します。 RAG は間違いなく、人工知能研究の中で最もエキサイティングな分野の 1 つです。 RAGについて詳しくは、当サイトのコラム記事「大型モデルの欠点を補うことに特化したRAGの新展開とは?」を参照してください。このレビューはそれを明確に説明しています。」しかし、RAG は完璧ではなく、ユーザーはそれを使用するときにいくつかの「問題点」に遭遇することがよくあります。最近、NVIDIA の生成 AI 高度なソリューション
