国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリース-AI-php.cn

ホームページ

テクノロジー周辺機器

国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリース

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 10, 2024 pm 02:49 PM

はじめる

iFlytek は、1 月 30 日に Spark Cognitive Large Model の V3.5 アップグレードカンファレンスを開催します。 iFlytek の Liu Qingfeng 会長と Liu Cong 研究所長は、初の国家産業用コンピューティング能力トレーニングに基づいて iFlytek Spark V3.5 を正式にリリースしました。

iFlytekは、数兆のパラメータを持つ大規模モデルのトレーニングをサポートするWanka初の国内コンピューティングパワープラットフォーム「Flying Star One」を2023年10月24日にリリースし、正式に開始すると発表しました。発売から 90 日以上にわたり、iFlytek Spark は、「Flying Star One」に基づいて GPT-4 をベンチマークするために、より大きなパラメーターを使用した大規模なモデルトレーニングを開始し、その結果、1 月 30 日に iFlytek Spark V3.5 アップグレードがリリースされました。

National Open Large Model トレーニングに基づいて、National Open Large Model Fire V3.5 は、言語理解、テキスト生成、知識の質問と回答、論理的推論、数学的能力、コーディングの 7 つの側面で包括的な結果を達成しました。能力とマルチモーダル能力のアップグレード。その中で、言語理解と数学的能力は GPT-4 Turbo を上回り、コードは GPT-4 Turbo の 96% に達し、マルチモーダル理解は GPT-4V の 91% に達しました。

現在、iFlytek Spark は、China Pacific Insurance との協力、Spark Pacific Insurance との協力、および Spark Pacific を通じて、保険、銀行、エネルギー、自動車、通信などの分野の大手企業に力を与えています。社内のナレッジサービス、オフィス、監査、展示会業界などに権限を与え、保険分野でのデジタルレイバー適用のベンチマークを作成する計画であり、交通銀行と共同で顧客サービス、展示会業界、オフィス、研究、展示会業界などに権限を与える。銀行分野におけるコード機能のアプリケーションベンチマークの作成に焦点を当てた開発など、National Energy Group と共同で、石炭における中央企業グループの統合連携のための大規模なモデルアプリケーションベンチマークを作成できるようにする。国家エネルギーグループと協力して石炭、電力、運輸、化学産業などに力を与え、中央企業グループの統合連携の大規模モデルを構築している。アプリケーションのベンチマーク。

さらに、国内のコンピューティング能力に深く適応した「iFlytek Spark オープンソース大規模モデル」が初めてリリースされ、最先端のシーンアプリケーション効果を備え、Shengsi オープンソースコミュニティが共同でこれを立ち上げました。オンライン。

国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリース

このオープンソースには、基本モデル iFlytekSpark-13B-base、微調整モデル iFlytekSpark-13B-chat、およびファインモデルを含む 1 億 3,000 万個のパラメータ (13B) があります。 -チューニングツールiFlytekSpark-13B-Lora、パーソナリティカスタマイズツールiFlytekSpark-13B-Charter。学術企業の研究は、フルスタックの自律的で制御可能な Spark 最適化スイートに基づいて、独自の専用の大規模モデルをより簡単にトレーニングできます。

Liu Qingfeng 氏は、Spark オープンソースの大規模モデルがテクノロジーにおいて差別化された利点を形成していることを明らかにしました。 Spark Open Source-13B は、テキスト生成、言語理解、テキスト書き換え、業界 Q&A、機械翻訳などの一般的なエンタープライズシナリオにおいて、綿密な調査と分析を通じて、多くのよく知られた公開評価タスクの中で最高の評価を受けています。学習支援や言語理解などの分野での最適化により、パフォーマンスが大幅に向上し、複雑な自然言語タスクを処理する際にさらに便利になりました。

「Flying Star One」トレーニングに基づいた、Spark オープンソース大規模モデルのフルスタック国内適応と最適化は、シンプルで使いやすく、優れたシーンアプリケーション効果を備えています。トレーニング戦略は非常に最適化されています。 Ascend のコンピューティング能力が向上し、トレーニング効率は A100 90% に達します。これは、Ascend AI ハードウェアのさらに徹底的な最適化であるだけでなく、国内のコンピューティング能力が国際的な先進レベルに追いつく決意と能力を示しています。

オープンソースは、より多くのシナリオが実装された場合にのみ、生態学的協力をさらに強化できます。現在、Huawei Shengsi オープンソースコミュニティは、Spark Large Model Open Source Version-13B を正式に開始しました。これは学術および企業研究に完全に無料であり、学術協力と産業探査を同時に強化します。

2024 年の iFlytek Spark 大型モデルの開発を楽しみにしている Liu Qingfeng 氏は、次の 3 つの点を指摘しました。「まず、一般的な大型モデルの基礎となる機能を最先端の国際レベルと比較してベンチマークし続ける必要があります。アルゴリズムの研究から小規模な計算の組み込みまで、そのギャップを理解するには頭が冴えて合理的でなければなりません。現在、小サンプルの高速トレーニング、マルチモーダルディープラーニングなどの分野では、GPT-4 の最高レベルとの間にはまだギャップがあります。 iFlytek Spark は、今年上半期に現在の最高レベルの GPT-4 に追いつくことができると確信しています。「今日の一般的な大規模モデルは、必ずしも人工知能の将来全体を表しているわけではありません。脳科学の相互作用、敵対的ネットワークの深い接続など、やるべきイノベーションはまだたくさんあります。これらには革新的なエコシステム全体が必要ですが、私たちは前に進む勇気と期待を持たなければなりません。最前線で」とLiu Qingfeng氏は指摘した。

「第二に、2024 年には、業界用途だけでなく、多くの主要な技術革新における大型モデルの連携においても、大型モデルの質と量を真に本格的に開始する必要があります。中国のビジネス界「

「第三に、高層ビルは安全で制御可能なプラットフォーム上に建設されなければなりません。また、私たちは独立した制御可能なプラットフォーム上で生態学的繁栄を達成しなければなりません。」Liu Qingfeng同氏は、アルゴリズムやデータ、アプリケーションシナリオからコンピューティングパワーに至るまで、完全に自律的で制御可能な豊かな人工知能エコシステムを構築するという目標を達成できると確信していると述べた。

以上が国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリースの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

脱衣画像を無料で

Clothoff.io

AI衣類リムーバー

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

神レベルのコード編集ソフト（SublimeText3）

ホットトピック

Gmailメールのログイン入り口はどこですか？

7683

Java チュートリアル

1639

CakePHP チュートリアル

1393

Laravel チュートリアル

1286

PHP チュートリアル

1229

Related knowledge

パデュー大学による、時間をかける価値のある拡散モデルのチュートリアル Apr 07, 2024 am 09:01 AM

拡散はより良いものを模倣するだけでなく、「創造」することもできます。拡散モデル（DiffusionModel）は、画像生成モデルである。 AI 分野でよく知られている GAN や VAE などのアルゴリズムと比較すると、拡散モデルは異なるアプローチを採用しており、その主な考え方は、最初に画像にノイズを追加し、その後徐々にノイズを除去するプロセスです。ノイズを除去して元の画像を復元する方法は、アルゴリズムの中核部分です。最後のアルゴリズムは、ランダムなノイズを含む画像から画像を生成できます。近年、生成 AI の驚異的な成長により、テキストから画像への生成、ビデオ生成など、多くのエキサイティングなアプリケーションが可能になりました。これらの生成ツールの背後にある基本原理は、以前の方法の制限を克服する特別なサンプリングメカニズムである拡散の概念です。

ワンクリックでPPTを生成！キミ: まずは「PPT出稼ぎ労働者」を普及させましょう Aug 01, 2024 pm 03:28 PM

キミ: たった 1 文の PPT がわずか 10 秒で完成します。 PPTはとても面倒です！会議を開催するには PPT が必要であり、週次報告書を作成するには PPT が必要であり、投資を勧誘するには PPT を提示する必要があり、不正行為を告発するには PPT を送信する必要があります。大学は、PPT 専攻を勉強するようなものです。授業中に PPT を見て、授業後に PPT を行います。おそらく、デニスオースティンが 37 年前に PPT を発明したとき、PPT がこれほど普及する日が来るとは予想していなかったでしょう。 PPT 作成の大変な経験を話すと涙が出ます。「20 ページを超える PPT を作成するのに 3 か月かかり、何十回も修正しました。PPT を見ると吐きそうになりました。」「ピーク時には 1 日に 5 枚の PPT を作成し、息をすることさえありました。」 PPTでした。」即席の会議をするなら、そうすべきです

CVPR 2024 のすべての賞が発表されました!オフラインでのカンファレンスには1万人近くが参加し、Googleの中国人研究者が最優秀論文賞を受賞した Jun 20, 2024 pm 05:43 PM

北京時間6月20日早朝、シアトルで開催されている最高の国際コンピュータビジョンカンファレンス「CVPR2024」が、最優秀論文やその他の賞を正式に発表した。今年は、最優秀論文 2 件と学生優秀論文 2 件を含む合計 10 件の論文が賞を受賞しました。また、最優秀論文ノミネートも 2 件、学生優秀論文ノミネートも 4 件ありました。コンピュータービジョン (CV) 分野のトップカンファレンスは CVPR で、毎年多数の研究機関や大学が集まります。統計によると、今年は合計 11,532 件の論文が投稿され、2,719 件が採択され、採択率は 23.6% でした。ジョージア工科大学による CVPR2024 データの統計分析によると、研究テーマの観点から最も論文数が多いのは画像とビデオの合成と生成です (Imageandvideosyn

ベアメタルから 700 億のパラメータを備えた大規模モデルまで、チュートリアルとすぐに使えるスクリプトがここにあります Jul 24, 2024 pm 08:13 PM

LLM が大量のデータを使用して大規模なコンピュータークラスターでトレーニングされていることはわかっています。このサイトでは、LLM トレーニングプロセスを支援および改善するために使用される多くの方法とテクノロジが紹介されています。今日、私たちが共有したいのは、基礎となるテクノロジーを深く掘り下げ、オペレーティングシステムさえ持たない大量の「ベアメタル」を LLM のトレーニング用のコンピュータークラスターに変える方法を紹介する記事です。この記事は、機械がどのように考えるかを理解することで一般的な知能の実現に努めている AI スタートアップ企業 Imbue によるものです。もちろん、オペレーティングシステムを持たない大量の「ベアメタル」を LLM をトレーニングするためのコンピュータークラスターに変換することは、探索と試行錯誤に満ちた簡単なプロセスではありませんが、Imbue は最終的に 700 億のパラメータを備えた LLM のトレーニングに成功しました。プロセスが蓄積する

PyCharm Community Edition インストールガイド: すべての手順をすばやくマスターする Jan 27, 2024 am 09:10 AM

PyCharm コミュニティ版のクイックスタート: 詳細なインストールチュートリアル完全な分析はじめに: PyCharm は、開発者が Python コードをより効率的に作成できるようにする包括的なツールセットを提供する強力な Python 統合開発環境 (IDE) です。この記事では、PyCharm Community Edition のインストール方法を詳しく紹介し、初心者がすぐに使い始めるのに役立つ具体的なコード例を示します。ステップ 1: PyCharm Community Edition をダウンロードしてインストールする PyCharm を使用するには、まず公式 Web サイトからダウンロードする必要があります

AIの活用 | AIが一人暮らしの女の子の生活ビデオブログを作成、3日間で数万件の「いいね！」を獲得 Aug 07, 2024 pm 10:53 PM

Machine Power Report 編集者: Yang Wen 大型モデルや AIGC に代表される人工知能の波は、私たちの生活や働き方を静かに変えていますが、ほとんどの人はまだその使い方を知りません。そこで、直感的で興味深く、簡潔な人工知能のユースケースを通じてAIの活用方法を詳しく紹介し、皆様の思考を刺激するコラム「AI in Use」を立ち上げました。また、読者が革新的な実践的な使用例を提出することも歓迎します。ビデオリンク: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ 最近、Xiaohongshu で一人暮らしの女の子の生活 vlog が人気になりました。イラスト風のアニメーションといくつかの癒しの言葉を組み合わせれば、数日で簡単に習得できます。

C言語学習を始めるためのプログラミングソフト5選 Feb 19, 2024 pm 04:51 PM

C言語は広く使われているプログラミング言語であり、コンピュータプログラミングを志す人にとって必ず学ばなければならない基本的な言語の一つです。ただし、初心者にとって、特に関連する学習ツールや教材が不足しているため、新しいプログラミング言語を学習するのは難しい場合があります。この記事では、C言語初心者がすぐに始められるプログラミングソフトを5つ紹介します。最初のプログラミングソフトウェアは Code::Blocks でした。 Code::Blocks は、無料のオープンソース統合開発環境 (IDE) です。

技術初心者必読：C言語とPythonの難易度分析 Mar 22, 2024 am 10:21 AM

タイトル: 技術初心者必読: 具体的なコード例を必要とする C 言語と Python の難易度分析今日のデジタル時代において、プログラミング技術はますます重要な能力となっています。ソフトウェア開発、データ分析、人工知能などの分野で働きたい場合でも、単に興味があってプログラミングを学びたい場合でも、適切なプログラミング言語を選択することが最初のステップです。数あるプログラミング言語の中でも、C言語とPythonは広く使われているプログラミング言語であり、それぞれに独自の特徴があります。この記事ではC言語とPythonの難易度を分析します。

See all articles

国家コンピューティングパワープラットフォーム「Flying Star One」トレーニングに基づいた iFlytek Spark V3.5 が正式リリース

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック