10 月 30 日、Kunlun Wanwei は、オープンソース 数百億の大規模言語モデル「Tiangong」シリーズ Skywork-13B シリーズを発表し、一致するシリーズをオープンソース化することはほとんどありませんでした。 600GB、150B トークン # の超大規模で高品質なオープンソースの中国のデータ セット。
Kunlun Wanwei の「Tiangong」Skywork-13B シリーズには、現在 130 億のパラメーターを備えた 2 つの主要なモデルが含まれています: Skywork-13B-Base モデル、 Skywork-13B-Mathmodel では、CEVAL や GSM8K などの複数の信頼できる評価やベンチマーク テストで、同じサイズのモデルの中で 最高のモデルであることが示されています。効果は で、その 中国語能力 は特に優れており、中国のテクノロジー、金融、政務などの分野での実績は他のオープンソース モデルよりも高いです。
Skywork-13B (モデル スコープ) のダウンロード アドレスは、https://modelscope.cn/organization/skywork
Skywork-13B のダウンロード アドレス (Github): https:/ で入手できます。 /github.com/SkyworkAI/Skywork
オープンソース モデルに加えて、Skywork-13B シリーズの大規模モデルもオープンソースになります。 600GB 、150B トークン の高品質中国語コーパス データ セットSkypile/ Chinese-Web-Text -150B、これは現在利用可能な最大のオープンソース中国語データセットの 1 つです。
同時に、Kunlun Wanwei の「Skywork-13B」Skywork-13B シリーズの大型モデルが間もなく完全に商用化されます。 use#— —開発者は申請なしで商用利用できます。
130 億のパラメータ、2 つの主要なモデル、中国最大のデータセットの 1 つが商業利用に完全にオープンです。Kunlun Wanwei "Tiangong"Skywork-13B シリーズの大型モデルは、業界で最も完全なオープンソースの数百億の高品質商用モデルと言えます。
Skywork-13B シリーズの大型モデルのオープンソースは、大型モデルのアプリケーションとオープンソース コミュニティの開発に最適な技術サポートを提供し、大型モデルの商業的敷居を下げます。さまざまな業界への人工知能技術の導入を促進し、人工知能エコシステムの構築に貢献し、オープンソースコミュニティと協力して未知の世界を開拓し、より良い未来を創造していきます。 #二大モデルSkywork-13B-Base
このモデルは Skywork-13B の基本モデルであり、3 兆 2,000 億の多言語高品質データによって学習されており、CEVAL で利用可能です。 CMMLU、MMLU、GSM8K 評価およびベンチマーク テストでは、同じサイズのモデルで最良の結果が得られました。このオープンソース Skywork-13B シリーズ モデルは、CEVAL、CMMLU、MMLU、GSM8K などのいくつかの信頼できる評価ベンチマークにおいて、LLaMA2-13B などの大規模なオープンソース モデルを包括的に上回り、同規模の大規模モデルの中で最高の結果を達成しています。 。 (10 月 25 日時点のデータ)
ほとんどのトレーニング データ:
3.2T高品質な多言語トレーニングデータSkywork-13B シリーズの大規模モデルには、130 億のパラメータと 3 兆 2000 億の高品質の多言語トレーニング データがあります。モデルの生成能力、創造能力、数学的推論能力が大幅に向上しました。 最強の中国語モデリング機能: すべての中国語オープンソース モデルを上回る中国語モデリングの複雑さ評価 Skywork-13B シリーズ大型モデルは中国語モデリングに優れ、優れた中国語を備えています。文化的および創造的な能力。 Skywork-13Bシリーズの大型モデルは、中国語文章作成分野での評価において、特にテクノロジー、金融、行政、企業サービス、文化創造、ゲームなどの分野で優れた能力を発揮し、その性能は高く評価されています。他のオープンソース モデルよりも優れています この図は、さまざまなデータ フィールドでの評価モデルの混乱を示しています。値が低いほど、モデルのモデリング能力が高くなります。そのフィールド。結果は、Tiangong 13B が技術記事、映画、政府報告書、ゲーム、金融、および一般分野で良好なパフォーマンスを示していることを示しています。 #中国最大のオープンソース データ セットの 1 つ:150B トークン高品質の中国語コーパス 最も誠実なオープンソースの商業利用: 申請する必要はなく、商業利用を実現できます オープンソース エコシステムの繁栄を促進し、より多くの開発者が参加できるようにします。 の技術開発において、共創と共有を通じて技術向上を推進します。 AI 時代では、オープンソースのエコロジー構築がブームになっており、AI とアプリケーションの統合を実現するための重要なリンクとなっています。モデル開発と使用コストの敷居を下げ、技術的能力と経験を最大限に共有することで、より多くの企業や開発者がAI主導の技術変化に参加できるようになります。 Kunlun Wanwei の会長兼 CEO である Fang Han は、オープンソース エコシステムの構築に最初に参加した上級オープンソース エキスパートの 1 人であり、中国 Linux オープンソースの先駆者の 1 人でもあります。オープンソースの精神と AIGC テクノロジーの開発は、Kunlun Wanwei の戦略に完全に統合されます Kunlun Wanwei Groupの紹介 憑藉對科技發展趨勢的超前預判,崑崙萬維早在2020年便已開始佈局AIGC領域。至今,已累積近三年的相關工程研發經驗,並建立了業界領先的預訓練資料深度處理能力,崑崙萬維也在人工智慧領域取得了重大突破,目前已形成AI大模型、AI搜尋、AI遊戲、AI音樂、AI動漫、AI社交六大AI業務矩陣,是國內模型技術與工程能力最強,佈局最全面,同時全心投入開源社群建設的企業之一。 #AIGC Kunlun Wanwei の戦略には、AGI および AIGC との協力が含まれます4 月 17 日、Kunlun Wanwei は、インテリジェンスの出現を真に実現する中国初の国産大規模言語モデル「Tiangong 3.5」をリリースし、招待を開始しました。テスト。
5月19日、北京市経済情報局は「北京総合人工知能産業イノベーションパートナーシッププログラムメンバーリスト」の第1弾を発表した。 Kunlun Wanwei は、AIGC 分野における最先端の探査および投資レイアウトを備えたモデルパートナーおよび投資パートナーの最初のグループとなりました。 8月23日、クンルン・ワンウェイは、Tiangong AI Searchという初の国内AI検索製品をリリースしました。9月1日、クンルン・ワンウェイは、コンピュータ・ビジョンの分野で世界トップのAI検索製品をリリースし、機械学習の専門家である厳水成教授は、崑崙技術に正式に入社し、崑崙技術の創始者周亜輝氏とともに天宮知能の共同CEOを務め、最先端の研究を担当する崑崙技術2050グローバル研究所の所長も務めた。テクノロジー。 Tencent Youtu Lab と厦門大学が実施したマルチモーダル大規模言語モデルの評価において、9 月 5 日に Kunlun Wanwei Tiangong Large Model が総合スコアで初の総合スコアを獲得しました9 月 25 日、Kunlun Wanwei はAijie Coreを正式に管理し、AIチップを配置しました。 本日、Kunlun Wanwei Groupは、Tiangong Skywork-13Bシリーズ大型モデルのオープンソースアクションを通じて、人工知能エコシステムへの投資を継続するという固い決意を示しました
以上が新しいKunlun Wanwei「Tiangong」13Bシリーズの大型モデルは、敷居なく簡単に商品化できます。の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。