合計 10000 件の関連コンテンツが見つかりました
大規模なモデルの知識がなくなったらどうすればよいでしょうか?浙江大学チームは、大規模モデルのパラメータを更新する方法、つまりモデル編集を研究しています
記事の紹介:Xi Xiaoyao Science and Technology Talk 原著者 | Xiaoxi と Python の大規模モデルには、その巨大なサイズの背後にある直観的な疑問があります。「大規模なモデルはどのように更新すべきか?」大規模なモデルの非常に膨大なコンピューティング オーバーヘッドの下では、大規模なモデルの知識を更新することはできません。簡単に解決できます。単純な「学習タスク」ではありません。世界のさまざまな状況が複雑に変化する中、いつでもどこでも大規模なモデルが時代に追いつくことが理想的です。しかし、新しい大規模なモデルを学習させるための計算負荷は大きくなります。モデルはリアルタイムで更新できるため、他の入力の結果に悪影響を与えることなく、特定の領域のモデル データを効果的に変更するための新しい概念「モデル編集」が登場しました。ここで、 は「有効な隣人」を表します
2023-05-30
コメント 0
1244
大型下位モデルへの対応
記事の紹介:大規模モデルの低ランク適応は、大規模モデルの高次元構造を低次元構造で近似することで複雑さを軽減する手法です。目的は、良好なパフォーマンスを維持しながら、より小さく、より管理しやすいモデル表現を作成することです。多くのタスクでは、大規模モデルの高次元構造に冗長な情報や無関係な情報が存在する可能性があります。これらの冗長性を特定して削除することで、元のパフォーマンスを維持しながらより効率的なモデルを作成でき、トレーニングとデプロイに使用するリソースを削減できます。低ランク適応は、メモリ消費量を削減しながら、大規模モデルのトレーニングを高速化できる方法です。その原理は、事前トレーニングされたモデルの重みを凍結し、トレーニング可能なランク分解行列を Transformer アーキテクチャの各層に導入することにより、下流タスクのトレーニング可能性を大幅に低下させることです。
2024-01-23
コメント 0
609
Vivo が自社開発の汎用 AI モデル - Blue Heart Model を発表
記事の紹介:Vivoは、11月1日に開催された2023年開発者カンファレンスで、自社開発の汎用人工知能大型モデルマトリックスであるBlue Heart Modelを発表しましたが、Vivoは、Blue Heart Modelは、それぞれ異なるパラメータレベルを持つ5つのモデルを発売すると発表しました。 : 数十億、数百億、数千億でコアシナリオをカバーしており、そのモデル機能は業界をリードする地位にあります。 Vivo は、優れた自社開発大型モデルには、大規模、包括的な機能、強力なアルゴリズム、安全で信頼できる、独自の進化、広くオープンソースという 5 つの要件を満たす必要があると考えており、リライトされた内容は次のとおりです。 1 つ目は Lanxin Big Model 7B です。これは、携帯電話とクラウドの二重サービスを提供するように設計された 70 億レベルのモデルです。 Vivoは、このモデルは言語理解やテキスト作成などの分野で使用できると述べた。
2023-11-01
コメント 0
1510
ByteDanceは、一般モデル、ロールプレイングモデル、音声再生モデル、音声認識モデル、ビンセント図モデルなどを含む「Doubao Big Model」ファミリーを正式にリリースした。
記事の紹介:5月15日の当サイトのニュースによると、今朝、バイトダンスは2024年春の火山エンジンフォースカンファレンスで、同社の大型ビーンバッグモデルが外部サービスを正式に開始したと正式に発表した。レポートによると、ビーンバッグ大型モデルには、ビーンバッグ ユニバーサル モデル Pro、ビーンバッグ ユニバーサル モデル リティ、ビーンバッグ ロールプレイング モデル、ビーンバッグ音声合成モデル、ビーンバッグ音声再生モデル、ビーンバッグ音声認識モデル、ビーンバッグ・ヴィンセントが含まれます。ダイアグラムモデル、お手玉・FunctionCallモデル。関係者によると、カンファレンスは「AI成長の機会、新たなAIアプリケーションパラダイム、強力なAIコンピューティングパワーの護衛」の3章に分かれているという。 Bytedanceは、自社開発の大型モデルのリリースに加えて、Volcano Engineの大型モデルサービスプラットフォームであるVolcano Arkも大幅にアップグレードすることを発表した。同じ
2024-06-02
コメント 0
382
360 Qiyuan大型モデルが登録を通過し、自社開発した2つのモデルが承認されたと発表
記事の紹介:11月5日の当ウェブサイトのニュースによると、360大型モデル「Qiyuan Large Model」が登録され、11月4日に発売されたとのこと。当サイトの検索結果によると、「360 Intelligent Brain大型モデル」は今年9月5日に一般公開されており、360社は両大型モデルを登録した初の国内テクノロジー企業となった。 Brain Large Model は、360GPT ラージ モデルと 360 マルチモーダルラージ モデルの技術機能を統合しており、10 のコア機能と、生成的作成、マルチラウンド ダイアログ、論理的推論などの数百のサブディビジョン機能を備えており、ラージ モデルのすべてのアプリケーション シナリオをカバーしています。 。ユーザーは、ai.360.comでのワンストップログインを通じて、360 Intelligent Brain App、360 Search、360 Secure Browser、LoRA360、AIデジタル従業員などの大規模なサービスを体験できると報告されています。
2023-11-05
コメント 0
1043
大規模言語モデルと単語埋め込みモデルの違い
記事の紹介:大規模言語モデルと単語埋め込みモデルは、自然言語処理における 2 つの重要な概念です。どちらもテキストの分析と生成に適用できますが、原理と適用シナリオは異なります。大規模な言語モデルは主に統計的モデルと確率的モデルに基づいており、連続的なテキストと意味の理解を生成するのに適しています。単語埋め込みモデルは、単語をベクトル空間にマッピングすることで単語間の意味関係を捉えることができ、単語の意味推論やテキスト分類に適しています。 1. 単語埋め込みモデル 単語埋め込みモデルは、単語を低次元のベクトル空間にマッピングすることでテキスト情報を処理する技術です。言語内の単語をベクトル形式に変換して、コンピューターがテキストをよりよく理解して処理できるようにします。一般的に使用される単語埋め込みモデルには、Word2Vec や GloVe などがあります。これらのモデルは自然言語処理タスクで広く使用されています
2024-01-23
コメント 0
1440
百度、中国初の「産業レベル」の医療モデル「霊性医学モデル」を発表:百度、中国初の「産業レベル」の医療モデル「霊性医学モデル」を発表
記事の紹介:9月19日のニュースによると、百度は本日、中国初の「産業レベル」の医療モデルである霊性医学モデルをリリースし、医療のデジタル化とインテリジェンスを促進するため、評価と試用のために上流および下流の業界に霊性医学モデルを公開した。医療業界。具体的な使用シナリオに関して言えば、スピリチュアルドクターの大規模モデルは、フリーテキストを組み合わせて構造化された医療記録を数秒で生成し、医師と患者の対話を正確に分析して主訴や現在の病歴などのコンテンツを生成できます。また、精神医学の大型モデルは、複数の中国語と英語の文書の同時分析をサポートし、文書分析の内容に基づいたインテリジェントな質疑応答を実現する大型モデルです。補助的な診断と治療に関しては、精神医学の大型モデルは、複数回の対話を通じて患者の状態を理解し、医師による病気のリアルタイム診断を支援し、治療計画を推奨し、治療プロセス全体の効率と経験を向上させることができます。 、そして患者の24時間の「健康管理者」になります。
2023-09-20
コメント 0
1406
30以上の大型モデルが集結、大型モデルが世界人工知能会議の「トップクラス」に
記事の紹介:7月6日から8日まで、2023年世界人工知能会議が上海で開催された。 iFlytek は、Spark コグニティブ大規模モデルと産業アプリケーションをこのカンファレンスに持ち込み、大規模モデルのコア機能と、教育、医療、オフィス、産業、その他の分野における最新のアプリケーション結果を展示しました。イベント中、カンファレンス用に iFlytek が作成したデジタルヒューマンの広報担当者が、上海万博センターと万博展示コンベンションセンターのサービスデスクに見事に登場し、Spark モデルのサポートにより、聴衆は交流することができました。より自然なリアルタイムで人工知能カンファレンスの最新情報や注目のトピックについて学びましょう。 iFLYTEK同時通訳は、本カンファレンスの開会式とメインフォーラムを技術サポートし、国内外からのゲストのバリアフリーコミュニケーションの実現を支援しました。さらに、国産のソフトウェアとハードウェアに基づくSparkモデルは、AI大型モデル技術領域とHuawei Shengteng Ecosystemでも利用可能です
2023-07-10
コメント 0
1076
MiracleVision ビジュアルモデル
記事の紹介:MiracleVision は、ChinaAi の GPT モデルに基づいてトレーニングされた視覚的タスク解決モデルであり、画像分類、物体検出、画像生成などの多くの分野で使用でき、その機能は非常に強力です。
2023-06-20
コメント 0
2942
2023 年のベスト大規模言語モデル 6 つ
記事の紹介:今は AI の季節で、テクノロジー企業はパン屋のパンのような大規模な言語モデルを大量に生産しています。新しいモデルが急速にリリースされ、それを追い続けるのは非常に困難になってきています。しかし、新しいリリースの嵐の中で、残っているモデルはほんのわずかです
2024-06-14
コメント 0
897
大規模モデルのモデル融合法について話しましょう
記事の紹介:これまでの実践では、モデル融合は、特に判別モデルで広く使用されており、パフォーマンスを着実に向上させることができる方法と考えられています。ただし、生成言語モデルの場合、復号化プロセスが関係するため、その動作方法は判別モデルほど単純ではありません。さらに、大規模なモデルのパラメータ数が増加するため、より大きなパラメータスケールのシナリオでは、単純なアンサンブル学習で考慮できる手法は、従来のスタッキング、ブースティング、およびなどの低パラメータの機械学習よりも制限されます。他の方法は、モデルをスタッキングするためです。パラメータの問題は簡単に拡張できません。したがって、大規模なモデルのアンサンブル学習には慎重な検討が必要です。以下では、モデル統合、確率的統合、グラフティング学習、クラウドソーシング投票、MOE という 5 つの基本的な統合手法について説明します。
2024-03-11
コメント 0
461
ポピュラー サイエンス: AI ラージ モデルとは何ですか?
記事の紹介:AI ラージ モデルとは、大規模なデータと強力なコンピューティング能力を使用してトレーニングされた人工知能モデルを指します。これらのモデルは通常、高度な精度と一般化機能を備えており、自然言語処理、画像認識、音声認識などのさまざまな分野に適用できます。大規模な AI モデルのトレーニングには大量のデータとコンピューティング リソースが必要であり、通常、トレーニング プロセスを高速化するには分散コンピューティング フレームワークを使用する必要があります。これらのモデルのトレーニング プロセスは非常に複雑で、データ分布、特徴の選択、モデル構造などについての綿密な調査と最適化が必要です。 AI 大型モデルは幅広い用途があり、スマート カスタマー サービス、スマート ホーム、自動運転などのさまざまなシナリオで使用できます。これらのアプリケーションでは、AI 大型モデルは、人々がさまざまなタスクをより迅速かつ正確に完了し、作業効率を向上させるのに役立ちます。
2023-06-29
コメント 0
10259
360 Intelligent Brain-Visual 大型モデルをリリース、周宏毅:大型モデルで強化された AIoT は「本物の AI」
記事の紹介:「本来のAIoTは垂直型AIに過ぎず、一般的なAIではない。大型モデルによって強化されたAIoTは『真のAI』である。」 周宏毅氏は「360インテリジェント脳視覚大型モデル」のリリースを発表し、マルチモーダル大型モデルとオブジェクト ネットワーキングの組み合わせが次のトレンドであり、大型モデルをインテリジェント ハードウェアに接続することで、大型モデルの機能をデジタル世界から物理世界に移行できるようになります。 360は5月31日、大型ビジュアルモデルとAIハードウェアの新製品発表会を開催し、360グループ創業者の周宏毅氏が出席し、大型モデルがAIoTの新時代を切り開くと講演した。周宏毅氏は、過去の人工知能は弱い人工知能であり、これに基づいて構築されたインテリジェントハードウェアには本当の知能はないと述べた。大型モデルの出現後、コンピューターは初めて世界を真に理解できるようになり、AIoT を強化できるようになります
2023-06-03
コメント 0
840