現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- 複数の形態とタスクに適応する、最も強力なオープンソースロボット学習システム「Octopus」が誕生
- ロボット学習に関しては、特定のロボットとタスクに固有のデータセットを収集し、それを使用してポリシーをトレーニングするのが一般的なアプローチです。ただし、この方法を使用してゼロから学習する場合、タスクごとに十分なデータを収集する必要があり、結果として得られるポリシーの一般化能力は通常不十分です。 「原則として、他のロボットやタスクから収集された経験は、モデルがさまざまなロボット制御の問題を認識できるようにする可能な解決策を提供し、これらの問題は、たとえ一般的なモデルであっても、ロボットの汎用化能力とパフォーマンスを向上させる可能性があります。さまざまな自然言語やコンピュータ ビジョンのタスクを処理できるロボットが登場していますが、「ユニバーサル ロボット モデル」の構築は依然として困難です。
- AI 618 2024-06-02 10:04:53
-
- 小規模言語モデルが AI の世界で次に注目されるのはなぜですか?
- 翻訳者 | Bugatti レビュー | Chonglou AI の分野では、テクノロジー大手がますます大規模な言語モデルの構築を競い合ってきましたが、現在、小さいことは大きいという驚くべき新しい傾向が現れています。大規模言語モデル (LLM) の進歩に行き詰まりの兆しが見られる中、研究者や開発者はますます小規模言語モデル (SLM) に注目を集めています。このコンパクトで効率的かつ適応性のある AI モデルは、「大きいほど優れている」という概念に挑戦し、AI 開発へのアプローチ方法を変えることを約束します。 LLM は停滞し始めていますか?最近発表された Vellum と HuggingFace のパフォーマンス比較結果は、LLM 間のパフォーマンスの差が急速に縮まりつつあることを示しています。この傾向は、多肢選択問題、推論、数学の問題などの特定のタスクで顕著です。
- AI 1095 2024-06-01 22:35:35
-
- データは多いほうがいいのか、それとも品質が高いほうがいいのか?この調査はあなたの選択に役立ちます
- 基本モデルのスケーリングとは、事前トレーニングにより多くのデータ、計算、パラメーターを使用することを指します。これは単に「スケール拡張」です。モデルを直接スケールアップすることは単純で粗雑に思えますが、実際に多くの優れたモデルを機械学習コミュニティにもたらしました。これまでの多くの研究では、神経経済モデルのスケールを拡大すると、いわゆる量的変化が質的変化を引き起こすことが認識されています。この考え方は、ニューラル スケーリングの法則としても知られています。ただし、モデルのサイズが大きくなると、コンピューティング リソースが集中的に消費されます。これは、モデルが大きくなると、プロセッサやメモリなど、より多くのコンピューティング リソースが必要になることを意味します。これは、多くの実際のアプリケーション、特にリソースに制約のあるデバイスでは実現できません。そこで研究者たちは、
- AI 1099 2024-06-01 22:09:19
-
- MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました
- 今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は
- AI 890 2024-06-01 22:03:37
-
- 正確なオブジェクト検出のためのマルチグリッド冗長境界ボックス注釈
- 1. はじめに 現在、主要なオブジェクト検出器は、深層 CNN のバックボーン分類器ネットワークを再利用した 2 段階または 1 段階のネットワークです。 YOLOv3 は、入力画像を受け取り、それを等しいサイズのグリッド マトリックスに分割する、よく知られた最先端の 1 段階検出器の 1 つです。ターゲット中心を持つグリッド セルは、特定のターゲットの検出を担当します。今日私が共有するのは、各ターゲットに複数のグリッドを割り当てて正確なタイトフィット境界ボックス予測を実現する新しい数学的手法です。研究者らはまた、ターゲット検出のための効果的なオフラインのコピー&ペーストデータの強化も提案しました。新しく提案された方法は、現在の最先端の物体検出器の一部よりも大幅に性能が優れており、より優れたパフォーマンスが期待されます。 2. バックグラウンドターゲット検出ネットワークは、次のように設計されています。
- AI 633 2024-06-01 21:46:08
-
- 君 + Coze (コーゼ) は素晴らしいコンボです、GPT-4o を作りたいです
- 皆さんこんにちは、ラオドゥです。国産大型モデルの中でもキミの性能は非常に良い。幸いなことに、coze プラットフォームは Kimi ラージ モデルをサポートしています。 Button はエージェント インテリジェンスを構築するためのプラットフォームです。今日は Kim+ Button を使用して GPT-4o 効果を持つエージェントを作成してみます。まず、ホームページの「ボットの作成」ボタンをクリックします。ボットは実際にはエージェントです。この写真では、選択された Moonshot シリーズのモデルは Kim ラージ モデルです。この写真の残りのハイライトは、Coze が提供する非常に豊富なプラグイン セットです。これはラージ モデルと組み合わせることができます。多くの複雑な機能を完了するモデル。いくつか例を挙げると、例えば視覚能力。プラグインを追加して、大規模なモデルで画像を生成して表示できるようにします。
- AI 1090 2024-06-01 20:23:12
-
- パス計画の概要: サンプリング、検索、最適化に基づいてすべて完了しました。
- 1 意思決定制御と動作計画の概要 現在の意思決定制御方法は、逐次計画、行動認識型計画、およびエンドツーエンド計画の 3 つのカテゴリに分類できます。逐次計画: 最も伝統的な方法であり、認識、意思決定、制御の 3 つの部分が比較的明確です。行動を意識した計画: 最初の方法と比較して、ハイライトは人間と機械の共同運転、車両と道路の導入です。外部動的環境のコラボレーションと車両リスク推定。エンドツーエンドの計画: DL および DRL テクノロジーは、画像やハンドルのコーナーなどの感覚情報を取得するために大量のデータ トレーニングを使用します。
- AI 1094 2024-06-01 20:12:48
-
- 生成 AI はプライベート クラウドのルネサンスにつながるのでしょうか?
- Compilation丨Produced by Noah | 51CTO Technology Stack (WeChat ID: blog51cto) テクノロジー革命の次のラウンドが近づいており、多くの企業はパブリック クラウドの利便性に依存し続けるか、それともプライベート クラウドに戻るかという戦略的な選択に直面しています。の抱擁? AI テクノロジーの急速な発展に伴い、この決定はより緊急になっています。 Forrester の 2023 年インフラストラクチャ クラウド調査によると、調査対象となった約 1,300 人の企業クラウド意思決定者のうち約 79% が、自社の組織がプライベート クラウドを導入していると回答しました。さらに IDC は、マネージド プライベート クラウドを含む専用プライベート クラウド サービスへの世界的な支出は 2024 年に 204 億ドルに達し、少なくとも 2027 年までに 2 倍になると予測しています。 2024 年以前の IDC データによると、
- AI 814 2024-06-01 20:11:36
-
- リー・フェイフェイは、AI が世界を真に理解できるようにするための起業家の方向性「空間インテリジェンス」を解釈します
- 李飛飛が起業のために選んだ「空間知性」の完全なTED解釈ビデオが公開されました。少し前に、ロイターは、有名な「AI ゴッドマザー」である李飛飛氏が新興企業を設立し、シードラウンドの資金調達を完了したと独占的に報じた。このスタートアップを紹介する際、情報提供者はバンクーバーのTEDでリー・フェイフェイ氏が行ったスピーチを引用し、彼がこのTEDスピーチで空間インテリジェンスの概念を導入したことを示した。ちょうど今日、リー・フェイフェイはTEDバンクーバーでのスピーチ全文のビデオをXで公開しました。彼女は Insight について紹介しました、洞察は理解に変わります、
- AI 1084 2024-06-01 19:56:00
-
- GPT-4o を数秒で破り、Llama 3 70B を 22B で破り、Mistral AI が最初のコード モデルを公開
- OpenAI をターゲットとするフランスの AI ユニコーン MistralAI は、新たな動きをとりました。初の大規模コード モデルである Codestral が誕生しました。 Codestral は、コード生成タスク専用に設計されたオープンな生成 AI モデルとして、命令と完了 API エンドポイントを共有することで、開発者がコードを作成して操作できるようにします。 Codestral のコーディングと英語の熟練により、ソフトウェア開発者は高度な AI アプリケーションを設計できます。 Codestral のパラメータ サイズは 22B で、新しい MistralAINon-ProductionLicense に準拠しており、研究およびテスト目的には使用できますが、商用利用は禁止されています。現在、このモデルは HuggingFace からダウンロードできます。ダウンロードリンク
- AI 354 2024-06-01 18:32:04
-
- 量子機能と 20,000 の分子動力学シミュレーションを組み合わせた、新しいタンパク質-リガンド複合体 ML データセットが Nature サブジャーナルに掲載されました。
- 編集者 | Dead Leaf Butterfly 大規模な言語モデルにより、生物学と化学を理解する科学者の能力は大幅に向上しましたが、構造ベースの創薬、量子化学、および構造生物学のための信頼できる方法はまだほとんどありません。大規模な言語モデルでは、正確な生体分子とリガンドの相互作用データセットが緊急に必要とされています。この問題を解決するために、ミュンヘンヘルムホルツ研究センター生物学研究所とミュンヘン工科大学の研究者らは、MISATOを提案しました。これは、小分子の量子力学 (QM) 特性と、約 20,000 の実験用タンパク質-リガンド複合体の関連する分子動力学 (MD) シミュレーション、および実験データの広範な検証を組み合わせたデータセットです。研究者らは、既存の実験構造から始めて、半経験的な量子力学を使用してこれらを体系的に改善しました。
- AI 366 2024-06-01 18:20:09
-
- Arthur Bench LLM 評価フレームワークを 1 つの記事で理解する
- こんにちは、私は Luga です。今日は人工知能 (AI) の生態分野に関連するテクノロジー、つまり LLM 評価について話します。周知のとおり、LLM 評価は人工知能の分野で重要なトピックです。 LLM がさまざまなシナリオでより広く使用されるようになるにつれて、その機能と制限を評価することがますます重要になります。 ArthurBench は、新興の LLM 評価ツールとして、AI 研究者と開発者に包括的で公平かつ再現可能な評価プラットフォームを提供することを目指しています。 1. 従来のテキスト評価が直面する課題 近年、大規模言語モデル (LLM) の急速な開発と改善により、従来のテキスト評価手法はいくつかの側面で適用できなくなる可能性があります。テキスト評価の分野では、次のようなことを聞いたことがあるかもしれません。
- AI 349 2024-06-01 17:57:01
-
- iFlytek、Alipayと提携してスマートコックピットサービスエコシステムを構築
- 30日後、iFlytekとAlipayは、大型モデル、自動車および機械の支払い、ミニプログラムサービスの分野で協力し、よりスマートなコックピットサービスエコシステムを共同構築する契約を発表した。将来的には、より多くの Alipay ミニプログラム サービスが、iFlytek 乗車機を通じて、旅行前、旅行中、旅行後のマルチシナリオでインテリジェントで便利な自動車体験を車の所有者に提供できるようになります。インターネット トラフィックがパノラマ プロセスに浸透するにつれて、ミニ プログラムはブランドにとって重要な役割を果たしています。私たちは、Alipay ミニ プログラム エコシステムを通じて、より豊かなサービスを自動車所有者に提供したいと考えています。 iFlytekの自動車部門副ゼネラルマネジャー、ヘ・ウェイミン氏は、iFlytekは多端末相互接続技術やミニプログラムセキュリティなどのシステム技術の利点を活用して、Alipayプラットフォームのスマートカーネットワーキングサービスエコロジーを同ブランドの自動車端末に提供すると述べた。権威ある研究によると
- AI 270 2024-06-01 17:55:26
-
- Llama3 レイヤー 1 を手動でティアリングする: llama3 を最初から実装する
- 1. Llama3 のアーキテクチャ このシリーズの記事では、llama3 を最初から実装します。 Llama3 の全体的なアーキテクチャ: Llama3 のモデル パラメーターをイメージします: Llama3 モデルのこれらのパラメーターの実際の値を見てみましょう。図[1] コンテキストウィンドウ (context-window) LlaMa クラスをインスタンス化する際、変数 max_seq_len によって context-window が定義されます。クラスには他にもパラメータがありますが、このパラメータは変圧器モデルに最も直接関係しています。ここでの max_seq_len は 8K です。図[2] 語彙サイズと注意力L
- AI 900 2024-06-01 17:45:42
-
- シンプルかつユニバーサル: Visual Basic ネットワークによりロスレス トレーニングが最大 3 倍高速化され、Tsinghua EfficientTrain++ が TPAMI 2024 に選ばれました
- 論文リンク: https://arxiv.org/pdf/2405.08768 コードと事前トレーニング済みモデルはオープンソースです: https://github.com/LeapLabTHU/EfficientTrain カンファレンスバージョン論文 (ICCV2023): https://arxiv. org/pdf/ 2211.09703 コンピュータ ビジョン研究所のコラム コンピュータ ビジョン研究所のコラム この記事では主に IEEE トランザクションソンのパターン分析とマシン インテリジェンス (TP) について紹介します。
- AI 307 2024-06-01 17:41:29