現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- AI エージェントの誇大宣伝と現実: GPT-4 はそれをサポートすることさえできず、実際のタスクの成功率は 15% 未満です
- 大規模な言語モデルの継続的な進化と自己革新により、パフォーマンス、精度、安定性が大幅に向上しており、それはさまざまなベンチマーク問題セットによって検証されています。ただし、LLM の既存のバージョンでは、その包括的な機能が AI エージェントを完全にサポートできないようです。マルチモーダル、マルチタスク、マルチドメイン推論は、公共メディア空間における AI エージェントの必須要件となっていますが、特定の機能実践で示される実際の効果は大きく異なります。これは、すべての AI ロボットの新興企業や大手テクノロジー企業に、より現実的であり、ビジネスを大きく広げすぎず、AI の強化機能から始めるという現実を認識するよう改めて思い出させるもののようです。最近、AI エージェントの宣伝と実際のパフォーマンスのギャップについてのブログが次の点を強調しました。
- AI 1096 2024-06-03 18:38:42
-
- この記事を読んで、いくつかの一般的な LangChain の代替手段を理解してください
- こんにちは、私は Luga です。今日は、人工知能 (AI) の生態分野に関連するテクノロジー、つまり LLM 開発フレームワークについて話します。 LLM (大規模言語モデル) アプリケーション開発の分野では、オープンソース フレームワークが重要な役割を果たし、開発者に強力なツール サポートを提供します。この分野のリーダーとして、LangChain はその革新的なデザインと包括的な機能で広く賞賛を得ています。しかし同時に、さまざまなシナリオのニーズに適したより良い選択肢を提供する代替フレームワークもいくつか登場しています。結局のところ、どのフレームワークにも必然的に一定の制限が存在します。たとえば、場合によっては、LangChain の高速抽象化によって開始がより困難になる可能性があり、デバッグ エクスペリエンスを改善する必要があり、一部のコードの品質も改善に値します。
- AI 1909 2024-06-03 18:25:26
-
- 2024年未来自動車パイオニアカンファレンス丨顧威豪:AI大型モデルが自動運転実現への唯一の道
- 6月1日、Hao Mo ZhixingのCEO、Gu Weihao氏は2024年(第2回)Future Automobile Pioneers Conferenceに招待され、「自動運転3.0時代、大型モデルがインテリジェント自動車路線を再形成する」という基調講演を行った。 Gu Weihao 氏は、「AI 大型モデルは自動運転を真に実現する唯一の方法であり、将来的にはエンドツーエンドが非常に重要な技術的方向性となるでしょう。エンドツーエンドとは、モデルの末端を最適化するだけではなく、しかし、データの供給とコンピューティング能力のサポートも必要です。「HaiMo DriveGPT は 2022 年からエンドツーエンドのソリューションを模索しており、適用されれば非常に素晴らしい結果がもたらされるでしょう。」 (HaoMo Zhixing CEO の Gu Weihao 氏が招待されました)。 2024年未来自動車パイオニアカンファレンスに参加)「現状への闘争」をテーマに、6月に開催。
- AI 1025 2024-06-03 17:18:53
-
- OpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指している
- 昨日の OpenAI の春リリースを見れば、今日の Google I/O カンファレンスで間違いなく AI アシスタントの紹介があることを推測するのは難しくありません。結局のところ、Google I/O カンファレンスの前に GPT-4o をリリースしたアルトマンは、アルトマンの手法を十分に適切に活用して、正確な攻撃を達成し、この「赤と青の対決」を終わらせる自信を持っています。案の定、このカンファレンスでは、Google CEOのピチャイ氏がDeepMindの創設者デミス氏を招待し、Google I/OカンファレンスでデビューしたGoogleの新しいAIアシスタントProjectAstraが発表された。プロジェクトアストラとは何ですか?プロジェクトアストラ
- AI 379 2024-06-03 15:23:07
-
- 最高人工知能責任者の必須スキルと特性
- 最高人工知能責任者 (CAIO) には、イノベーションを推進し、AI 対応の文化を構築して主導し、複雑で急速に進化するテクノロジーを活用して具体的な組織成果を達成するための多面的なスキルが必要です。さらに、CAIO は強力なリーダーシップ能力を備え、絶えず変化する環境において AI の戦略的計画と実装を推進できる必要があります。 CAIO には、照合 AI、特に生成 AI の急速な普及を理解するための深いビジネス知識と技術的背景が必要であり、多くの組織が最高人工知能責任者 (CAIO) を雇用または昇進するようになりました。これまでのところ、多くの役職はテクノロジーベンダーに集中していましたが、最近のいくつかの AI 法案の成立を受けて、同様の役職が政府機関にも登場しつつあります。しかし、今後数年間で、企業組織における CAIO のポジションの数は増加し続けると予想されます。
- AI 902 2024-06-03 12:32:13
-
- 機械に話しかける: 迅速なエンジニアリングの 10 の秘密が明らかに
- AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/ をご覧ください。プロンプトの力は驚くべきものです。人間の言語に近いいくつかの単語を入力するだけで、Well- を取得できます。フォーマットされ、構造化された回答。曖昧なトピックや、手の届かない事実はありません。少なくとも、それがトレーニング コーパスの一部であり、モデルの ShadowyController によって承認されている限り、単純なプロンプトで答えを得ることができます。しかし、プロンプトの魔法が絶対的なものではないことに気づき始めている人もいます。私たちの合図は、常に私たちが望む結果を生み出すとは限りません。一部のプロンプト言語は他の言語よりもさらに優れています
- AI 487 2024-06-03 10:53:11
-
- Microsoft、米国のデータセンター容量を拡大するための33億ドルのAIインフラ投資計画を発表
- Microsoftは2026年末までに4段階の投資戦略を開始する予定だ。このテクノロジー企業はデータセンターキャンパスを建設し、2030年までに州全体で1000万人以上の人々をGenAIでスキルアップする計画だ。 AWS、Google、Microsoft は、コンピューティング能力に対する需要の増大をサポートするための包括的なインフラストラクチャ計画を策定しており、全米の州に投資を行っています。今年初め、AWSはインドネシアとミシシッピ州のデータセンターに2億1000万ドルの投資を発表した。これは両州で最大の設備投資となる。グーグルは先月、バージニア州とインディアナ州のデータセンターキャンパスの建設と拡張に30億ドルを投資する計画を発表した。 SynergyResearchGroupが10月に発表したレポート
- AI 1196 2024-06-03 10:52:37
-
- アメリカの教授は、2 歳の娘を使って AI モデルをトレーニングし、『サイエンス』誌に掲載されました。人間の子はヘッドマウント カメラを使用して新しい AI をトレーニングします
- 信じられないことに、ニューヨーク州立大学の教授は、AI モデルをトレーニングするために、GoPro のようなカメラを娘の頭に縛り付けました。信じられないように聞こえますが、この教授の行動には実は十分な根拠があります。 LLM の背後にある複雑なニューラル ネットワークをトレーニングするには、大量のデータが必要です。現在の LLM トレーニング プロセスは、必ずしも最もシンプルで効率的な方法なのでしょうか?確かにそうではありません!科学者たちは、人間の幼児の脳がスポンジのように水を吸収し、急速に一貫した世界観を形成していることを発見しました。 LLM は時々驚くべきパフォーマンスを発揮しますが、時間が経つにつれて、人間の子供はモデルよりも賢く、より創造的になります。子どもたちが言語を習得する秘訣 LLM をより良い方法で訓練するには?科学者が解決策に困惑しているとき、
- AI 845 2024-06-03 10:08:09
-
- ICML 2024 | 大規模言語モデルの事前トレーニングの新境地: 「ベスト アダプテーション パッケージング」が文書処理標準を再構築
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 大規模な言語モデルのトレーニング プロセスでは、データ処理の方法が重要です。従来の方法では通常、多数のドキュメントを連結して、モデルのコンテキスト長に等しいトレーニング シーケンスに分割します。これによりトレーニングの効率は向上しますが、多くの場合、ドキュメントが不必要に切り捨てられることになります。
- AI 717 2024-06-02 21:42:20
-
- Tencent Hunyuanの大型モデルが大幅値下げされました! Hunyuan-lite は今後無料です
- 5月22日、テンセントクラウドは新たな大規模モデルアップグレード計画を発表した。主要モデルの 1 つである Hunyuan-lite モデルは、API 入出力の合計長が現在の 4k から 256k にアップグレードされる予定で、価格は 0.008 元/千トークンから完全無料に調整されます。渾源標準 API の入力価格は 0.01 元/千トークンから 0.0045 元/千トークンに 55% 下落し、API 出力価格は 0.01 元/千トークンから 0.005 元/千トークンに下落し、55% 減少しました。 50%。新しく発売されたHunyuan-standard-256kは38万文字を超える超長文を処理する能力があり、API入力価格は0.015元/千トークンに値下げされた。
- AI 723 2024-06-02 20:07:09
-
- オックスフォード大学の最新情報 | 約 400 の要約!大規模言語モデルと三次元世界に関する最新のレビューについて語る
- 上記および著者の個人的な理解: 大規模言語モデル (LLM) の開発により、それらと 3D 空間データ (3DLLM) の統合が急速に進み、物理空間を理解し、対話するための前例のない機能が提供されました。この記事では、3D データの処理、理解、生成に対する LLM のアプローチの包括的な概要を説明します。私たちは、文脈学習、段階的推論、オープンボキャブラリー機能、広範な世界知識などの LLM の独自の利点を強調し、空間理解と組み込み人工知能 (AI) システムとの相互作用を促進する LLM の可能性を強調します。私たちの研究は、点群からニューラル レンダリング フィールド (NeRF) まで、さまざまな 3D データ表現をカバーしています。 3D シーンの理解、字幕、
- AI 632 2024-06-02 19:41:32
-
- マルチエージェントを構築するための AutoGen オープンソース フレームワークを理解するには、この記事を読んでください。
- こんにちは、私の名前はルーガです。今日は、人工知能 (AI) の生態分野に関連するテクノロジー、つまり統合されたマルチエージェント対話フレームワークである AutoGen についてお話します。私たちがもはや単独で戦うのではなく、高度にパーソナライズされた、クロスドメインに統合された AI チームを持つシナリオを想像してみてください。チームメンバーはそれぞれ、それぞれの分野で熟練し、プロフェッショナルであり、互いにシームレスに協力し、効率的にコミュニケーションをとり、決して疲れることはありません。彼らは高度に協力して、複雑で常に変化する課題に対処することができます。これは、画期的なマルチエージェント対話フレームワークである AutoGen の本質です。 AutoGen+ は私たちに無限の可能性を与え、独自の戦略的人工知能チームを自由に形成できるようにします。メンバーそれぞれが個性を持っている
- AI 1377 2024-06-02 19:12:02
-
- 単なる 3D ガウス以上のもの!最先端の 3D 再構成技術の最新概要
- 上記と著者の個人的な理解は、画像ベースの 3D 再構成は、一連の入力画像からオブジェクトまたはシーンの 3D 形状を推測することを含む困難なタスクであるということです。学習ベースの手法は、3D形状を直接推定できることから注目を集めています。このレビュー ペーパーは、これまでにない新しいビューの生成など、最先端の 3D 再構成技術に焦点を当てています。入力タイプ、モデル構造、出力表現、トレーニング戦略など、ガウス スプラッシュ メソッドの最近の開発の概要が提供されます。未解決の課題と今後の方向性についても議論します。この分野の急速な進歩と 3D 再構成手法を強化する数多くの機会を考慮すると、アルゴリズムを徹底的に調査することが重要であると思われます。したがって、この研究は、ガウス散乱の最近の進歩の包括的な概要を提供します。 (親指を上にスワイプしてください
- AI 1120 2024-06-02 18:57:35
-
- GPT-3.5でデータセットを生成!北京大学天宮と他のチームによる画像編集用の新しい SOTA は、物理世界のシーンを正確にシミュレートできます
- 高品質の画像編集には多くの方法がありますが、どれも現実の物理世界を正確に表すものではありません。ぜひ、EdittheWorld を試してみてください。北京大学、TiamatAI、Tiangong AI、Mila Labs は、世界から指示された画像編集という新しい編集タスクを導入した EditWorld を提案しました。さまざまな世界のシナリオに基づいて命令を定義および分類します。画像は、GPT-3.5、Video-LLava、SDXL などの事前トレーニング済みモデルのセットによってサポートされており、ワールド命令を含むマルチモーダル データセットを構築します。拡散ベースの画像編集モデル EditWorld がこのデータセットでトレーニングされ、その結果が新しいタスクに反映されます。
- AI 920 2024-06-02 17:18:08
-
- ターゲット検出のための新しい SOTA、デバイスと側面のリアルタイム認識、Shen Xiangyang はめったに転送せず、いいね!
- ターゲット検出の分野は、IDEA Research Institute チームによって作成された GroundingDINO1.5 という新たな進歩をもたらしました。これは、デバイス側でリアルタイム認識を実現できます。この進歩は、通常は毎年変更を加える AI 王の沈祥陽氏によって伝えられました。このリリースには、Pro と Edge の 2 つの主要なバージョンがあります。 Pro バージョンはより強力で、Edge バージョンはより高速です。以前のバージョンの GroundingDINO のデュアル エンコーダとシングル デコーダの構造を維持しており、これに基づいて、より大きなビジュアル バックボーンを組み合わせてモデル サイズを拡張し、2,000 万を超える Grounding データを使用して豊富なコーパスを取得し、検出を大幅に向上させます。精度と速度が向上し、Pro バージョンと Edge バージョンを通じてさまざまなアプリケーションを対象としています。
- AI 1295 2024-06-02 16:41:05