現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- クラウドソーシングの新しい遊び方!劣悪な生徒と上位の生徒を厳密に区別するために、LLM アリーナでベンチマーク テストが誕生しました。
- 大型モデルランキングではどの企業が強いのでしょうか? LLM アリーナもご覧ください ~ 現在、合計 90 名の LLM が参戦し、ユーザー投票総数は 77 万を超えています。しかし、ネチズンが新モデルのランキング急上昇や旧モデルの威厳の失墜を嘲笑する中、Renjia Arenaを運営する組織LMSYSは静かに結果の変革を完了した:実戦から生まれた最も説得力のあるベンチマークテスト—— Arena -難しい。画像 Arena-Hard によって実証された 4 つの利点は、まさに現在の LLM ベンチマークに最も必要なものです。 - 分離性 (87.4%) は MT ベンチ (22.6%) よりも大幅に優れています。 - ChatbotArena と同様に最高のランクに達し、89.1% に達します。走行速度、価格の安さ
- AI 371 2024-06-02 13:21:08
-
- 2,500ページに及ぶアルゴリズム文書が流出!検索史上最強のブラックボックスが暴露、Googleは再び覆してアップグレードするのか?
- Noah 著 | 51CTO テクノロジー スタック (WeChat ID: blog51cto) Google は少々悪い年を迎えています。過去 2 日間にわたって、この検索エンジンは、頻繁にひどく不正確な検索結果を提供する「AI 概要」機能に関する情報を提供してきました。たとえば、ピザからチーズが滑り落ちないようにユーザーに接着剤を使用するよう不条理に示唆するなどです。これに関してピチャイCEOも、これは大規模言語モデルの幻想が原因であり、現時点では解決策がないことを認めざるを得ませんでした。 Google の検索エンジンに関する内部文書が最近流出し、おそらくその仕組みが初めて一般に公開されたと思われます。この記事はここで最初に公開されました Google はまだ漏洩に対して正式な回答を出しておらず、文書の信頼性に異議を唱えていません。長い間、Google は
- AI 785 2024-06-02 12:21:35
-
- Goose Factory は、オンライン小説に特化し、言語スタイルを自動的に適応させ、現実の人間と GPT-4 の両方が上手に読むことができる AI 翻訳会社を構築しました。
- Goose Factory は 150 名以上の従業員からなる全員が AI エージェントです。本業はオンライン小説の翻訳で、評価に参加した読者は翻訳が本物の人の翻訳よりも優れていると評価している。また、実際の人間を雇用する場合と比較して、文学作品の翻訳にこれを使用すると、コストが 80 倍近く削減されます。 ATransAgents は、各ポジションに 30 人の異なる従業員を擁し、言語、ジャンル、対象者に応じてさまざまな翻訳スタイルに適応できます。従来の翻訳と比較して、結果として得られる翻訳は、より柔軟かつ多様で、ターゲット言語の表現習慣により一致し、より文学的になります。したがって、TransAgents は類似性に基づく自動評価には「失敗」しましたが、読者や専門家からは高い評価を得ています。それで
- AI 403 2024-06-02 12:09:21
-
- AI コーディング、それは本当に必要なものでしょうか、それとも単なるギミックでしょうか?
- ゲスト | 徐暁強によるインタビュー | 張暁南による執筆 | 李梅漢による制作 | 51CTO テクノロジー スタック (WeChat ID: blog51cto) 生成型 AI の普及以来、AI はプログラマーの役割に「苦労」しているようです。 AI プログラミング ツールがプログラマーに取って代わることができるかどうかという話題が、ほぼ時折、再び議論されます。 AI プログラミングによって引き起こされた白熱した議論は人々を混乱させます。これはプログラミングの分野で生産性革命を引き起こすのでしょうか?それともこれもまた誇張されすぎたスタントなのでしょうか? AI プログラミングのおかげで、Baidu は人的効率の 10% 向上を達成し、今日エンジニアが提出した新しいコードの 27% は AI によって生成されました。この答えの先駆者は、この答えを模索している大手メーカーです。ただし、Baidu Comate のアーキテクトとして、私はこの製品の創設者でもあります。
- AI 1082 2024-06-02 10:15:47
-
- 複数の形態とタスクに適応する、最も強力なオープンソースロボット学習システム「Octopus」が誕生
- ロボット学習に関しては、特定のロボットとタスクに固有のデータセットを収集し、それを使用してポリシーをトレーニングするのが一般的なアプローチです。ただし、この方法を使用してゼロから学習する場合、タスクごとに十分なデータを収集する必要があり、結果として得られるポリシーの一般化能力は通常不十分です。 「原則として、他のロボットやタスクから収集された経験は、モデルがさまざまなロボット制御の問題を認識できるようにする可能な解決策を提供し、これらの問題は、たとえ一般的なモデルであっても、ロボットの汎用化能力とパフォーマンスを向上させる可能性があります。さまざまな自然言語やコンピュータ ビジョンのタスクを処理できるロボットが登場していますが、「ユニバーサル ロボット モデル」の構築は依然として困難です。
- AI 668 2024-06-02 10:04:53
-
- 小規模言語モデルが AI の世界で次に注目されるのはなぜですか?
- 翻訳者 | Bugatti レビュー | Chonglou AI の分野では、テクノロジー大手がますます大規模な言語モデルの構築を競い合ってきましたが、現在、小さいことは大きいという驚くべき新しい傾向が現れています。大規模言語モデル (LLM) の進歩に行き詰まりの兆しが見られる中、研究者や開発者はますます小規模言語モデル (SLM) に注目を集めています。このコンパクトで効率的かつ適応性のある AI モデルは、「大きいほど優れている」という概念に挑戦し、AI 開発へのアプローチ方法を変えることを約束します。 LLM は停滞し始めていますか?最近発表された Vellum と HuggingFace のパフォーマンス比較結果は、LLM 間のパフォーマンスの差が急速に縮まりつつあることを示しています。この傾向は、多肢選択問題、推論、数学の問題などの特定のタスクで顕著です。
- AI 1143 2024-06-01 22:35:35
-
- データは多いほうがいいのか、それとも品質が高いほうがいいのか?この調査はあなたの選択に役立ちます
- 基本モデルのスケーリングとは、事前トレーニングにより多くのデータ、計算、パラメーターを使用することを指します。これは単に「スケール拡張」です。モデルを直接スケールアップすることは単純で粗雑に思えますが、実際に多くの優れたモデルを機械学習コミュニティにもたらしました。これまでの多くの研究では、神経経済モデルのスケールを拡大すると、いわゆる量的変化が質的変化を引き起こすことが認識されています。この考え方は、ニューラル スケーリングの法則としても知られています。ただし、モデルのサイズが大きくなると、コンピューティング リソースが集中的に消費されます。これは、モデルが大きくなると、プロセッサやメモリなど、より多くのコンピューティング リソースが必要になることを意味します。これは、多くの実際のアプリケーション、特にリソースに制約のあるデバイスでは実現できません。そこで研究者たちは、
- AI 1146 2024-06-01 22:09:19
-
- MLP に代わる KAN は、オープンソース プロジェクトによって畳み込みまで拡張されました
- 今月初め、MIT やその他の機関の研究者らは、MLP に代わる非常に有望な代替案である KAN を提案しました。 KAN は、精度と解釈可能性の点で MLP よりも優れています。また、非常に少数のパラメーターを使用して、多数のパラメーターを使用して実行する MLP よりも優れたパフォーマンスを発揮できます。たとえば、著者らは、KAN を使用して、より小規模なネットワークと高度な自動化で DeepMind の結果を再現したと述べています。具体的には、DeepMind の MLP には約 300,000 個のパラメーターがありますが、KAN には約 200 個のパラメーターしかありません。 KAN は、MLP が普遍近似定理に基づいているのに対し、KAN はコルモゴロフ-アーノルド表現定理に基づいているのと同様に、強力な数学的基礎を持っています。以下の図に示すように、KAN は
- AI 960 2024-06-01 22:03:37
-
- 正確なオブジェクト検出のためのマルチグリッド冗長境界ボックス注釈
- 1. はじめに 現在、主要なオブジェクト検出器は、深層 CNN のバックボーン分類器ネットワークを再利用した 2 段階または 1 段階のネットワークです。 YOLOv3 は、入力画像を受け取り、それを等しいサイズのグリッド マトリックスに分割する、よく知られた最先端の 1 段階検出器の 1 つです。ターゲット中心を持つグリッド セルは、特定のターゲットの検出を担当します。今日私が共有するのは、各ターゲットに複数のグリッドを割り当てて正確なタイトフィット境界ボックス予測を実現する新しい数学的手法です。研究者らはまた、ターゲット検出のための効果的なオフラインのコピー&ペーストデータの強化も提案しました。新しく提案された方法は、現在の最先端の物体検出器の一部よりも大幅に性能が優れており、より優れたパフォーマンスが期待されます。 2. バックグラウンドターゲット検出ネットワークは、次のように設計されています。
- AI 685 2024-06-01 21:46:08
-
- 君 + Coze (コーゼ) は素晴らしいコンボです、GPT-4o を作りたいです
- 皆さんこんにちは、ラオドゥです。国産大型モデルの中でもキミの性能は非常に良い。幸いなことに、coze プラットフォームは Kimi ラージ モデルをサポートしています。 Button はエージェント インテリジェンスを構築するためのプラットフォームです。今日は Kim+ Button を使用して GPT-4o 効果を持つエージェントを作成してみます。まず、ホームページの「ボットの作成」ボタンをクリックします。ボットは実際にはエージェントです。この写真では、選択された Moonshot シリーズのモデルは Kim ラージ モデルです。この写真の残りのハイライトは、Coze が提供する非常に豊富なプラグイン セットです。これはラージ モデルと組み合わせることができます。多くの複雑な機能を完了するモデル。いくつか例を挙げると、例えば視覚能力。プラグインを追加して、大規模なモデルで画像を生成して表示できるようにします。
- AI 1140 2024-06-01 20:23:12
-
- パス計画の概要: サンプリング、検索、最適化に基づいてすべて完了しました。
- 1 意思決定制御と動作計画の概要 現在の意思決定制御方法は、逐次計画、行動認識型計画、およびエンドツーエンド計画の 3 つのカテゴリに分類できます。逐次計画: 最も伝統的な方法であり、認識、意思決定、制御の 3 つの部分が比較的明確です。行動を意識した計画: 最初の方法と比較して、ハイライトは人間と機械の共同運転、車両と道路の導入です。外部動的環境のコラボレーションと車両リスク推定。エンドツーエンドの計画: DL および DRL テクノロジーは、画像やハンドルのコーナーなどの感覚情報を取得するために大量のデータ トレーニングを使用します。
- AI 1147 2024-06-01 20:12:48
-
- 生成 AI はプライベート クラウドのルネサンスにつながるのでしょうか?
- Compilation丨Produced by Noah | 51CTO Technology Stack (WeChat ID: blog51cto) テクノロジー革命の次のラウンドが近づいており、多くの企業はパブリック クラウドの利便性に依存し続けるか、それともプライベート クラウドに戻るかという戦略的な選択に直面しています。の抱擁? AI テクノロジーの急速な発展に伴い、この決定はより緊急になっています。 Forrester の 2023 年インフラストラクチャ クラウド調査によると、調査対象となった約 1,300 人の企業クラウド意思決定者のうち約 79% が、自社の組織がプライベート クラウドを導入していると回答しました。さらに IDC は、マネージド プライベート クラウドを含む専用プライベート クラウド サービスへの世界的な支出は 2024 年に 204 億ドルに達し、少なくとも 2027 年までに 2 倍になると予測しています。 2024 年以前の IDC データによると、
- AI 864 2024-06-01 20:11:36
-
- リー・フェイフェイは、AI が世界を真に理解できるようにするための起業家の方向性「空間インテリジェンス」を解釈します
- 李飛飛が起業のために選んだ「空間知性」の完全なTED解釈ビデオが公開されました。少し前に、ロイターは、有名な「AI ゴッドマザー」である李飛飛氏が新興企業を設立し、シードラウンドの資金調達を完了したと独占的に報じた。このスタートアップを紹介する際、情報提供者はバンクーバーのTEDでリー・フェイフェイ氏が行ったスピーチを引用し、彼がこのTEDスピーチで空間インテリジェンスの概念を導入したことを示した。ちょうど今日、リー・フェイフェイはTEDバンクーバーでのスピーチ全文のビデオをXで公開しました。彼女は Insight について紹介しました、洞察は理解に変わります、
- AI 1147 2024-06-01 19:56:00
-
- GPT-4o を数秒で破り、Llama 3 70B を 22B で破り、Mistral AI が最初のコード モデルを公開
- OpenAI をターゲットとするフランスの AI ユニコーン MistralAI は、新たな動きをとりました。初の大規模コード モデルである Codestral が誕生しました。 Codestral は、コード生成タスク専用に設計されたオープンな生成 AI モデルとして、命令と完了 API エンドポイントを共有することで、開発者がコードを作成して操作できるようにします。 Codestral のコーディングと英語の熟練により、ソフトウェア開発者は高度な AI アプリケーションを設計できます。 Codestral のパラメータ サイズは 22B で、新しい MistralAINon-ProductionLicense に準拠しており、研究およびテスト目的には使用できますが、商用利用は禁止されています。現在、このモデルは HuggingFace からダウンロードできます。ダウンロードリンク
- AI 418 2024-06-01 18:32:04
-
- 量子機能と 20,000 の分子動力学シミュレーションを組み合わせた、新しいタンパク質-リガンド複合体 ML データセットが Nature サブジャーナルに掲載されました。
- 編集者 | Dead Leaf Butterfly 大規模な言語モデルにより、生物学と化学を理解する科学者の能力は大幅に向上しましたが、構造ベースの創薬、量子化学、および構造生物学のための信頼できる方法はまだほとんどありません。大規模な言語モデルでは、正確な生体分子とリガンドの相互作用データセットが緊急に必要とされています。この問題を解決するために、ミュンヘンヘルムホルツ研究センター生物学研究所とミュンヘン工科大学の研究者らは、MISATOを提案しました。これは、小分子の量子力学 (QM) 特性と、約 20,000 の実験用タンパク質-リガンド複合体の関連する分子動力学 (MD) シミュレーション、および実験データの広範な検証を組み合わせたデータセットです。研究者らは、既存の実験構造から始めて、半経験的な量子力学を使用してこれらを体系的に改善しました。
- AI 411 2024-06-01 18:20:09