現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- OmniDrive: 大規模モデルを 3D 運転タスクと連携させるためのフレームワーク
- まず、スパース クエリを使用して視覚表現を 3D にリフトおよび圧縮し、LLM に入力する新しい 3DMLLM アーキテクチャから始めます。タイトル: OmniDrive: AHolisticLLM-AgentFramework for Autonomous Driving with 3DPerception Reasoning and Planning 著者の所属: 北京工業大学、NVIDIA、華中科技大学 オープンソース アドレス: GitHub-NVlabs/OmniDrive マルチモーダル大規模言語モデル (MLLM) の開発強力な推論能力を活用して、LLM ベースの自動運転への関心が高まっています
- AI 1145 2024-05-06 15:16:35
-
- MLPは一夜にして消滅した! MIT カリフォルニア工科大学とその他の革新的な KAN が記録を破り、DeepMind を打ち砕く数学的定理を発見
- 一夜にして、機械学習のパラダイムが変わろうとしています。現在、深層学習の分野を支配しているインフラストラクチャは、ニューロンに活性化関数を配置する多層パーセプトロン (MLP) です。では、それを超えて、新たなルートはあるのでしょうか?ちょうど今日、MIT、カリフォルニア工科大学、ノースイースタン大学、その他の機関のチームが、新しいニューラル ネットワーク構造であるコルモゴロフ アーノルド ネットワーク (KAN) をリリースしました。研究者らは、学習可能な活性化関数をノード (ニューロン) からエッジ (重み) に移動することで、MLP に簡単な変更を加えました。論文アドレス: https://arxiv.org/pdf/2404.19756 この変更は一見すると根拠がないように見えます
- AI 1097 2024-05-06 15:10:01
-
- 医療診断市場における人工知能は2028年までに40億ドルに達する
- 正確さとスピードが重要な医療分野では、人工知能 (AI) の統合が変革の力となっています。医療診断における人工知能の市場は、かつては新興のニッチ市場でしたが、急速に強力な市場に成長し、その規模は数十億ドルに達すると予測されています。医療診断における人工知能の市場規模は、2023 年の収益が 12 億 5,000 万米ドルに達し、2028 年までに 44 億 8,000 万米ドルに達すると予測されており、予測期間中に 29.04% の CAGR で成長します。医療診断市場における人工知能の成長は、いくつかの重要な要因によって推進されています。 人工知能ベースのソリューションに対する需要の増大: 現代の医療環境が進化し続け、新たな疾患や状態が発見されるにつれ、人工知能ベースのソリューションに対する需要が高まっています。
- AI 620 2024-05-06 15:01:06
-
- テスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能です
- テスラの人型ロボットが新しいスキルを解放しました!昨日、テスラ オプティマスは、第 2 世代オプティマス人型ロボットの最新の進歩を示す新しいデモビデオを正式にリリースしました。今回、オプティマスはテスラ電池工場で電池の組み立てを学び、以前よりも速く、より遠くへ、そしてより安定して歩き始めました。まずはオプティマスの最新スキルとトレーニング内容を見ていきましょう。オプティマスのエンドツーエンドのニューラル ネットワークは現在、テスラの工場でバッテリー セルを正確に組み立てるようにトレーニングされています。これは、2D カメラ、ハンドタッチ、および力センサーのみに依存して、ロボットの FSD コンピューター上でリアルタイムで実行されます。オプティマスは脚を使ってバランスを保ち、ネットワークが上半身全体を動かします。
- AI 1105 2024-05-06 14:52:10
-
- CVPR 2024 | 浙江大学は神経構造化光を利用して動的三次元現象のリアルタイム取得と再構築を実現
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。煙などの動的三次元物理現象を効率的かつ高品質に再現することは、航空力学的設計検証や気象三次元観測などの分野での幅広い応用が期待できる関連科学研究の重要な課題です。時間の経過とともに変化する 3 次元の密度シーケンスを再構築することで、科学者を支援することができます。
- AI 919 2024-05-06 14:50:14
-
- ICLR 2024 スポットライト | NoiseDiffusion: 拡散モデルのノイズを修正し、補間画像の品質を向上
- 著者|PengfeiZheng Unit|USTC,HKBUTMLRGroup 近年、生成 AI の急速な発展により、テキストから画像への生成やビデオ生成などの注目を集める分野に大きな推進力が注入されています。これらの技術の中核は、拡散モデルの適用にあります。拡散モデルは、最初に連続的にノイズを追加する順方向プロセスを定義することによって画像を徐々にガウス ノイズに変更し、次に逆方向プロセスを通じてガウス ノイズを徐々に除去して鮮明な画像に変換して実際のサンプルを取得します。拡散常微分モデルは、生成された画像の値を補間するために使用され、ビデオや一部の広告クリエイティブの生成に大きな応用可能性があります。ただし、この方法を自然画像に適用すると、補間された画像効果が満足できない場合が多いことに気付きました。存在する
- AI 1164 2024-05-06 14:01:24
-
- AIは自分の思考と理性をこっそり隠すことを学びます!人間の経験に頼らずに複雑なタスクを解決することは、よりブラックボックスです
- AIが数学の問題を解く時の本当の思考は実は密かに「暗算」?ニューヨーク大学のチームによる新しい研究では、たとえ AI がステップを書くことを許可されておらず、意味のない「...」に置き換えられたとしても、一部の複雑なタスクのパフォーマンスは大幅に向上する可能性があることがわかりました。著者の一人、JacabPfau 氏は次のように述べています。追加のトークンを生成するためにコンピューティング能力を費やす限り、どのトークンを選択しても利点は得られます。たとえば、Llama34M に次のような単純な質問に答えてもらいます。自然定数 e の最初の 6 桁のうち、5 より大きいものはいくつありますか? AIの直接の答えは、最初の6桁だけをカウントし、実際には7をカウントするのと同じです。 AI に各数値を検証する手順を書き取らせると、正しい答えが得られます。 AI にステップを非表示にして、多数の「...」に置き換えます。
- AI 1000 2024-05-06 12:00:30
-
- スタンフォード大学のリー・フェイフェイが最初のビジネスを始めた:2年間の学業休暇を経て、「空間インテリジェンス」を目指す
- 「AIゴッドマザー」リー・フェイフェイさんが起業した。予想外なことに、大型モデルの時代には、有名な「AI ゴッドマザー」李飛飛も「起業」し、資金調達のシードラウンドを完了しました。ロイターの独占レポートによると、有名なコンピューター科学者のリー・フェイフェイ氏が新興企業を設立しているという。同社は人間のような視覚データ処理を活用して、人工知能による高度な推論の実行を可能にしています。関係者らによると、リー・フェイフェイさんは最近、シリコンバレーのベンチャーキャピタル会社アンドリーセン・ホロウィッツや、昨年入社したカナダの企業ラディカル・ベンチャーズなどの投資家とともに、同社へのシードラウンドで資金調達を行った。しかし、アンドリーセン・ホロヴィッツとラディカル・ベンチャーズの両方の広報担当者はこれを認めた。
- AI 1270 2024-05-05 13:04:06
-
- ヨガボールの上で「犬」の散歩! NVIDIA のトップ 10 プロジェクトの 1 つに選ばれた Eureka が新たな進歩を遂げました
- ロボット犬はヨガボールの上で安定して歩き、そのバランスは非常に優れています。平らな歩道でも、歩きにくい芝生でも、さまざまなシーンに対応できます。ヨガボールを足に置いても、研究者が蹴ることさえできます。 、たとえ風船がしぼんでも、ロボット犬は転倒しません。上記のデモはすべて 1 倍速であり、加速されていません。論文アドレス: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf プロジェクトホームページ: https://github.com/eureka-research/DrEureka 論文タイトル: DrE
- AI 761 2024-05-05 13:01:01
-
- 小型モデルのパフォーマンスが飽和してパフォーマンスが低下する根本原因はソフトマックスにありますか?
- 小規模な言語モデルの登場は、大規模な言語モデルの学習や推論のコストがかかるという欠点を補うためのものですが、ある段階まで学習すると性能が低下する(飽和現象)という事実もあります。この現象のために?それを克服して、小さな言語モデルのパフォーマンスを向上させるために活用することはできるでしょうか?言語モデリングの分野における最新の進歩は、非常に大規模な Web テキスト コーパス上で高度にパラメータ化されたニューラル ネットワークを事前トレーニングすることにあります。実際には、このようなモデルをトレーニングと推論に使用するとコストが高くなる可能性があり、より小規模な代替モデルの使用が求められます。ただし、小規模なモデルでは飽和が発生し、トレーニングのある程度の進んだ段階で能力の低下と頭打ちを特徴とする現象が発生する可能性があることが観察されています。最近の論文では、この飽和和現象はより小さなモデルによって軽減できることが判明しました。
- AI 1106 2024-05-04 13:10:01
-
- 最後に、誰かが小規模モデルの過学習を調査しました。その 3 分の 2 でデータ汚染が発生し、Microsoft Phi-3 と Mixtral 8x22B が命名されました。
- 現在、最も人気のある大規模モデルの 3 分の 2 に過剰適合の問題が発生していますか?発表されたばかりの研究は、この分野の多くの研究者を驚かせました。大規模な言語モデルの推論能力を向上させることは、この種のタスクにおいて現在の研究の最も重要な方向性の 1 つであり、最近リリースされた多くの小規模なモデルは、そのようなタスクにうまく対処できるようです。たとえば、Microsoft の Phi-3、Mistral8x22B などのモデルです。研究者らは、現在の大規模モデル研究の分野には重要な問題があると指摘しました。それは、多くの研究が既存の LLM の機能を正確にベンチマークできていないということです。これは、現在の LLM 機能レベルの評価とテストにもっと時間を費やす必要があることを示唆しています。これは、現在の研究のほとんどが GSM8k、MATH、M を使用しているためです。
- AI 669 2024-05-04 13:05:13
-
- 300 年以上にわたるリレー: テレンス・テルに触発されて、数学者たちは AI を使用してフェルマーの最終定理の証明を形式化することに決めました。
- テレンス・タオに触発されて、ますます多くの数学者が人工知能を使用して数学的探求を行おうとし始めました。今回のターゲットは、世界トップ10に入る数学の難問「フェルマーの最終定理」。フェルマーの最終定理は非常に複雑な数学的問題であり、これまでのところ実現可能な解決策は見つかっていません。数学者は、人工知能の強力な計算能力とインテリジェントなアルゴリズムを利用して、17 世紀のフランスの数学者ピエールによって発明された、「フェルマーの最終定理 (FLT)」としても知られるフェルマーの最終定理を数学で探求できることを期待しています。フェルマーが提案した。その背景には伝説的な物語があります。 1637年頃、フェルマーはディオファントスの『算術』のラテン語訳を読んでいたとき、第11巻の第8命題の隣にこう書いたと言われている。
- AI 836 2024-05-03 13:04:01
-
- トランスフォーマーはカンスフォーマーになりたいですか? MLPが挑戦者KANを迎えるまでに数十年かかった
- MLP (多層パーセプトロン) は何十年も使用されてきましたが、本当に他に選択肢はないのでしょうか?完全接続フィードフォワード ニューラル ネットワークとしても知られる多層パーセプトロン (MLP) は、今日の深層学習モデルの基本的な構成要素です。 MLP は機械学習における非線形関数を近似するためのデフォルトの方法であるため、MLP の重要性はいくら強調してもしすぎることはありません。しかし、MLP は私たちが構築できる最良の非線形回帰変数でしょうか? MLP は広く使用されていますが、重大な欠点があります。たとえば、Transformer モデルでは、MLP はほぼすべての非埋め込みパラメーターを消費するため、一般に、後処理分析ツールがないとアテンション レイヤーに比べて解釈しにくくなります。では、MLP に代わるものはあるのでしょうか?
- AI 1062 2024-05-03 13:01:04
-
- 最も人気のある生成 AI ハードウェアは 100,000 台以上販売されていますが、分解してみたら単なる Android アプリだったことがわかりました。
- 「RabbitR1 は、本質的には Android システム上のランチャー プログラムです。クラッキングされた後は、携帯電話上で実行できるようになります。」ラーマン氏は、クラッキングを通じて、Pixel6a 携帯電話上で R1 アプリケーションを起動して実行することに成功しました。火曜日、アメリカ人ジャーナリストのミシャール・ラーマン氏は、有名な生成 AI ハードウェア RabbitR1 の詳細を暴露し、すぐにテクノロジー界の注目を集めました。数カ月前、Humane と Rabbit という 2 つの新興企業が、人工知能デバイスである AiPin と RabbitR1 の発売を続けました。当初、これらのデバイスがウェアラブル人工知能の新時代の到来をもたらすと信じていた人もいました。しかし、月が経つにつれて、この 2 つのデバイスをめぐる論争が大きくなりました。 R
- AI 889 2024-05-02 16:01:19
-
- Yu Chengdong氏がHuawei Terminal BGのCEOを辞任し、He Gang氏が後任となる
- 複数メディアの報道によると、ファーウェイは4月30日午後、社内で人事調整文書を発行し、余成東氏がファーウェイターミナルBGのCEOを辞任すると発表した。ユー・チェンドン氏は今後もターミナルBGの会長職に留まる。元ファーウェイ・ターミナル BG 兼最高執行責任者である何剛氏が、ファーウェイ・ターミナル BG の CEO の職を引き継ぎます。報道によると、上記の個人的な変更や調整を除けば、この文書にはそれ以上の情報は含まれていないという。この大規模な人事異動の背景と、ターミナル BG の CEO を退任した余成東氏の新たな事業の焦点については、これ以上の説明はありません。一部の関係者は、今回の調整は日常的な事業構造調整であり、これにより余成東は消費者向けに高品質な製品を作るためのより多くのエネルギーを得ることができるだろうと述べた。 Yu Chengdong は 1969 年生まれ。ノースウェスタン工科大学の自動制御学科を卒業し、清華大学で学士号と修士号を取得しました。
- AI 813 2024-05-02 16:01:14