現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI

  • OmniDrive: 大規模モデルを 3D 運転タスクと連携させるためのフレームワーク
    OmniDrive: 大規模モデルを 3D 運転タスクと連携させるためのフレームワーク
    まず、スパース クエリを使用して視覚表現を 3D にリフトおよび圧縮し、LLM に入力する新しい 3DMLLM アーキテクチャから始めます。タイトル: OmniDrive: AHolisticLLM-AgentFramework for Autonomous Driving with 3DPerception Reasoning and Planning 著者の所属: 北京工業大学、NVIDIA、華中科技大学 オープンソース アドレス: GitHub-NVlabs/OmniDrive マルチモーダル大規模言語モデル (MLLM) の開発強力な推論能力を活用して、LLM ベースの自動運転への関心が高まっています
    AI 1145 2024-05-06 15:16:35
  • MLPは一夜にして消滅した! MIT カリフォルニア工科大学とその他の革新的な KAN が記録を破り、DeepMind を打ち砕く数学的定理を発見
    MLPは一夜にして消滅した! MIT カリフォルニア工科大学とその他の革新的な KAN が記録を破り、DeepMind を打ち砕く数学的定理を発見
    一夜にして、機械学習のパラダイムが変わろうとしています。現在、深層学習の分野を支配しているインフラストラクチャは、ニューロンに活性化関数を配置する多層パーセプトロン (MLP) です。では、それを超えて、新たなルートはあるのでしょうか?ちょうど今日、MIT、カリフォルニア工科大学、ノースイースタン大学、その他の機関のチームが、新しいニューラル ネットワーク構造であるコルモゴロフ アーノルド ネットワーク (KAN) をリリースしました。研究者らは、学習可能な活性化関数をノード (ニューロン) からエッジ (重み) に移動することで、MLP に簡単な変更を加えました。論文アドレス: https://arxiv.org/pdf/2404.19756 この変更は一見すると根拠がないように見えます
    AI 1097 2024-05-06 15:10:01
  • 医療診断市場における人工知能は2028年までに40億ドルに達する
    医療診断市場における人工知能は2028年までに40億ドルに達する
    正確さとスピードが重要な医療分野では、人工知能 (AI) の統合が変革の力となっています。医療診断における人工知能の市場は、かつては新興のニッチ市場でしたが、急速に強力な市場に成長し、その規模は数十億ドルに達すると予測されています。医療診断における人工知能の市場規模は、2023 年の収益が 12 億 5,000 万米ドルに達し、2028 年までに 44 億 8,000 万米ドルに達すると予測されており、予測期間中に 29.04% の CAGR で成長します。医療診断市場における人工知能の成長は、いくつかの重要な要因によって推進されています。 人工知能ベースのソリューションに対する需要の増大: 現代の医療環境が進化し続け、新たな疾患や状態が発見されるにつれ、人工知能ベースのソリューションに対する需要が高まっています。
    AI 620 2024-05-06 15:01:06
  • テスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能です
    テスラのオプティマス人型ロボットは工場で働き、バッテリーの分解や自己修正に熟練しており、さらに先のことも可能です
    テスラの人型ロボットが新しいスキルを解放しました!昨日、テスラ オプティマスは、第 2 世代オプティマス人型ロボットの最新の進歩を示す新しいデモビデオを正式にリリースしました。今回、オプティマスはテスラ電池工場で電池の組み立てを学び、以前よりも速く、より遠くへ、そしてより安定して歩き始めました。まずはオプティマスの最新スキルとトレーニング内容を見ていきましょう。オプティマスのエンドツーエンドのニューラル ネットワークは現在、テスラの工場でバッテリー セルを正確に組み立てるようにトレーニングされています。これは、2D カメラ、ハンドタッチ、および力センサーのみに依存して、ロボットの FSD コンピューター上でリアルタイムで実行されます。オプティマスは脚を使ってバランスを保ち、ネットワークが上半身全体を動かします。
    AI 1105 2024-05-06 14:52:10
  • CVPR 2024 | 浙江大学は神経構造化光を利用して動的三次元現象のリアルタイム取得と再構築を実現
    CVPR 2024 | 浙江大学は神経構造化光を利用して動的三次元現象のリアルタイム取得と再構築を実現
    AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com。煙などの動的三次元物理現象を効率的かつ高品質に再現することは、航空力学的設計検証や気象三次元観測などの分野での幅広い応用が期待できる関連科学研究の重要な課題です。時間の経過とともに変化する 3 次元の密度シーケンスを再構築することで、科学者を支援することができます。
    AI 919 2024-05-06 14:50:14
  • ICLR 2024 スポットライト | NoiseDiffusion: 拡散モデルのノイズを修正し、補間画像の品質を向上
    ICLR 2024 スポットライト | NoiseDiffusion: 拡散モデルのノイズを修正し、補間画像の品質を向上
    著者|PengfeiZheng Unit|USTC,HKBUTMLRGroup 近年、生成 AI の急速な発展により、テキストから画像への生成やビデオ生成などの注目を集める分野に大きな推進力が注入されています。これらの技術の中核は、拡散モデルの適用にあります。拡散モデルは、最初に連続的にノイズを追加する順方向プロセスを定義することによって画像を徐々にガウス ノイズに変更し、次に逆方向プロセスを通じてガウス ノイズを徐々に除去して鮮明な画像に変換して実際のサンプルを取得します。拡散常微分モデルは、生成された画像の値を補間するために使用され、ビデオや一部の広告クリエイティブの生成に大きな応用可能性があります。ただし、この方法を自然画像に適用すると、補間された画像効果が満足できない場合が多いことに気付きました。存在する
    AI 1164 2024-05-06 14:01:24
  • AIは自分の思考と理性をこっそり隠すことを学びます!人間の経験に頼らずに複雑なタスクを解決することは、よりブラックボックスです
    AIは自分の思考と理性をこっそり隠すことを学びます!人間の経験に頼らずに複雑なタスクを解決することは、よりブラックボックスです
    AIが数学の問題を解く時の本当の思考は実は密かに「暗算」?ニューヨーク大学のチームによる新しい研究では、たとえ AI がステップを書くことを許可されておらず、意味のない「...」に置き換えられたとしても、一部の複雑なタスクのパフォーマンスは大幅に向上する可能性があることがわかりました。著者の一人、JacabPfau 氏は次のように述べています。追加のトークンを生成するためにコンピューティング能力を費やす限り、どのトークンを選択しても利点は得られます。たとえば、Llama34M に次のような単純な質問に答えてもらいます。自然定数 e の最初の 6 桁のうち、5 より大きいものはいくつありますか? AIの直接の答えは、最初の6桁だけをカウントし、実際には7をカウントするのと同じです。 AI に各数値を検証する手順を書き取らせると、正しい答えが得られます。 AI にステップを非表示にして、多数の「...」に置き換えます。
    AI 1000 2024-05-06 12:00:30
  • スタンフォード大学のリー・フェイフェイが最初のビジネスを始めた:2年間の学業休暇を経て、「空間インテリジェンス」を目指す
    スタンフォード大学のリー・フェイフェイが最初のビジネスを始めた:2年間の学業休暇を経て、「空間インテリジェンス」を目指す
    「AIゴッドマザー」リー・フェイフェイさんが起業した。予想外なことに、大型モデルの時代には、有名な「AI ゴッドマザー」李飛飛も「起業」し、資金調達のシードラウンドを完了しました。ロイターの独占レポートによると、有名なコンピューター科学者のリー・フェイフェイ氏が新興企業を設立しているという。同社は人間のような視覚データ処理を活用して、人工知能による高度な推論の実行を可能にしています。関係者らによると、リー・フェイフェイさんは最近、シリコンバレーのベンチャーキャピタル会社アンドリーセン・ホロウィッツや、昨年入社したカナダの企業ラディカル・ベンチャーズなどの投資家とともに、同社へのシードラウンドで資金調達を行った。しかし、アンドリーセン・ホロヴィッツとラディカル・ベンチャーズの両方の広報担当者はこれを認めた。
    AI 1270 2024-05-05 13:04:06
  • ヨガボールの上で「犬」の散歩! NVIDIA のトップ 10 プロジェクトの 1 つに選ばれた Eureka が新たな進歩を遂げました
    ヨガボールの上で「犬」の散歩! NVIDIA のトップ 10 プロジェクトの 1 つに選ばれた Eureka が新たな進歩を遂げました
    ロボット犬はヨガボールの上で安定して歩き、そのバランスは非常に優れています。平らな歩道でも、歩きにくい芝生でも、さまざまなシーンに対応できます。ヨガボールを足に置いても、研究者が蹴ることさえできます。 、たとえ風船がしぼんでも、ロボット犬は転倒しません。上記のデモはすべて 1 倍速であり、加速されていません。論文アドレス: https://eureka-research.github.io/dr-eureka/assets/dreureka-paper.pdf プロジェクトホームページ: https://github.com/eureka-research/DrEureka 論文タイトル: DrE
    AI 761 2024-05-05 13:01:01
  • 小型モデルのパフォーマンスが飽和してパフォーマンスが低下する根本原因はソフトマックスにありますか?
    小型モデルのパフォーマンスが飽和してパフォーマンスが低下する根本原因はソフトマックスにありますか?
    小規模な言語モデルの登場は、大規模な言語モデルの学習や推論のコストがかかるという欠点を補うためのものですが、ある段階まで学習すると性能が低下する(飽和現象)という事実もあります。この現象のために?それを克服して、小さな言語モデルのパフォーマンスを向上させるために活用することはできるでしょうか?言語モデリングの分野における最新の進歩は、非常に大規模な Web テキスト コーパス上で高度にパラメータ化されたニューラル ネットワークを事前トレーニングすることにあります。実際には、このようなモデルをトレーニングと推論に使用するとコストが高くなる可能性があり、より小規模な代替モデルの使用が求められます。ただし、小規模なモデルでは飽和が発生し、トレーニングのある程度の進んだ段階で能力の低下と頭打ちを特徴とする現象が発生する可能性があることが観察されています。最近の論文では、この飽和和現象はより小さなモデルによって軽減できることが判明しました。
    AI 1106 2024-05-04 13:10:01
  • 最後に、誰かが小規模モデルの過学習を調査しました。その 3 分の 2 でデータ汚染が発生し、Microsoft Phi-3 と Mixtral 8x22B が命名されました。
    最後に、誰かが小規模モデルの過学習を調査しました。その 3 分の 2 でデータ汚染が発生し、Microsoft Phi-3 と Mixtral 8x22B が命名されました。
    現在、最も人気のある大規模モデルの 3 分の 2 に過剰適合の問題が発生していますか?発表されたばかりの研究は、この分野の多くの研究者を驚かせました。大規模な言語モデルの推論能力を向上させることは、この種のタスクにおいて現在の研究の最も重要な方向性の 1 つであり、最近リリースされた多くの小規模なモデルは、そのようなタスクにうまく対処できるようです。たとえば、Microsoft の Phi-3、Mistral8x22B などのモデルです。研究者らは、現在の大規模モデル研究の分野には重要な問題があると指摘しました。それは、多くの研究が既存の LLM の機能を正確にベンチマークできていないということです。これは、現在の LLM 機能レベルの評価とテストにもっと時間を費やす必要があることを示唆しています。これは、現在の研究のほとんどが GSM8k、MATH、M を使用しているためです。
    AI 669 2024-05-04 13:05:13
  • 300 年以上にわたるリレー: テレンス・テルに触発されて、数学者たちは AI を使用してフェルマーの最終定理の証明を形式化することに決めました。
    300 年以上にわたるリレー: テレンス・テルに触発されて、数学者たちは AI を使用してフェルマーの最終定理の証明を形式化することに決めました。
    テレンス・タオに触発されて、ますます多くの数学者が人工知能を使用して数学的探求を行おうとし始めました。今回のターゲットは、世界トップ10に入る数学の難問「フェルマーの最終定理」。フェルマーの最終定理は非常に複雑な数学的問題であり、これまでのところ実現可能な解決策は見つかっていません。数学者は、人工知能の強力な計算能力とインテリジェントなアルゴリズムを利用して、17 世紀のフランスの数学者ピエールによって発明された、「フェルマーの最終定理 (FLT)」としても知られるフェルマーの最終定理を数学で探求できることを期待しています。フェルマーが提案した。その背景には伝説的な物語があります。 1637年頃、フェルマーはディオファントスの『算術』のラテン語訳を読んでいたとき、第11巻の第8命題の隣にこう書いたと言われている。
    AI 836 2024-05-03 13:04:01
  • トランスフォーマーはカンスフォーマーになりたいですか? MLPが挑戦者KANを迎えるまでに数十年かかった
    トランスフォーマーはカンスフォーマーになりたいですか? MLPが挑戦者KANを迎えるまでに数十年かかった
    MLP (多層パーセプトロン) は何十年も使用されてきましたが、本当に他に選択肢はないのでしょうか?完全接続フィードフォワード ニューラル ネットワークとしても知られる多層パーセプトロン (MLP) は、今日の深層学習モデルの基本的な構成要素です。 MLP は機械学習における非線形関数を近似するためのデフォルトの方法であるため、MLP の重要性はいくら強調してもしすぎることはありません。しかし、MLP は私たちが構築できる最良の非線形回帰変数でしょうか? MLP は広く使用されていますが、重大な欠点があります。たとえば、Transformer モデルでは、MLP はほぼすべての非埋め込みパラメーターを消費するため、一般に、後処理分析ツールがないとアテンション レイヤーに比べて解釈しにくくなります。では、MLP に代わるものはあるのでしょうか?
    AI 1062 2024-05-03 13:01:04
  • 最も人気のある生成 AI ハードウェアは 100,000 台以上販売されていますが、分解してみたら単なる Android アプリだったことがわかりました。
    最も人気のある生成 AI ハードウェアは 100,000 台以上販売されていますが、分解してみたら単なる Android アプリだったことがわかりました。
    「RabbitR1 は、本質的には Android システム上のランチャー プログラムです。クラッキングされた後は、携帯電話上で実行できるようになります。」ラーマン氏は、クラッキングを通じて、Pixel6a 携帯電話上で R1 アプリケーションを起動して実行することに成功しました。火曜日、アメリカ人ジャーナリストのミシャール・ラーマン氏は、有名な生成 AI ハードウェア RabbitR1 の詳細を暴露し、すぐにテクノロジー界の注目を集めました。数カ月前、Humane と Rabbit という 2 つの新興企業が、人工知能デバイスである AiPin と RabbitR1 の発売を続けました。当初、これらのデバイスがウェアラブル人工知能の新時代の到来をもたらすと信じていた人もいました。しかし、月が経つにつれて、この 2 つのデバイスをめぐる論争が大きくなりました。 R
    AI 889 2024-05-02 16:01:19
  • Yu Chengdong氏がHuawei Terminal BGのCEOを辞任し、He Gang氏が後任となる
    Yu Chengdong氏がHuawei Terminal BGのCEOを辞任し、He Gang氏が後任となる
    複数メディアの報道によると、ファーウェイは4月30日午後、社内で人事調整文書を発行し、余成東氏がファーウェイターミナルBGのCEOを辞任すると発表した。ユー・チェンドン氏は今後もターミナルBGの会長職に留まる。元ファーウェイ・ターミナル BG 兼最高執行責任者である何剛氏が、ファーウェイ・ターミナル BG の CEO の職を引き継ぎます。報道によると、上記の個人的な変更や調整を除けば、この文書にはそれ以上の情報は含まれていないという。この大規模な人事異動の背景と、ターミナル BG の CEO を退任した余成東氏の新たな事業の焦点については、これ以上の説明はありません。一部の関係者は、今回の調整は日常的な事業構造調整であり、これにより余成東は消費者向けに高品質な製品を作るためのより多くのエネルギーを得ることができるだろうと述べた。 Yu Chengdong は 1969 年生まれ。ノースウェスタン工科大学の自動制御学科を卒業し、清華大学で学士号と修士号を取得しました。
    AI 813 2024-05-02 16:01:14

ツールの推奨事項

jQuery エンタープライズ メッセージ フォームの連絡先コード

jQuery エンタープライズ メッセージ フォーム連絡先コードは、シンプルで実用的なエンタープライズ メッセージ フォームおよび連絡先紹介ページ コードです。

HTML5 MP3 オルゴール再生効果

HTML5 MP3 オルゴール再生特殊効果は、HTML5 + css3 に基づく MP3 音楽プレーヤーで、かわいいオルゴールの絵文字を作成し、スイッチ ボタンをクリックします。

HTML5 クールなパーティクル アニメーション ナビゲーション メニューの特殊効果

HTML5 クールなパーティクル アニメーションのナビゲーション メニュー特殊効果は、ナビゲーション メニューにマウスを置くと色が変化する特殊効果です。

jQuery ビジュアル フォームのドラッグ アンド ドロップ編集コード

jQuery ビジュアル フォームのドラッグ アンド ドロップ編集コードは、jQuery およびブートストラップ フレームワークに基づいたビジュアル フォームです。

有機果物と野菜のサプライヤー Web テンプレート Bootstrap5

有機果物と野菜のサプライヤー Web テンプレート-Bootstrap5

Bootstrap3 多機能データ情報バックグラウンド管理レスポンシブ Web ページ テンプレート-Novus

Bootstrap3 多機能データ情報バックグラウンド管理レスポンシブ Web ページ テンプレート-Novus

不動産リソース サービス プラットフォーム Web ページ テンプレート Bootstrap5

不動産リソース サービス プラットフォーム Web ページ テンプレート Bootstrap5

シンプルな履歴書情報 Web テンプレート Bootstrap4

シンプルな履歴書情報 Web テンプレート Bootstrap4

かわいい夏の要素のベクター素材 (EPS+PNG)

これは、太陽、日よけ帽子、ココナッツの木、ビキニ、飛行機、スイカ、アイスクリーム、アイスクリーム、冷たい飲み物、浮き輪、ビーチサンダル、パイナップル、巻貝、貝殻、ヒトデ、カニを含む、かわいい夏の要素のベクター素材です。 、レモン、日焼け止め、サングラスなど、素材は JPG プレビューを含む EPS および PNG 形式で提供されています。
PNG素材
2024-05-09

4 つの赤い 2023 卒業バッジ ベクター素材 (AI+EPS+PNG)

これは、2023 年卒業バッジの赤いベクター素材で、合計 4 つがあり、JPG プレビューを含む AI、EPS、PNG 形式で利用できます。
PNG素材
2024-02-29

歌う鳥と花がいっぱいのカートデザイン春のバナーベクター素材(AI+EPS)

これは、さえずる鳥と​​花でいっぱいのカートをデザインした春のバナー ベクター素材で、JPG プレビューを含む AI および EPS 形式で利用できます。
バナー画像
2024-02-29

金色の卒業帽ベクター素材(EPS+PNG)

これは、JPG プレビューを含む EPS および PNG 形式で利用できる、金色の卒業帽のベクター素材です。
PNG素材
2024-02-27

室内装飾クリーニングおよび修理サービス会社のウェブサイトのテンプレート

家の装飾のクリーニングとメンテナンス サービス会社の Web サイト テンプレートは、家の装飾、クリーニング、メンテナンス、その他のサービス組織を提供するプロモーション Web サイトに適した Web サイト テンプレートのダウンロードです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

フレッシュカラーの個人履歴書ガイドページテンプレート

フレッシュカラーマッチング個人求人応募履歴書ガイドページテンプレートは、フレッシュカラーマッチングスタイルに適した個人求人検索履歴書仕事表示ガイドページWebテンプレートのダウンロードです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

デザイナーのクリエイティブな仕事の履歴書 Web テンプレート

デザイナー クリエイティブ ジョブ履歴書 Web テンプレートは、さまざまなデザイナーのポジションに適した個人の職務履歴書表示用のダウンロード可能な Web テンプレートです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。

現代のエンジニアリング建設会社のウェブサイトのテンプレート

最新のエンジニアリングおよび建設会社の Web サイト テンプレートは、エンジニアリングおよび建設サービス業界の宣伝に適したダウンロード可能な Web サイト テンプレートです。ヒント: このテンプレートは Google フォント ライブラリを呼び出すため、ページが開くのが遅くなる場合があります。