現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- ビデオモデルに速い目と遅い目を追加すると、Apple のトレーニング不要の新しいメソッドはすべての SOTA を数秒で上回ります
- Sora のリリース以来、AI ビデオ生成の分野はさらに「忙しく」なりました。過去数か月間、私たちは Jimeng、RunwayGen-3、LumaAI、Kuaishou Keling が順番に爆発するのを目撃してきました。モデルが AI によって生成されたことが一目でわかる過去とは異なり、この大規模なビデオ モデルのバッチは、これまで見た中で「最高」である可能性があります。ただし、ビデオ大規模言語モデル (LLM) の驚くべきパフォーマンスの背後には、非常に高いコストを必要とする、細かく注釈が付けられた巨大なビデオ データ セットがあります。最近、追加のトレーニングを必要としない多くの革新的な方法が研究分野で登場しました。つまり、トレーニングされた画像の大規模言語モデルを使用してビデオタスクを直接処理し、「高価な」トレーニングプロセスを回避します。さらに、既存のほとんどのビデオ LLM
- AI 601 2024-08-11 16:02:31
-
- ハイブリッド エキスパートはより積極的であり、複数のモダリティを認識し、状況に応じて行動することができます。メタはモダリティを認識したエキスパート ハイブリッドを提案します。
- 混合専門家も専門分野を持っています。現在の混合モダリティ基本モデルの一般的なアーキテクチャ設計は、特定のモダリティのエンコーダまたはデコーダを融合することです。ただし、この方法には限界があります。つまり、異なるモダリティからの情報を統合することができず、複数のモダリティを含むコンテンツを出力することが困難です。この制限を克服するために、MetaFAIR の Chameleon チームは、最近の論文「Chameleon: Mixed-modalearly-fusionfoundationmodels」で、次のトークンの予測ターゲットに基づいて離散画像とテキストを変換できる新しい単一の Transformer アーキテクチャを提案しました。トークンで構成されるシーケンスがモデル化されるため、さまざまなモードで
- AI 488 2024-08-11 13:02:22
-
- オープンソースとクローズドソースのモデル「カオス」:どのエージェントが人間の真の意図を最もよく垣間見ることができるか見てみましょう
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この記事の最初の著者は、清華大学コンピューターサイエンス学部の学部生、Qian Cheng と He Bingxiang です。二人ともTHUNLPのメンバーです。 Qian Cheng の主な研究対象は、ツール学習と大規模モデル駆動エージェントであり、現在 UIUC で博士号取得を目指しています。 He Bingxiang の主な研究対象は大規模モデルのアラインメントと
- AI 1300 2024-08-11 13:02:02
-
- 初の人工知能パーティーが無事開催されました
- 1905年、北京鳳台写真館で中国人自身が撮影した最初の映画『定軍山』が誕生し、中国における国産映画の存在しない歴史に終止符を打った。 100年以上経った2023年8月28日、人民日報新メディアビルの「原心」ホールで、中国人大学生らによる「異次元協力」により「新定軍山」という曲が披露された。アカデミー・オブ・オペラとデジタル担当のムー・ランが登場し、その場にいた聴衆から割れんばかりの拍手が起こりました。古代京劇の芸術、反復的な光と影の技術、そして新しいデジタル技術が古典に敬意を払いながら、時代を突破して新たな魅力を示しています。これは、人民日報オンラインが主催する第 1 回人工知能 (AI) ガラで開始された主要プログラムの 1 つです。テクノロジー、インテリジェンス、そして未来に満ちた一連の文化祭を通じて、パーティーは
- AI 595 2024-08-10 22:23:02
-
- 2024年世界人工知能会議TOP20の若手優秀論文を公開
- 2024年3月に「『2024年世界人工知能会議若手優秀論文賞』の参加論文推薦に関するお知らせ」を公表し、大学、科学研究機関を対象に人工知能分野の若手優秀論文の収集活動を開始しました。 、世界中の企業。投稿締切現在、国際的に著名な大学、科学研究機関、企業を含む国内外から合計159件の査読論文が寄せられています。予備評価と再評価を経て、2024年の優秀な青少年論文TOP20を発表しました。 (論文分野・論文名のアルファベット順) 2024年世界人工知能会議ユース優秀論文賞は、7月の世界人工知能会議で発表される予定ですので、ご期待ください!
- AI 1042 2024-08-10 16:06:11
-
- フォーラム プレビュー | 「知識が世界を変える - 垂直大規模モデルが知識管理を再定義する」フォーラムがまもなく開催されます
- はじめに: ラージ モデル テクノロジーは、知識の獲得、統合、応用、イノベーションを加速する大きな可能性を秘めており、教育、金融、政府事務などの多くの業界に変革的な影響をもたらす可能性があります。現在、我が国の企業シナリオにおける垂直大規模モデルの適用はまだ模索段階にあり、多くの企業が大規模モデルの最適な実装計画を模索しています。その中で、企業の内部知識ベースとの緊密な統合が重要と考えられています。垂直型大規模モデルを実装するためのエンタープライズ レベルのシナリオ。アプリケーションの重要な方向性。この目的を達成するために、2024年の世界人工知能会議および人工知能グローバルガバナンスに関するハイレベル会議中に、大関データは復丹・大関金融垂直応用大規模モデル学校・企業共同研究センターおよび浦東青年連盟と協力して共同開催する予定です。 「知識が世界を変える - モデルが知識管理を再定義する」をテーマにした垂直ビッグ フォーラム。フォーラムは2024年7月に開催されます
- AI 1018 2024-08-10 11:20:06
-
- 最高の国際データベースカンファレンスである ICDE に選出され、Tencent Cloud データベース技術革新が当局に認められました
- 今日、Tencent Cloud Database から 2 つの論文が国際データベース会議のトップである ICDE に選出されたことを知りました。その分散トランザクション プロトコルである Lion とメモリディスクにまたがるインデックス設計フレームワークは、データベース分野の一般的な問題を解決しており、その技術革新は国際当局によって認められています。 ICDE会場でのTencent Cloud Database Teamの共有技術 ICDE(IEEE International Conference on Data Engineering)は、SIGMOD、VLDBと並んでデータベース研究の三大カンファレンスとしても知られています。分散データベース トランザクション処理 分散トランザクション処理には、複数回のノード間通信が含まれるため、時間がかかります。過去の移住
- AI 731 2024-08-10 07:10:06
-
- AI は学業を手伝ってくれますが、代わりにやってくれるわけではありません (ChatGPT、NotebookLM)
- 私は、AI ツールに関して複雑な感情を抱いているストレート A の大学院生です。多くの人が学術現場で自分の努力を代替するために AI を使用しています。ただし、AI を使用して学習を支援し、研究を効率化し、学習を改善することはできます。 スタートインデ
- AI 838 2024-08-10 06:43:32
-
- Tongyi Qianwen が Qwen2-Math をオープンソース化し、最先端の数学専用モデルとなる
- 8月9日のニュースによると、Alibaba Tongyiチームは、基本モデルと1.5B、7B、72Bの3つのパラメータを備えた命令微調整モデルを含む新世代数学モデルQwen2-Mathをオープンソース化した。 Qwen2-Math は、Tongyi Qianwen オープンソース大規模言語モデル Qwen2 に基づいて開発されており、フラッグシップ モデル Qwen2-Math-72B-Instruct は、GPT-4o、Claude-3.5-Sonnet、Gemini-1.5-Pro、Llama よりも高いスコアを獲得しています。権威ある評価セット MATH. -3.1-405B などは、代数学、幾何学、計数と確率、数論などのさまざまな数学問題を 84% の精度で処理する、最も高度な数学に特化したモデルです。注: MATH ベンチマーク評価において
- AI 938 2024-08-09 19:44:14
-
- Google I/O 開発者カンファレンス チャイナ ステーション: 大型モデル テクノロジーがエコシステム全体に参入
- 水曜日、Googleは北京で中国開発者会議を開催した。 5月にカリフォルニア州マウンテンビューで開催されたI/Oカンファレンスに加え、今年のI/OConnectグローバルツアーはドイツのベルリンからインドのバンガロールに始まり、中国の北京にも到着しました。このイベントでは、さまざまな分野の専門家が、国内の開発者向けに、AI、Web、モバイル、クラウド テクノロジーなどの分野における Google の最新の技術進歩、開発ツール、グローバル サービス プラットフォームについて詳しく共有しました。 Google Greater China の社長、Chen Junting 氏は冒頭のスピーチで、「中国は世界最大の開発者市場の 1 つであり、当社の開発者は常に世界舞台で不可欠な先駆者であり続けています」と述べました。 「昨年、中国の 25 の開発チームが、世界中のさまざまな地域で合計 31 のゲームとアプリケーションを制作しました。
- AI 673 2024-08-09 19:42:02
-
- 1 年間の MD 計算を 2.5 日で完了しますか? DeepMind チームのユークリッド変換に基づく新しい計算方法
- Editor | Radish Skin 近年、ab initio 参照計算に基づいた機械学習力場 (MLFF) の開発が大きく進歩しました。低いテストエラーが達成されていますが、分子動力学 (MD) シミュレーションにおける MLFF の信頼性は、より長いシミュレーション時間スケールにおける不安定性への懸念により、ますます厳しい監視に直面しています。研究により、累積不正確性に対する堅牢性とMLFFにおける等変表現の使用との間に潜在的な関連性があることが示されていますが、これらの表現に関連する計算コストにより、実際にはこの利点が制限される可能性があります。この問題を解決するために、Google DeepMind とベルリン工科大学 (TUBerlin) の研究者は、SO3krates と呼ばれるトランスフォーマー フレームワークを提案しました。
- AI 773 2024-08-09 19:40:30
-
- Karpathy 氏の見解は物議を醸している: RLHF は本物の強化学習ではなく、Google と Meta はそれに反対している
- RLHF と RL を同じカテゴリーに分類できるかどうかについては、依然として意見が分かれているようです。 AI の第一人者である Karpathy が、人工知能の概念を広めるために再びここに来ました。昨日、彼は「人間のフィードバックに基づく強化学習 (RLHF) は単なる強化学習 (RL) です。」とツイートしました。Karpathy の全文は次のように説明されています: RLHF は大規模言語モデル (LLM) を訓練するための 3 番目の (そして 3 番目の) 方法です。 ) 最後の) メインステージ、最初の 2 つのステージは事前トレーニングと教師あり微調整 (SFT) です。 RLHF は RL とみなされるかぎり広く認識されていないと思います。 RL は強力ですが、RLHF は強力ではありません。実際の RL を使用してトレーニングされた AlphaGo の例を見てみましょう。コンピュータゲーム
- AI 1080 2024-08-09 16:40:09
-
- 2 つの論文が同時に最優秀論文賞にノミネートされました。SIGGRAPH の最初のリアルタイム ライブ中国チームは、生成 AI を使用して 3D 世界を作成しました。
- コンピューターグラフィックスに焦点を当てた世界最高峰の学術会議であるSIGGRAPHが新たな潮流を生み出しつつある。先週開催されたSIGGRAPH2024カンファレンスでは、最優秀論文などの賞のうち、上海科技大学MARS研究室のチームが最優秀論文の名誉ノミネートを2つ同時に受賞し、その研究成果も急速に進んでいます。工業化に向けて。著者は生成モデルの手法を使用して、想像力を複雑な 3D モデルに直接変換する新しい方法を切り開きます。最優秀論文にノミネートされた 2 つの論文、CLAY と DressCode は、それぞれ 3D 生成と 3D 衣類生成に関するものです。 SIGGARPH の Real-TimeLive セッションでは、上海科技大学のチームがこれら 2 つの作品に基づいたリアルタイムの結果を実証しました。
- AI 1080 2024-08-09 16:03:49
-
- DeepMind ロボットが卓球をすると、フォアハンドとバックハンドが空中に滑り出し、人間の初心者を完全に打ち負かしました
- でももしかしたら公園の老人には勝てないかもしれない?パリオリンピックの真っ最中で、卓球が注目を集めています。同時に、ロボットは卓球のプレーにも新たな進歩をもたらしました。先ほど、DeepMind は、卓球競技において人間のアマチュア選手のレベルに到達できる初の学習ロボット エージェントを提案しました。論文のアドレス: https://arxiv.org/pdf/2408.03906 DeepMind ロボットは卓球でどれくらい優れていますか?おそらく人間のアマチュアプレーヤーと同等です: フォアハンドとバックハンドの両方: 相手はさまざまなプレースタイルを使用しますが、ロボットもそれに耐えることができます: さまざまなスピンでサーブを受ける: ただし、ゲームの激しさはそれほど激しくないようです公園の老人。ロボット、卓球用
- AI 1450 2024-08-09 16:01:32
-
- 投機的サンプリングにより、大規模な言語モデルの推論精度が失われるのでしょうか?
- 投機的サンプリングのプロトタイプの概念は、2018 年に MitchellStern らによって提案されました。その後、このアプローチは LookaheadDecoding、REST、Medusa、EAGLE などのさまざまな研究によってさらに開発および洗練され、投機的サンプリングによって大規模言語モデル (LLM) の推論プロセスが大幅に高速化されています。重要な質問は、LLM の投機的サンプリングは元のモデルの精度に悪影響を与えるかどうかです。答えから始めましょう: いいえ。標準の投機的サンプリング アルゴリズムはロスレスであり、この記事では数学的分析と実験を通じてこれを証明します。数学的には、投機的サンプリング公式は次のように定義できます。 ここで、 ? は一様分布からサンプリングされた実数です。予測される次のトークンです。 ?(?)はドラフトモデルによって与えられます
- AI 1273 2024-08-09 13:09:05