現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- 機械に話しかける: 迅速なエンジニアリングの 10 の秘密が明らかに
- AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/ をご覧ください。プロンプトの力は驚くべきものです。人間の言語に近いいくつかの単語を入力するだけで、Well- を取得できます。フォーマットされ、構造化された回答。曖昧なトピックや、手の届かない事実はありません。少なくとも、それがトレーニング コーパスの一部であり、モデルの ShadowyController によって承認されている限り、単純なプロンプトで答えを得ることができます。しかし、プロンプトの魔法が絶対的なものではないことに気づき始めている人もいます。私たちの合図は、常に私たちが望む結果を生み出すとは限りません。一部のプロンプト言語は他の言語よりもさらに優れています
- AI 394 2024-06-03 10:53:11
-
- Microsoft、米国のデータセンター容量を拡大するための33億ドルのAIインフラ投資計画を発表
- Microsoftは2026年末までに4段階の投資戦略を開始する予定だ。このテクノロジー企業はデータセンターキャンパスを建設し、2030年までに州全体で1000万人以上の人々をGenAIでスキルアップする計画だ。 AWS、Google、Microsoft は、コンピューティング能力に対する需要の増大をサポートするための包括的なインフラストラクチャ計画を策定しており、全米の州に投資を行っています。今年初め、AWSはインドネシアとミシシッピ州のデータセンターに2億1000万ドルの投資を発表した。これは両州で最大の設備投資となる。グーグルは先月、バージニア州とインディアナ州のデータセンターキャンパスの建設と拡張に30億ドルを投資する計画を発表した。 SynergyResearchGroupが10月に発表したレポート
- AI 1129 2024-06-03 10:52:37
-
- アメリカの教授は、2 歳の娘を使って AI モデルをトレーニングし、『サイエンス』誌に掲載されました。人間の子はヘッドマウント カメラを使用して新しい AI をトレーニングします
- 信じられないことに、ニューヨーク州立大学の教授は、AI モデルをトレーニングするために、GoPro のようなカメラを娘の頭に縛り付けました。信じられないように聞こえますが、この教授の行動には実は十分な根拠があります。 LLM の背後にある複雑なニューラル ネットワークをトレーニングするには、大量のデータが必要です。現在の LLM トレーニング プロセスは、必ずしも最もシンプルで効率的な方法なのでしょうか?確かにそうではありません!科学者たちは、人間の幼児の脳がスポンジのように水を吸収し、急速に一貫した世界観を形成していることを発見しました。 LLM は時々驚くべきパフォーマンスを発揮しますが、時間が経つにつれて、人間の子供はモデルよりも賢く、より創造的になります。子どもたちが言語を習得する秘訣 LLM をより良い方法で訓練するには?科学者が解決策に困惑しているとき、
- AI 707 2024-06-03 10:08:09
-
- ICML 2024 | 大規模言語モデルの事前トレーニングの新境地: 「ベスト アダプテーション パッケージング」が文書処理標準を再構築
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com 大規模な言語モデルのトレーニング プロセスでは、データ処理の方法が重要です。従来の方法では通常、多数のドキュメントを連結して、モデルのコンテキスト長に等しいトレーニング シーケンスに分割します。これによりトレーニングの効率は向上しますが、多くの場合、ドキュメントが不必要に切り捨てられることになります。
- AI 637 2024-06-02 21:42:20
-
- Tencent Hunyuanの大型モデルが大幅値下げされました! Hunyuan-lite は今後無料です
- 5月22日、テンセントクラウドは新たな大規模モデルアップグレード計画を発表した。主要モデルの 1 つである Hunyuan-lite モデルは、API 入出力の合計長が現在の 4k から 256k にアップグレードされる予定で、価格は 0.008 元/千トークンから完全無料に調整されます。渾源標準 API の入力価格は 0.01 元/千トークンから 0.0045 元/千トークンに 55% 下落し、API 出力価格は 0.01 元/千トークンから 0.005 元/千トークンに下落し、55% 減少しました。 50%。新しく発売されたHunyuan-standard-256kは38万文字を超える超長文を処理する能力があり、API入力価格は0.015元/千トークンに値下げされた。
- AI 437 2024-06-02 20:07:09
-
- オックスフォード大学の最新情報 | 約 400 の要約!大規模言語モデルと三次元世界に関する最新のレビューについて語る
- 上記および著者の個人的な理解: 大規模言語モデル (LLM) の開発により、それらと 3D 空間データ (3DLLM) の統合が急速に進み、物理空間を理解し、対話するための前例のない機能が提供されました。この記事では、3D データの処理、理解、生成に対する LLM のアプローチの包括的な概要を説明します。私たちは、文脈学習、段階的推論、オープンボキャブラリー機能、広範な世界知識などの LLM の独自の利点を強調し、空間理解と組み込み人工知能 (AI) システムとの相互作用を促進する LLM の可能性を強調します。私たちの研究は、点群からニューラル レンダリング フィールド (NeRF) まで、さまざまな 3D データ表現をカバーしています。 3D シーンの理解、字幕、
- AI 419 2024-06-02 19:41:32
-
- マルチエージェントを構築するための AutoGen オープンソース フレームワークを理解するには、この記事を読んでください。
- こんにちは、私の名前はルーガです。今日は、人工知能 (AI) の生態分野に関連するテクノロジー、つまり統合されたマルチエージェント対話フレームワークである AutoGen についてお話します。私たちがもはや単独で戦うのではなく、高度にパーソナライズされた、クロスドメインに統合された AI チームを持つシナリオを想像してみてください。チームメンバーはそれぞれ、それぞれの分野で熟練し、プロフェッショナルであり、互いにシームレスに協力し、効率的にコミュニケーションをとり、決して疲れることはありません。彼らは高度に協力して、複雑で常に変化する課題に対処することができます。これは、画期的なマルチエージェント対話フレームワークである AutoGen の本質です。 AutoGen+ は私たちに無限の可能性を与え、独自の戦略的人工知能チームを自由に形成できるようにします。メンバーそれぞれが個性を持っている
- AI 1149 2024-06-02 19:12:02
-
- 単なる 3D ガウス以上のもの!最先端の 3D 再構成技術の最新概要
- 上記と著者の個人的な理解は、画像ベースの 3D 再構成は、一連の入力画像からオブジェクトまたはシーンの 3D 形状を推測することを含む困難なタスクであるということです。学習ベースの手法は、3D形状を直接推定できることから注目を集めています。このレビュー ペーパーは、これまでにない新しいビューの生成など、最先端の 3D 再構成技術に焦点を当てています。入力タイプ、モデル構造、出力表現、トレーニング戦略など、ガウス スプラッシュ メソッドの最近の開発の概要が提供されます。未解決の課題と今後の方向性についても議論します。この分野の急速な進歩と 3D 再構成手法を強化する数多くの機会を考慮すると、アルゴリズムを徹底的に調査することが重要であると思われます。したがって、この研究は、ガウス散乱の最近の進歩の包括的な概要を提供します。 (親指を上にスワイプしてください
- AI 875 2024-06-02 18:57:35
-
- GPT-3.5でデータセットを生成!北京大学天宮と他のチームによる画像編集用の新しい SOTA は、物理世界のシーンを正確にシミュレートできます
- 高品質の画像編集には多くの方法がありますが、どれも現実の物理世界を正確に表すものではありません。ぜひ、EdittheWorld を試してみてください。北京大学、TiamatAI、Tiangong AI、Mila Labs は、世界から指示された画像編集という新しい編集タスクを導入した EditWorld を提案しました。さまざまな世界のシナリオに基づいて命令を定義および分類します。画像は、GPT-3.5、Video-LLava、SDXL などの事前トレーニング済みモデルのセットによってサポートされており、ワールド命令を含むマルチモーダル データセットを構築します。拡散ベースの画像編集モデル EditWorld がこのデータセットでトレーニングされ、その結果が新しいタスクに反映されます。
- AI 849 2024-06-02 17:18:08
-
- ターゲット検出のための新しい SOTA、デバイスと側面のリアルタイム認識、Shen Xiangyang はめったに転送せず、いいね!
- ターゲット検出の分野は、IDEA Research Institute チームによって作成された GroundingDINO1.5 という新たな進歩をもたらしました。これは、デバイス側でリアルタイム認識を実現できます。この進歩は、通常は毎年変更を加える AI 王の沈祥陽氏によって伝えられました。このリリースには、Pro と Edge の 2 つの主要なバージョンがあります。 Pro バージョンはより強力で、Edge バージョンはより高速です。以前のバージョンの GroundingDINO のデュアル エンコーダとシングル デコーダの構造を維持しており、これに基づいて、より大きなビジュアル バックボーンを組み合わせてモデル サイズを拡張し、2,000 万を超える Grounding データを使用して豊富なコーパスを取得し、検出を大幅に向上させます。精度と速度が向上し、Pro バージョンと Edge バージョンを通じてさまざまなアプリケーションを対象としています。
- AI 1193 2024-06-02 16:41:05
-
- DiffMap: 高精度地図構築を強化するために LDM を使用する最初のネットワーク
- 論文のタイトル: DiffMap: EnhancingMapSegmentationwithMapPriorUsingDiffusionModel 論文著者: PeijinJia、TuopuWen、ZiangLuo、MengmengYang、KunJiang、ZhiquanLei、XueweiTang、ZiyuanLiu、LeCui、KehuaSheng、BoZhang、DiangYang01 背景 はじめに 自動運転車の場合、高解像度 (HD) マップが役立ちます精度環境理解(認識)とナビゲーションの正確さ。ただし、人工的に構築された描画面は、
- AI 847 2024-06-02 16:26:44
-
- GPT-4o と GPT-4 Turbo を 1 つの記事で読む
- こんにちは、私はルーガです。今日は人工知能 (AI) の生態分野に関連するテクノロジー、GPT-4o モデルについて話します。 2024 年 5 月 13 日、OpenAI は最も先進的かつ最先端のモデル GPT-4o を革新的に発売しました。これは、人工知能チャット ロボットと大規模言語モデルの分野で大きな進歩をもたらしました。人工知能機能の新時代の到来を告げる GPT-4o は、速度と多用途性の両方で前世代の GPT-4 を上回る大幅なパフォーマンスの向上を誇ります。この画期的な進歩により、以前のバージョンでしばしば悩まされていた遅延の問題が解決され、シームレスで応答性の高いユーザー エクスペリエンスが保証されます。 GPT-4o とは何ですか? 2024 年 5 月 13 日に OpenAI がリリースされました。
- AI 736 2024-06-02 16:02:40
-
- 自動運転の初の純粋な視覚的静的再構築
- 純粋に視覚的な注釈ソリューションでは、主に視覚に加えて、GPS、IMU、および車輪速度センサーからのデータを動的注釈に使用します。もちろん、量産シナリオでは、純粋な視覚である必要はありません。一部の量産車両には固体レーダー (AT128) などのセンサーが搭載されています。大量生産の観点からデータの閉ループを作成し、これらすべてのセンサーを使用すると、動的オブジェクトのラベル付けの問題を効果的に解決できます。しかし、私たちの計画には固体レーダーはありません。したがって、この最も一般的な量産ラベル ソリューションを紹介します。純粋に視覚的な注釈ソリューションの中核は、高精度のポーズ再構築にあります。再構築の精度を確保するために、Structure from Motion (SFM) のポーズ再構築スキームを使用します。でもパスする
- AI 770 2024-06-02 15:24:40
-
- 思考回路はもう存在しない?ニューヨーク大学の最新研究: 推論ステップは省略可能
- 人気の思考連鎖テクノロジーが覆されるかも!大規模なモデルが実際に思考チェーンを使用して段階的に思考できることにまだ驚きますか?思考連鎖を促す言葉を書けなくてまだ悩んでいませんか?ニューヨーク大学の研究者らは、「それは問題ではない。推論のステップは重要ではない。書きたくない場合はプロンプトの単語を書く必要はなく、代わりに省略記号を使用すればよい」と述べた。 。論文アドレス: https://arxiv.org/pdf/2404.15758 この記事のタイトルでは、思考連鎖の「Let'sthinkstepbystep」と比較するために「Let'sthinkdotbydot」を直接使用しており、「省略」の威力を示しています。 「点と点」の力 研究者たちは、チェーンオーが
- AI 427 2024-06-02 15:21:41
-
- Microsoft が Copilot エージェントをリリースし、ネイティブの小規模言語モデルも導入
- 現地時間2022年5月22日のニュースによると、MicrosoftはBuild開発者カンファレンスでCopilot新エージェントを発表した。これは仮想従業員のようなもので、タスクを自動的に実行できる。 Microsoft は、この種の人工知能は従業員の仕事を完全に置き換えるのではなく、退屈な仕事内容を排除すると考えています。 Microsoft の Copilot は、オープン ソース コード モデル GPT-3 に基づいて開発されており、開発者がより効率的にコードを作成できるようにするために、多数のコード ライブラリとアルゴリズムが使用されています。 Copilot はコンテキストを分析し、一致するコード スニペットを生成することができるため、開発の速度と品質が大幅に向上します。ただし、Copilot の機能はまだ限定されており、人工知能を完全に置き換えることはできません。さらに、Microsoft は Copi もターゲットにしています
- AI 405 2024-06-02 14:56:12