現在位置:ホームページ > 技術記事 > テクノロジー周辺機器 > AI
- 方向:
- 全て ウェブ3.0 バックエンド開発 ウェブフロントエンド データベース 運用・保守 開発ツール PHPフレームワーク 毎日のプログラミング WeChat アプレット よくある問題 他の 技術 CMS チュートリアル Java システムチュートリアル コンピューターのチュートリアル ハードウェアチュートリアル モバイルチュートリアル ソフトウェアチュートリアル モバイル ゲームのチュートリアル
- 分類する:
-
- CVPR\'24 口頭 | 純粋な疎点群検出器 SAFDNet の過去と現在の様子を見てみましょう。
- 上記と著者の個人的な理解は、3D 点群オブジェクト検出が自動運転の知覚にとって重要であるということです。まばらな点群データから特徴表現を効率的に学習する方法は、3D 点群オブジェクト検出の分野における重要な課題です。この記事では、NeurIPS2023 でチームによって公開された HEDNet と、CVPR2024 での SAFDNet を紹介します。SAFDNet は純粋なネットワークであるのに対し、既存のスパース畳み込みニューラル ネットワークでは長距離特徴間の依存関係を捉えるのが難しいという問題の解決に焦点を当てています。 HEDNet に基づくスパース点群検出器。点群オブジェクトの検出では、従来の方法は手作業で設計された特徴抽出器に依存することが多く、まばらな点群データを処理する場合、その有効性は限られています。近年ではこれをもとに、
- AI 723 2024-06-08 12:25:22
-
- Tencent Hunyuan がオープンソース アクセラレーション ライブラリをリリース、画像生成時間を 75% 短縮
- 6 月 8 日、テンセントは、グラフ生成用の Tencent の Hunyuan テキスト生成オープンソース大規模モデル (Hunyuan DiT モデルと呼ばれる) のアクセラレーション ライブラリをリリースしました。これにより、推論効率が大幅に向上し、グラフ生成時間が 75% 短縮されます。 Hunyuan DiT モデルを使用するための敷居も大幅に引き下げられました。ユーザーは、ComfyUI のグラフィカル インターフェイスに基づいて Tencent Hunyuan Wensheng グラフ モデル機能を使用できます。同時に、Hunyuan DiT モデルは HuggingFaceDiffusers の一般モデル ライブラリにデプロイされており、ユーザーは元のコード ライブラリをダウンロードせずに、わずか 3 行のコードで Hunyuan DiT モデルを呼び出すことができます。以前、Tencent は、Hunyuan テキスト生成モデルが完全にアップグレードされ、オープンソース化され、企業や個人の開発者が無料で商用利用できるようになったと発表しました。これは、業界初のオープンソースの中国語ネイティブ DiT アーキテクチャのテキスト生成図です。
- AI 1232 2024-06-08 12:12:11
-
- 一度に38万語の入力に対応! Tencent Hunyuan が、Tencent Cloud を通じて企業および個人開発者に公開される 256,000 の長い記事モデルを開始
- AI ラージ モデル テクノロジーは、高品質の生産性の開発を促進する重要な力となり、数千の業界の統合において重要な役割を果たしています。 Tencent の Hunyuan 大型モデルは、混合エキスパート モデル (MoE) 構造を採用することでモデルを 1 兆レベルのパラメーター スケールに拡張し、推論コストを削減しながら予測パフォーマンスを向上させる「頭脳」の能力を高めています。一般的なモデルとして、Tencent Hunyuan は中国語のパフォーマンス、特にテキスト生成、数理論理学、マルチターン対話において業界をリードしています。最近、Tencent Hunyuan Large Model は 256k の長いテキスト モデルを正式にリリースし、Tencent Cloud を通じて大部分の企業と個人開発者に公開し、より広範囲のイノベーションとアプリケーションをサポートしました。 Tencent Hunyuan 256k モデル バージョンは、380,000 文字を超える超長文を処理する機能を備えています。
- AI 514 2024-06-08 11:11:19
-
- IEEE ICWS の最初のインテリジェント サービス監視ワークショップは現在、提出物を募集しています。
- IEEE 国際 World Wide Web 会議である IEEEICWS (IEEE International Conference on Web Services) が、2024 年 7 月 7 日から 13 日まで中国の深センで開催されます。 ICWS は CCF-B 国際フォーラムであり、ネットワーク ベースのサービスの最新の技術と実践における最新の基本的な進歩を交換し、新たな研究トピックを特定し、ネットワーク ベースのサービスの将来を定義することを目的としています。 SRG は、スマート サービス監視に焦点を当てた IEEEICWS の最初のワークショップです。提出リンク: https://icws.conferences.computer.org/2024/srg-workshop/SRG 紹介番号
- AI 458 2024-06-08 09:14:09
-
- 一般人工知能とは何ですか?あなたは知っていますか?
- ピクチャ ピクチャ ピクチャ ピクチャ ピクチャ ナロー人工知能は、英語の ArtificialNarrowIntelligence に対応し、ANI と呼ばれ、タスク固有の人工知能とも呼ばれます。インテリジェントテクノロジーは、インテリジェント運転、顔認識、AlphaGo、AIペインティング、自然言語モデルなど、さまざまな特定のタスクを完了するために広く使用されており、これらはすべてインテリジェントテクノロジーのカテゴリに属します。写真は人工知能を突破して、当然特定の分野ではより高い知能を持っていますが、それはその分野に限定されています。たとえば、AI 絵画モデルに囲碁を一緒にプレイしてもらう方法はなく、顔認識モデルに車を運転してもらう方法も、AlphaGo に記事を書いてもらう方法もありません。一方、人間は、小さな脳(と数)しか持っていませんが、
- AI 826 2024-06-08 09:10:05
-
- 大規模なモデルがより大きな役割を果たすためには、ナレッジ ベースの重要な要素と切り離すことができません。
- 大型模型の世界には「カードを引く」「錬金術を精製する」などの俗語があります。これらの用語は簡単で楽しいように聞こえますが、「エリクサー」が実際に機能するには、その背後に重要な要素、つまり知識ベースが存在します。このナレッジ ベースには、プレイヤーがこれらのスラングをよりよく理解し、使用できるようにするための大量の情報とテクニックが保存されています。ナレッジ ベースには、ゲームのルールやゲームプレイだけでなく、自然言語処理 (NLP) やコンテンツ生成から画像認識に至るまで、ゲームの背景ストーリーやキャラクターも含まれており、この大規模なモデルはさまざまな分野で驚くべき機能を実証しています。 。ただし、大規模なモデルが特定の分野の問題を扱う場合、必要な背景知識が不足しているため、出力結果が正確でなかったり、十分に関連性がなかったりする可能性があります。 AI 専用に構築されたナレッジ ベースをどのように理解すればよいでしょうか?知識ベース
- AI 690 2024-06-07 22:44:36
-
- 革新的な GPT-4o: 人間とコンピューターのインタラクション エクスペリエンスを再構築する
- OpenAI によってリリースされた GPT-4o モデルは、特に複数の入力メディア (テキスト、オーディオ、画像) を処理し、対応する出力を生成する機能において、間違いなく大きな進歩です。この機能により、人間とコンピューターの対話がより自然かつ直観的になり、AI の実用性と使いやすさが大幅に向上します。 GPT-4o の主なハイライトには、高いスケーラビリティ、マルチメディア入出力、自然言語理解機能のさらなる向上などが含まれます。 1. クロスメディア入出力: GPT-4o+ は、テキスト、オーディオ、画像の任意の組み合わせを入力として受け入れ、これらのメディアから出力を直接生成できます。これにより、単一の入力タイプのみを処理する従来の AI モデルの制限が打ち破られ、人間とコンピューターの対話がより柔軟かつ多様になります。このイノベーションはスマート アシスタントの強化に役立ちます
- AI 566 2024-06-07 21:02:31
-
- 2024年北京知源カンファレンスの登録受付が開始されました!
- 北京知源会議は、2019年10月の初開催以来、5回にわたり成功裏に開催されてきた人工知能分野の総合専門家イベントです。このカンファレンスには、国内外の研究者が素晴らしい講演と深い対話を行うという特徴があり、チューリング賞受賞者は計 11 名が参加し、毎年約 200 名のトップ専門家が参加し、50 万人以上の視聴者がいます。 30の国と地域が集まり、研究成果を共有し、最先端の知識を探索し、実践経験を交換し、緊密な協力を確立します。カンファレンスの特徴: グローバルな視点:世界のトップ専門家との対面コミュニケーション、国境を越えたテクノロジーの魅力の体験:その年の優秀な研究者が一堂に会し、新たなアイデアを交換し、新たなリーダーシップを模索します。 : AI 分野の重要な問題を調査し、重要な概念を発表し、将来の方向性を導きます 過去 5 年間の輝かしい章、
- AI 958 2024-06-07 19:36:31
-
- XJTLU とリバプール大学が提案: 点群データ強化に関する最初の包括的なレビュー
- AIxivコラムは、当サイトが学術的・技術的な内容を掲載するコラムです。過去数年間で、このサイトの AIxiv コラムには 2,000 件を超えるレポートが寄せられ、世界中の主要な大学や企業のトップ研究室がカバーされ、学術交流と普及を効果的に促進しています。共有したい優れた作品がある場合は、お気軽に寄稿するか、報告のために当社までご連絡ください。提出電子メール: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com この論文の筆頭著者である Zhu Qinfeng は、西安交通大学とリバプール大学によって共同訓練を受けた 1 年生の博士候補者です。ファン・レイ准教授。彼の主な研究方向は、セマンティック セグメンテーション、マルチモーダル情報融合、3D ビジョン、ハイパースペクトル画像、データ強化です。レッスン
- AI 816 2024-06-07 18:54:46
-
- 生成 AI モデル ビッグ PK——GPT-4、Claude 2.1、および Claude 3.0 Opus
- AIGC について詳しくは、51CTOAI.x コミュニティ https://www.51cto.com/aigc/ をご覧ください。 はじめに 現在、RAG (検索拡張生成) システムの新しい評価版が毎日リリースされているようですが、その多くは次の点に焦点を当てています。関連するフレームの取得フェーズ中。ただし、生成的な側面、つまりモデルがこの取得した情報をどのように合成して表現するかという側面も、実際には同様に重要である可能性があります。多くの実際的な応用例は、システムがコンテキストからデータを返す必要があるだけでなく、この情報をより複雑な応答に変換する必要があることを証明しています。この目的を達成するために、私たちはいくつかの実験を実施し、GPT-4、Claude2.1、Claude3Opus の 3 つのモデルの生成機能をテストしました。
- AI 1172 2024-06-07 18:32:37
-
- データセットが異なればスケーリング則も異なりますか?圧縮アルゴリズムを使用してそれを予測できます
- 一般に、ニューラル ネットワークのトレーニングに必要な計算が増えるほど、パフォーマンスが向上します。計算をスケールアップするときは、モデル パラメーターの数を増やすか、データ セットのサイズを増やすかを決定する必要があります。この 2 つの要素は、固定された計算予算内で比較検討する必要があります。モデル パラメーターの数を増やす利点は、モデルの複雑さと表現能力が向上し、それによってトレーニング データの適合性が向上することです。ただし、パラメーターが多すぎると過剰適合が発生し、目に見えないデータに対するモデルのパフォーマンスが低下する可能性があります。一方、データセットのサイズを拡張すると、モデルの汎化能力が向上し、過剰適合の問題が軽減されます。パラメーターとデータを適切に割り当てている限り、固定されたコンピューティング予算内でパフォーマンスを最大化できます。これまでの多くの研究では、神経言語モデルの Scalingl が検討されてきました。
- AI 794 2024-06-07 17:51:01
-
- 武漢市民は自動運転を称賛、市交通局:大手企業と協力してインテリジェントコネクテッドカー業界の新たな青写真を描く
- 「武漢市はインテリジェント・コネクテッド・ビークル産業の発展を非常に重視しており、インテリジェント・コネクテッド・ビークル向けに1,000キロメートル以上の一般道路を次々に開通させている。これは、大手インテリジェント・コネクテッド・ビークル企業が武漢に定住し、協力して新たな青写真を作成することを奨励している」武漢のインテリジェントコネクテッドカー産業の発展のために バイドゥキャロットは自動運転業界のリーディングカンパニーとして、クアイパオは武漢のインテリジェントコネクテッドカー産業の発展を重視しており、武漢経済発展に定住して以来、自動運転サービスに深く関わってきました。 Baidu Luobo Kuaipao は、より多くの国民が自動運転技術によってもたらされる技術的な魅力を感じられるように、自動運転体験サービスを推進し続けます。」 5 月 30 日、武漢市交通局は、積極的な宣伝の強化を求める市民の要求に応えました。大きな注目を集めた自動運転。上記の市民はメッセージの中で次のように述べています。
- AI 387 2024-06-07 17:31:02
-
- Hot ChatTTS はオープンソース音声の上限を突破し、3 日間で 9,000 個のスターを獲得しました
- これが人々の間のコミュニケーションの未来の姿でしょうか?最近、ChatTTS と呼ばれるテキスト読み上げプロジェクトが人気を集め、大きな注目を集めています。わずか 3 日間で、GitHub で 9.2,000 個のスターを獲得しました。プロジェクトのアドレス: https://github.com/2noise/ChatTTS/tree/main 作者自身も x で ChatTTS がオープンソースの天井を突破したと述べています。ただし、現在オープンソースとして公開されているのは基本モデルのみであり、SFT による監修や微調整は行われていません。このプロジェクトはテキストを音声に変換し、その効果は次のとおりです。ChatTTS は中国語を話すだけでなく、英語も話すことができ、笑いや話し方などを追加できるきめ細かい制御もサポートしています。
- AI 661 2024-06-07 17:10:54
-
- 画期的な CVM アルゴリズムが 40 年以上の計数の問題を解決します。コンピューター科学者がコインを投げて「ハムレット」を表す固有の単語を割り出す
- 数を数えるのは簡単そうに思えますが、実際にやってみるととても難しいです。あなたが野生動物の個体数調査を実施するために自然のままの熱帯雨林に運ばれたと想像してください。動物を見かけたら必ず写真を撮りましょう。デジタル カメラでは追跡された動物の総数のみが記録されますが、固有の動物の数に興味がありますが、統計はありません。では、このユニークな動物群にアクセスする最善の方法は何でしょうか?この時点で、今すぐ数え始めて、最後に写真から各新種をリストと比較すると言わなければなりません。ただし、この一般的なカウント方法は、数十億エントリに達する情報量には適さない場合があります。インド統計研究所、UNL、およびシンガポール国立大学のコンピューター科学者は、新しいアルゴリズムである CVM を提案しました。長いリスト内のさまざまな項目の計算を近似できます。
- AI 1104 2024-06-07 15:44:57
-
- Baidu が推奨するリソースのコールド スタートの実践
- 1. コンテンツ コールド スタートの概念と課題 Baidu Feed Recommendation は、月間数億人のユーザーを抱える包括的な情報フロー レコメンデーション プラットフォームです。このプラットフォームは、グラフィック、ビデオ、アップデート、ミニ プログラム、Q&A など、さまざまな種類のコンテンツをカバーしています。 1 列または 2 列に似たクリックアンドクリックのレコメンデーションを提供するだけでなく、ビデオ イマージョンなどのさまざまなレコメンデーション フォームも含まれます。同時に、レコメンデーション システムは、C 側のユーザー エクスペリエンスだけを含むマルチステークホルダー システムです。コンテンツプロデューサーはレコメンデーションシステムにおいて重要な役割を果たしており、Baidu Feed には多数のアクティブな実践者がおり、毎日大量のコンテンツを制作しています。コンテンツ プラットフォーム レコメンデーション システムの本質は、ユーザー側にとってすべての関係者にとって有利な状況を実現することです。プラットフォームは、高品質で新鮮かつ多様なコンテンツをユーザーに継続的に推奨し、より多くのユーザーを引き付け、より多くの時間を提供する必要があります。 ; 作者側にとって
- AI 710 2024-06-07 15:08:43