ホームページ テクノロジー周辺機器 AI Ant Group の 11 件の論文が AI のトップ国際会議である ICLR 2024 に選出されました

Ant Group の 11 件の論文が AI のトップ国際会議である ICLR 2024 に選出されました

Jan 24, 2024 pm 11:54 PM
はじめる iclr ノイズ相関 マルチモーダル技術 関連する学習

最近、人工知能のトップカンファレンスである ICLR 2024 が入学結果を発表しました。 Ant Group はこの会議で 11 件の論文を採択し、そのうち 1 件は口頭レポートとして評価され、3 件はフォーカスレポートとして選ばれ、残りの 7 件はポスター発表でした。人工知能の学術コミュニティにおける Ant Group の進歩は多くの注目を集めています。

AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选

(写真: Ant Group の「長時間ビデオで学習する多粒度ノイズの関連付け」が口頭論文として収録されました)

今年、ICLR組織委員会は7,262件の論文投稿を受け取り、採択率は約31%でした。受理結果によると、論文の 1.2% が口頭論文として受理され、これらの著者には 10 分間の口頭スピーチの機会が与えられます。さらに 5% の論文がスポットライト論文として受け入れられ、これらの著者には 4 分間のスポットライト時間が与えられます。残りの論文はポスター形式で発表されます。全体として、口頭論文の重要性が最も高く、次にスポットライト論文、ポスター論文の重要性が最も低くなります。

毎年、かなりの数の ICLR 口頭論文が「ICLR Best Papers」として評価されます。これは、新しい年の研究の方向性を導くことも意味します。今年、ICLRはAnt Groupの「雑音のある教育ビデオからの多粒度通信学習」(雑音のある教育ビデオからの多粒度通信学習)を含む85本の口頭論文を選出した。この論文では、ノイズの多い教育ビデオを使用した学習方法を提案します。これにより、複数の粒度での関連学習を通じてモデルのパフォーマンスとロバスト性が向上します。この研究は、現実世界に存在するノイズと不確実性の問題を解決する上で非常に重要であり、ビデオ理解の分野のさらなる発展のための新しいアイデアを提供します。

ショートビデオは人々の日常生活におけるエンターテイメントの主な形式となっており、マルチモーダルテクノロジーは現在の AI 分野で人気の研究方向です。ただし、計算リソースのオーバーヘッドが高いため、既存のビデオ作品は主にセグメントの理解に焦点を当てており、長いビデオの時間的依存性は無視されています。この問題を解決するために、この論文では、長いビデオ学習を短いビデオ クリップ間の関連付けの調整に変換します。この研究では、ビデオとテキスト間のノイズ相関の問題を目的として、統合された最適な伝送調整スキームが提案され、このスキームにより長いビデオの理解が大幅に改善され、時間も節約されました。この研究を通じて、長いビデオをより深く理解し、ビデオとテキストの関連付けをより正確かつ効率的に処理できるようになります。

このソリューションは非常に汎用性が高く、提案されたノイズ相関処理方法は、コンテンツの調整が必要な他のモデルの事前トレーニング学習に適しています。

Spotlight には、「iTransformer: Inverted Transformers Are Effects for Time Series Forecasting」(iTransformer: Inverted Transformers Are Ideal for Time Series Forecasting)、「Enhanced Face Recognition using Intra-class Incoherence Constraint」の 3 つの論文が掲載されています。 「(クラス内不一致制約によって強化された顔認識テクノロジー)」および「効率的に学習された可逆圧縮のための有限状態自己回帰エントロピー コーディング」(効率的な可逆圧縮アルゴリズムのためのルックアップ テーブル実装に基づく学習可能な自己回帰モデル)。 最初の論文では、従来のモデル構造を打ち破ることにより、複雑な時系列予測タスクにおいて包括的に優れた結果を達成する新しい時系列予測手法を紹介します。この研究は、時系列予測の精度と効率の向上に重要な意味を持ちます。 2 番目の論文では、顔認識の精度を向上させる新しい手法を紹介します。この方法では、クラス内不整合制約を利用して、顔認識テクノロジをさらに最適化します。この研究は、顔認識システムの性能と精度を向上させる上で非常に重要です。 3 番目の論文では、効率的な可逆圧縮のためのルックアップ テーブルに基づいて実装された学習可能な自己回帰モデルを提案しています。この研究は、データの圧縮と保存に重要な応用価値を持つ、高い圧縮率と高いスループット率を備えた可逆圧縮アルゴリズムを実現します。 これら 3 つの論文の出版は、それぞれの分野で重要な進歩と進歩をもたらし、関連分野の研究と応用に強力なサポートを提供しました。彼らの出現は学術界の研究成果を豊かにし、関連分野の発展に新たな可能性をもたらしました。

2017 年以降、ICLR が受け取る論文数は毎年 30% 増加しており、2 つのトップ人工知能カンファレンスである NeurIPS と ICML も急速な成長傾向を示しています。最近の NeurIPS カンファレンスでは、コンピュータ ビジョン、自然言語処理、グラフ ニューラル ネットワーク、画像処理、その他の人工知能と機械学習の分野における最先端のトピックをカバーする Ant Group の合計 20 件の論文が参加しました。この成果は、人工知能分野におけるアント グループの卓越した研究力とイノベーション能力をさらに証明しています。

AI国际顶会ICLR 2024结果揭晓,蚂蚁集团11篇论文入选

(写真: 2013 年の設立以来の ICLR の年間論文数。2017 年から論文数は増加しています。)

ICLR は、主に Open Review 審査システムにより、近年業界で好評を博しています。提出されたすべての論文は、すべての同僚によって評価および質問され、学者は誰でも匿名または実名で論文を評価できます。公開レビューが完了した後、論文の著者は論文を調整および修正することもできます。

過去 5 年間で、Ant Group は、AI 分野の 300 以上の論文を含む、500 本近くの論文を一流の国際学術誌や学術会議に発表したことがわかっています。 Ant Group は人工知能分野のテクノロジーへの投資を続けており、大規模なビジネス シナリオのニーズに基づいて、大規模モデル、ナレッジ グラフ、運用の最適化、グラフ学習、信頼できる AI などの技術分野を展開しています。

以上がAnt Group の 11 件の論文が AI のトップ国際会議である ICLR 2024 に選出されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

パデュー大学による、時間をかける価値のある拡散モデルのチュートリアル パデュー大学による、時間をかける価値のある拡散モデルのチュートリアル Apr 07, 2024 am 09:01 AM

拡散はより良いものを模倣するだけでなく、「創造」することもできます。拡散モデル(DiffusionModel)は、画像生成モデルである。 AI 分野でよく知られている GAN や VAE などのアルゴリズムと比較すると、拡散モデルは異なるアプローチを採用しており、その主な考え方は、最初に画像にノイズを追加し、その後徐々にノイズを除去するプロセスです。ノイズを除去して元の画像を復元する方法は、アルゴリズムの中核部分です。最後のアルゴリズムは、ランダムなノイズを含む画像から画像を生成できます。近年、生成 AI の驚異的な成長により、テキストから画像への生成、ビデオ生成など、多くのエキサイティングなアプリケーションが可能になりました。これらの生成ツールの背後にある基本原理は、以前の方法の制限を克服する特別なサンプリング メカニズムである拡散の概念です。

ワンクリックでPPTを生成!キミ: まずは「PPT出稼ぎ労働者」を普及させましょう ワンクリックでPPTを生成!キミ: まずは「PPT出稼ぎ労働者」を普及させましょう Aug 01, 2024 pm 03:28 PM

キミ: たった 1 文の PPT がわずか 10 秒で完成します。 PPTはとても面倒です!会議を開催するには PPT が必要であり、週次報告書を作成するには PPT が必要であり、投資を勧誘するには PPT を提示する必要があり、不正行為を告発するには PPT を送信する必要があります。大学は、PPT 専攻を勉強するようなものです。授業中に PPT を見て、授業後に PPT を行います。おそらく、デニス オースティンが 37 年前に PPT を発明したとき、PPT がこれほど普及する日が来るとは予想していなかったでしょう。 PPT 作成の大変な経験を話すと涙が出ます。 「20 ページを超える PPT を作成するのに 3 か月かかり、何十回も修正しました。PPT を見ると吐きそうになりました。」 「ピーク時には 1 日に 5 枚の PPT を作成し、息をすることさえありました。」 PPTでした。」 即席の会議をするなら、そうすべきです

CVPR 2024 のすべての賞が発表されました!オフラインでのカンファレンスには1万人近くが参加し、Googleの中国人研究者が最優秀論文賞を受賞した CVPR 2024 のすべての賞が発表されました!オフラインでのカンファレンスには1万人近くが参加し、Googleの中国人研究者が最優秀論文賞を受賞した Jun 20, 2024 pm 05:43 PM

北京時間6月20日早朝、シアトルで開催されている最高の国際コンピュータビジョンカンファレンス「CVPR2024」が、最優秀論文やその他の賞を正式に発表した。今年は、最優秀論文 2 件と学生優秀論文 2 件を含む合計 10 件の論文が賞を受賞しました。また、最優秀論文ノミネートも 2 件、学生優秀論文ノミネートも 4 件ありました。コンピュータービジョン (CV) 分野のトップカンファレンスは CVPR で、毎年多数の研究機関や大学が集まります。統計によると、今年は合計 11,532 件の論文が投稿され、2,719 件が採択され、採択率は 23.6% でした。ジョージア工科大学による CVPR2024 データの統計分析によると、研究テーマの観点から最も論文数が多いのは画像とビデオの合成と生成です (Imageandvideosyn

PyCharm Community Edition インストール ガイド: すべての手順をすばやくマスターする PyCharm Community Edition インストール ガイド: すべての手順をすばやくマスターする Jan 27, 2024 am 09:10 AM

PyCharm コミュニティ版のクイック スタート: 詳細なインストール チュートリアル 完全な分析 はじめに: PyCharm は、開発者が Python コードをより効率的に作成できるようにする包括的なツール セットを提供する強力な Python 統合開発環境 (IDE) です。この記事では、PyCharm Community Edition のインストール方法を詳しく紹介し、初心者がすぐに使い始めるのに役立つ具体的なコード例を示します。ステップ 1: PyCharm Community Edition をダウンロードしてインストールする PyCharm を使用するには、まず公式 Web サイトからダウンロードする必要があります

ベアメタルから 700 億のパラメータを備えた大規模モデルまで、チュートリアルとすぐに使えるスクリプトがここにあります ベアメタルから 700 億のパラメータを備えた大規模モデルまで、チュートリアルとすぐに使えるスクリプトがここにあります Jul 24, 2024 pm 08:13 PM

LLM が大量のデータを使用して大規模なコンピューター クラスターでトレーニングされていることはわかっています。このサイトでは、LLM トレーニング プロセスを支援および改善するために使用される多くの方法とテクノロジが紹介されています。今日、私たちが共有したいのは、基礎となるテクノロジーを深く掘り下げ、オペレーティング システムさえ持たない大量の「ベア メタル」を LLM のトレーニング用のコンピューター クラスターに変える方法を紹介する記事です。この記事は、機械がどのように考えるかを理解することで一般的な知能の実現に努めている AI スタートアップ企業 Imbue によるものです。もちろん、オペレーティング システムを持たない大量の「ベア メタル」を LLM をトレーニングするためのコンピューター クラスターに変換することは、探索と試行錯誤に満ちた簡単なプロセスではありませんが、Imbue は最終的に 700 億のパラメータを備えた LLM のトレーニングに成功しました。プロセスが蓄積する

AIの活用 | AIが一人暮らしの女の子の生活ビデオブログを作成、3日間で数万件の「いいね!」を獲得 AIの活用 | AIが一人暮らしの女の子の生活ビデオブログを作成、3日間で数万件の「いいね!」を獲得 Aug 07, 2024 pm 10:53 PM

Machine Power Report 編集者: Yang Wen 大型モデルや AIGC に代表される人工知能の波は、私たちの生活や働き方を静かに変えていますが、ほとんどの人はまだその使い方を知りません。そこで、直感的で興味深く、簡潔な人工知能のユースケースを通じてAIの活用方法を詳しく紹介し、皆様の思考を刺激するコラム「AI in Use」を立ち上げました。また、読者が革新的な実践的な使用例を提出することも歓迎します。ビデオリンク: https://mp.weixin.qq.com/s/2hX_i7li3RqdE4u016yGhQ 最近、Xiaohongshu で一人暮らしの女の子の生活 vlog が人気になりました。イラスト風のアニメーションといくつかの癒しの言葉を組み合わせれば、数日で簡単に習得できます。

技術初心者必読:C言語とPythonの難易度分析 技術初心者必読:C言語とPythonの難易度分析 Mar 22, 2024 am 10:21 AM

タイトル: 技術初心者必読: 具体的なコード例を必要とする C 言語と Python の難易度分析 今日のデジタル時代において、プログラミング技術はますます重要な能力となっています。ソフトウェア開発、データ分析、人工知能などの分野で働きたい場合でも、単に興味があってプログラミングを学びたい場合でも、適切なプログラミング言語を選択することが最初のステップです。数あるプログラミング言語の中でも、C言語とPythonは広く使われているプログラミング言語であり、それぞれに独自の特徴があります。この記事ではC言語とPythonの難易度を分析します。

RAG の 12 の問題点を数え上げ、NVIDIA シニア アーキテクトが解決策を教える RAG の 12 の問題点を数え上げ、NVIDIA シニア アーキテクトが解決策を教える Jul 11, 2024 pm 01:53 PM

検索拡張生成 (RAG) は、検索を使用して言語モデルを強化する手法です。具体的には、言語モデルは回答を生成する前に、広範な文書データベースから関連情報を取得し、この情報を使用して生成プロセスをガイドします。このテクノロジーにより、コンテンツの精度と関連性が大幅に向上し、幻覚の問題を効果的に軽減し、知識の更新速度が向上し、コンテンツ生成の追跡可能性が向上します。 RAG は間違いなく、人工知能研究の中で最もエキサイティングな分野の 1 つです。 RAGについて詳しくは、当サイトのコラム記事「大型モデルの欠点を補うことに特化したRAGの新展開とは?」を参照してください。このレビューはそれを明確に説明しています。」しかし、RAG は完璧ではなく、ユーザーはそれを使用するときにいくつかの「問題点」に遭遇することがよくあります。最近、NVIDIA の生成 AI 高度なソリューション

See all articles