7 月の最も人気のある AI 研究リストの第 2 版が登場しました!
前のリストは Twitter のいいね数、リツイート、Github スターに基づいて並べ替えられていますが、一部のネチズンは Twitter のいいね数は機械によって調整される可能性があり、Twitter にいいねをしたユーザーもいると不満を抱いていました。できませんでした。研究を知らなければなりません。
今回は著者 @bycloudai が経験から学び、指標は Twitter のいいねの数ではなく、Github のスターの数である必要があります。
今回のインジケーターはあまり専門的ではありませんが、Twitterに比べてGithubを閲覧できる数は考えられますAI研究とより密接に関連するようになります。
さらに、著者はリストの冒頭で、このリストが趣味で作成した荒唐無稽なリストであり、娯楽のみを目的としていることも明らかにしました。
とはいえ、この「続刊リスト」は基本的に前号のスタイルを踏襲しており、上位 10 位には資料館アドレス、論文リンク、タイトル、著者、発行単位が記載されています。
この「改良版」では、7 月に最も人気のある AI 研究のリストにどのような研究が含まれているかを見てみましょう~
Top1 :YOLOv7: トレーニング可能な景品の袋がリアルタイム物体検出器の新しい最先端を設定
著者: Chien-Yao Wang、 Alexey Bochkovskiy、Hong -Yuan Mark Liao 組織: 「中央研究院」情報科学研究所 Github スター: 3.8k
概要: YOLOv7 は、5FPS から 160FPS までの速度と精度において、すべての既知のオブジェクト検出器を上回っており、GPU V100 で 56.8% AP で 30FPS 以上のすべてのリアルタイム オブジェクト検出器の中で最高の精度を備えています。 YOLOv7-E6 オブジェクト検出器 (56 FPS V100、55.9% AP) は、Transformer ベースの検出器 SWIN-L Cascade-Mask R-CNN (9.2 FPS A100、53.9% AP) よりも 509% 高速かつ正確です。
この論文の筆頭著者である Chien-Yao wang (Wang Jianyao) は、コロンビア大学の機械工学の大学院生であり、現在はコロンビア大学の Chrome 開発者であることは言及する価値があります。インテルのソフトウェアエンジニア。
Top2:検索拡張拡散モデルを使用したテキストガイドによる芸術的画像の合成
著者: Robin Rombach、Andreas Blattmann、Bjorn Ommer 機関: Ludwig-Maximilians-Universität München
Github スター: 2.4k
要約: 最近、新しいアーキテクチャにより生成画像合成が改善され、さまざまなタスクで優れたビジュアル品質が可能になりました。特に注目されるのは「AI-Art」の分野だ。音声と画像の合成モデルを組み合わせることにより、いわゆる「キュー エンジニアリング」が確立されました。この技術では、慎重に選択して組み合わせた文を使用して、合成画像内で特定の視覚スタイルを実現します。
この文書では、検索拡張拡散モデル (RDM) に基づく代替アプローチを提案します。 RDM では、各トレーニング インスタンスのトレーニング中に最近傍のセットが外部データベースから取得され、拡散モデルはこれらの有益なサンプルに基づいて条件付けされます。
論文内の AI アート作品の効果を見てみましょう~
トップ 3:NUWA-Infinity: 無限の視覚合成のための自己回帰生成と自己回帰生成
## 著者: Wu Chenfei、Liang Jian、 Xiaowei Hu およびその他の機関 :Microsoft Research Asia、北京大学、Microsoft Azure AIGithub Stars: 2.4k
第3位は、以前から話題を集めた全中華クラスのAI傑作「NUWA INFINITY」です。
4. トランスフォーマーを一緒にトレーニングする (1,000 個のスター)
著者: Alexander Borzunov、Max Ryabinin、Tim Dettmers、その他の機関: ロシア国立高等経済学校、ワシントン大学など
##5. テセウス: 微分可能な非線形最適化のためのライブラリ (星 791 個)
著者: Luis Pineda、 Taosha Fan、Maurizio Monge 組織: Meta AI、Reality Labs Research
6、K 平均法マスク トランスフォーマー(星 704 個)
発行単位: ジョンズ ホプキンス大学、Google Research Resourcesライブラリ: https://github.com/google-research/deeplab2 論文: https://arxiv.org/abs/2207.04044v1
7、XMem: Long-アトキンソン・シフリン記憶モデルを使用した用語ビデオ オブジェクト セグメンテーション (星 699 個)
出版単位: University ofイリノイ シャンペーン-アーバナ リソース ライブラリ: https://github.com/hkchengrex/XMem 論文: https://arxiv.org/abs/2207.07115v2
8、 TinyViT : Small Vision Transformers のための高速事前トレーニング蒸留 (星 656 個)
出版社: Microsoft Research Institute 、Microsoft Cloud AI リソース ライブラリ: https://github.com/microsoft/cream 論文: https://arxiv.org/abs/2207.10666v1
9 、に向けてオブジェクト追跡の大統合 (星 644 個)
発行単位: 大連理工大学、Byte Beat、香港大学彭城研究室
リソース ライブラリ: ttps://github.com/masterbin-iiau/unicorn 論文: https://arxiv.org/abs/2207.07078 v3
##10、Multiface: ニューラル フェイス レンダリング用のデータセット(星 337 個)
## 発行単位: メタリアリティ研究所リソースライブラリ: https://github.com/facebookresearch/multiface 論文: https://arxiv.org/abs/2207.11243v1
以上がGithubの7月の注目AIプロジェクトリストに続編が登場! Nuwa Unlimited Editionは3位しかランクインできないのですか?の詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。