Die zweite Ausgabe der beliebtesten KI-Forschungsliste im Juli ist da!
Die vorherige Liste wurde nach Twitter-Likes, Retweets und Github-Stars sortiert. Einige Internetnutzer beschwerten sich jedoch darüber, dass die Anzahl der Likes auf Twitter von Benutzern gelöscht werden könnte Wer die Funktion mag, versteht die Forschung möglicherweise nicht unbedingt.
Diesmal hat der Autor @bycloudai aus Erfahrung gelernt. Diesmal muss der Indikator nicht die Anzahl der Likes auf Twitter sein, sondern die Anzahl der Sterne auf Github .
Obwohl die Indikatoren dieses Mal nicht sehr professionell sind, oder? Aber im Vergleich Laut Twitter kann davon ausgegangen werden, dass die Anzahl der Personen, die Github besuchen können, eher mit der KI-Forschung zusammenhängt.
Darüber hinaus hat der Autor am Anfang der Liste auch deutlich gemacht, dass es sich bei dieser Liste um eine wilde Liste handelt, die er zum Spaß erstellt hat und nur der Unterhaltung dient.
Allerdings behält diese „Sequel List“ im Wesentlichen den Stil der vorherigen Ausgabe bei Autor und Ausgabestelle.
Werfen wir in dieser „verbesserten Version“ einen Blick darauf, welche Forschung auf der Liste der beliebtesten KI-Forschung im Juli steht ~
Top1:YOLOv7: Trainierbare Tasche voller Gratisartikel setzt neue Maßstäbe für Echtzeit-Objektdetektoren
# 🎜🎜## 🎜🎜#Autor: Chien-Yao Wang, Alexey Bochkovskiy, Hong-Yuan Mark Liao Institution: „Academia Sinica“ Institut für Informationswissenschaft Github-Sterne: 3,8k# 🎜🎜 #
Zusammenfassung: YOLOv7 übertrifft alle bekannten Objekte in Geschwindigkeit und Genauigkeit im Bereich von 5 FPS bis 160 FPS-Detektor und hat mit 56,8 % AP die höchste Genauigkeit unter allen Echtzeit-Objektdetektoren über 30 FPS auf der GPU V100. Der Objektdetektor YOLOv7-E6 (56 FPS V100, 55,9 % AP) ist 509 % schneller und genauer als der Transformer-basierte Detektor SWIN-L Cascade-Mask R-CNN (9,2 FPS A100, 2 % AP).
Es ist erwähnenswert, dass der Erstautor dieser Arbeit, Chien-Yao wang (王家尧), ein Doktorand im Maschinenbau an der Columbia University ist und es jetzt ist ein Intel A Chrome-Softwareentwickler.
Top2: Textgeführte Synthese künstlerischer Bilder mit Retrieval-Augmented Diffusion Models
Autor: Robin Rombach, Andreas Blattmann und Björn Ommer Institution: Ludwig-Maximilians-Universität München (Ludwig-Maximilians-Universität München)
Github-Sterne: 2.4k
Zusammenfassung: Neu Die Architektur wurde kürzlich mit Generativ verbessert Bildsynthese, die eine hervorragende visuelle Qualität bei einer Vielzahl von Aufgaben ermöglicht. Besonders hervorzuheben ist der Bereich „AI-Art“. Durch die Kombination von Sprach- und Bildsynthesemodellen wurde das sogenannte „Cue Engineering“ etabliert, bei dem sorgfältig ausgewählte und kombinierte Sätze verwendet werden, um einen bestimmten visuellen Stil in den synthetisierten Bildern zu erreichen.
Dieses Papier schlägt einen alternativen Ansatz vor, der auf dem Retrieval Enhanced Diffusion Model (RDM) basiert. In RDM wird während des Trainings für jede Trainingsinstanz ein Satz nächster Nachbarn aus einer externen Datenbank abgerufen, und das Diffusionsmodell wird auf diese informativen Stichproben konditioniert.
Werfen wir einen Blick auf die Wirkung der AI-Art-Werke im Papier~
# 🎜🎜## # 🎜 🎜##🎜 🎜#
Autor: Wu Chenfei, Liang Jian, Xiaowei Hu und andere Institutionen: Microsoft Research Asia, Peking University, Microsoft Azure AIGithub Sterne: 2,4k
Den dritten Platz belegt das rein chinesische KI-Meisterwerk NUWA INFINITY, das zuvor viel Aufmerksamkeit erregt hat.
4, Transformers Together trainieren (1K Sterne)
Autor: Alexander Borzunov, Max Ryabinin, Tim Dettmers und andere Institutionen: Russian State Higher School of Economics, University of Washington usw.
5. Theseus: Eine Bibliothek für differenzierbare nichtlineare Optimierung (791 Sterne)
Autor: Luis Pineda, Taosha Fan, Maurizio Monge Organisation: Meta AI, Reality Labs Research
6, k-bedeutet Mask Transformer (704 Sterne)
Publikationseinheit: Johns Hopkins University, Google Research Bibliothek: https://github . com/google-research/deeplab2 Papier: https://arxiv.org/abs/2207.04044v1
7, XMem: Langzeit-Videoobjektsegmentierung mit einem Atkinson-Shiffrin-Speichermodell (699 Sterne)
Ausgabeeinheit: University of Illinois at Urbana-Champaign Ressourcenbibliothek: https://github.com/hkchengrex/XMem Paper: https://arxiv.org/abs/2207.07115v2
8. TinyViT: Schnelle Pretraining-Destillation für Small Vision Transformers (656 Sterne)
Publikationseinheit: Microsoft Research, Microsoft Cloud + AI Resource Library: https://github.com/microsoft/ Cremefarbenes Papier: https://arxiv.org/abs/2207.10666v1
9, Towards Grand Unification of Object Tracking (644 Sterne)
Publikationseinheit: Dalian University of Technology, Wörter Jie Doi, Universität Hongkong, Pengcheng-Labor
Ressourcenbibliothek: ttps://github.com/masterbin-iiau/unicorn Papier: https://arxiv.org/abs/2207.07078v3
10, Multiface: Ein Datensatz für die neuronale Gesichtsdarstellung (337 Sterne)
Publikationseinheit: Meta Reality Laboratory Ressourcenbibliothek: https://github.com/facebookresearch/multiface Papier: https://arxiv.org/abs/2207.11243v1#🎜🎜 #
Das obige ist der detaillierte Inhalt vonGithubs heiße KI-Projektliste für Juli hat eine Fortsetzung! Kann die Nuwa Unlimited Edition nur auf dem dritten Platz landen?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!