


Agenda der Intelligent Source-Konferenz 2024 enthüllt: Generatives Modell
Am 14. und 15. Juni 2024 findet die 6. Beijing Zhiyuan Conference in einer Kombination aus Offline und Online statt. Der Offline-Veranstaltungsort wird im Zhongguancun National Independent Innovation Demonstration Zone Conference Center stattfinden. Die Zhiyuan-Konferenz 2024 bringt erneut herausragende Forscher des Jahres mit einer globalen Perspektive zusammen, um neue Ideen auszutauschen, neue Ideen zu erkunden und neue Grenzen zu erschließen. Die Registrierungskanäle sind jetzt offiziell geöffnet. Countdown zur Pekinger Zhiyuan-Konferenz: 11 Tage
Forumsagenda
Li Chongxuan, außerordentlicher Professor und Doktorvater an der Hillhouse School of Artificial Intelligence der Renmin-Universität. Er erhielt seinen Bachelor- und Doktorgrad von 2010 bis 2019 an der Tsinghua-Universität. Die repräsentativen Arbeiten konzentrieren sich hauptsächlich auf maschinelles Lernen und tiefe generative Modelle und werden am großen Text-zu-Bild-Modell DALL·E 2, Stable Diffusion und am großen Text-zu-Video-Modell ViDu durchgeführt. Er hat den International Conference ICLR Best Paper Award, den Wu Wenjun Outstanding Youth Award, den Wu Wenjun Artificial Intelligence First Prize und die China Computer Federation Outstanding Doctoral Thesis gewonnen. Er wurde in den Boxin-Plan und den Beijing Science and Technology Star aufgenommen und leitete und beteiligte sich an vielen Projekten der National Natural Science Foundation und des Ministeriums für Wissenschaft und Technologie. War Vorsitzender internationaler Konferenzen wie ICLR und NeurIPS. Chen Jianfei, außerordentlicher Professor an der Tsinghua-Universität 2019 bzw. gearbeitet und mit gearbeitet die TSAIL-Gruppe arbeitete mit Professor Zhu Jun zusammen. Seine Forschungsinteressen umfassen effizientes maschinelles Lernen, insbesondere quantisierte neuronale Netze, stochastische Optimierungsalgorithmen und probabilistische Inferenzalgorithmen. In der Vergangenheit hat er auch mehrere skalierbare Themenmodell-Trainingssysteme entwickelt. Im Jahr 2019 gewann Chen Jianfei für seine herausragende Arbeit den CCF Outstanding Doctoral Thesis Award. Außerdem gewann er 2009 die Goldmedaille bei der Informatikolympiade in China. Im Jahr 2018 war Chen Jianfei Mitbegründer von RealAI, ein bemerkenswerter Erfolg in seiner Karriere.
Redethema und Gastvorstellung
(in der Reihenfolge des Vortrags)vor der Videogenerierung
entlang des. Fortschritts
Anders als bei der Bildgenerierung steht die Videogenerierung vor großen Herausforderungen hinsichtlich der Inhaltskonsistenz, der langen Videogenerierung und dem Verbrauch von Rechenressourcen. Allerdings hat die Videoerzeugung auch im Jahr 2023 eine rasante Entwicklung erreicht, mit dem Aufkommen hervorragender Modelle wie Stable Video Diffusion, Runway Gen-2, Video Diffusion Transformer und Sora. Dieser Bericht stellt zunächst die aktuellen Herausforderungen der Videogenerierung vor, stellt dann ausführlich die neuesten hervorragenden Videogenerierungsmodelle vor und gibt abschließend einen Ausblick auf die technologische Entwicklung der Videogenerierung.
Lu Zhiwu, Professor der Renmin University of China
Dr. Lu Zhiwu, Professor und Doktorvater an der Hillhouse School of Artificial Intelligence, Renmin University of China. Im Jahr 2005 schloss er sein Studium an der Abteilung für Informationswissenschaft der Fakultät für Mathematische Wissenschaften der Universität Peking mit einem Master of Science ab; 2011 schloss er sein Studium mit einem Ph.D. an der Fakultät für Informatik der City University of Hong Kong ab. Seine Forschungsrichtung ist maschinelles Lernen und Computer Vision. Entwerfen Sie das erste chinesische universelle multimodale Pre-Training-Modell Wenlan BriVL. Veröffentlichung des ersten Nature-Sub-Journal-Artikels im Bereich Multimodalität. Vor OpenAI wurde die Sora-ähnliche Videogenerierungsbasis VDT veröffentlicht.
2, visuelle autoregressive Modellierung: skalierbare Bildgenerierung über die Vorhersage der nächsten Ebene Visual Tokenizer wird mit Transformer kombiniert, um Next Scale Prediction zu implementieren, das erstmals eine autoregressive visuelle Generierung im GPT-Stil ermöglicht, Diffusion in Bezug auf Wirkung, Geschwindigkeit und Skalierungsfähigkeiten übertrifft und Skalierungsgesetze im Bereich der visuellen Generierung einführt Durch das Teilen erhalten Sie eine Einführung in das klassische Diffusionsmodell und den innovativen Fortschritt des Auto-Regressiv-Modells, das in letzter Zeit die Aufmerksamkeit aller auf sich gezogen hat.
Jiang Yi, ByteDance GenAI-Forscher
Jiang Yi, ByteDance GenAI-Forscher, Absolvent der Zhejiang-Universität. Zu seinen repräsentativen Arbeiten gehören Sparse R-CNN, ByteTrack, UNINEXT usw. Seine aktuellen Forschungsinteressen liegen hauptsächlich in der Forschung und Entwicklung von Basismodellen für Computer Vision und visuelle Generierung. Er hat mehr als 30 Artikel in Konferenzen und Fachzeitschriften wie CVPR, ICCV, NeurIPS, ICLR, ICML, ECCV usw. veröffentlicht die in Oral, Spotlight, aufgenommen wurden. Seine Arbeit ist Open Source auf Github und hat 20.000 Sterne gesammelt.
Gu Shuyan, ein Forscher in der Visual Computing Group von Microsoft Research Asia
Gu Shuyan, erhielt seinen Bachelor-Abschluss in Automatisierungsabteilung der University of Science and Technology of China im Jahr 2017 bzw. 2022, derzeit Forscher in der Visual Computing Group von Microsoft Research Asia. Sein Forschungsschwerpunkt sind generative Modelle im Bereich Computer Vision. Zu den Forschungsinteressen zählen vor allem die Theorie und Anwendung generativer kontradiktorischer Netzwerke und Diffusionsmodelle, die Erforschung einer neuen Generation generativer Modelle sowie die Qualitätsbewertung generativer Modelle. Er hat viele Artikel auf CVPR-, ICCV-, ECCV- und anderen Konferenzen veröffentlicht und war als Gutachter für viele Konferenzen und Zeitschriften tätig. Persönliche Homepage: https://cientgu.github.io/
Effiziente parallele Inferenzmethode für große ModelleBerichtseinführung:
AIGC-Großmodell hat weit verbreitete Anwendungsergebnisse erzielt. Der ineffiziente sequentielle Argumentationsprozess führt jedoch häufig zu einer schlechten Benutzererfahrung und hohen Bereitstellungskosten. In diesem Bericht wird vorgestellt, wie die Inferenzeffizienz großer Modelle aus der Perspektive von Inferenzalgorithmen verbessert werden kann, und es werden Beschleunigungsmethoden in anderen Aspekten wie Modellarchitektur, Sequenzkomprimierung und Cache-Optimierung untersucht.Deng Zhijie, Assistenzprofessor am Qingyuan Research Institute, Shanghai Jiao Tong University
Deng Zhijie, Assistenzprofessor und Doktorvater am Qingyuan Research Institute, School of Electrical Engineering, Shanghai Jiao Tong University. Die Hauptforschungsrichtungen sind generative Modelle und maschinelles Lernen. Er hat mehr als 20 Artikel als erster/korrespondierender Autor auf Konferenzen und Fachzeitschriften wie ICML, NeurIPS, ICLR und CVPR veröffentlicht. Gewann den NVIDIA Pioneer Research Award. Die Forschungsarbeit wird von der National Natural Science Foundation of China, dem Shanghai Science and Technology Innovation Action Plan, dem CCF-Baichuan-Inbo Large Model Fund und anderen Projekten unterstützt. 5. Runde Tischdiskussion Universität (Moderator) Gu Shuhu丨Forscher der Visual Computing Group bei Microsoft Research AsiaDeng Zhijie丨Assistenzprofessor am Qingyuan Research Institute der Shanghai Jiao Tong UniversityLi Chongxuan丨Assoziierter Professor an der Renmin University of China Scannen Sie den QR-Code, um sich jetzt zu registrieren und an der Konferenzregistrierung teilzunehmen. Diese Konferenz übernimmt die Integration von Offline- und Online-Modi. Der Registrierungskanal ist geöffnet Code zur kostenlosen Registrierung. Aufgrund der begrenzten Offline-Plätze schließen Sie die Registrierung bitte so früh wie möglich ab. Das Organisationskomitee prüft die Anmeldung gemäß der Anmeldereihenfolge und sendet vor dem Treffen eine Benachrichtigung über die Überprüfungsergebnisse. Die öffentliche Sitzung wird für registrierte Benutzer live online übertragen.
Das obige ist der detaillierte Inhalt vonAgenda der Intelligent Source-Konferenz 2024 enthüllt: Generatives Modell. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen











Aber vielleicht kann er den alten Mann im Park nicht besiegen? Die Olympischen Spiele in Paris sind in vollem Gange und Tischtennis hat viel Aufmerksamkeit erregt. Gleichzeitig haben Roboter auch beim Tischtennisspielen neue Durchbrüche erzielt. Gerade hat DeepMind den ersten lernenden Roboteragenten vorgeschlagen, der das Niveau menschlicher Amateurspieler im Tischtennis-Wettkampf erreichen kann. Papieradresse: https://arxiv.org/pdf/2408.03906 Wie gut ist der DeepMind-Roboter beim Tischtennisspielen? Vermutlich auf Augenhöhe mit menschlichen Amateurspielern: Sowohl Vorhand als auch Rückhand: Der Gegner nutzt unterschiedliche Spielstile, und auch der Roboter hält aus: Aufschlagannahme mit unterschiedlichem Spin: Allerdings scheint die Intensität des Spiels nicht so intensiv zu sein wie Der alte Mann im Park. Für Roboter, Tischtennis

Am 21. August fand in Peking die Weltroboterkonferenz 2024 im großen Stil statt. Die Heimrobotermarke „Yuanluobot SenseRobot“ von SenseTime hat ihre gesamte Produktfamilie vorgestellt und kürzlich den Yuanluobot AI-Schachspielroboter – Chess Professional Edition (im Folgenden als „Yuanluobot SenseRobot“ bezeichnet) herausgebracht und ist damit der weltweit erste A-Schachroboter für heim. Als drittes schachspielendes Roboterprodukt von Yuanluobo hat der neue Guoxiang-Roboter eine Vielzahl spezieller technischer Verbesserungen und Innovationen in den Bereichen KI und Maschinenbau erfahren und erstmals die Fähigkeit erkannt, dreidimensionale Schachfiguren aufzunehmen B. durch mechanische Klauen an einem Heimroboter, und führen Sie Mensch-Maschine-Funktionen aus, z. B. Schach spielen, jeder spielt Schach, Überprüfung der Notation usw.

Der Schulstart steht vor der Tür und nicht nur die Schüler, die bald ins neue Semester starten, sollten auf sich selbst aufpassen, sondern auch die großen KI-Modelle. Vor einiger Zeit war Reddit voller Internetnutzer, die sich darüber beschwerten, dass Claude faul werde. „Sein Niveau ist stark gesunken, es kommt oft zu Pausen und sogar die Ausgabe wird sehr kurz. In der ersten Woche der Veröffentlichung konnte es ein komplettes 4-seitiges Dokument auf einmal übersetzen, aber jetzt kann es nicht einmal eine halbe Seite ausgeben.“ !

Auf der World Robot Conference in Peking ist die Präsentation humanoider Roboter zum absoluten Mittelpunkt der Szene geworden. Am Stand von Stardust Intelligent führte der KI-Roboterassistent S1 drei große Darbietungen mit Hackbrett, Kampfkunst und Kalligraphie auf Ein Ausstellungsbereich, der sowohl Literatur als auch Kampfkunst umfasst, zog eine große Anzahl von Fachpublikum und Medien an. Durch das elegante Spiel auf den elastischen Saiten demonstriert der S1 eine feine Bedienung und absolute Kontrolle mit Geschwindigkeit, Kraft und Präzision. CCTV News führte einen Sonderbericht über das Nachahmungslernen und die intelligente Steuerung hinter „Kalligraphie“ durch. Firmengründer Lai Jie erklärte, dass hinter den seidenweichen Bewegungen die Hardware-Seite die beste Kraftkontrolle und die menschenähnlichsten Körperindikatoren (Geschwindigkeit, Belastung) anstrebt. usw.), aber auf der KI-Seite werden die realen Bewegungsdaten von Menschen gesammelt, sodass der Roboter stärker werden kann, wenn er auf eine schwierige Situation stößt, und lernen kann, sich schnell weiterzuentwickeln. Und agil

Bei dieser ACL-Konferenz haben die Teilnehmer viel gewonnen. Die sechstägige ACL2024 findet in Bangkok, Thailand, statt. ACL ist die führende internationale Konferenz im Bereich Computerlinguistik und Verarbeitung natürlicher Sprache. Sie wird von der International Association for Computational Linguistics organisiert und findet jährlich statt. ACL steht seit jeher an erster Stelle, wenn es um akademischen Einfluss im Bereich NLP geht, und ist außerdem eine von der CCF-A empfohlene Konferenz. Die diesjährige ACL-Konferenz ist die 62. und hat mehr als 400 innovative Arbeiten im Bereich NLP eingereicht. Gestern Nachmittag gab die Konferenz den besten Vortrag und weitere Auszeichnungen bekannt. Diesmal gibt es 7 Best Paper Awards (zwei davon unveröffentlicht), 1 Best Theme Paper Award und 35 Outstanding Paper Awards. Die Konferenz verlieh außerdem drei Resource Paper Awards (ResourceAward) und einen Social Impact Award (

Tiefe Integration von Vision und Roboterlernen. Wenn zwei Roboterhände reibungslos zusammenarbeiten, um Kleidung zu falten, Tee einzuschenken und Schuhe zu packen, gepaart mit dem humanoiden 1X-Roboter NEO, der in letzter Zeit für Schlagzeilen gesorgt hat, haben Sie vielleicht das Gefühl: Wir scheinen in das Zeitalter der Roboter einzutreten. Tatsächlich sind diese seidigen Bewegungen das Produkt fortschrittlicher Robotertechnologie + exquisitem Rahmendesign + multimodaler großer Modelle. Wir wissen, dass nützliche Roboter oft komplexe und exquisite Interaktionen mit der Umgebung erfordern und die Umgebung als Einschränkungen im räumlichen und zeitlichen Bereich dargestellt werden kann. Wenn Sie beispielsweise möchten, dass ein Roboter Tee einschenkt, muss der Roboter zunächst den Griff der Teekanne ergreifen und sie aufrecht halten, ohne den Tee zu verschütten, und ihn dann sanft bewegen, bis die Öffnung der Kanne mit der Öffnung der Tasse übereinstimmt , und neigen Sie dann die Teekanne in einem bestimmten Winkel. Das

Einleitung zur Konferenz Mit der rasanten Entwicklung von Wissenschaft und Technologie ist künstliche Intelligenz zu einer wichtigen Kraft bei der Förderung des sozialen Fortschritts geworden. In dieser Zeit haben wir das Glück, die Innovation und Anwendung der verteilten künstlichen Intelligenz (DAI) mitzuerleben und daran teilzuhaben. Verteilte Künstliche Intelligenz ist ein wichtiger Zweig des Gebiets der Künstlichen Intelligenz, der in den letzten Jahren immer mehr Aufmerksamkeit erregt hat. Durch die Kombination des leistungsstarken Sprachverständnisses und der Generierungsfähigkeiten großer Modelle sind plötzlich Agenten aufgetaucht, die auf natürlichen Sprachinteraktionen, Wissensbegründung, Aufgabenplanung usw. basieren. AIAgent übernimmt das große Sprachmodell und ist zu einem heißen Thema im aktuellen KI-Kreis geworden. Au

Heute Nachmittag begrüßte Hongmeng Zhixing offiziell neue Marken und neue Autos. Am 6. August veranstaltete Huawei die Hongmeng Smart Xingxing S9 und die Huawei-Konferenz zur Einführung neuer Produkte mit umfassendem Szenario und brachte die Panorama-Smart-Flaggschiff-Limousine Xiangjie S9, das neue M7Pro und Huawei novaFlip, MatePad Pro 12,2 Zoll, das neue MatePad Air und Huawei Bisheng mit Mit vielen neuen Smart-Produkten für alle Szenarien, darunter die Laserdrucker der X1-Serie, FreeBuds6i, WATCHFIT3 und der Smart Screen S5Pro, von Smart Travel über Smart Office bis hin zu Smart Wear baut Huawei weiterhin ein Smart-Ökosystem für alle Szenarien auf, um Verbrauchern ein Smart-Erlebnis zu bieten Internet von allem. Hongmeng Zhixing: Huawei arbeitet mit chinesischen Partnern aus der Automobilindustrie zusammen, um die Modernisierung der Smart-Car-Industrie voranzutreiben
