Inhaltsverzeichnis
3" >3
Technisches Personal macht fast 90 % aus
Die Generation nach den 90ern ist die Hauptkraft
9 Menschen sind Chinesen mit einer Ausbildung an renommierten Schulen davon 27 Personen. Davon haben 25 einen Bachelor-Abschluss, 25 einen Master-Abschluss und 28 einen Doktortitel, was 33 %, 30 % bzw. 37 % entspricht.
Der Kampf um KI-Talente
Heim Technologie-Peripheriegeräte KI Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Apr 11, 2023 pm 11:49 PM
技术 研究

Die Popularität von ChatGPT hat OpenAI nicht nur große Aufmerksamkeit und Nutzergunst verschafft. In der Diskussion darüber, „Warum OpenAI ChatGPT ausmachen kann“, sind auch seine personellen Vorteile in den Mittelpunkt der Aufmerksamkeit der Außenwelt gerückt.

Kürzlich haben Wisdom Research und AMiner einen statistischen Bericht des Forschungsteams hinter OpenAI veröffentlicht. Dem Bericht zufolge haben dieses Mal 87 Personen zum ChatGPT-Projekt beigetragen, darunter diejenigen, die „sehr jung“ sind, „einen luxuriösen Hintergrund haben“, „sich auf Technologie konzentrieren“, „stark angehäuft sind“ und „Unternehmertum befürworten“. und „chinesischer“ Blickfang“ und andere Besonderheiten.

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Link melden: https://mp.weixin.qq.com/s/Y_LjjsuoEEmhIg5WO_iQhA

In einem solchen Team von weniger als hundert Leuten ist die phänomenale Großsprache Das ChatGPT-Modell wurde geboren. Dies übt großen Druck auf große Unternehmen wie Google, Microsoft, Baidu und Alibaba aus. Sie haben aufmerksam verfolgt und ChatGPT-ähnliche Produkte veröffentlicht oder vorab veröffentlicht.

Als gemeinnützige Forschungseinrichtung für künstliche Intelligenz wird OpenAI von vielen jungen Talenten, die an der Entwicklung einer KI-Karriere interessiert sind, schon immer als Technologieparadies angesehen. Hier können sie direkt an den modernsten und kreativsten KI-Projekten teilnehmen, die wichtigsten wissenschaftlichen Forschungsressourcen mobilisieren und sich ohne Ablenkung der technologischen Innovation widmen.

In den letzten Jahren haben Marginalisierung und Unentschlossenheit dazu geführt, dass KI-Forschungsinstitute und wissenschaftliche Forschungstalente in großen inländischen Herstellern mit Überlebensschwierigkeiten konfrontiert sind. Ich glaube jedoch, dass KI-Talente unter dem Einfluss von ChatGPT wieder in den Blickpunkt der Öffentlichkeit rücken und einläuten werden in einer neuen Ära. Eine neue Runde des Wettbewerbs und Mischens.

1

Technisches Personal macht fast 90 % aus

Die Generation nach den 90ern ist die Hauptkraft

Aus der Positionsabteilung des ChatGPT-Teams (Abbildung 1), unter den 87 Personen, die an diesem Projekt teilnehmen , die Zahl der F&E-Mitarbeiter Die Zahl erreichte 77, was 88 % entspricht, einschließlich des Mitbegründers des Unternehmens, Wojciech Zaremba, der zuvor im Jahr 2023 zum einflussreichsten Wissenschaftler auf dem Gebiet der KI 2000 gewählt wurde.

Es gibt 4 Produktmitarbeiter, was 5 % entspricht. Darüber hinaus können die Positionsinformationen von 6 Teilnehmern nicht eingeholt werden.

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Abbildung 1: Positionsaufteilung im ChatGPT-Team

In Bezug auf die Altersverteilung der Mitglieder (Abbildung 2) ist die Generation nach den 90ern die Hauptkraft des Teams, darunter auch die Älteren zwischen 20 und 29 Jahren. Insgesamt gibt es 28 Mitglieder, die 34 % ausmachen; die meisten Mitglieder sind 30 bis 39 Jahre alt, insgesamt sind es 50 Personen, die 61 % ausmachen Die Altersgruppe liegt zwischen 40 und 49 Jahren, und nur einer ist über 60 Jahre alt.

Laut Statistik liegt das Durchschnittsalter dieses Forschungsteams bei 32 Jahren.

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Abbildung 2: Altersverteilung des ChatGPT-Teams

„Starkes Alter“ und „Fokus auf Technologie“ sind zwei wesentliche Merkmale der ChatGPT-Teammitglieder.

Obwohl das Durchschnittsalter nur 32 Jahre beträgt, konzentrieren sich die Teammitglieder stark auf Technologieforschung und -entwicklung. Aufgrund ihres großen Interesses und ihrer vollen Hingabe an KI-Innovation sowie Forschung und Entwicklung haben sie dieses phänomenale Modell geschaffen löste eine neue Runde globaler Technologie aus. Es zeigt sich, dass es durchaus möglich ist, dass junge Menschen, denen man annimmt, dass sie nicht über ausreichende Forschungs- und Entwicklungserfahrung verfügen, große Durchbrüche auf dem Gebiet der Spitzenwissenschaft und -technologie erzielen.

Derzeit mangelt es in China nicht an jungen Talenten wie OpenAI.

Nach der Einführung von ChatGPT verlagerte Zhang Jiaxing, leitender Wissenschaftler am IDEA Research Institute, Ende letzten Jahres schnell die große Modellentwicklung des Teams auf die Konversationsaufgabenlinie von ChatGPT.

Ihm zufolge sind die Hauptforscher in seinem Team allesamt herausragende junge Talente, die in den 1990er Jahren geboren wurden. Derzeit ist das von ihnen entwickelte ChatGPT-ähnliche Modell genauso effektiv wie ChatGPT, verfügt über nur 5 Milliarden Parameter und ist ebenfalls sehr schnell. Es befindet sich derzeit in internen Tests und wird in naher Zukunft der Öffentlichkeit zugänglich gemacht.

2

9 Menschen sind Chinesen mit einer Ausbildung an renommierten Schulen davon 27 Personen. Davon haben 25 einen Bachelor-Abschluss, 25 einen Master-Abschluss und 28 einen Doktortitel, was 33 %, 30 % bzw. 37 % entspricht.

Unter ihnen hat die Stanford University mit 14 die größte Anzahl an Alumni, gefolgt von der UC Berkeley mit 10 und dem MIT auf dem dritten Platz mit 7.

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-TalenteAbbildung 3: Top 10 der ChatGPT-Teammitglieder mit Universitätsabschluss

Chinesische Wissenschaftler sind mit insgesamt 9 Personen eine wichtige Kraft für technologische Innovation im Team fast 10 %.

Unter ihnen haben 5 Personen einen Abschluss an chinesischen Universitäten und 3 Personen haben einen Bachelor-Abschluss von der Tsinghua-Universität, nämlich Weng Jiayi, Zhao Shengjia und Yuan Qiming. Derzeit sind jeweils 1 Person im Team tätig einen Bachelor-Abschluss. Absolvent der Huazhong University of Science and Technology und der Peking University/Hong Kong University, jeweils Jiang Xu und Weng Lilian.

Sie alle gingen nach ihrem Abschluss an den besten inländischen Universitäten für weitere Studien in die Vereinigten Staaten und erhielten einen Master- oder Doktortitel. Abbildung 4: Chinesische Mitglieder des ChatGPT-Teams , wie OpenAI, eine reinere Forschungseinrichtung, wird von ihnen stärker bevorzugt.

Insgesamt 5 Teammitglieder wurden zu den AI 2000 Global Artificial Intelligence Scholars 2023 ernannt. Sie sind:

1. OpenAI-Mitbegründer Wojciech Zaremba (ausgewählter Bereich und Ranking: Robotik, 10. Platz)

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

2. ChatGPT-Forscher Lukasz Kaiser (ausgewählter Bereich und Ranking: Maschinelles Lernen, 10. Platz) )

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

3. OpenAI-Mitbegründer, ChatGPT-Forschungswissenschaftler John Schulman (ausgewähltes Feld und Ranking: maschinelles Lernen, 41.)

4. ChatGPT-Forschungs- und Entwicklungsingenieur Tomer Kaftan (ausgewähltes Feld und Ranking: Datenbank, 41.)

5.ChatGPT-Forschungswissenschaftler Barret Zoph (ausgewähltes Feld und Ranking: maschinelles Lernen, 95.)

Anteil des Personals von externen Unternehmen, frischer Absolventen von Universitäten, wissenschaftlichen Forschungseinrichtungen und Universitätsfakultäten. Sie betrugen 81 %, 13 % , 4 % bzw. 3 % von ihnen kamen von führenden oder bekannten Technologieunternehmen wie Google, Microsoft, Meta, Intel, NVIDIA, Apple usw. Insgesamt kamen 10 Personen von Google und 1 Person hatte gearbeitet bei Baidu.

Abbildung 5: Mitgliederfluss im ChatGPT-Team

Statistik ergab außerdem, dass an der Forschung und Entwicklung der ersten sieben technischen Projekte im Zusammenhang mit ChatGPT mehr Personen aus dem ChatGPT-Team teilgenommen haben Sie befinden sich in der Entwicklung.

Das CodeX-Projekt hat mit insgesamt 22 teilnehmenden Personen die größte Teilnehmerzahl, was 25 % des Teams ausmacht, gefolgt von webGPT und instructGPT mit insgesamt 9 teilnehmenden Personen; An dritter Stelle steht RLHF, an vierter Stelle nahmen 3 Personen teil.

Interpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente

Abbildung 6: Die Anzahl der Personen, die an den letzten sieben großen Technologieforschungen und -entwicklungen des ChatGPT-Teams beteiligt waren

Man kann sagen, dass ChatGPT die jahrelange Technologieakkumulation von OpenAI in der ist Bereich großer Sprachmodelle, Top-Talentführer und exzellentes KI-Technikpersonal. Die gesammelten Ergebnisse legten eine solide Grundlage für die erfolgreiche Entwicklung von ChatGPT.

3

Der Kampf um KI-Talente

Tatsächlich standen KI-Forschungsinstitute und KI-Talente in den letzten Jahren lange vor dem Dilemma der Marginalisierung und strategischen Schwankungen innerhalb großer Fabriken, wie oben bei Google erwähnt Viele Talente sind an heilige Orte der reinen wissenschaftlichen Forschung wie OpenAI geflossen.

Innerhalb des Organisationsstrukturmodells des Unternehmens fällt es KI-Mitarbeitern in großen Fabriken oft schwer, ihre Fähigkeiten und Erfolge zu entwickeln.

Aber im Gegensatz zu traditionellen Technologiegiganten ist es für Unternehmen wie OpenAI die Mission, „künstliche Intelligenz zu entwickeln“, und KI-Forschung, -Entwicklung und -Innovation sind ihre Mission, d. h. die enge Beteiligung an den modernsten KI-Projekten Die meisten Kernressourcen werden für Forschung und Entwicklung verwendet, und hinter den Kulissen müssen wir in der Lage sein, der Verantwortung standzuhalten, über einen längeren Zeitraum keine Ergebnisse zu erzielen. Unter anderem dauerte das GPT-Modell vom ersten Start bis zum Abschluss der Schulung bis zu drei Jahre und erforderte vom Team eine vollständige Reihe systematischer Garantien für Geld, Technologie und Talente.

Das Aufkommen von ChatGPT hat KI-Talente wieder in den Fokus der Öffentlichkeit gerückt, die Bedeutung reiner wissenschaftlicher Forschung bekräftigt und wird mit Sicherheit eine neue Runde des Talentwettbewerbs auslösen. Gleichzeitig wird dadurch auch der Schwerpunkt großer Hersteller auf Infrastruktur wie großen Modellen und Rechenressourcen gestärkt und der Aufholprozess und die Ergänzung der zugrunde liegenden technischen Fähigkeiten beschleunigt.

Wie der ehemalige CEO von Sogou, Wang Xiaochuan, auf Weibo sagte: „Der Erfolg von OpenAI ist zuallererst der Sieg des technischen Idealismus. Der Erfolg von ChatGPT ist untrennbar mit den gemeinsamen Anstrengungen von Industrie, Wissenschaft und Forschung verbunden.“ Es ist das Interesse der Teammitglieder an der Technologie der künstlichen Intelligenz und ihr Glaube daran, daran festzuhalten. Es gibt keinen Mangel an Spitzenkräften in der wissenschaftlichen Forschung im Land. Für die Förderung der Entwicklung von KI-Innovationen in China ist es von großer Bedeutung, sich auf modernste technologische Innovationen zu konzentrieren.

Das obige ist der detaillierte Inhalt vonInterpretation der Forschungskraft hinter ChatGPT: Die Generation nach den 90er-Jahren ist zur Hauptkraft geworden, und große Hersteller sind nicht mehr die erste Wahl für Top-KI-Talente. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
2 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Repo: Wie man Teamkollegen wiederbelebt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
Hello Kitty Island Abenteuer: Wie man riesige Samen bekommt
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Ein tiefer Einblick in Modelle, Daten und Frameworks: eine ausführliche 54-seitige Übersicht über effiziente große Sprachmodelle Ein tiefer Einblick in Modelle, Daten und Frameworks: eine ausführliche 54-seitige Übersicht über effiziente große Sprachmodelle Jan 14, 2024 pm 07:48 PM

Large-Scale Language Models (LLMs) haben überzeugende Fähigkeiten bei vielen wichtigen Aufgaben bewiesen, darunter das Verständnis natürlicher Sprache, die Sprachgenerierung und das komplexe Denken, und hatten tiefgreifende Auswirkungen auf die Gesellschaft. Diese herausragenden Fähigkeiten erfordern jedoch erhebliche Schulungsressourcen (im linken Bild dargestellt) und lange Inferenzzeiten (im rechten Bild dargestellt). Daher müssen Forscher wirksame technische Mittel entwickeln, um ihre Effizienzprobleme zu lösen. Darüber hinaus wurden, wie auf der rechten Seite der Abbildung zu sehen ist, einige effiziente LLMs (LanguageModels) wie Mistral-7B erfolgreich beim Entwurf und Einsatz von LLMs eingesetzt. Diese effizienten LLMs können den Inferenzspeicher erheblich reduzieren und gleichzeitig eine ähnliche Genauigkeit wie LLaMA1-33B beibehalten

Dieser Artikel reicht aus, um etwas über autonomes Fahren und Flugbahnvorhersage zu lesen! Dieser Artikel reicht aus, um etwas über autonomes Fahren und Flugbahnvorhersage zu lesen! Feb 28, 2024 pm 07:20 PM

Die Trajektorienvorhersage spielt eine wichtige Rolle beim autonomen Fahren. Unter autonomer Fahrtrajektorienvorhersage versteht man die Vorhersage der zukünftigen Fahrtrajektorie des Fahrzeugs durch die Analyse verschiedener Daten während des Fahrvorgangs. Als Kernmodul des autonomen Fahrens ist die Qualität der Trajektorienvorhersage von entscheidender Bedeutung für die nachgelagerte Planungssteuerung. Die Trajektorienvorhersageaufgabe verfügt über einen umfangreichen Technologie-Stack und erfordert Vertrautheit mit der dynamischen/statischen Wahrnehmung des autonomen Fahrens, hochpräzisen Karten, Fahrspurlinien, Fähigkeiten in der neuronalen Netzwerkarchitektur (CNN&GNN&Transformer) usw. Der Einstieg ist sehr schwierig! Viele Fans hoffen, so schnell wie möglich mit der Flugbahnvorhersage beginnen zu können und Fallstricke zu vermeiden. Heute werde ich eine Bestandsaufnahme einiger häufiger Probleme und einführender Lernmethoden für die Flugbahnvorhersage machen! Einführungsbezogenes Wissen 1. Sind die Vorschaupapiere in Ordnung? A: Schauen Sie sich zuerst die Umfrage an, S

Das Stable Diffusion 3-Papier wird endlich veröffentlicht und die architektonischen Details werden enthüllt. Wird es helfen, Sora zu reproduzieren? Das Stable Diffusion 3-Papier wird endlich veröffentlicht und die architektonischen Details werden enthüllt. Wird es helfen, Sora zu reproduzieren? Mar 06, 2024 pm 05:34 PM

Der Artikel von StableDiffusion3 ist endlich da! Dieses Modell wurde vor zwei Wochen veröffentlicht und verwendet die gleiche DiT-Architektur (DiffusionTransformer) wie Sora. Nach seiner Veröffentlichung sorgte es für großes Aufsehen. Im Vergleich zur Vorgängerversion wurde die Qualität der von StableDiffusion3 generierten Bilder erheblich verbessert. Es unterstützt jetzt Eingabeaufforderungen mit mehreren Themen, und der Textschreibeffekt wurde ebenfalls verbessert, und es werden keine verstümmelten Zeichen mehr angezeigt. StabilityAI wies darauf hin, dass es sich bei StableDiffusion3 um eine Reihe von Modellen mit Parametergrößen von 800 M bis 8 B handelt. Durch diesen Parameterbereich kann das Modell direkt auf vielen tragbaren Geräten ausgeführt werden, wodurch der Einsatz von KI deutlich reduziert wird

DualBEV: BEVFormer und BEVDet4D deutlich übertreffen, öffnen Sie das Buch! DualBEV: BEVFormer und BEVDet4D deutlich übertreffen, öffnen Sie das Buch! Mar 21, 2024 pm 05:21 PM

In diesem Artikel wird das Problem der genauen Erkennung von Objekten aus verschiedenen Blickwinkeln (z. B. Perspektive und Vogelperspektive) beim autonomen Fahren untersucht, insbesondere wie die Transformation von Merkmalen aus der Perspektive (PV) in den Raum aus der Vogelperspektive (BEV) effektiv ist implementiert über das Modul Visual Transformation (VT). Bestehende Methoden lassen sich grob in zwei Strategien unterteilen: 2D-zu-3D- und 3D-zu-2D-Konvertierung. 2D-zu-3D-Methoden verbessern dichte 2D-Merkmale durch die Vorhersage von Tiefenwahrscheinlichkeiten, aber die inhärente Unsicherheit von Tiefenvorhersagen, insbesondere in entfernten Regionen, kann zu Ungenauigkeiten führen. Während 3D-zu-2D-Methoden normalerweise 3D-Abfragen verwenden, um 2D-Features abzutasten und die Aufmerksamkeitsgewichte der Korrespondenz zwischen 3D- und 2D-Features über einen Transformer zu lernen, erhöht sich die Rechen- und Bereitstellungszeit.

Das erste Weltmodell zur Erzeugung autonomer Fahrszenen mit mehreren Ansichten | DrivingDiffusion: Neue Ideen für BEV-Daten und Simulation Das erste Weltmodell zur Erzeugung autonomer Fahrszenen mit mehreren Ansichten | DrivingDiffusion: Neue Ideen für BEV-Daten und Simulation Oct 23, 2023 am 11:13 AM

Einige persönliche Gedanken des Autors Im Bereich des autonomen Fahrens sind mit der Entwicklung BEV-basierter Teilaufgaben/End-to-End-Lösungen hochwertige Multi-View-Trainingsdaten und der entsprechende Aufbau von Simulationsszenen immer wichtiger geworden. Als Reaktion auf die Schwachstellen aktueller Aufgaben kann „hohe Qualität“ in drei Aspekte zerlegt werden: Long-Tail-Szenarien in verschiedenen Dimensionen: z. B. Nahbereichsfahrzeuge in Hindernisdaten und präzise Kurswinkel beim Schneiden von Autos sowie Spurliniendaten . Szenen wie Kurven mit unterschiedlichen Krümmungen oder Rampen/Zusammenführungen/Zusammenführungen, die schwer zu erfassen sind. Diese basieren häufig auf der Sammlung großer Datenmengen und komplexen Data-Mining-Strategien, die kostspielig sind. Echter 3D-Wert – hochkonsistentes Bild: Die aktuelle BEV-Datenerfassung wird häufig durch Fehler bei der Sensorinstallation/-kalibrierung, hochpräzisen Karten und dem Rekonstruktionsalgorithmus selbst beeinträchtigt. das hat mich dazu geführt

„Minecraft' verwandelt sich in eine KI-Stadt und NPC-Bewohner spielen Rollenspiele wie echte Menschen „Minecraft' verwandelt sich in eine KI-Stadt und NPC-Bewohner spielen Rollenspiele wie echte Menschen Jan 02, 2024 pm 06:25 PM

Bitte beachten Sie, dass dieser kantige Mann die Stirn runzelt und über die Identität der „ungebetenen Gäste“ vor ihm nachdenkt. Es stellte sich heraus, dass sie sich in einer gefährlichen Situation befand, und als ihr dies klar wurde, begann sie schnell mit der mentalen Suche nach einer Strategie zur Lösung des Problems. Letztendlich entschloss sie sich, vom Unfallort zu fliehen, dann so schnell wie möglich Hilfe zu suchen und sofort Maßnahmen zu ergreifen. Gleichzeitig dachte die Person auf der Gegenseite das Gleiche wie sie... In „Minecraft“ gab es eine solche Szene, in der alle Charaktere von künstlicher Intelligenz gesteuert wurden. Jeder von ihnen hat eine einzigartige Identität. Das zuvor erwähnte Mädchen ist beispielsweise eine 17-jährige, aber kluge und mutige Kurierin. Sie haben die Fähigkeit, sich zu erinnern und zu denken und in dieser kleinen Stadt in Minecraft wie Menschen zu leben. Was sie antreibt, ist ein brandneues,

I2V-Adapter aus der SD-Community: keine Konfiguration erforderlich, Plug-and-Play, perfekt kompatibel mit dem Tusheng-Video-Plug-in I2V-Adapter aus der SD-Community: keine Konfiguration erforderlich, Plug-and-Play, perfekt kompatibel mit dem Tusheng-Video-Plug-in Jan 15, 2024 pm 07:48 PM

Die Aufgabe der Bild-zu-Video-Generierung (I2V) ist eine Herausforderung im Bereich Computer Vision, die darauf abzielt, statische Bilder in dynamische Videos umzuwandeln. Die Schwierigkeit dieser Aufgabe besteht darin, dynamische Informationen in der zeitlichen Dimension aus einem einzelnen Bild zu extrahieren und zu generieren und dabei die Authentizität und visuelle Kohärenz des Bildinhalts zu wahren. Bestehende I2V-Methoden erfordern häufig komplexe Modellarchitekturen und große Mengen an Trainingsdaten, um dieses Ziel zu erreichen. Kürzlich wurde ein neues Forschungsergebnis „I2V-Adapter: AGeneralImage-to-VideoAdapter for VideoDiffusionModels“ unter der Leitung von Kuaishou veröffentlicht. Diese Forschung stellt eine innovative Bild-zu-Video-Konvertierungsmethode vor und schlägt ein leichtes Adaptermodul vor, d. h.

VPR 2024 perfektes Ergebnispapier! Meta schlägt EfficientSAM vor: schnell alles aufteilen! VPR 2024 perfektes Ergebnispapier! Meta schlägt EfficientSAM vor: schnell alles aufteilen! Mar 02, 2024 am 10:10 AM

Diese Arbeit von EfficientSAM wurde mit einer perfekten Bewertung von 5/5/5 in CVPR2024 aufgenommen! Der Autor teilte das Ergebnis in den sozialen Medien mit, wie im Bild unten gezeigt: Der Gewinner des LeCun Turing Award hat dieses Werk ebenfalls wärmstens empfohlen! In einer aktuellen Forschung haben Meta-Forscher eine neue, verbesserte Methode vorgeschlagen, nämlich das Mask Image Pre-Training (SAMI) unter Verwendung von SAM. Diese Methode kombiniert MAE-Vortrainingstechnologie und SAM-Modelle, um hochwertige vorab trainierte ViT-Encoder zu erhalten. Durch SAMI versuchen Forscher, die Leistung und Effizienz des Modells zu verbessern und bessere Lösungen für Sehaufgaben bereitzustellen. Der Vorschlag dieser Methode bringt neue Ideen und Möglichkeiten zur weiteren Erforschung und Entwicklung der Bereiche Computer Vision und Deep Learning. durch die Kombination verschiedener

See all articles