Inhaltsverzeichnis
Warum diesen Erfahrungsbeitrag schreiben?
Auf der Suche nach einem akademischen Job
Meine Sicht auf meine Arbeit und meine Ziele hat sich verändert
Andere Unterschiede zwischen Wissenschaft und Industrie
Heim Technologie-Peripheriegeräte KI Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

May 10, 2023 am 09:22 AM
研究 offer

Wie soll sich ein Doktorand, der einen Job im Bereich Informatik finden möchte, zwischen Wissenschaft und Industrie entscheiden?

Während der Jobsuche hatte sich Rowan Zellers, ein Doktorand an der University of Washington, ursprünglich vorgenommen, eine Lehrstelle zu finden. Zu diesem Zweck erstellte er eine Zielgruppenliste, verfasste zahlreiche Bewerbungsunterlagen und nutzte sein soziales Netzwerk im akademischen Bereich, um nach weiteren Möglichkeiten zu suchen.

Gleichzeitig begann er auch, sich den Möglichkeiten in der Branche zu öffnen. Die Kommunikation mit Industrieunternehmen erschütterte allmählich die Ideen von Rowan Zellers. Er stellte fest, dass es für sein Forschungsgebiet – multimodale künstliche Intelligenz – schwierig und immer schwieriger wird, groß angelegte Grundlagenforschung im akademischen Bereich durchzuführen, und die Möglichkeiten in der Industrie werden immer zahlreicher .

Obwohl Technologieunternehmen um das Jahr 2022 herum die Einstellung von Mitarbeitern verlangsamt oder eingefroren haben, fand Rowan Zellers immer noch eine attraktivere Gelegenheit – OpenAI warf ihm einen Olivenzweig zu.

In der letzten Phase der Jobsuche tat er etwas, woran er noch nie gedacht hatte – er lehnte alle akademischen Stellen ab und beschloss, das Angebot von OpenAI zu unterzeichnen. Im Juni 2022 verabschiedete sich Rowan Zellers offiziell von vielen Schuljahren und trat OpenAI bei.

Was hat es ihm ermöglicht, seine Denkweise innerhalb eines Jahres zu ändern? In einem aktuellen Blogbeitrag teilte Rowan Zellers einige seiner Tipps für die Jobsuche mit.

Das Folgende ist der Text des Blogs:

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

Rowan Zellers präsentierte seine Arbeit zum visuellen Denken mit gesundem Menschenverstand auf der CVPR 2019.

Ich war während des Entscheidungsprozesses sehr nervös und gestresst – es fühlte sich damals wie eine Wendung an –, aber am Ende bin ich wirklich zufrieden mit dem Ergebnis. Für mich spielen zwei Schlüsselfaktoren eine Rolle:

1) Ich habe das Gefühl, dass ich bei OpenAI das tun kann, wofür ich leidenschaftlich bin.

2) San Francisco, wo OpenAI seinen Sitz hat, ist ein großartiger Ort Stadt leben und arbeiten.

In diesem Artikel werde ich den Entscheidungsprozess weiter besprechen.

Warum diesen Erfahrungsbeitrag schreiben?

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

Während meiner Jobsuche habe ich von Professoren in meinem sozialen Netzwerk viele tolle Ratschläge dazu bekommen, wie man sich auf eine Stelle bewirbt, wie man Vorstellungsgespräche führt und wie man eine tolle Bewerbung erstellt. (Im ersten Teil dieser Serie habe ich versucht, diesen Rat in einem empirischen Artikel über die Bewerbung auf einen Job zusammenzufassen.)

Als es jedoch an der Zeit war, tatsächlich eine Entscheidung zu treffen, fühlte ich mich immer noch ein wenig allein. Ich gebe zu, dass ich großes Glück hatte, über ein so starkes Netzwerk von Professoren und Industrieforschern zu verfügen, mit denen ich in diesen Fragen Kontakt aufnehmen kann. Aber die Entscheidung zwischen Karrierewegen ist eher eine individuelle, persönliche Entscheidung, auf die es bis zu einem gewissen Grad „keine richtige Antwort“ gibt.

Ein weiterer Faktor, der die Entscheidungsfindung beeinflusst, ist, dass die meisten Menschen, die ich kenne, sich offenbar für eine Seite zwischen Wissenschaft und Industrie entschieden haben. Die meisten Professoren, die ich kenne, sind fest im akademischen System verankert (obwohl es einige Versuche in der Industrie gibt), und die meisten Leute, die ich in der Industrie kenne, haben nie ernsthaft über eine akademische Laufbahn nachgedacht.

Das kommt mir besonders seltsam vor. Denn mitten in meiner Doktorarbeit habe ich mich für den „akademischen Weg“ entschieden, weil ich damit die endgültige Entscheidung zwischen Wissenschaft und Industrie aufschieben könnte – angesichts der allgemeinen Ansicht, dass der Wechsel von der Wissenschaft in die Industrie einfacher ist als sich in die andere Richtung zu drehen. Doch fast ein paar Jahre später wurde mir klar, dass es tatsächlich Teil meiner beruflichen Identität war, den akademischen Weg einzuschlagen. Viele meiner Kommilitonen taten das Gleiche, und ich hatte das Gefühl, dass mich eine Kraft dazu drängte, den akademischen Weg einzuschlagen.

Jedenfalls habe ich diesen Artikel geschrieben, um eine N=1-Meinungsperspektive darüber zu vermitteln, wie ich meine eigenen Entscheidungen unter einigen ziemlich unterschiedlichen Entscheidungen getroffen habe.

Auf der Suche nach einem akademischen Job

Meine Sicht auf meine Arbeit und meine Ziele hat sich verändert

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

Mein Büro während der Pandemie.

Als Hintergrund war ich von 2016 bis 2022 Doktorand an der University of Washington und war von dem Prozess absolut begeistert. In meinem Forschungsgebiet geht es um multimodale künstliche Intelligenz – den Aufbau maschineller Lernsysteme, die Sprache, Vision und den Rest der Welt verstehen können.

Wie im ersten Teil dieser Serie geschrieben, haben Forschungsinteressen meinen vorgegebenen Karriereweg geprägt. Am meisten reizt mich die Grundlagenforschung und die Betreuung von Nachwuchsforschern. Zumindest auf der traditionellen Ebene der Informatik steht dies im Fokus der Wissenschaft, während sich die Industrie auf angewandte Forschung spezialisiert und bestrebt ist, wissenschaftliche Fortschritte in erfolgreiche Produkte umzusetzen.

Die Suche nach einem Job im akademischen Bereich gab mir eine Vorstellung davon, wie es ist, Professor an vielen verschiedenen Institutionen und Informatik-Teilbereichen zu sein. Ich habe in all meinen Interviews mit über 160 Professoren gesprochen. Am Ende war ich mir nicht ganz sicher, ob die akademische Welt etwas für mich ist.

Es ist schwer, groß angelegte Grundlagenforschung im akademischen Bereich zu betreiben.

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

In den letzten sechs Jahren war der akademische Bereich (genauer gesagt die Forschung meines Betreuers an der University of Washington-Gruppe) sehr gut Umgebung für mich. Ich war bestrebt, eine Forschungsrichtung zu verfolgen, die mich begeisterte und großzügige Unterstützung in Bezug auf Mentoring und Ressourcen erhielt. Unter diesen Voraussetzungen bin ich in der Lage, Forschungen zum Aufbau multimodaler KI-Systeme zu leiten, die sich mit zunehmender Skalierung verbessern und dann (für mich) mehr Fragen als Antworten generieren.

Im Vergleich dazu passten die meisten großen Forschungslabore der Industrie zu dieser Zeit nicht zu meinen Interessen. Während meiner Doktorarbeit habe ich versucht, mich für ein Praktikum zu bewerben, aber es gelang mir nie, eines zu finden, das mit meiner Forschungsagenda übereinzustimmen schien. Die meisten Branchenteams, die ich kenne, konzentrieren sich in erster Linie auf Sprache oder Visuelles, und ich konnte mich weder für das eine noch für das andere entscheiden. Ich habe viel Zeit am Allen Institute for Artificial Intelligence verbracht, einem gemeinnützigen Forschungslabor, das im Vergleich dazu sehr akademisch wirkt.

Allerdings ändern sich die Dinge. In den Bereichen, auf die ich mich konzentriere, befürchte ich, dass es schwierig ist, bahnbrechende Forschung zum Systemaufbau im akademischen Bereich durchzuführen, und dass dies immer schwieriger wird.

Die Realität ist, dass der Aufbau eines Systems wirklich schwierig ist. Es erfordert viele Ressourcen und viel Technik. Ich denke, dass die Anreizstruktur in der Wissenschaft für diese Art kostenintensiver und risikoreicher Systemaufbauforschung nicht geeignet ist.

Der Aufbau eines künstlichen Systems und der Nachweis, dass es gut skaliert, kann für einen Doktoranden Jahre dauern und über 100.000 US-Dollar an nicht subventionierten Computergebühren kosten. Und während das Feld wächst, scheinen diese Zahlen exponentiell zu steigen. Viele Arbeiten zu schreiben ist also keine praktikable Strategie, zumindest sollte es derzeit nicht das Ziel sein, aber leider kenne ich viele Wissenschaftler, die dazu neigen, die Anzahl der Arbeiten als objektives Maß zu verwenden. Darüber hinaus sind Aufsätze die „Verhandlungsgrundlage“, mit der sich die akademische Gemeinschaft um Fördermittel bewirbt. Wir müssen viele Aufsätze schreiben, auf Konferenzen etwas zu besprechen haben, Praktikumsmöglichkeiten für Studierende finden usw. In dem Sinne, dass es bei einer erfolgreichen akademischen Karriere darum geht, Studierenden bei der Ausarbeitung ihrer eigenen Forschungspläne zu helfen (sie können an anderer Stelle Professoren werden, und der Zyklus kann fortgesetzt werden), ist dies ein wesentlicher Bestandteil der Zusammenarbeit, die für eine großartige Spannungsforschung erforderlich ist.

Allerdings denke ich, dass der allgemeinere Trend eine Verlagerung der Wissenschaft hin zu angewandter Forschung ist.

Da die Modelltechnologie immer leistungsfähiger wird und die Konstruktionskosten immer höher werden, versuchen immer mehr Wissenschaftler, Anwendungen auf der Grundlage des Modells zu entwickeln. Dies ist ein Trend, den ich auch in den beiden großen Bereichen NLP und CV sehe. Dies wiederum hat Auswirkungen auf die Themen, denen akademische Kreise Aufmerksamkeit schenken und die sie diskutieren, und Forscher haben begonnen, sich Gedanken darüber zu machen, wie einige praktische und spezifische Probleme gelöst werden können.

In der akademischen Welt denke ich, dass ich für den Abschluss einer erfolgreichen Forschung mehrere Phasen durchlaufen muss, einschließlich der Beschaffung von Geldern und der Einrichtung eines Labors, und dann kann ich das wissenschaftliche Forschungsprojekt offiziell starten. Wenn ich endlich ein gutes Forschungsergebnis erhalte, sind möglicherweise mehrere Jahre vergangen. Vielleicht hat in dieser Zeit jemand bereits bahnbrechende Ergebnisse erzielt, und es fällt mir schwer, auf diesem Weg herauszustechen. Dennoch wurden in diesem Bereich in den letzten Jahren sehr schnelle Fortschritte erzielt.

Realistischer ausgedrückt: Wenn ich in einem Track versage, muss ich möglicherweise die Richtung meiner Forschung ändern. Das war jedoch nicht meine ursprüngliche Absicht und war wahrscheinlich der Hauptgrund, warum ich mich schließlich für die Industrie entschieden habe.

Andere Unterschiede zwischen Wissenschaft und Industrie

In meinem Forschungsbereich umfassen alle Aufgaben akademischer Professoren die Lehre (und die Vorbereitung von Lehrmaterialien), Tragen Sie zu Hochschulen und Fachbereichen bei, bauen und verwalten Sie eine Computerinfrastruktur, beantragen Sie Zuschüsse, verwalten Sie Gelder und vieles mehr. Obwohl ich diese Dinge interessant finde, möchte ich mich nicht mit so vielen Arbeitsszenarien gleichzeitig befassen, was eine starke Arbeitsfähigkeit erfordert, um dies problemlos zu bewältigen. Ich möchte, dass sich meine Arbeit auf eine wichtige Aufgabe konzentriert, beispielsweise auf das Unterrichten.

Ebenso konzentriere ich mich während meiner Doktorarbeit gerne jeweils nur auf eine wichtige Forschungsfrage. Ich denke, dass diese Art von fokussierter Arbeitsszene in der Branche häufiger vorkommt. Als Professor ist es wirklich nicht einfach, gleichzeitig Experimente durchzuführen und Code zu schreiben, und in der Branche gibt es eine klarere Arbeitsteilung.

Ich glaube, viele Menschen fühlen sich unbewusst von der Wissenschaft angezogen, weil sie ihnen Prestige verleiht, aber das gefällt mir nicht. Ich denke, dass die Konzentration auf Rankings und Reputation dazu führt, dass ich die falschen Ziele verfolge und mir das Gefühl gebe, verloren zu sein. Andererseits zieht es viele Menschen auch deshalb in die Branche, weil sie höhere Gehälter bietet, was wichtig ist. Glücklicherweise habe ich eine Umgebung gefunden, die mir mehr innere Zufriedenheit verschaffte.

Lohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?

Arbeitsplatz- und Karrieresicherheit​# 🎜🎜#

Ich glaube, dass viele Leute die Amtszeit missverstehen. Zwar sind Tenure-Track-Stellen wie die Professur stabil und arbeitsplatzsicher. Aber auch für Berufstätige ist der akademische Arbeitsmarkt sehr komplex. Natürlich können akademische Forscher im Gegensatz zu Industrieforschern auch in einer Rezession problemlos den Arbeitsplatz wechseln.

Im akademischen Bereich habe ich theoretisch die Freiheit, zu jedem Thema zu recherchieren, aber in der Praxis kann es sein, dass ich nicht über genügend Ressourcen oder ein ausreichend unterstützendes Umfeld verfüge. Ich bin OpenAI beigetreten, weil ich hier großartige Unterstützung bei der Lösung der Probleme erhalten habe, die mich am meisten interessieren. Ich denke, für jedes Industrielabor muss die Lösung der Probleme, die mir am Herzen liegen, auf die Produkte des Unternehmens abgestimmt sein, und OpenAI hat genau diese Regelung.

Die Arbeit im Team von OpenAI gibt mir die Möglichkeit, Nachwuchsforscher zu betreuen und ausreichende Forschungsressourcen zu gewinnen. Noch wichtiger ist, dass ich motiviert bin, herausfordernde Probleme zu lösen, die mir wichtig sind.

Das sind die Gründe, warum ich mich für eine Vollzeitstelle bei OpenAI entschieden habe. Ein halbes Jahr nach Beginn meiner Tätigkeit stellt sich heraus, dass mir die Arbeit bei OpenAI wirklich Spaß macht.

Das obige ist der detaillierte Inhalt vonLohnt es sich, auf OpenAI-Beitrittsangebote zu verzichten?. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
3 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Ein tiefer Einblick in Modelle, Daten und Frameworks: eine ausführliche 54-seitige Übersicht über effiziente große Sprachmodelle Ein tiefer Einblick in Modelle, Daten und Frameworks: eine ausführliche 54-seitige Übersicht über effiziente große Sprachmodelle Jan 14, 2024 pm 07:48 PM

Large-Scale Language Models (LLMs) haben überzeugende Fähigkeiten bei vielen wichtigen Aufgaben bewiesen, darunter das Verständnis natürlicher Sprache, die Sprachgenerierung und das komplexe Denken, und hatten tiefgreifende Auswirkungen auf die Gesellschaft. Diese herausragenden Fähigkeiten erfordern jedoch erhebliche Schulungsressourcen (im linken Bild dargestellt) und lange Inferenzzeiten (im rechten Bild dargestellt). Daher müssen Forscher wirksame technische Mittel entwickeln, um ihre Effizienzprobleme zu lösen. Darüber hinaus wurden, wie auf der rechten Seite der Abbildung zu sehen ist, einige effiziente LLMs (LanguageModels) wie Mistral-7B erfolgreich beim Entwurf und Einsatz von LLMs eingesetzt. Diese effizienten LLMs können den Inferenzspeicher erheblich reduzieren und gleichzeitig eine ähnliche Genauigkeit wie LLaMA1-33B beibehalten

Nvidias GPU der nächsten Generation zerschmettert H100 und wird enthüllt! Das erste 3-nm-Multichip-Moduldesign, vorgestellt im Jahr 2024 Nvidias GPU der nächsten Generation zerschmettert H100 und wird enthüllt! Das erste 3-nm-Multichip-Moduldesign, vorgestellt im Jahr 2024 Sep 30, 2023 pm 12:49 PM

3-nm-Prozess, Leistung übertrifft H100! Kürzlich brachten die ausländischen Medien DigiTimes die Nachricht, dass Nvidia die GPU der nächsten Generation, die B100, mit dem Codenamen „Blackwell“ entwickelt, angeblich als Produkt für Anwendungen im Bereich der künstlichen Intelligenz (KI) und des Hochleistungsrechnens (HPC). Der B100 wird den 3-nm-Prozess von TSMC sowie ein komplexeres Multi-Chip-Modul (MCM)-Design nutzen und im vierten Quartal 2024 erscheinen. Nvidia, das mehr als 80 % des GPU-Marktes für künstliche Intelligenz monopolisiert, kann mit dem B100 zuschlagen, solange das Eisen heiß ist, und in dieser Welle des KI-Einsatzes weitere Herausforderer wie AMD und Intel angreifen. Nach Schätzungen von NVIDIA wird erwartet, dass der Produktionswert dieses Bereichs bis 2027 ungefähr erreicht

Die leistungsstarke Kombination aus Diffusions- und Superauflösungsmodellen, der Technologie hinter Googles Bildgenerator Imagen Die leistungsstarke Kombination aus Diffusions- und Superauflösungsmodellen, der Technologie hinter Googles Bildgenerator Imagen Apr 10, 2023 am 10:21 AM

In den letzten Jahren hat multimodales Lernen große Aufmerksamkeit erhalten, insbesondere in den beiden Richtungen der Text-Bild-Synthese und des kontrastiven Bild-Text-Lernens. Einige KI-Modelle haben aufgrund ihrer Anwendung bei der kreativen Bilderzeugung und -bearbeitung große öffentliche Aufmerksamkeit erregt, wie beispielsweise die von OpenAI eingeführten Textbildmodelle DALL・E und DALL-E 2 sowie GauGAN und GauGAN2 von NVIDIA. Um nicht zu übertreffen, hat Google Ende Mai sein eigenes Text-zu-Bild-Modell Imagen veröffentlicht, das die Grenzen der untertitelbedingten Bildgenerierung offenbar noch weiter erweitert. Mit nur einer Beschreibung einer Szene kann Imagen eine hohe Qualität und Auflösung erzeugen

Die umfassendste Übersicht über multimodale Großmodelle finden Sie hier! 7 Microsoft-Forscher arbeiteten intensiv zusammen, 5 Hauptthemen, 119 Seiten Dokument Die umfassendste Übersicht über multimodale Großmodelle finden Sie hier! 7 Microsoft-Forscher arbeiteten intensiv zusammen, 5 Hauptthemen, 119 Seiten Dokument Sep 25, 2023 pm 04:49 PM

Die umfassendste Übersicht über multimodale Großmodelle finden Sie hier! Es wurde von sieben chinesischen Forschern bei Microsoft verfasst und umfasst 119 Seiten. Es geht von zwei Arten multimodaler Forschungsrichtungen für große Modelle aus, die abgeschlossen wurden und immer noch an der Spitze stehen, und fasst fünf spezifische Forschungsthemen umfassend zusammen: visuelles Verständnis und visuelle Generierung Der vom einheitlichen visuellen Modell LLM unterstützte multimodale Großmodell-Multimodalagent konzentriert sich auf ein Phänomen: Das multimodale Grundmodell hat sich von spezialisiert zu universell entwickelt. Ps. Aus diesem Grund hat der Autor am Anfang des Artikels direkt ein Bild von Doraemon gezeichnet. Wer sollte diese Rezension (Bericht) lesen? Mit den ursprünglichen Worten von Microsoft: Solange Sie daran interessiert sind, das Grundwissen und die neuesten Fortschritte multimodaler Grundmodelle zu erlernen, egal ob Sie ein professioneller Forscher oder ein Student sind, ist dieser Inhalt sehr gut für Sie geeignet.

I2V-Adapter aus der SD-Community: keine Konfiguration erforderlich, Plug-and-Play, perfekt kompatibel mit dem Tusheng-Video-Plug-in I2V-Adapter aus der SD-Community: keine Konfiguration erforderlich, Plug-and-Play, perfekt kompatibel mit dem Tusheng-Video-Plug-in Jan 15, 2024 pm 07:48 PM

Die Aufgabe der Bild-zu-Video-Generierung (I2V) ist eine Herausforderung im Bereich Computer Vision, die darauf abzielt, statische Bilder in dynamische Videos umzuwandeln. Die Schwierigkeit dieser Aufgabe besteht darin, dynamische Informationen in der zeitlichen Dimension aus einem einzelnen Bild zu extrahieren und zu generieren und dabei die Authentizität und visuelle Kohärenz des Bildinhalts zu wahren. Bestehende I2V-Methoden erfordern häufig komplexe Modellarchitekturen und große Mengen an Trainingsdaten, um dieses Ziel zu erreichen. Kürzlich wurde ein neues Forschungsergebnis „I2V-Adapter: AGeneralImage-to-VideoAdapter for VideoDiffusionModels“ unter der Leitung von Kuaishou veröffentlicht. Diese Forschung stellt eine innovative Bild-zu-Video-Konvertierungsmethode vor und schlägt ein leichtes Adaptermodul vor, d. h.

VPR 2024 perfektes Ergebnispapier! Meta schlägt EfficientSAM vor: schnell alles aufteilen! VPR 2024 perfektes Ergebnispapier! Meta schlägt EfficientSAM vor: schnell alles aufteilen! Mar 02, 2024 am 10:10 AM

Diese Arbeit von EfficientSAM wurde mit einer perfekten Bewertung von 5/5/5 in CVPR2024 aufgenommen! Der Autor teilte das Ergebnis in den sozialen Medien mit, wie im Bild unten gezeigt: Der Gewinner des LeCun Turing Award hat dieses Werk ebenfalls wärmstens empfohlen! In einer aktuellen Forschung haben Meta-Forscher eine neue, verbesserte Methode vorgeschlagen, nämlich das Mask Image Pre-Training (SAMI) unter Verwendung von SAM. Diese Methode kombiniert MAE-Vortrainingstechnologie und SAM-Modelle, um hochwertige vorab trainierte ViT-Encoder zu erhalten. Durch SAMI versuchen Forscher, die Leistung und Effizienz des Modells zu verbessern und bessere Lösungen für Sehaufgaben bereitzustellen. Der Vorschlag dieser Methode bringt neue Ideen und Möglichkeiten zur weiteren Erforschung und Entwicklung der Bereiche Computer Vision und Deep Learning. durch die Kombination verschiedener

Bekanntgabe des Boltzmann-Preises 2022: Gründer von Hopfield Network gewinnt Auszeichnung Bekanntgabe des Boltzmann-Preises 2022: Gründer von Hopfield Network gewinnt Auszeichnung Aug 13, 2023 pm 08:49 PM

Die beiden Wissenschaftler, die den Boltzmann-Preis 2022 gewonnen haben, wurden bekannt gegeben. Diese Auszeichnung wurde vom IUPAP-Komitee für statistische Physik (C3) ins Leben gerufen, um Forscher zu würdigen, die herausragende Leistungen auf dem Gebiet der statistischen Physik erbracht haben. Der Gewinner muss ein Wissenschaftler sein, der zuvor weder einen Boltzmann-Preis noch einen Nobelpreis gewonnen hat. Dieser Preis wurde 1975 ins Leben gerufen und wird alle drei Jahre zum Gedenken an Ludwig Boltzmann, den Begründer der statistischen Physik, verliehen. Grund für die Auszeichnung: In Anerkennung der bahnbrechenden Beiträge von Deepak Dharistheoriginalstatement auf dem Gebiet der statistischen Physik, einschließlich der exakten Lösung selbstorganisierter Systeme kritisches Modell, Schnittstellenwachstum, Störung

MiniGPT-5, das Bild- und Textgenerierung vereinheitlicht, ist da: Aus Token wird Voken, und das Modell kann nicht nur weiterschreiben, sondern auch automatisch Bilder hinzufügen. MiniGPT-5, das Bild- und Textgenerierung vereinheitlicht, ist da: Aus Token wird Voken, und das Modell kann nicht nur weiterschreiben, sondern auch automatisch Bilder hinzufügen. Oct 11, 2023 pm 12:45 PM

Großformatige Modelle schaffen den Sprung zwischen Sprache und Vision und versprechen, Text- und Bildinhalte nahtlos zu verstehen und zu generieren. Einer Reihe aktueller Studien zufolge ist die Integration multimodaler Funktionen nicht nur ein wachsender Trend, sondern hat bereits zu wichtigen Fortschritten geführt, die von multimodalen Gesprächen bis hin zu Tools zur Inhaltserstellung reichen. Große Sprachmodelle haben beispiellose Fähigkeiten beim Verstehen und Generieren von Texten gezeigt. Die gleichzeitige Generierung von Bildern mit kohärenten Texterzählungen ist jedoch noch ein Bereich, der weiterentwickelt werden muss. Kürzlich hat ein Forschungsteam an der University of California, Santa Cruz, MiniGPT-5 vorgeschlagen, einen innovativen Interleaving-Algorithmus, der auf dem Konzept der „generativen Gutscheine“ basiert Sprachgenerierungstechnologie. Papieradresse: https://browse.arxiv.org/p

See all articles