Der große Modelltest ist da! Dieser Artikel wird Ihnen helfen, die Evolutionsgeschichte großer Modelle globaler KI-Giganten zu klären-KI-php.cn

Xi Xiaoyao Science and Technology Talk Original
Autor |. Kleines Drama, Python

Wenn Sie ein Neuling in großen Modellen sind, was werden Sie denken, wenn Sie zum ersten Mal die seltsame Kombination dieser Wörter GPT, PaLm und LLaMA sehen? Wenn ich tiefer gehe und seltsame Wörter wie BERT, BART, RoBERTa und ELMo sehe, die nacheinander auftauchen, frage ich mich, ob ich als Anfänger verrückt werde?

Selbst ein Veteran, der schon lange im kleinen NLP-Kreis tätig ist, ist angesichts der explosiven Entwicklungsgeschwindigkeit großer Modelle möglicherweise verwirrt und nicht in der Lage, mit der schnellen Entwicklung neuer und schneller großer Modelle Schritt zu halten . Zu diesem Zeitpunkt müssen Sie möglicherweise eine umfassende Modellbewertung anfordern, um weiterzuhelfen! Diese große Modellrezension „Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond“, die von Forschern von Amazon, der Texas A&M University und der Rice University ins Leben gerufen wurde, bietet uns eine Möglichkeit, einen „Stammbaum“ zu erstellen. In diesem Artikel haben wir mehr darüber erfahren Vergangenheit, Gegenwart und Zukunft großer Modelle werden von ChatGPT dargestellt. Basierend auf den Aufgaben wurde ein sehr umfassender praktischer Leitfaden für große Modelle erstellt, der uns die Vor- und Nachteile großer Modelle in verschiedenen Aufgaben vorstellte und schließlich auf die aktuelle Situation hinwies Risiken und Herausforderungen des Modells.

Papiertitel:
Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond

Papierlink: https://www.php.cn/link/f50fb34f27bd263e6be8ffcf8967ced0

Projekthomepage: https:// www.php.cn/link/968b15768f3d19770471e9436d97913c

Stammbaum – das vergangene und gegenwärtige Leben großer Models

Die Suche nach der „Quelle allen Übels“ großer Models sollte wahrscheinlich mit dem Artikel „Aufmerksamkeit ist alles, was Sie brauchen“ beginnen ", basierend auf diesem Artikel Ausgehend von Transformer, einem vom Google Machine Translation-Team vorgeschlagenen maschinellen Übersetzungsmodell, das aus mehreren Gruppen von Encoder und Decoder besteht, folgt die Entwicklung großer Modelle im Allgemeinen zwei Wegen. Ein Weg besteht darin, den Decoder-Teil aufzugeben und Verwenden Sie den Encoder nur als Vortrainingsmodell für den Encoder, dessen bekanntester Vertreter die Bert-Familie ist. Diese Modelle begannen, die Methode des „unüberwachten Vortrainings“ auszuprobieren, um große Datenmengen in natürlicher Sprache besser zu nutzen, die leichter zu erhalten sind als andere Daten. Die „unüberwachte“ Methode ist das Masked Language Model (MLM) durch Entfernen der Maske einige Wörter im Satz und lassen Sie das Modell die Fähigkeit erlernen, den Kontext zu verwenden, um die von Mask entfernten Wörter vorherzusagen. Als Bert herauskam, war es auch eine Bombe im Bereich NLP. Gleichzeitig wurde SOTA für viele gängige Aufgaben der Verarbeitung natürlicher Sprache verwendet, wie z. B. Stimmungsanalyse, Erkennung benannter Entitäten usw. Mit Ausnahme von Bert und ALBert vorgeschlagen von Google, herausragende Vertreter der Familie Bert. Darüber hinaus gibt es ERNIE von Baidu, RoBERTa von Meta, DeBERTa von Microsoft usw.