Seit der Veröffentlichung von ChatGPT und Stable Diffusion sind verschiedene verwandte Open-Source-Projekte floriert, was wirklich überwältigend ist.
Heute konzentriere ich mich auf die Auswahl einiger hochwertiger Open-Source-Projekte, die ich mit Ihnen teilen möchte und die für unsere tägliche Arbeit, unser Studium und unser Leben eine große Hilfe sein werden.
Dies ist ein Open-Source-Projekt von Microsoft. In etwas mehr als einer Woche hat es mehr als 23,6.000 Sterne erhalten.
Um es einfach zusammenzufassen: Es handelt sich um ein multimodales Frage- und Antwortsystem.
Unterstützt KI-Malerei, Sprachfragen und -antworten sowie Bildfragen und -antworten und integriert die drei aktuellen Hotspots in der KI-Branche.
Effektanzeige:
Das Systemimplementierungsframework lautet wie folgt:
Dies ist ein Open-Source-Projekt, das „mit großem Aufwand Wunder vollbringt“, Integration der Forschungsergebnisse vieler Parteien: BLIP, CLIP, ChatGPT, pix2pix, inpainting, vqa usw.
Um es ganz klar auszudrücken: Es geht darum, Ihnen beizubringen, wie Sie mit diesen Projekten ein multimodales Frage- und Antwortsystem aufbauen können. Diese Systemarchitektur ist von großem Referenzwert.
Projektadresse:
https://github.com/microsoft/visual-chatgpt
Nur Open Source, frisch und heiß~
Die Funktion ist: Basierend auf einem Bild und einem Audiostück ein Video des Gesichts synthetisieren, das diese Stimme spricht.
In Kombination mit ChatGPT, AIGC und Audio-zu-Text-Konvertierung können virtuelle zweidimensionale oder dreidimensionale Bilder „live“ sein.
Das erzeugte Bild kann direkt mit einem Audiostück abgeglichen werden, um ein synthetisiertes Video zu erzeugen.
Projektadresse:https://github.com/winfredy/sadtalker
3. Kann FateZero
FateZero: Ich kann!
Das linke Bild ist das Originalbild, das rechte Bild ist der generierte Effekt, der Eingabetext lautet:
Pokémon-Animationsstil hinzufügen:
Zum Beispiel: Eichhörnchen frisst Karotte, Kaninchen frisst Aubergine.
Dieses Projekt basiert ebenfalls auf SD, was der Generierung von Videos mit einem Klick einen Schritt näher kommt.
Projektadresse:
https://github.com/chenyangqiqi/fatezero
arXiv Ich glaube, jeder weiß, dass es die beliebteste Paper-Hosting-Website bei Wissenschaftlern und Forschern aus der ganzen Welt ist .Gelehrter.
Um die Effizienz von arXiv-Benutzern beim Lesen von Artikeln zu verbessern, hat jemand ChatPaper als Open-Source-Lösung entwickelt, ein Open-Source-Tool, das ChatGPT verwendet, um arXiv-Artikel zusammenzufassen.
Die Motivation des Entwicklers, er sagte es so:
Kurz gesagt, dieses Projekt kann die neuesten Artikel zu arXiv basierend auf Benutzerschlüsselwörtern herunterladen und dabei die leistungsstarke Zusammenfassungsfähigkeit der ChatGPT3.5-API nutzen in ein festes Format mit wenigen Wörtern und leicht zu lesen.
Gleichzeitig unterstützt das Projekt Einzelpersonen dabei, es selbst einzusetzen oder direkt zu Hugge Face zu gehen, um es zu erleben.
Projektadresse:
https://github.com/kaixindelele/ChatPaper
https://huggingface.co/spaces/wangrongsheng/ChatPaper
In letzter Zeit gibt es zu viele Unternehmen in ChatGPT, Es entstehen auch immer wieder verschiedene verwandte Open-Source-Projekte.
Ich hoffe, diese Projekte können für Sie hilfreich sein.