


Ein Schnappschuss kann ein Video wiederherstellen! Das AAAI-Papier von 2023 schlägt einen neuen Algorithmus für die Snapshot-Komprimierung der Bildgebung vor
Dieser Artikel wird mit Genehmigung von AI New Media Qubit (öffentliche Konto-ID: QbitAI) nachgedruckt. Bitte wenden Sie sich für einen Nachdruck an die Quelle.
Mit der Entwicklung optischer Algorithmen können wir nun hochdimensionale Signale mit niedrigdimensionalen Sensoren „erfassen“.
Zum Beispiel ist dies ein „Foto“, das wir mit einem 2D-Sensor aufgenommen haben, das voller verrauschter Daten aussieht:
Durch die in diesem „Foto“ enthaltenen Daten können wir jedoch ein wiederherstellen dynamisches Video!
Es klingt magisch, aber es kann tatsächlich durch eine Methode namens Snapshot Compressive Imaging (Snapshot Compressive Imaging, SCI) erreicht werden.
Mit dieser Methode können hochdimensionale Daten als zweidimensionale Messung abgetastet werden, wodurch eine effiziente Erfassung hochdimensionaler visueller Signale erreicht wird.
Nehmen Sie eine Kamera als Beispiel, obwohl es sich um einen 2D-Sensor handelt, wenn Sie eine Möglichkeit finden, ein digitales Mikrospiegelgerät-Messgerät hinter dem Kameraobjektiv anzubringen (Digital Micromirror Devices, DMD), ist dies ein Gerät, das genau kann Steuern der Lichtquelle ) gibt es eine Möglichkeit, mit gewöhnlichen Kameras Dimensionsreduktionsmessungen an hochdimensionalen Daten durchzuführen, einfache 2D-Daten zu erhalten und dann hochdimensionale visuelle 3D-Signale wiederherzustellen.
Zum Beispiel ist die Bildrate einer gewöhnlichen Kamera sehr niedrig und sie kann nur ein paar Dutzend Fotos pro Sekunde aufnehmen (vorausgesetzt, sie kann 30 Fotos aufnehmen).
Wenn wir sich schnell bewegende Objekte aufnehmen möchten, wird dieses digitale Mikrospiegelgerät, solange wir es zu einer gewöhnlichen Kamera hinzufügen, „das Videosignal entlang der Zeitdimension komprimieren“ und jedes Mal, wenn ein Foto aufgenommen wird, mehrere Frames oder sogar Dutzende Frames von Fotos (das heißt, ein Video wird wiederhergestellt) . Angenommen, die voreingestellte Komprimierungsrate für das digitale Mikrospiegelgerät beträgt 10. Wenn Sie jetzt ein Foto aufnehmen, können 10 Fotos
(oder ein Video mit 10 Einzelbildern) wiederhergestellt werden, und die Kamera hat auch eine direkte Erhöhung der Bildrate um das Zehnfache, und es können 300 Fotos in einer Sekunde aufgenommen werden.Jetzt stellt sich die Frage, wie man aus diesen komprimierten niedrigdimensionalen Messdaten, die Rauschen enthalten, das ursprüngliche hochdimensionale Signal möglichst effizient wiederherstellen kann. Mit der Entwicklung des Deep Learning wurden verschiedene Rekonstruktionsalgorithmen vorgeschlagen. Allerdings sind die Genauigkeit und Stabilität der durch diese Algorithmen rekonstruierten Signale immer noch nicht gut genug.
Zu diesem Zweck haben Forscher derHong Kong University, der Chinese Academy of Sciences und der Westlake University
eine Deep Equilibrium Models(DEQ)
-Methode für die Komprimierung von Video-Schnappschüssen vorgeschlagen, die in AAAI 2023 aufgenommen wurde:
Diese Methode verbessert nicht nur die Rekonstruktionsgenauigkeit und -stabilität, sondern optimiert auch den Speicherbedarf weiter –
Der Algorithmus benötigt während des Trainings und Tests nur
ändert sich nicht mit der Netzwerktiefe
(während sich bei Verwendung herkömmlicher Optimierungsmethoden der verbrauchte Speicherplatz nicht mit der Anzahl der Iterationen ändert) . Lass uns einen Blick darauf werfen. Was ist die Schwierigkeit bei der Snapshot-Komprimierung?
Dank der Entwicklung neuartiger optischer Hardware und Bildgebungsalgorithmen kann das Snapshot Compressive Imaging (SCI)-System hochdimensionale Daten als zweidimensionale Messung in einer Snapshot-Messung erfassen und so eine effiziente Erfassung hochdimensionaler Daten erreichen visuelles Signal. Wie in Abbildung 1 dargestellt, kann das SCI-System in zwei Teile unterteilt werden, Hardware-Kodierung und Software-Dekodierung:
△ Abbildung 1. Das Snapshot-komprimierte Bildgebungssystem verwendet niedrigdimensionale Sensoren, um hochdimensionale Daten zu erfassen bei Schnappschussmessungen
Nehmen Sie als Beispiel das Aufnehmen von Videos: Das SCI-System tastet die Videodaten ab und komprimiert sie anschließend in der Zeitdimension. Anschließend wird ein Algorithmus verwendet, um die ursprünglichen hochdimensionalen Videodaten zu rekonstruieren.
Wir betrachten hier das Video-SCI-System, wie in Video 1 gezeigt. Der obere Teil des Videos zeigt die vom Hardware-Teil des SCI-Systems erhaltenen Komprimierungsmessungen und der untere Teil des Videos zeigt die mit dem wiederhergestellten Videoergebnisse Algorithmus, der in der Arbeit vorgeschlagen wird.
Wie man ein Video aus verrauschten komprimierten Messungen wiederherstellt
.Obwohl es viele Rekonstruktionsmethoden gibt, die das umgekehrte Problem der SCI-Bildgebung lösen können, weist jede dieser Methoden ihre eigenen Mängel auf, wie in Abbildung 2 dargestellt:
△Abbildung 2. Bestehende Methoden der SCI-Rekonstruktionsmethoden und Hauptprobleme
Unter ihnen weist der traditionelle Optimierungsalgorithmus (a) eine begrenzte Leistung auf.
Mit der Entwicklung von Deep Learning, End-to-End Deep Networks (b) und Entfaltungsmethoden (c) können sie zwar die Leistung verbessern, leiden aber zwangsläufig unter einem wachsenden Gedächtnis, wenn die Tiefe des Layer-Netzwerks zunimmt. Belegungsanforderungen und das Modell muss sorgfältig entworfen werden.
Plug and Play(PnP)Framework(d)Obwohl dieser Algorithmus die Vorteile der datengesteuerten Regularisierung und der flexiblen iterativen Optimierung nutzt, muss er durch geeignete Parametereinstellungen genaue Ergebnisse gewährleisten und erfordert sogar einige komplexe Strategien, um zufriedenstellende Ergebnisse zu erzielen Leistung.
Im Vergleich zu anderen Methoden schlägt das Papier neue Algorithmen DE-RNN und DE-GAP vor, um die Genauigkeit und Stabilität der Rekonstruktionsergebnisse sicherzustellen. Die Leistung der Rekonstruktionsergebnisse kann auf ein höheres Niveau konvergieren, wie in Abbildung 3 dargestellt Gezeigt:
△ Abbildung 3. Vergleich der Rekonstruktionsergebnisse zwischen DE-GAP und anderen Methoden
Generell sind die Rekonstruktionsergebnisse früherer Methoden wie RNN und PnP instabil und die Leistung verschlechtert sich langfristig sogar Iterationen.
Allerdings können die Ergebnisse der DE-GAP-Rekonstruktion die Leistungsverbesserung aufrechterhalten, wenn die Anzahl der Iterationen zunimmt, und schließlich zu einem stabilen Ergebnis konvergieren.
Wie geht das?
Einführung fortschrittlicher Modelle zur Verbesserung der Leistung
Um die Probleme früherer Methoden zu lösen und eine fortgeschrittenere SCI-Rekonstruktion zu erreichen, schlägt dieser Artikel erstmals eine neue Idee vor –
Verwendung des DEQ-Modells zur Lösung des inversen Problems Frage zur Video-SCI-Rekonstruktion.
Das DEQ-Modell wurde erstmals 2019 vorgeschlagen und wird hauptsächlich bei umfangreichen Sprachverarbeitungsaufgaben mit langen Sequenzen in der Verarbeitung natürlicher Sprache verwendet.
Wie in Abbildung 4 gezeigt, kann das DEQ-Modell den Fixpunkt im Prozess der Vorwärtsausbreitung und Rückausbreitung durch Wurzelfindungsmethoden wie die Newton-Iterationsmethode direkt lösen und so effektiv Unendlichkeit erreichen, indem nur Speicher auf konstanter Ebene verwendet wird :
△ Abbildung 4. Festpunktmethode zur Lösung des DEQ-Modells (links) und Speichernutzung auf konstantem Niveau (rechts)
(Abbildung 4 stammt aus dem Artikel: S. Bai et al., „ Deep Equilibrium Models“, NeurIPS 2019.)
In diesem Artikel wird das DEQ-Modell zum ersten Mal auf zwei bestehende Video-SCI-Rekonstruktions-Frameworks angewendet: RNN und PnP.
Der Effekt ist auch sehr gut, wenn ein unendlich tiefes Netzwerk nur mit Speicher auf konstantem Niveau realisiert wird.
Wie in Abbildung 5 gezeigt, entwirft das Papier iterative Funktionen in Kombination mit dem DEQ-Modell für RNN bzw. PnP, wobei x das Rekonstruktionsergebnis, y die Kompressionsmessung und Φ die Messmatrix ist:(Einzelheiten zum spezifischen Ableitungsprozess sowie zur Vorwärts- und Rückwärtsausbreitung finden Sie im Dokument)
Was sind die experimentellen Ergebnisse? In der Arbeit wurden Experimente mit sechs klassischen SCI-Datensätzen und realen Daten durchgeführt. Im Vergleich zu früheren Methoden sind die Rekonstruktionsergebnisse insgesamt besser. Wie in Tabelle 1 gezeigt, erreicht diese Methode im Durchschnitt eine Verbesserung des PSNR um etwa 0,1 dB und eine Verbesserung des SSIM um etwa 0,04. Die Verbesserung von SSIM zeigt, dass diese Methode Bilder mit relativ feinen Strukturen rekonstruieren kann:△Abbildung 6
Abbildung 7 ist ein Vergleich der Rekonstruktionsergebnisse verschiedener Algorithmen anhand realer Daten, und der Effekt ist im Vergleich besser:
△Abbildung 7
Mehr experimentelle Ergebnisse können sein Papier gesehen.
Derzeit ist der Papiercode Open Source und interessierte Freunde können ihn verwenden~
(Am Ende des Artikels ist auch das Erklärungsvideo des Autors angehängt, in dem die ausführlichen und einfachen Dinge erklärt werden)
Papieradresse:
https://www.php.cn/link/b8002139cdde66b87638f7f91d169d96
Codeadresse:
https ://www.php.cn/link /fa95123aa5f89781ed4e89a55eb2edcc
Erklärvideo des Autors:
Englisch: https://www. bilibili.com/video /BV1X54y1g7D9/
Chinesisch: https://www.bilibili.com/video/BV1V54y137QK/
Plastisches Kantonesisch: https://www.bilibili.com/video/BV122 4y1G7ee/
Das obige ist der detaillierte Inhalt vonEin Schnappschuss kann ein Video wiederherstellen! Das AAAI-Papier von 2023 schlägt einen neuen Algorithmus für die Snapshot-Komprimierung der Bildgebung vor. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

AI Hentai Generator
Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen



Mit dem Aufkommen von Kurzvideoplattformen ist Douyin zu einem unverzichtbaren Bestandteil des täglichen Lebens eines jeden geworden. Auf TikTok können wir interessante Videos aus aller Welt sehen. Manche Leute posten gerne die Videos anderer Leute, was die Frage aufwirft: Verstößt Douyin gegen das Posten der Videos anderer Leute? In diesem Artikel wird dieses Problem erörtert und Ihnen erklärt, wie Sie Videos ohne Rechtsverletzung bearbeiten und Probleme mit Rechtsverletzungen vermeiden können. 1. Verstößt es gegen Douyins Veröffentlichung von Videos anderer Personen? Gemäß den Bestimmungen des Urheberrechtsgesetzes meines Landes stellt die unbefugte Nutzung der Werke des Urheberrechtsinhabers ohne die Erlaubnis des Urheberrechtsinhabers einen Verstoß dar. Daher stellt das Posten von Videos anderer Personen auf Douyin ohne die Erlaubnis des ursprünglichen Autors oder Urheberrechtsinhabers einen Verstoß dar. 2. Wie bearbeite ich ein Video ohne Urheberrechtsverletzung? 1. Verwendung von gemeinfreien oder lizenzierten Inhalten: Öffentlich

Wie entferne ich Wasserzeichen aus Videos in Wink? Es gibt ein Tool zum Entfernen von Wasserzeichen aus Videos in Wink, aber die meisten Freunde wissen nicht, wie man Wasserzeichen aus Videos in Wink entfernt Vom Herausgeber bereitgestelltes Text-Tutorial, interessierte Benutzer kommen vorbei und schauen es sich an! So entfernen Sie das Video-Wasserzeichen in Wink: 1. Öffnen Sie zunächst die Wink-App und wählen Sie im Startseitenbereich die Funktion [Wasserzeichen entfernen] aus. 2. Wählen Sie dann das Video aus, bei dem Sie das Wasserzeichen entfernen möchten in der oberen rechten Ecke nach der Bearbeitung des Videos [√] 4. Klicken Sie abschließend auf [Ein-Klick-Drucken] und dann auf [Verarbeiten].

Douyin, die nationale Kurzvideoplattform, ermöglicht uns nicht nur, in unserer Freizeit eine Vielzahl interessanter und neuartiger Kurzvideos zu genießen, sondern gibt uns auch eine Bühne, um uns zu zeigen und unsere Werte zu verwirklichen. Wie kann man also Geld verdienen, indem man Videos auf Douyin veröffentlicht? Dieser Artikel wird diese Frage ausführlich beantworten und Ihnen dabei helfen, mit TikTok mehr Geld zu verdienen. 1. Wie kann man mit dem Posten von Videos auf Douyin Geld verdienen? Nachdem Sie ein Video gepostet und eine bestimmte Anzahl an Aufrufen auf Douyin erreicht haben, haben Sie die Möglichkeit, am Werbe-Sharing-Plan teilzunehmen. Diese Einkommensmethode ist eine der bekanntesten unter Douyin-Benutzern und stellt auch für viele YouTuber die Haupteinnahmequelle dar. Douyin entscheidet anhand verschiedener Faktoren wie Kontogewicht, Videoinhalt und Publikumsfeedback, ob Möglichkeiten zum Teilen von Werbung bereitgestellt werden sollen. Die TikTok-Plattform ermöglicht es Zuschauern, ihre Lieblingsschöpfer durch das Versenden von Geschenken zu unterstützen.

Auf iOS-Geräten können Sie mit der Kamera-App Zeitlupenvideos aufnehmen, oder sogar 240 Bilder pro Sekunde, wenn Sie das neueste iPhone besitzen. Mit dieser Funktion können Sie High-Speed-Aktionen detailreich erfassen. Aber manchmal möchten Sie vielleicht Zeitlupenvideos mit normaler Geschwindigkeit abspielen, damit Sie die Details und das Geschehen im Video besser wahrnehmen können. In diesem Artikel erklären wir alle Methoden zum Entfernen von Zeitlupe aus vorhandenen Videos auf dem iPhone. So entfernen Sie Zeitlupe aus Videos auf dem iPhone [2 Methoden] Sie können die Fotos-App oder die iMovie-App verwenden, um Zeitlupe aus Videos auf Ihrem Gerät zu entfernen. Methode 1: Mit der Fotos-App auf dem iPhone öffnen

1. Öffnen Sie zunächst Weibo auf Ihrem Mobiltelefon und klicken Sie unten rechts auf [Ich] (wie im Bild gezeigt). 2. Klicken Sie dann oben rechts auf [Zahnrad], um die Einstellungen zu öffnen (wie im Bild gezeigt). 3. Suchen und öffnen Sie dann [Allgemeine Einstellungen] (wie im Bild gezeigt). 4. Geben Sie dann die Option [Video Follow] ein (wie im Bild gezeigt). 5. Öffnen Sie dann die Einstellung [Video-Upload-Auflösung] (wie im Bild gezeigt). 6. Wählen Sie abschließend [Originalbildqualität] aus, um eine Komprimierung zu vermeiden (wie im Bild gezeigt).

Wie wandele ich vom UC-Browser heruntergeladene Videos in lokale Videos um? Viele Mobiltelefonbenutzer verwenden gerne den UC-Browser. Sie können nicht nur im Internet surfen, sondern auch verschiedene Videos und Fernsehprogramme online ansehen und ihre Lieblingsvideos auf ihr Mobiltelefon herunterladen. Eigentlich können wir heruntergeladene Videos in lokale Videos konvertieren, aber viele Leute wissen nicht, wie das geht. Daher stellt Ihnen der Editor speziell eine Methode zur Verfügung, mit der Sie die vom UC-Browser zwischengespeicherten Videos in lokale Videos konvertieren können. Methode zum Konvertieren von im UC-Browser zwischengespeicherten Videos in lokale Videos 1. Öffnen Sie den UC-Browser und klicken Sie auf die Option „Menü“. 2. Klicken Sie auf „Download/Video“. 3. Klicken Sie auf „Video zwischengespeichert“. 4. Drücken Sie lange auf ein beliebiges Video. Wenn die Optionen angezeigt werden, klicken Sie auf „Verzeichnis öffnen“. 5. Markieren Sie diejenigen, die Sie herunterladen möchten

Mit dem Aufkommen von Kurzvideoplattformen ist Xiaohongshu für viele Menschen zu einer Plattform geworden, auf der sie ihr Leben teilen, sich ausdrücken und Traffic gewinnen können. Auf dieser Plattform ist die Veröffentlichung von Videoarbeiten eine sehr beliebte Art der Interaktion. Wie veröffentlicht man also Xiaohongshu-Videoarbeiten? 1. Wie veröffentliche ich Xiaohongshu-Videowerke? Stellen Sie zunächst sicher, dass Sie einen Videoinhalt zum Teilen bereit haben. Sie können zum Fotografieren Ihr Mobiltelefon oder eine andere Kameraausrüstung verwenden, Sie müssen jedoch auf die Bildqualität und die Klarheit des Tons achten. 2. Bearbeiten Sie das Video: Um die Arbeit attraktiver zu gestalten, können Sie das Video bearbeiten. Sie können professionelle Videobearbeitungssoftware wie Douyin, Kuaishou usw. verwenden, um Filter, Musik, Untertitel und andere Elemente hinzuzufügen. 3. Wählen Sie ein Cover: Das Cover ist der Schlüssel, um Benutzer zum Klicken zu bewegen. Wählen Sie ein klares und interessantes Bild als Cover, um Benutzer zum Klicken zu bewegen.

Ich habe festgestellt, dass das von einer bestimmten Download-Website heruntergeladene komprimierte Paket nach der Dekomprimierung größer ist als das ursprüngliche komprimierte Paket. Der Unterschied beträgt mehrere zehn KB und mehrere zehn MB. Wenn es auf eine Cloud-Festplatte oder einen kostenpflichtigen Speicherplatz hochgeladen wird, spielt es keine Rolle Wenn die Datei klein ist und viele Dateien vorhanden sind, erhöhen sich die Speicherkosten erheblich. Ich habe einige Recherchen dazu durchgeführt und kann bei Bedarf daraus lernen. Komprimierungsstufe: 9-extreme Komprimierung. Wörterbuchgröße: 256 oder 384. Je stärker das Wörterbuch komprimiert ist, desto langsamer ist der Unterschied in der Komprimierungsrate vor 256 MB. Nach 384 MB gibt es keinen Unterschied in der Komprimierungsrate Parameter: f=BCJ2, die Komprimierungsrate für Test- und Add-Parameter ist höher
