


Treler GTA6 telah dimainkan lebih daripada 1 bilion kali, dan gergasi AI boleh dengan cepat memasuki peranan gangster GTA
Pernahkah anda melihat treler permainan GTA baharu? Dikatakan bahawa treler ini telah memecahkan tiga Rekod Dunia Guinness dan telah ditonton lebih 100 juta kali.
Jika saya memberitahu anda bahawa tiga gergasi AI juga boleh memainkan peranan dalam permainan "Grand Theft Auto", adakah anda masih boleh membezakan mereka?
Tiga Besar AI: Yann LeCun, Geoffrey Hinton dan Yoshua Bengio.
Foto ini disintesis menggunakan model FaceStudio AI Tencent, menunjukkan kesan gaya GTA. Keunikan model AI ini terletak pada pengecaman wataknya yang sangat baik, yang mendorong teknologi "foto AI" yang digunakan secara meluas ke tahap yang lebih tinggi
Dalam perkembangan pesat teknologi kecerdasan buatan hari ini, pemotretan AI telah menjadi AI A arah popular untuk teknologi aplikasi. Dalam bidang aplikasi imej AI +, produk foto AI seperti Miaoya Camera telah menunjukkan potensi dan populariti yang besar. Kamera Miaoya telah menarik banyak perhatian di media sosial hanya beberapa minggu selepas pelancarannya, dan pertumbuhan pesatnya menyerlahkan potensi besar pasaran ini. Walaupun begitu, banyak produk pengambilan foto AI masih mempunyai had teknikal tertentu Sebagai contoh, pengguna perlu memuat naik berbilang foto dengan perbezaan yang besar dan perlu menunggu lama untuk mendapatkan kesan komposit, yang sudah pasti mempengaruhi pengalaman pengguna.
Dalam gelombang inovasi imej yang diterajui oleh kecerdasan buatan ini, hasil penyelidikan terbaharu Tencent FaceStudio menunjukkan penemuan teknologi selanjutnya. Penyelidikan ini bukan sahaja tertumpu kepada mensintesis potret dengan cepat, tetapi juga lebih memfokuskan pada mengekalkan maklumat identiti potret untuk memenuhi keperluan estetik di samping mengekalkan keunikan dan pengiktirafan watak. Ia bukan sahaja mewarisi kelebihan teras algoritma sumber terbuka StableDiffusion, tetapi juga membuat penambahbaikan inovatif dalam berbilang fungsi utama. Yang paling menarik perhatian ialah keupayaannya untuk menggunakan panduan hibrid untuk penjanaan imej, terutamanya dalam memproses foto berbilang orang dan imej yang digayakan. Teknologi teras FaceStudio terletak pada keupayaannya untuk mencipta imej tanpa mengorbankan identiti peribadi sintesis imej watak tercapai. Teknologi sintesis imej AI tradisional sering mengorbankan keunikan dan pengiktirafan watak semasa mengejar keindahan visual. Walau bagaimanapun, melalui mekanisme panduan hibrid lanjutan, FaceStudio dapat mempertimbangkan secara serentak isyarat teks, imej gaya dan imej identiti apabila menjana imej, dengan itu mencapai pemindahan gaya yang pelbagai sambil mengekalkan ciri individu. Ini bukan sahaja satu kejayaan besar dalam teknologi, tetapi juga menyediakan pengguna dengan pilihan sintesis imej yang lebih kaya dan diperibadikan.
Selain itu, mekanisme perhatian silang berbilang identiti unik FaceStudio menjadikannya sangat baik dalam memproses imej yang mengandungi berbilang orang. Kaedah tradisional sering menghadapi masalah membezakan dan mengekalkan ciri-ciri setiap orang dengan tepat apabila memproses imej tersebut. Tetapi mekanisme FaceStudio ini boleh memetakan maklumat ciri identiti berbeza dengan tepat ke bahagian imej yang sepadan, yang sangat baik dalam mengekalkan keunikan setiap watak dan penyelarasan gaya keseluruhan.
FaceStudio menyokong pelbagai aplikasi berkaitan muka yang menarik
- 23
- Alamat halaman utama: https ://icoz69.github.io/facestudio/
- Tinjauan Keseluruhan Kaedah
Ikhtisar KaedahReka Bentuk Tali Boot Hibrid
🎜🎜 bagi reka bentuk muka hibridnya. Pasukan itu menggunakan pendekatan unik yang membolehkan model menerima kedua-dua imej dan isyarat teks secara serentak, dengan itu menghasilkan imej dengan ciri identiti tertentu. Modul panduan berasaskan gesaan imej mengandungi dua sub-modul: 🎜🎜
- Modul Berpandukan Imej: Dalam bahagian ini, FaceStudio menggunakan pengekod visual CLIP untuk memproses imej manusia. Imej ini selalunya digayakan dan mengandungi maklumat visual yang kaya seperti warna, tekstur dan komposisi. Pengekod CLIP dapat mengekstrak ciri gaya kompleks daripada imej ini.
- Modul pengecaman identiti: Selari dengan modul panduan imej, pasukan Tencent juga mereka bentuk modul pengecaman identiti, yang menggunakan model Arcface untuk memproses imej muka individu. Tujuan utamanya adalah untuk mengekstrak ciri identiti utama seperti struktur muka, ekspresi dan maklumat biometrik unik lain daripada imej muka.
Selepas mengekstrak ciri visual imej yang digayakan dan ciri identiti imej muka, kedua-dua set ciri ini digabungkan bersama. Langkah ini dicapai melalui lapisan linear yang menggabungkan kedua-dua ciri untuk mencipta ciri panduan yang komprehensif. Kelebihan kaedah ini ialah ia bukan sahaja mengekalkan identiti watak, tetapi juga menggabungkan gaya dan kandungan tertentu ke dalam proses penjanaan imej
FaceStudio bukan sahaja mempunyai fungsi panduan imej, tetapi juga menyepadukan fungsi panduan teks. Ciri ini dicapai dengan menggunakan model PriorTransformer yang telah terlatih. Model ini dapat memetakan ciri teks CLIP kepada ciri visual CLIP yang sepadan. Kemudian, sama dengan modul panduan gesaan imej, ciri visual ini digabungkan dengan ciri modul pengecaman identiti untuk membentuk ciri panduan komprehensif yang boleh bertindak balas kepada gesaan teks. Akhir sekali, kedua-dua ciri segera ditimbang dan digabungkan untuk mencapai bimbingan hibrid
Kandungan yang perlu ditulis semula ialah: gambar rajah seni bina Facebook Studio
Sintesis imej berbilang orang
Dalam rangka kerja FaceStudio yang dibangunkan oleh pasukan Tencent, terdapat inovasi utama, iaitu bahagian "pemprosesan imej berbilang orang". Bahagian ini memfokuskan pada penggubahan potret berbilang orang dalam satu imej untuk memastikan setiap orang mengekalkan identiti unik mereka dalam imej akhir. Berhadapan dengan imej yang mengandungi berbilang orang, FaceStudio menggunakan mekanisme perhatian khas. Mekanisme ini memastikan bahawa semasa proses sintesis imej, ciri setiap kawasan aksara hanya mengakses maklumat identiti yang sepadan. Ini bermakna model boleh mengawal identiti setiap watak dengan tepat, memastikan ia muncul dengan betul dalam imej akhir. Untuk mencapai kawalan tepat ini, pasukan Tencent menggunakan model pembahagian contoh watak. Model ini dapat mengenal pasti orang yang berbeza dalam imej dan mengaitkan rantau setiap orang dengan ciri identiti yang sepadan. Dengan cara ini, model boleh memastikan maklumat identiti setiap watak dibimbing dengan betul semasa mensintesis imej
Membandingkan kesan FaceStudio dan algoritma garis dasar pada penjanaan imej berbilang orang
Strategi latihan
Pasukan Tencent mereka bentuk strategi latihan untuk FaceStudio yang menyasarkan pembinaan semula imej manusia. Dengan pendekatan ini, mereka menggunakan imej asal dengan kawasan muka bertopeng sebagai input kepada imej manusia yang digayakan, dan pada masa yang sama menggunakan wajah yang dipotong daripada imej yang sama sebagai input kepada identiti. Dengan cara ini, model dapat mengekalkan identiti orang tersebut dengan lebih tepat apabila menjana imej bimbingan. Berbeza daripada kaedah latihan model generatif sedia ada, kaedah ini hanya bergantung pada potret sebagai data latihan dan tidak memerlukan anotasi teks, yang mengurangkan pergantungan pada data beranotasi. Ia boleh menyesuaikan diri dengan lebih baik kepada pelbagai gaya potret
Paparan hasil
FaceStudio menunjukkan kelebihan uniknya dengan menilai persamaan wajah dan masa penjanaan potret. Keputusan percubaan menunjukkan bahawa FaceStudio mengambil masa kurang daripada 4 saat untuk menjana satu potret, manakala DreamBooth, algoritma popular berdasarkan pengoptimuman, mengambil masa sehingga 6 minit. Pada masa yang sama, FaceStudio lebih baik mengekalkan ciri potret dan mempunyai persamaan wajah yang lebih baik. Keputusan percubaan dibandingkan seperti berikut:
Para penyelidik membandingkan FaceStudio dengan algoritma model penjanaan potret terbaik semasa, menggunakan imej yang sama seperti sampel. Hasil perbandingan menunjukkan bahawa FaceStudio mencapai tahap keputusan yang lebih baik atau sama pada hampir semua sampel. Ini seterusnya membuktikan bahawa FaceStudio mempunyai prestasi keteguhan dan generalisasi yang kuat. Keputusan perbandingan khusus adalah seperti berikut:
🎜Di samping itu, pelbagai aplikasi penjanaan imej wajah yang unik ditunjukkan dalam eksperimen FaceStudo, termasuk penjanaan berpandu pengadunan identiti dan penggabungan imej teks
Eksperimen penjanaan imej berpandu teks dan imej
Sampel potret yang dihasilkan oleh FaceStudio mempunyai pelbagai gaya
Ringkasan
Ringkasan Wajah logo mewakili major maju dalam bidang penjanaan imej yang diperibadikan. Ia menawarkan pilihan penggayaan yang kaya dan penjanaan imej dipacu teks sambil mengekalkan identiti watak. Keupayaan ini bukan sahaja bernilai tinggi kepada industri penciptaan artistik dan hiburan, tetapi juga boleh memainkan peranan penting dalam bidang seperti pengiklanan, pengeluaran media digital dan penciptaan kandungan yang diperibadikan. Dengan mengawal identiti dan gaya dalam imej dengan tepat, FaceStudio membuka laluan baharu untuk pembangunan masa depan teknologi penjanaan imej, mewar-warkan inovasi dan perubahan dalam bidang ini
Atas ialah kandungan terperinci Treler GTA6 telah dimainkan lebih daripada 1 bilion kali, dan gergasi AI boleh dengan cepat memasuki peranan gangster GTA. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



DDREASE ialah alat untuk memulihkan data daripada fail atau peranti sekat seperti cakera keras, SSD, cakera RAM, CD, DVD dan peranti storan USB. Ia menyalin data dari satu peranti blok ke peranti lain, meninggalkan blok data yang rosak dan hanya memindahkan blok data yang baik. ddreasue ialah alat pemulihan yang berkuasa yang automatik sepenuhnya kerana ia tidak memerlukan sebarang gangguan semasa operasi pemulihan. Selain itu, terima kasih kepada fail peta ddasue, ia boleh dihentikan dan disambung semula pada bila-bila masa. Ciri-ciri utama lain DDREASE adalah seperti berikut: Ia tidak menimpa data yang dipulihkan tetapi mengisi jurang sekiranya pemulihan berulang. Walau bagaimanapun, ia boleh dipotong jika alat itu diarahkan untuk melakukannya secara eksplisit. Pulihkan data daripada berbilang fail atau blok kepada satu

0. Apakah fungsi artikel ini? Kami mencadangkan DepthFM: model anggaran kedalaman monokular generatif yang serba boleh dan pantas. Sebagai tambahan kepada tugas anggaran kedalaman tradisional, DepthFM juga menunjukkan keupayaan terkini dalam tugas hiliran seperti mengecat kedalaman. DepthFM cekap dan boleh mensintesis peta kedalaman dalam beberapa langkah inferens. Mari kita baca karya ini bersama-sama ~ 1. Tajuk maklumat kertas: DepthFM: FastMonocularDepthEstimationwithFlowMatching Pengarang: MingGui, JohannesS.Fischer, UlrichPrestel, PingchuanMa, Dmytr

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Menghadapi ketinggalan, sambungan data mudah alih perlahan pada iPhone? Biasanya, kekuatan internet selular pada telefon anda bergantung pada beberapa faktor seperti rantau, jenis rangkaian selular, jenis perayauan, dsb. Terdapat beberapa perkara yang boleh anda lakukan untuk mendapatkan sambungan Internet selular yang lebih pantas dan boleh dipercayai. Betulkan 1 – Paksa Mulakan Semula iPhone Kadangkala, paksa memulakan semula peranti anda hanya menetapkan semula banyak perkara, termasuk sambungan selular. Langkah 1 – Hanya tekan kekunci naikkan kelantangan sekali dan lepaskan. Seterusnya, tekan kekunci Turun Kelantangan dan lepaskannya semula. Langkah 2 - Bahagian seterusnya proses adalah untuk menahan butang di sebelah kanan. Biarkan iPhone selesai dimulakan semula. Dayakan data selular dan semak kelajuan rangkaian. Semak semula Betulkan 2 – Tukar mod data Walaupun 5G menawarkan kelajuan rangkaian yang lebih baik, ia berfungsi lebih baik apabila isyarat lemah

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Saya menangis hingga mati. Dunia sedang membina model besar. Data di Internet tidak mencukupi. Model latihan kelihatan seperti "The Hunger Games", dan penyelidik AI di seluruh dunia bimbang tentang cara memberi makan data ini kepada pemakan yang rakus. Masalah ini amat ketara dalam tugas berbilang modal. Pada masa mereka mengalami kerugian, pasukan pemula dari Jabatan Universiti Renmin China menggunakan model baharu mereka sendiri untuk menjadi yang pertama di China untuk menjadikan "suapan data yang dijana model itu sendiri" menjadi kenyataan. Selain itu, ia merupakan pendekatan serampang dua mata dari segi pemahaman dan sisi penjanaan Kedua-dua pihak boleh menjana data baharu berbilang modal yang berkualiti tinggi dan memberikan maklum balas data kepada model itu sendiri. Apakah model? Awaker 1.0, model berbilang modal besar yang baru sahaja muncul di Forum Zhongguancun. Siapa pasukan itu? Enjin Sophon. Diasaskan oleh Gao Yizhao, pelajar kedoktoran di Sekolah Kecerdasan Buatan Hillhouse Universiti Renmin.

Apa? Adakah Zootopia dibawa menjadi realiti oleh AI domestik? Didedahkan bersama-sama dengan video itu ialah model penjanaan video domestik berskala besar baharu yang dipanggil "Keling". Sora menggunakan laluan teknikal yang serupa dan menggabungkan beberapa inovasi teknologi yang dibangunkan sendiri untuk menghasilkan video yang bukan sahaja mempunyai pergerakan yang besar dan munasabah, tetapi juga mensimulasikan ciri-ciri dunia fizikal dan mempunyai keupayaan gabungan konsep dan imaginasi yang kuat. Mengikut data, Keling menyokong penjanaan video ultra panjang sehingga 2 minit pada 30fps, dengan resolusi sehingga 1080p dan menyokong berbilang nisbah aspek. Satu lagi perkara penting ialah Keling bukanlah demo atau demonstrasi hasil video yang dikeluarkan oleh makmal, tetapi aplikasi peringkat produk yang dilancarkan oleh Kuaishou, pemain terkemuka dalam bidang video pendek. Selain itu, tumpuan utama adalah untuk menjadi pragmatik, bukan untuk menulis cek kosong, dan pergi ke dalam talian sebaik sahaja ia dikeluarkan Model besar Ke Ling telah pun dikeluarkan di Kuaiying.

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh
