OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar-AI-php.cn

Jadual Kandungan

Syarikat ini bijak, tetapi juga sangat hipokrit

Rumah

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 05, 2023 pm 03:03 PM

Google ai

Dalam era baharu AI generatif, syarikat teknologi besar sedang melaksanakan strategi "buat seperti yang saya katakan, bukan buat seperti yang saya lakukan" apabila ia melibatkan penggunaan kandungan dalam talian. Sedikit sebanyak, strategi ini boleh dikatakan sebagai double standard dan penyalahgunaan hak bersuara.

Pada masa yang sama, memandangkan model bahasa besar (LLM) menjadi trend arus perdana dalam pembangunan AI, kedua-dua syarikat besar dan syarikat baharu tidak berusaha untuk membangunkan model besar mereka sendiri. Antaranya, data latihan adalah prasyarat penting untuk keupayaan model besar.

Baru-baru ini, menurut laporan Insider, OpenAI yang disokong Microsoft, Google dan Anthropic yang disokongnya telah menggunakan kandungan dalam talian dari tapak web atau syarikat lain untuk latihan selama bertahun-tahun. model AI generatif. Ini semua dilakukan tanpa meminta kebenaran khusus dan akan membentuk sebahagian daripada pertarungan undang-undang untuk menentukan masa depan web dan cara undang-undang hak cipta digunakan dalam era baharu ini.

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

Syarikat teknologi besar ini mungkin berhujah bahawa mereka digunakan secara adil, sama ada perkara itu benar-benar berlaku untuk dibahaskan. Tetapi mereka tidak akan membiarkan kandungan mereka digunakan untuk melatih model AI yang lain. Oleh itu, kami tidak boleh tidak bertanya, mengapa syarikat teknologi besar ini boleh menggunakan kandungan dalam talian syarikat lain apabila melatih model besar?

Syarikat ini bijak, tetapi juga sangat hipokrit

Adakah terdapat bukti kukuh untuk dakwaan bahawa syarikat teknologi besar menggunakan kandungan dalam talian orang lain tetapi tidak membenarkan orang lain untuk menggunakan mereka sendiri? Ini boleh dilihat dari segi perkhidmatan dan penggunaan beberapa produk mereka.

Pertama, mari kita lihat Claude, pembantu AI yang serupa dengan ChatGPT yang dilancarkan oleh Anthropic. Sistem boleh menyelesaikan tugas seperti ringkasan ringkasan, carian, bantuan dalam penciptaan, soal jawab, dan pengekodan. Ia telah dinaik taraf semula beberapa ketika dahulu dan token konteks telah dikembangkan kepada 100k, yang telah mempercepatkan kelajuan pemprosesan.

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

Syarat perkhidmatan Claude adalah seperti berikut. Anda tidak boleh mengakses atau menggunakan Perkhidmatan dengan cara berikut (sebahagian daripadanya disenaraikan di sini Jika mana-mana sekatan ini tidak konsisten atau tidak jelas dengan Polisi Penggunaan Boleh Diterima, yang kedua akan diguna pakai:

Membangunkan mana-mana produk atau perkhidmatan yang bersaing dengan Perkhidmatan kami, termasuk membangunkan atau melatih mana-mana AI atau algoritma atau model pembelajaran mesin
Dari Perangkak kami, merangkak atau sebaliknya dapatkan data atau maklumat dalam Perkhidmatan

Syarat Perkhidmatan Claude Alamat: https://vault.pactsafe.io/s /9f502c93-cb5c-4571-b205-1e479da61794 /legal.html#terms

Begitu juga, Syarat Penggunaan AI Generatif Google menyatakan, “Anda tidak boleh menggunakan Perkhidmatan Untuk membangunkan model pembelajaran mesin atau teknologi berkaitan 》

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

Alamat Penggunaan Google Generative AI: https: //policies.google.com/terms/generative-ai

Bagaimana pula dengan syarat penggunaan OpenAI? Sama seperti Google, "Anda tidak boleh menggunakan output daripada Perkhidmatan untuk membangunkan model yang bersaing dengan OpenAI." >Alamat penggunaan OpenAI: https://openai.com/policies/terms-of-use

Syarikat ini bijak dan mereka tahu bahawa kandungan berkualiti tinggi adalah penting untuk melatih model AI baharu, jadi wajar untuk tidak membenarkan orang lain menggunakan output mereka dengan cara ini. Tetapi mereka tidak ragu-ragu dalam menggunakan data orang lain untuk melatih model mereka sendiri. Bagaimana untuk menjelaskan perkara ini?

OpenAI, Google dan Anthropic menolak permintaan Insider untuk komen dan tidak membalas.

Reddit, Twitter dan Lain-Lain: Cukuplah

Sebenarnya, syarikat lain tidak gembira apabila menyedari apa yang berlaku. Pada bulan April, Reddit, yang telah digunakan selama bertahun-tahun untuk melatih model AI, merancang untuk mula mengecas untuk akses kepada datanya.

Ketua Pegawai Eksekutif Reddit Steve Huffman berkata, "Korpus data Reddit terlalu berharga untuk memberikan nilai itu kepada syarikat terbesar di dunia secara percuma

Juga pada April tahun ini, Musk menuduh Microsoft, penyokong utama OpenAI, secara haram menggunakan data Twitter untuk melatih model AI. "Masa untuk litigasi," tulisnya di Twitter.

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

Namun, sebagai tindak balas kepada komen Insider, Microsoft berkata, “Terdapat banyak perkara yang salah dengan premis ini sehingga saya tidak tahu di mana untuk memulakan. 》

Ketua Pegawai Eksekutif OpenAI Sam Altman cuba mendalami masalah ini dengan meneroka model AI baharu yang menghormati hak cipta. Menurut Axios, dia baru-baru ini berkata, "Kami sedang cuba membangunkan model baharu. Jika sistem AI menggunakan kandungan anda atau menggunakan gaya anda, anda akan dibayar untuknya." 🎜>

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar Sam Altman

Penerbit (termasuk Orang Dalam) semuanya adalah kepentingan peribadi. Selain itu, beberapa penerbit, termasuk U.S. News Corp., sudah pun mendesak syarikat teknologi membayar untuk menggunakan kandungan mereka untuk melatih model AI.

Kaedah latihan semasa model AI "memecahkan" rangkaian

Seorang bekas eksekutif Microsoft berkata mesti ada masalah dengan perkara ini. Veteran Microsoft dan pembangun perisian terkenal Steven Sinofsky percaya bahawa kaedah latihan semasa model AI "memecahkan" rangkaian.

OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar

Steven Sinofsky

Dia menolak Dia menulis, "Pada masa lalu, data yang dirangkak digunakan sebagai pertukaran untuk kadar klik lalu. Tetapi kini ia hanya digunakan untuk melatih model dan tidak membawa apa-apa nilai kepada pencipta dan pemilik hak cipta." >Mungkin, apabila lebih banyak syarikat bangun, penggunaan data yang tidak sekata dalam era AI generatif ini akan diubah tidak lama lagi.

Atas ialah kandungan terperinci OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Di mana untuk mencari kad kunci kawalan kren di atomfall

3 minggu yang lalu By DDD

Penjimatan di R.E.P.O. Dijelaskan (dan simpan fail)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows - Cara Mencari Orang Panda

4 minggu yang lalu By DDD

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7569

Tutorial CakePHP

1386

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

107

Tunjukkan Lagi

Related knowledge

Cara Memeriksa Konfigurasi HDFS CentOS Apr 14, 2025 pm 07:21 PM

Panduan Lengkap untuk Memeriksa Konfigurasi HDFS Dalam Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk memeriksa konfigurasi dan menjalankan status HDFS secara berkesan pada sistem CentOS. Langkah -langkah berikut akan membantu anda memahami sepenuhnya persediaan dan operasi HDFS. Sahkan Pembolehubah Alam Sekitar Hadoop: Pertama, pastikan pembolehubah persekitaran Hadoop ditetapkan dengan betul. Di terminal, laksanakan arahan berikut untuk mengesahkan bahawa Hadoop dipasang dan dikonfigurasi dengan betul: Hadoopversion Semak fail konfigurasi HDFS: Fail konfigurasi teras HDFS terletak di/etc/hadoop/conf/direktori, di mana core-site.xml dan hdfs-site.xml adalah kritikal. gunakan

Baris arahan shutdown centos Apr 14, 2025 pm 09:12 PM

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

CentOS memasang MySQL Apr 14, 2025 pm 08:09 PM

Memasang MySQL pada CentOS melibatkan langkah -langkah berikut: Menambah sumber MySQL YUM yang sesuai. Jalankan YUM Pasang Perintah MySQL-Server untuk memasang pelayan MySQL. Gunakan perintah mysql_secure_installation untuk membuat tetapan keselamatan, seperti menetapkan kata laluan pengguna root. Sesuaikan fail konfigurasi MySQL seperti yang diperlukan. Tune parameter MySQL dan mengoptimumkan pangkalan data untuk prestasi.

Penjelasan terperinci mengenai Prinsip Docker Apr 14, 2025 pm 11:57 PM

Docker menggunakan ciri -ciri kernel Linux untuk menyediakan persekitaran berjalan yang cekap dan terpencil. Prinsip kerjanya adalah seperti berikut: 1. Cermin digunakan sebagai templat baca sahaja, yang mengandungi semua yang anda perlukan untuk menjalankan aplikasi; 2. Sistem Fail Kesatuan (Unionfs) menyusun pelbagai sistem fail, hanya menyimpan perbezaan, menjimatkan ruang dan mempercepatkan; 3. Daemon menguruskan cermin dan bekas, dan pelanggan menggunakannya untuk interaksi; 4. Ruang nama dan cgroups melaksanakan pengasingan kontena dan batasan sumber; 5. Pelbagai mod rangkaian menyokong interkoneksi kontena. Hanya dengan memahami konsep -konsep teras ini, anda boleh menggunakan Docker dengan lebih baik.

Cara menentukan fail header untuk vscode Apr 15, 2025 pm 09:09 PM

Bagaimana untuk menentukan fail header menggunakan kod Visual Studio? Buat fail header dan mengisytiharkan simbol dalam fail header menggunakan nama sufiks .h atau .hpp (seperti kelas, fungsi, pembolehubah) menyusun program menggunakan arahan #include untuk memasukkan fail header dalam fail sumber. Fail header akan dimasukkan dan simbol yang diisytiharkan tersedia.

CentOS8 memulakan semula SSH Apr 14, 2025 pm 09:00 PM

Perintah untuk memulakan semula perkhidmatan SSH ialah: Sistem Restart SSHD. Langkah -langkah terperinci: 1. Akses terminal dan sambungkan ke pelayan; 2. Masukkan arahan: SistemCtl Restart SSHD; 3. Sahkan Status Perkhidmatan: Status Sistem SSHD.

Docker menggunakan Yaml Apr 15, 2025 am 07:21 AM

YAML digunakan untuk mengkonfigurasi bekas, imej, dan perkhidmatan untuk Docker. Untuk mengkonfigurasi: Untuk bekas, tentukan nama, imej, pelabuhan, dan pembolehubah persekitaran dalam docker-compose.yml. Untuk imej, imej asas, membina arahan, dan arahan lalai disediakan dalam Dockerfile. Untuk perkhidmatan, tetapkan nama, cermin, port, kelantangan, dan pembolehubah persekitaran dalam docker-service.yml.

Adakah anda menggunakan C dalam Kod Visual Studio Apr 15, 2025 pm 08:03 PM

Menulis C dalam kod VS bukan sahaja boleh dilaksanakan, tetapi juga cekap dan elegan. Kuncinya adalah untuk memasang sambungan C/C yang sangat baik, yang menyediakan fungsi seperti penyelesaian kod, penonjolan sintaks, dan debugging. Keupayaan debugging Vs Code membantu anda dengan cepat mencari pepijat, manakala output Printf adalah kaedah debugging yang lama tetapi berkesan. Di samping itu, apabila peruntukan memori dinamik, nilai pulangan perlu diperiksa dan memori dibebaskan untuk mengelakkan kebocoran memori, dan menyahpepijat isu -isu ini mudah dalam kod VS. Walaupun kod VS tidak dapat membantu secara langsung dengan pengoptimuman prestasi, ia menyediakan persekitaran pembangunan yang baik untuk analisis mudah prestasi kod. Tabiat pengaturcaraan yang baik, kebolehbacaan dan penyelenggaraan juga penting. Bagaimanapun, kod vs adalah

See all articles