


OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar
Dalam era baharu AI generatif, syarikat teknologi besar sedang melaksanakan strategi "buat seperti yang saya katakan, bukan buat seperti yang saya lakukan" apabila ia melibatkan penggunaan kandungan dalam talian. Sedikit sebanyak, strategi ini boleh dikatakan sebagai double standard dan penyalahgunaan hak bersuara.
Pada masa yang sama, memandangkan model bahasa besar (LLM) menjadi trend arus perdana dalam pembangunan AI, kedua-dua syarikat besar dan syarikat baharu tidak berusaha untuk membangunkan model besar mereka sendiri. Antaranya, data latihan adalah prasyarat penting untuk keupayaan model besar.
Baru-baru ini, menurut laporan Insider, OpenAI yang disokong Microsoft, Google dan Anthropic yang disokongnya telah menggunakan kandungan dalam talian dari tapak web atau syarikat lain untuk latihan selama bertahun-tahun. model AI generatif. Ini semua dilakukan tanpa meminta kebenaran khusus dan akan membentuk sebahagian daripada pertarungan undang-undang untuk menentukan masa depan web dan cara undang-undang hak cipta digunakan dalam era baharu ini.
Syarikat teknologi besar ini mungkin berhujah bahawa mereka digunakan secara adil, sama ada perkara itu benar-benar berlaku untuk dibahaskan. Tetapi mereka tidak akan membiarkan kandungan mereka digunakan untuk melatih model AI yang lain. Oleh itu, kami tidak boleh tidak bertanya, mengapa syarikat teknologi besar ini boleh menggunakan kandungan dalam talian syarikat lain apabila melatih model besar?
Syarikat ini bijak, tetapi juga sangat hipokrit
Adakah terdapat bukti kukuh untuk dakwaan bahawa syarikat teknologi besar menggunakan kandungan dalam talian orang lain tetapi tidak membenarkan orang lain untuk menggunakan mereka sendiri? Ini boleh dilihat dari segi perkhidmatan dan penggunaan beberapa produk mereka.
Pertama, mari kita lihat Claude, pembantu AI yang serupa dengan ChatGPT yang dilancarkan oleh Anthropic. Sistem boleh menyelesaikan tugas seperti ringkasan ringkasan, carian, bantuan dalam penciptaan, soal jawab, dan pengekodan. Ia telah dinaik taraf semula beberapa ketika dahulu dan token konteks telah dikembangkan kepada 100k, yang telah mempercepatkan kelajuan pemprosesan.
Syarat perkhidmatan Claude adalah seperti berikut. Anda tidak boleh mengakses atau menggunakan Perkhidmatan dengan cara berikut (sebahagian daripadanya disenaraikan di sini Jika mana-mana sekatan ini tidak konsisten atau tidak jelas dengan Polisi Penggunaan Boleh Diterima, yang kedua akan diguna pakai:
- Membangunkan mana-mana produk atau perkhidmatan yang bersaing dengan Perkhidmatan kami, termasuk membangunkan atau melatih mana-mana AI atau algoritma atau model pembelajaran mesin
- Dari Perangkak kami, merangkak atau sebaliknya dapatkan data atau maklumat dalam Perkhidmatan
Syarat Perkhidmatan Claude Alamat: https://vault.pactsafe.io/s /9f502c93-cb5c-4571-b205-1e479da61794 /legal.html#terms
Begitu juga, Syarat Penggunaan AI Generatif Google menyatakan, “Anda tidak boleh menggunakan Perkhidmatan Untuk membangunkan model pembelajaran mesin atau teknologi berkaitan 》
Alamat Penggunaan Google Generative AI: https: //policies.google.com/terms/generative-ai
Bagaimana pula dengan syarat penggunaan OpenAI? Sama seperti Google, "Anda tidak boleh menggunakan output daripada Perkhidmatan untuk membangunkan model yang bersaing dengan OpenAI." >Alamat penggunaan OpenAI: https://openai.com/policies/terms-of-use
Syarikat ini bijak dan mereka tahu bahawa kandungan berkualiti tinggi adalah penting untuk melatih model AI baharu, jadi wajar untuk tidak membenarkan orang lain menggunakan output mereka dengan cara ini. Tetapi mereka tidak ragu-ragu dalam menggunakan data orang lain untuk melatih model mereka sendiri. Bagaimana untuk menjelaskan perkara ini?
OpenAI, Google dan Anthropic menolak permintaan Insider untuk komen dan tidak membalas.
Reddit, Twitter dan Lain-Lain: Cukuplah
Sebenarnya, syarikat lain tidak gembira apabila menyedari apa yang berlaku. Pada bulan April, Reddit, yang telah digunakan selama bertahun-tahun untuk melatih model AI, merancang untuk mula mengecas untuk akses kepada datanya.
Ketua Pegawai Eksekutif Reddit Steve Huffman berkata, "Korpus data Reddit terlalu berharga untuk memberikan nilai itu kepada syarikat terbesar di dunia secara percuma
Juga pada April tahun ini, Musk menuduh Microsoft, penyokong utama OpenAI, secara haram menggunakan data Twitter untuk melatih model AI. "Masa untuk litigasi," tulisnya di Twitter.
Namun, sebagai tindak balas kepada komen Insider, Microsoft berkata, “Terdapat banyak perkara yang salah dengan premis ini sehingga saya tidak tahu di mana untuk memulakan. 》
Ketua Pegawai Eksekutif OpenAI Sam Altman cuba mendalami masalah ini dengan meneroka model AI baharu yang menghormati hak cipta. Menurut Axios, dia baru-baru ini berkata, "Kami sedang cuba membangunkan model baharu. Jika sistem AI menggunakan kandungan anda atau menggunakan gaya anda, anda akan dibayar untuknya." 🎜>
Sam Altman
Penerbit (termasuk Orang Dalam) semuanya adalah kepentingan peribadi. Selain itu, beberapa penerbit, termasuk U.S. News Corp., sudah pun mendesak syarikat teknologi membayar untuk menggunakan kandungan mereka untuk melatih model AI.
Kaedah latihan semasa model AI "memecahkan" rangkaian
Seorang bekas eksekutif Microsoft berkata mesti ada masalah dengan perkara ini. Veteran Microsoft dan pembangun perisian terkenal Steven Sinofsky percaya bahawa kaedah latihan semasa model AI "memecahkan" rangkaian.
Dia menolak Dia menulis, "Pada masa lalu, data yang dirangkak digunakan sebagai pertukaran untuk kadar klik lalu. Tetapi kini ia hanya digunakan untuk melatih model dan tidak membawa apa-apa nilai kepada pencipta dan pemilik hak cipta." >Mungkin, apabila lebih banyak syarikat bangun, penggunaan data yang tidak sekata dalam era AI generatif ini akan diubah tidak lama lagi.
Atas ialah kandungan terperinci OpenAI dan Google bermain-main dengan standard dwi mereka: melatih model besar menggunakan data orang lain, tetapi tidak pernah membenarkan data mereka sendiri bocor keluar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Panduan Lengkap untuk Memeriksa Konfigurasi HDFS Dalam Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk memeriksa konfigurasi dan menjalankan status HDFS secara berkesan pada sistem CentOS. Langkah -langkah berikut akan membantu anda memahami sepenuhnya persediaan dan operasi HDFS. Sahkan Pembolehubah Alam Sekitar Hadoop: Pertama, pastikan pembolehubah persekitaran Hadoop ditetapkan dengan betul. Di terminal, laksanakan arahan berikut untuk mengesahkan bahawa Hadoop dipasang dan dikonfigurasi dengan betul: Hadoopversion Semak fail konfigurasi HDFS: Fail konfigurasi teras HDFS terletak di/etc/hadoop/conf/direktori, di mana core-site.xml dan hdfs-site.xml adalah kritikal. gunakan

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Memasang MySQL pada CentOS melibatkan langkah -langkah berikut: Menambah sumber MySQL YUM yang sesuai. Jalankan YUM Pasang Perintah MySQL-Server untuk memasang pelayan MySQL. Gunakan perintah mysql_secure_installation untuk membuat tetapan keselamatan, seperti menetapkan kata laluan pengguna root. Sesuaikan fail konfigurasi MySQL seperti yang diperlukan. Tune parameter MySQL dan mengoptimumkan pangkalan data untuk prestasi.

Docker menggunakan ciri -ciri kernel Linux untuk menyediakan persekitaran berjalan yang cekap dan terpencil. Prinsip kerjanya adalah seperti berikut: 1. Cermin digunakan sebagai templat baca sahaja, yang mengandungi semua yang anda perlukan untuk menjalankan aplikasi; 2. Sistem Fail Kesatuan (Unionfs) menyusun pelbagai sistem fail, hanya menyimpan perbezaan, menjimatkan ruang dan mempercepatkan; 3. Daemon menguruskan cermin dan bekas, dan pelanggan menggunakannya untuk interaksi; 4. Ruang nama dan cgroups melaksanakan pengasingan kontena dan batasan sumber; 5. Pelbagai mod rangkaian menyokong interkoneksi kontena. Hanya dengan memahami konsep -konsep teras ini, anda boleh menggunakan Docker dengan lebih baik.

Bagaimana untuk menentukan fail header menggunakan kod Visual Studio? Buat fail header dan mengisytiharkan simbol dalam fail header menggunakan nama sufiks .h atau .hpp (seperti kelas, fungsi, pembolehubah) menyusun program menggunakan arahan #include untuk memasukkan fail header dalam fail sumber. Fail header akan dimasukkan dan simbol yang diisytiharkan tersedia.

Perintah untuk memulakan semula perkhidmatan SSH ialah: Sistem Restart SSHD. Langkah -langkah terperinci: 1. Akses terminal dan sambungkan ke pelayan; 2. Masukkan arahan: SistemCtl Restart SSHD; 3. Sahkan Status Perkhidmatan: Status Sistem SSHD.

YAML digunakan untuk mengkonfigurasi bekas, imej, dan perkhidmatan untuk Docker. Untuk mengkonfigurasi: Untuk bekas, tentukan nama, imej, pelabuhan, dan pembolehubah persekitaran dalam docker-compose.yml. Untuk imej, imej asas, membina arahan, dan arahan lalai disediakan dalam Dockerfile. Untuk perkhidmatan, tetapkan nama, cermin, port, kelantangan, dan pembolehubah persekitaran dalam docker-service.yml.

Menulis C dalam kod VS bukan sahaja boleh dilaksanakan, tetapi juga cekap dan elegan. Kuncinya adalah untuk memasang sambungan C/C yang sangat baik, yang menyediakan fungsi seperti penyelesaian kod, penonjolan sintaks, dan debugging. Keupayaan debugging Vs Code membantu anda dengan cepat mencari pepijat, manakala output Printf adalah kaedah debugging yang lama tetapi berkesan. Di samping itu, apabila peruntukan memori dinamik, nilai pulangan perlu diperiksa dan memori dibebaskan untuk mengelakkan kebocoran memori, dan menyahpepijat isu -isu ini mudah dalam kod VS. Walaupun kod VS tidak dapat membantu secara langsung dengan pengoptimuman prestasi, ia menyediakan persekitaran pembangunan yang baik untuk analisis mudah prestasi kod. Tabiat pengaturcaraan yang baik, kebolehbacaan dan penyelenggaraan juga penting. Bagaimanapun, kod vs adalah
