Mari beralih ke awan dan faktor semula kod bersama-sama.
Untuk bidang penyelidikan akademik yang semakin pantas, arXiv ialah platform pracetak kertas yang sangat penting. Seperti Wikipedia, ia adalah organisasi bukan untung.
Pada hari Khamis waktu tempatan, Cornell Tech mengumumkan berita baik bahawa arXiv menerima sumbangan yang besar.
Sebagai pangkalan data bukan untung, arXiv adalah percuma dan boleh diakses oleh semua dan telah lama bergantung pada derma. Cornell Tech mengumumkan bahawa Yayasan Simons dan Yayasan Sains Kebangsaan (NSF) telah menganugerahkan geran berjumlah lebih daripada $10 juta untuk menyokong arXiv.
Menurut laporan, pembiayaan akan membolehkan repositori penyelidikan dengan lebih daripada 2 juta kertas kerja ini dipindahkan ke awan dan memodenkan kodnya untuk memastikan tahap kebolehpercayaan, toleransi kesalahan dan kebolehaksesan yang lebih tinggi.
Dalam beberapa hari, kita sepatutnya dapat memuatkan PDF pada arXiv dengan lebih pantas, dan mungkin kita boleh membaca kertas itu terus di halaman web.
"Saya amat berterima kasih kepada Yayasan Simons dan Yayasan Sains Kebangsaan atas sokongan besar mereka," kata Greg Morrisett, Dekan Jack dan Leila Nefsey dan Naib Provost Cornell Tech. "Pelaburan ini memastikan perkhidmatan arXiv terus berkembang, melayani khalayak yang lebih luas dan memberi perkhidmatan yang lebih baik kepada komuniti saintifik
Ramin Zabih, profesor sains komputer di Cornell Tech Campus, berkata: "Dengan memodenkan." asas kod dan peralihan kepada awan, kami sedang memperkukuh infrastruktur arXiv dan memastikan ia terus menjadi sumber inovasi dalam perkongsian penerbitan ilmiah."
arXiv (disebut " arkib") telah diasaskan pada 1991 oleh Dr. Paul Ginsparg, seorang ahli fizik di Los Alamos National Laboratory, yang ketika itu ingin mengkatalogkan kira-kira 100 kertas penyelidikan. Semasa kertas kerja mengalir, dia cuba menyelesaikan masalah itu dengan bantuan program komputer, yang dilaporkan dia belajar cara menulis "dengan menghadiri seminar pembelajaran mesin selama lebih dari satu dekad." Ginsparg kini seorang profesor fizik dan sains maklumat di Universiti Cornell.
Platform kertas kini diselenggara dan dikendalikan oleh Perpustakaan Universiti Cornell Ia merupakan repositori pracetak yang besar bagi kertas akademik, mengumpul kertas yang diterbitkan dan sejumlah besar kertas yang tidak diterbitkan. Artikel yang telah melalui proses semakan rakan sebaya atau tidak bertujuan untuk diterbitkan dalam jurnal berwasit.Pada masa ini, subdisiplin yang diliputi oleh arXiv termasuk pelbagai bidang sains semula jadi dan sains sosial, termasuk fizik, matematik, sains komputer, biologi kuantitatif, kewangan kuantitatif, statistik, kejuruteraan elektrik dan ekonomi. Sehingga penghujung tahun 2022, terdapat lebih daripada 2.2 juta penyerahan pada arXiv.
Disebabkan tarikan hebat arXiv, penyelidik dalam banyak bidang akan menerbitkan penyelidikan terbaru mereka sebelum diterima oleh persidangan akademik atau jurnal. diterbitkan lebih awal" di platform ini. Umumnya orang berfikir bahawa faedah melakukan ini terletak pada "mengambil kesempatan daripada" dan publisiti: mereka bukan sahaja dapat melindungi idea mereka sendiri, tetapi juga mengembangkan publisiti dan meningkatkan pengaruh ulama itu sendiri. Pada masa yang sama, pendekatan ini juga sangat mempercepatkan penyebaran maklumat dalam komuniti akademik.
Sebaliknya, walaupun dalam bidang AI yang serba pantas hari ini, ia mengambil masa berbulan-bulan untuk menunggu kertas persidangan atau jurnal daripada penyerahan kepada keterlihatan akhir, malah kadangkala teknologi baharu telah muncul dalam tempoh ini.
Oleh itu, arXiv secara beransur-ansur menjadi tempat "penyerahan" pilihan untuk banyak bidang akademik, seperti matematik dan sains komputer. Hari ini, kerap melayari arXiv telah menjadi kebiasaan bagi ramai sarjana. Dalam bidang kecerdasan buatan, banyak artikel yang disertakan dalam persidangan teratas seperti NeurIPS, CVPR dan AAAI telah disiarkan di arXiv terlebih dahulu untuk mendapatkan pendedahan. Sebaliknya, kerana ia tidak mempunyai mekanisme penyaringan yang sangat berkesan, terdapat juga banyak kertas berkualiti rendah pada platform Ini mungkin arah yang arXiv cuba ubah selepas menerima pembiayaan baharu.
Kebanyakan masa, sama ada ia diterima oleh persidangan jurnal penting adalah kriteria penting untuk menilai kualiti kertas. Walau bagaimanapun, selepas kemunculan arXiv, banyak kertas kerja yang terlepas oleh persidangan itu telah memberi pengaruh penting dalam dunia akademik dan menerima banyak petikan. Dalam bidang kecerdasan buatan, kami boleh menyenaraikan dengan mudah beberapa artikel yang muncul di arXiv dan terkenal, tetapi telah ditolak oleh persidangan AI teratas, seperti penyelidikan tentang YOLO, transformer XL dan Dropout.YOLO, algoritma pengesanan sasaran yang terkenal dalam bidang penglihatan komputer, mempunyai lebih daripada 40,000 petikan dalam kertas kerjanya Walau bagaimanapun, ia pada asalnya ditolak oleh NIPS dan kemudiannya diserahkan kepada CVPR 2016 dan diterima.
Pada tahun 2012, pemenang Anugerah Turing kemudiannya Geoffrey Hinton mencadangkan dalam kertas kerja "Meningkatkan rangkaian saraf dengan menghalang penyesuaian bersama pengesan ciri" Keciciran. Pada tahun yang sama, kemunculan AlexNet membuka era baharu pembelajaran mendalam. AlexNet menggunakan Dropout untuk mengurangkan overfitting dengan ketara dan memainkan peranan penting dalam kemenangannya dalam pertandingan ILSVRC 2012. Boleh dikatakan bahawa tanpa Keciciran, perkembangan besar pembelajaran mendalam mungkin tertangguh selama beberapa tahun.
Walau bagaimanapun, kertas kerja ini telah ditolak oleh NIPS 2012 dan masih dalam status pracetak pada arXiv.
Apakah platform arXiv, yang membawa harapan sains maju, akan berkembang pada masa hadapan?
Cornell University berkata fasa seterusnya pembangunan arXiv akan termasuk mengupah lebih ramai pembangun perisian untuk menyokong usaha pemodenan. Pada masa yang sama, fakulti sains komputer akan membangunkan teknologi carian dan pengesyoran baharu dengan pembiayaan NSF yang dirancang untuk menyokong komuniti pengguna besar arXiv dan akan disokong oleh jaminan privasi terkini. Di samping itu, arXiv akan menyediakan akses yang lebih baik untuk mereka yang cacat penglihatan dengan menjana kandungan versi HTML dan PDF.
Pembiayaan $10 juta akan meningkatkan keupayaan arXiv dengan ketara. Sebagai perbandingan, arXiv membelanjakan sejumlah $2.42 juta pada 2021.
Selepas berita derma dikeluarkan, orang ramai bertepuk tangan dan menantikan evolusi masa depan platform pracetak.
Kandungan rujukan: #🎜#
#🎜##🎜🎜🎜##🎜🎜 #https://news.cornell.edu/stories/2023/10/research-repository-arxiv-receives-10m-upgrades#🎜 🎜#
https://news.ycombinator.com/item?id=37949656https://medium .com/nautilus-magazine/what-counts-as-science-76ebd1f5d403
Atas ialah kandungan terperinci Menerima derma AS$10 juta untuk pemfaktoran semula kod dan pemindahan awan, dan platform pracetak kertas arXiv 'semakin baik'. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!