(SeaPRwire) – Minggu ini, Tabung Sains Kebangsaan (NSF) mengumumkan bahawa ia akan melancarkan program percubaan dengan 10 agensi persekutuan lain dan 25 organisasi sektor swasta dan bukan untung yang boleh menjadi langkah pertama untuk mendemokratkan akses kepada infrastruktur mahal yang diperlukan untuk penyelidikan AI terkini.
Program Percubaan Sumber AI Kebangsaan (NAIRR) bertujuan untuk menyediakan daya pemprosesan komputasi yang mahal, set data, model AI, dan alat lain kepada penyelidik AI akademik yang sering kali sukar mendapatkan sumber yang semakin diperlukan.
Pembuat cip, salah satu syarikat yang terlibat dalam program itu, mengumumkan bahawa ia akan menyumbang $30 juta sumber pengkomputeran awan dan perisian kepada percubaan itu selama dua tahun, manakala Microsoft mengumumkan bahawa ia akan menyumbang $20 juta kredit pengkomputeran awan selain sumber lain. OpenAI, Anthropic, dan Meta, yang merupakan antara syarikat terkemuka dalam sektor itu, sedang menyediakan akses kepada model AI mereka.
Program Percubaan NAIRR datang pada masa yang kritikal bagi penyelidikan AI. Apabila syarikat-syarikat teknologi telah menumpukan ke dalam memperoleh sumber komputasi dan set data, dan mengambil kakitangan berkemahiran, penyelidik di akademik dan sektor awam telah ditinggalkan. Ini menyebabkan arahan penyelidikan penting dan penyelidikan saintifik asas tidak diterokai. Walau bagaimanapun, pengulas memberi amaran bahawa percubaan ini hanyalah langkah awal, dan menutup jurang AI akan memerlukan pelaburan kerajaan yang berterusan dan berani.
Industri mengatasi
Sistem AI mempunyai tiga input—daya pemprosesan (sering dirujuk sebagai komputasi), data, dan algoritma. Jumlah data dan komputasi yang lebih besar serta algoritma yang lebih baik direka bentuk akan menghasilkan sistem AI yang lebih berdaya. Akses industri yang semakin istimewa kepada ketiga-tiga input AI ini telah menyebabkan jurang yang semakin melebar antara sistem AI yang dibina oleh perniagaan berbanding dengan yang dibina oleh penyelidik di akademik.
Beberapa dekad yang lalu, kebanyakan terobosan menarik dilakukan oleh penyelidik di akademik, kata Nur Ahmed, seorang penyelidik di Sekolah Pengurusan MIT Sloan. “Kini, akademik melakukan lebih banyak penyelidikan susulan daripada cuba mendorong sempadan.”
Manakala sebelum ini sistem AI paling berdaya yang mungkin akan dibina oleh akademik, kini hampir kesemua sistem AI terkini sekurang-kurangnya melibatkan kerjasama dengan industri, dan banyak dibina sepenuhnya oleh industri.
Dalam amalan, komputasi bermakna akses kepada cip khas, yang mahal dan terhad. Apabila akses kepada kuasa pengkomputan menjadi lebih terhad, jumlah yang digunakan untuk melatih sistem AI semakin meningkat— sekali setiap 20 bulan sejak permulaan AI pada tahun 1950. Tetapi, apabila menjadi jelas bahawa melatih model menggunakan jumlah komputasi yang lebih besar akan menjadikan model itu jauh lebih berdaya, pembangun AI mula melatih model yang lebih besar, dengan jumlah komputasi digunakan menggandakan setiap 6 bulan.
Sejak itu, jumlah wang yang dibelanjakan untuk melatih sistem AI telah melonjak— kajian Epoch mendapati kos komputasi meningkat setiap tahun kira-kira faktor tiga antara 2009 dan 2022. Data Epoch menunjukkan bahawa akademik sebenarnya telah dikeluarkan akademik daripada membangunkan model terkini.
Kebanyakan data yang digunakan untuk melatih sistem AI—terutamanya model bahasa, yang menggunakan jumlah data besar yang dicapai dari internet—boleh didapati secara awam. Tetapi industri masih mempunyai dua kelebihan berbanding akademik dan sektor awam, kata Neil Thompson, pengarah Projek Penyelidikan Masa Depan MIT.
Pertama, menguruskan jumlah data besar yang digunakan untuk melatih sistem AI terkini memerlukan jumlah komputasi yang besar dan mudah jika mempunyai pasukan khusus untuk pembersihan dan penyediaan data, kedua-duanya tersedia untuk industri tetapi bukan akademik. Kedua, syarikat sering mempunyai akses kepada set data eksklusif yang sangat bernilai untuk tujuan khusus mereka.
Penyelidik mereka algoritma. Oleh itu, organisasi yang boleh mengakses bilangan penyelidik berbakat terbesar cenderung mempunyai akses kepada algoritma yang lebih canggih. Berikutan pelancaran ChatGPT dan ledakan AI seterusnya, pasaran buruh AI sangat panas, kata Thompson, mencipta persaingan yang hebat untuk penyelidik dan jurutera berkemahiran. Syarikat telah menawarkan gaji yang semakin besar untuk menarik pekerja ini—tawaran pekerjaan Netflix tahun lalu menawarkan gaji sehingga $900,000. Selain jurang gaji, penyelidik juga tertarik dengan akses data dan komputasi yang lebih unggul yang ditawarkan oleh industri, kata Thompson.
Dinamik ini mungkin buruk bagi masyarakat secara keseluruhan, kata Ahmed dari MIT. Pembangun AI komersial mempunyai motivasi mereka sendiri, dan sumber penyelidikan akademik yang kurang mungkin bermakna kerja yang kurang dilakukan mengenai isu-isu penting masyarakat seperti menangani bias dalam sistem AI, kata Ahmed. Satu kertas pada tahun 2020 oleh penyelidik di Tabung Kebangsaan untuk Sains, Teknologi dan Seni menyokong kebimbangan Ahmed, mendapati bahawa “penyelidik AI sektor swasta cenderung mengkhususkan diri dalam kaedah pembelajaran dalam yang intensif data dan komputasi berbanding… penyelidikan yang mempertimbangkan implikasi sosial dan etika AI atau mengaplikasikannya dalam domain seperti kesihatan.”
Dibiarkan sendiri, pihak swasta cenderung mengurangkan pembiayaan asas, kata Thompson. Dan tanpa komputasi yang mencukupi, akademik dan penyelidik sektor awam tidak akan dapat menyemak kerja penyelidik industri.
Menutup jurang
Program percubaan yang diumumkan minggu ini telah lama ditunggu. Akta NAIRR, diluluskan pada tahun 2020, menubuhkan pasukan petugas untuk membangunkan pelan induk bagi program kebangsaan untuk meningkatkan akses kepada pengkomputan, data, dan alat pendidikan. Laporan Akhir Pasukan Petugas NAIRR, dikeluarkan pada Januari 2023, menyatakan bahawa $2.6 bilion diperlukan untuk mengendalikan NAIRR selama enam tahun, dan mencadangkan percubaan sebagai cara untuk maju tanpa pembiayaan penuh. Belanjawan Presiden Biden, ditandatangani pada 30 Oktober, memberi NSF 90 hari—sehingga 28 Januari—untuk melancarkan percubaan NAIRR.
Program percubaan, walaupun menyenangkan, tidak mencukupi, kata Divyansh Kaushik, pengarah penyelidikan teknologi masa depan dan keselamatan kebangsaan di Persatuan Saintis Amerika, yang menasihati Pasukan Petugas NAIRR. Kongres mesti meluluskan undang-undang yang memberi kuasa kepada NAIRR dan membuat dana yang diperlukan tersedia, katanya, dengan menambah kebanyakan ahli parlimen menyokong program itu. “Tidak benar-benar ada sebarang tentangan,” katanya.
Satu undang-undang sedemikian dicadangkan pada Julai, apabila kepimpinan Kongres Caucus Kecerdasan Buatan Akta CREATE AI, yang akan menubuhkan NAIRR. Senator Martin Heinrich, Todd Young, Cory Booker, dan Mike Rounds satu rang undang-undang saudara di Senat. “Kami mematuhi hampir sepenuhnya apa yang disyorkan oleh pasukan petugas. Pendapat saya, mereka melakukan kerja yang sangat baik,” kata Kongreswan Anna Eschoo, seorang Demokrat California dan pengerusi bersama Kongres Caucus Kecemasan Buatan kepada TIME pada September 2023.
Artikel ini disediakan oleh pembekal kandungan pihak ketiga. SeaPRwire (https://www.seaprwire.com/) tidak memberi sebarang waranti atau perwakilan berkaitan dengannya.
Sektor: Top Story, Berita Harian
SeaPRwire menyampaikan edaran siaran akhbar secara masa nyata untuk syarikat dan institusi, mencapai lebih daripada 6,500 kedai media, 86,000 penyunting dan wartawan, dan 3.5 juta desktop profesional di seluruh 90 negara. SeaPRwire menyokong pengedaran siaran akhbar dalam bahasa Inggeris, Korea, Jepun, Arab, Cina Ringkas, Cina Tradisional, Vietnam, Thai, Indonesia, Melayu, Jerman, Rusia, Perancis, Sepanyol, Portugis dan bahasa-bahasa lain.
“NAIRR akan memberikan penyelidik—dari universiti, bukan untung, dari kerajaan—dengan set data kuasa dan pengkomputan yang benar-benar diperlukan,” kata Eschoo. “Untuk memastikan semua orang mempunyai akses kepada alat yang diperlukan untuk penyelidikan dan pembangunan AI s