OpenAI: 'Tidak Mungkin Membuat model AI yang Berguna Tanpa Materi Berhak Cipta'
Pengembangan model bahasa besar seperti ChatGPT oleh OpenAI memunculkan isu penting mengenai penggunaan materi berhak cipta. Menurut laporan The Telegraph, OpenAI, dalam sebuah pengajuan kepada Komite Pilih Komunikasi dan Digital House of Lords di Inggris, menyatakan bahwa pengembangan model AI seperti ini tidak mungkin dilakukan tanpa menggunakan materi berhak cipta.
AI seperti ChatGPT dan generator gambar DALL-E dibangun melalui sesi pelatihan yang mengandalkan konten internet publik dalam jumlah besar, seringkali tanpa izin dari pemegang hak. OpenAI sendiri menggunakan sebagian konten yang dilisensikan. Metode pengambilan konten secara luas ini telah menjadi bagian dari penelitian pembelajaran mesin akademis selama bertahun-tahun, namun seiring dengan komersialisasi model AI deep learning, metode ini mulai mendapat sorotan.
Dalam pengajuan tersebut, OpenAI mengungkapkan bahwa hampir semua bentuk ekspresi manusia, termasuk blog, foto, postingan forum, kode perangkat lunak, dan dokumen pemerintah, saat ini dilindungi hak cipta. Oleh karena itu, menurut OpenAI, akan sangat sulit untuk melatih model AI terkini tanpa memanfaatkan materi-materi berhak cipta tersebut.
OpenAI juga menekankan bahwa hanya menggunakan data dari domain publik yang berusia lebih dari satu abad tidak akan memadai untuk menciptakan sistem AI yang bisa memenuhi kebutuhan masyarakat modern.
Latar belakang pernyataan ini adalah gugatan yang diajukan oleh The New York Times terhadap OpenAI dan Microsoft, yang menuduh penggunaan konten koran tersebut secara ilegal dalam produk mereka.
Menanggapi gugatan itu, OpenAI mengklaim di situs webnya bahwa tuntutan tersebut tidak memiliki dasar dan menegaskan dukungannya terhadap jurnalisme dan kerja sama dengan organisasi berita.
Pertahanan OpenAI sebagian besar didasarkan pada prinsip hukum fair use, yang memungkinkan penggunaan terbatas materi berhak cipta tanpa izin pemilik dalam kondisi tertentu. Perusahaan ini mengklaim bahwa hukum hak cipta tidak menghalangi pelatihan model AI dengan menggunakan materi tersebut.
Dalam sebuah posting blog, OpenAI menyatakan, "Melatih model AI dengan menggunakan materi internet yang tersedia untuk publik adalah fair use, sesuai dengan preseden yang telah lama berlaku dan diterima secara luas. Kami melihat ini sebagai hal yang adil bagi pencipta, diperlukan untuk inovasi, dan krusial untuk daya saing AS."
Situasi serupa terjadi pada Agustus, di mana OpenAI menggunakan argumen fair use dalam menanggapi gugatan hak cipta yang melibatkan komedian Sarah Silverman, dengan mengklaim bahwa para penggugat tidak memahami sepenuhnya cakupan dan batasan hak cipta, termasuk fair use, yang memberikan ruang bagi inovasi seperti model bahasa besar yang menjadi terdepan dalam kecerdasan buatan.
Sumber: arstechnica