Sekarang Kamu Bisa Memblokir Perayap Web OpenAI
OpenAI kini memberikan opsi kepada pengguna untuk memblokir perayap web-nya agar tidak mengambil data dari situs milikmu untuk melatih modelGPT.
Menurut OpenAI, kamu sebagai pengelola situs web dapat dengan spesifik melarang perayap GPTBot-nya untuk mengakses berkas Robots.txt di situs atau memblokir alamat IP-nya.
"Halaman-halaman web yang diambil dengan identitas pengguna GPTBot berpotensi digunakan untuk meningkatkan model-model di masa depan dan telah disaring untuk menghilangkan sumber-sumber yang memerlukan langganan berbayar, mengumpulkan informasi identifikasi pribadi (PII), atau mengandung teks yang melanggar kebijakan kami," jelas OpenAI dalam sebuah pos di blog mereka.
Bagi sumber-sumber yang tidak masuk dalam kriteria-kriteria yang dikecualikan tersebut, "mengizinkan GPTBot mengakses situs milikmu bisa membantu model AI menjadi lebih akurat serta meningkatkan kemampuan dan keamanannya secara umum."
Langkah memblokir GPTBot ini bisa menjadi langkah awal OpenAI untuk memberi pengguna internet opsi untuk tidak mengizinkan data mereka digunakan sebagai latihan bagi model bahasa besar mereka.
Langkah ini mengikuti beberapa upaya awal dalam menciptakan tanda yang akan mengkecualikan konten dari pelatihan, seperti tag "NoAI" yang dibuat oleh DeviantArt tahun lalu. Namun, perlu diperhatikan bahwa langkah ini tidak berdampak retrospektif terhadap konten yang sebelumnya telah diambil dari situs milikmu dan digunakan sebagai data latihan untuk ChatGPT.
Data dari internet telah menjadi salah satu sumber utama dalam melatih model bahasa besar seperti model GPT dari OpenAI dan Bard dari Google. Namun, OpenAI belum mengkonfirmasi apakah data tersebut diperoleh dari postingan media sosial, karya yang dilindungi hak cipta, atau bagian-bagian tertentu dari internet yang diambil informasinya.
Pengumpulan data untuk latihan kecerdasan buatan (AI) semakin menjadi perdebatan. Beberapa situs, termasuk Reddit dan Twitter, berusaha untuk mengurangi penggunaan postingan pengguna mereka oleh perusahaan-perusahaan AI, sementara para penulis dan kreator lainnya telah mengajukan gugatan atas penggunaan tidak sah dari karya-karya mereka. Pemerintah juga telah mengangkat isu privasi data dan persetujuan dalam beberapa sidang Senat tentang regulasi AI bulan lalu.
Sebagaimana dilaporkan oleh Axios, beberapa perusahaan, seperti Adobe, telah mengusulkan ide penandaan data sebagai data yang tidak boleh digunakan untuk latihan melalui undang-undang anti-pemalsuan. Meskipun begitu, perusahaan-perusahaan AI, termasuk OpenAI, telah menandatangani kesepakatan dengan Gedung Putih untuk mengembangkan sistem penandaan untuk memberi tahu orang apakah sesuatu dihasilkan oleh AI. Namun, belum ada jaminan untuk berhenti menggunakan data dari internet sebagai latihan bagi model AI.
Sumber: TheVerge