Meta Diduga Terlibat Kasus Pelanggaran Hak Cipta Pengembangan AI
Meta menghadapi gugatan pelanggaran hak cipta terkait penggunaan data terlarang untuk model AI.
Meta Platforms Inc. kini menghadapi gugatan besar terkait pelanggaran hak cipta yang mengungkap sejumlah komunikasi internal mengenai rencana perusahaan dalam mengembangkan model AI open-source bernama Llama.
Mengutip The Verge, Kamis (16/1), dokumen-dokumen ini, yang dibuka oleh pengadilan California, menunjukkan bahwa Meta diduga menggunakan data yang dilindungi hak cipta saat melatih sistem AI-nya dan berusaha menyembunyikannya.
Gugatan ini diajukan oleh penulis Richard Kadrey, komedian Sarah Silverman, dan beberapa pihak lainnya, yang menuduh Meta menggunakan konten yang diperoleh secara ilegal untuk melatih model AI mereka, melanggar undang-undang kekayaan intelektual.
Dalam sebuah email yang dikirim pada Oktober 2023, Ahmad Al-Dahle, wakil presiden AI generatif di Meta, menyatakan bahwa tujuan perusahaan adalah untuk mencapai level GPT-4, model bahasa besar yang diumumkan oleh OpenAI pada Maret 2023.
Al-Dahle menekankan pentingnya Meta untuk 'belajar bagaimana membangun frontier dan memenangkan perlombaan ini.' Rencana tersebut tampaknya melibatkan penggunaan situs pembajakan buku, Library Genesis (LibGen), untuk melatih sistem AI mereka.
Dalam dokumen internal, Sony Theakanath, direktur produk Meta, mempertimbangkan apakah akan menggunakan LibGen hanya untuk benchmark yang akan dimasukkan dalam sebuah blog, atau untuk membuat model yang dilatih berdasarkan data dari situs tersebut.
Theakanath mencatat bahwa 'GenAI telah disetujui untuk menggunakan LibGen untuk Llama3... dengan sejumlah mitigasi yang disepakati.' Mitigasi ini termasuk penghapusan data yang jelas ditandai sebagai bajakan dan menghindari penyebutan penggunaan data pelatihan dari situs tersebut.
Risiko Hukum dan Tindakan Preventif Meta
Beberapa tindakan mitigasi yang diusulkan termasuk penghapusan informasi hak cipta dari data pelatihan LibGen. Dalam email tersebut, Theakanath juga menyebutkan perlunya 'red team' untuk model perusahaan guna mengidentifikasi risiko terkait bioweapons dan CBRNE (Chemical, Biological, Radiological, Nuclear, and Explosives).
Selain itu, email tersebut mengungkapkan kekhawatiran tentang bagaimana regulator mungkin bereaksi terhadap pemberitaan media yang menunjukkan penggunaan konten bajakan oleh Meta.
Dalam percakapan antara peneliti Meta, Nikolay Bashlykov, dan anggota tim AI, Bashlykov mengakui bahwa ia 'tidak yakin apakah kita bisa menggunakan IP Meta untuk memuat konten bajakan melalui torrent.'
Beberapa dokumen internal lainnya menunjukkan langkah-langkah yang diambil Meta untuk menyembunyikan informasi hak cipta dalam data pelatihan LibGen.
Salah satu dokumen berjudul 'observasi tentang LibGen-SciMag' mencatat saran dari karyawan untuk 'menghapus lebih banyak header hak cipta dan pengidentifikasi dokumen.'
Reaksi Pasar Terhadap Penggunaan Data Berlisensi
Beberapa eksekutif di Meta berpendapat bahwa pendekatan mereka dapat dibenarkan dengan merujuk pada 'preseden pasar' yang ditetapkan oleh OpenAI dalam menggunakan karya berhak cipta.
Mereka juga mencatat kemenangan pengadilan Google pada tahun 2015 yang menetapkan haknya untuk memindai buku bisa memberikan perlindungan hukum. Hal ini menunjukkan bahwa Meta berusaha untuk memperluas kapasitas AI-nya secepat mungkin, meskipun ada risiko hukum yang jelas.
Gugatan ini dapat memperkuat posisi Kadrey dan Silverman saat kasus mereka bergerak maju di pengadilan. Meskipun seorang hakim sebagian menolak gugatan mereka tahun lalu, bukti yang diungkapkan dalam dokumen ini dapat memberikan kekuatan tambahan pada argumen mereka.
Meta, seperti perusahaan AI lainnya, berpendapat bahwa penggunaan materi berhak cipta dalam data pelatihan seharusnya dianggap sebagai penggunaan yang adil secara hukum.