OpenAI telah meluncurkan GPTBot, perayap web yang akan digunakan untuk menyempurnakan model AI perusahaan seperti ChatGPT. GPTBot dirancang agar lebih berfokus pada privasi daripada perayap web lainnya, dan ini hanya akan merayapi situs web yang memilih untuk dirayapi.
“Halaman web yang dirayapi dengan agen pengguna GPTBot berpotensi digunakan untuk meningkatkan model mendatang dan difilter untuk menghapus sumber yang memerlukan akses paywall, diketahui mengumpulkan informasi identitas pribadi (PII), atau memiliki teks yang melanggar kebijakan kami,”kata OpenAI dalam postingan blog.
Fitur ini memungkinkan operator situs web memblokir perayap web yang digunakan OpenAI untuk mengekstrak konten situs mereka dan menggunakannya untuk melatih model AI-nya. Perayap web, disebut GPTBot, dapat diblokir oleh menambahkan baris ke file Robots.txt situs atau dengan memblokir alamat IP-nya.
OpenAI mengatakan fitur ini dirancang untuk menghormati preferensi pemilik situs web yang mungkin tidak ingin datanya digunakan untuk penelitian AI. Pemilik situs web yang tidak ingin GPTBot merayapi situs mereka dapat menambahkan kode berikut ke robot mereka File.txt: User-agent: GPTB – Disallow:/
fiturnya mungkin merupakan langkah pertama untuk memungkinkan pengguna internet memilih apakah mereka ingin data mereka digunakan untuk melatih model bahasa besar atau tidak. Masalah ini telah menjadi sumber kontroversi dan perdebatan, karena banyak situs dan pembuat konten yang menolak penggunaan data mereka oleh perusahaan AI tanpa persetujuan atau kompensasi mereka.
Memilih Cara AI Mengakses Situs Web Anda
Beberapa contohnya adalah Reddit dan Twitter, yang telah mencoba membatasi penggunaan bebas pos pengguna mereka oleh perusahaan AI, dan penulis serta materi iklan lainnya, yang telah menggugat dugaan penggunaan tidak sah atas karya mereka. Pertanyaan tentang privasi dan persetujuan data juga telah menarik perhatian anggota parlemen, yang telah mengangkatnya dalam beberapa dengar pendapat Senat tentang peraturan AI bulan lalu.
Beberapa perusahaan dan organisasi telah mengusulkan cara berbeda untuk menandai data sebagai bukan untuk pelatihan, seperti tag “NoAI”disarankan oleh DeviantArt tahun lalu, atau undang-undang anti-peniruan yang dianjurkan oleh Adobe. Perusahaan AI, termasuk OpenAI, juga telah setuju dengan Gedung Putih untuk mengembangkan sistem watermarking agar orang tahu jika ada sesuatu yang dihasilkan oleh AI, tetapi mereka belum membuat komitmen apa pun untuk berhenti menggunakan data internet untuk pelatihan.
Memblokir GPTBot adalah salah satu cara bagi pemilik situs web untuk melakukan kontrol atas data mereka, tetapi hal itu tidak memengaruhi data yang telah dihapus dari situs mereka dan digunakan untuk melatih ChatGPT.
Closing
Thus the article about OpenAI Meluncurkan Webcrawler GPTBot untuk Melatih ChatGPT, tetapi Pemilik Situs Web Dapat Memblokirnya I hope the information in the article is useful to you. Thank you for taking the time to visit this blog. If there are suggestions and criticisms, please contact us : admin@bocahhandal.com