Memblokir bot AI dari Microsoft dan lainnya telah menjadi “hal yang menyebalkan”: CEO Reddit
Tampilan umum beranda Reddit

CEO Reddit Steve Huffman mendukung keputusan Reddit untuk memblokir perusahaan agar tidak mengambil data dari situs tersebut tanpa perjanjian AI.

Minggu lalu, 404 Media memperhatikan bahwa mesin pencari selain Google tidak lagi mencantumkan postingan Reddit terkini dalam hasil. Hal ini karena Reddit memperbarui Protokol Pengecualian Robot (berkas teks) untuk memblokir bot agar tidak mengikis situs tersebut. File tersebut berbunyi: “Reddit percaya pada Internet terbuka, tetapi tidak pada penyalahgunaan konten publik.” Sejak berita tersebut tersiar, OpenAI mengumumkan PencarianGPTyang dapat menampilkan hasil Reddit terkini.

Perubahan ini terjadi setahun setelah Reddit memulai upayanya untuk menghentikan free scraping, yang awalnya dibingkai oleh Huffman sebagai upaya untuk menghentikan perusahaan AI menghasilkan uang dari konten Reddit secara gratis. Upaya ini juga menyebabkan Reddit mulai mengenakan biaya untuk akses API (harga yang tinggi menyebabkan banyak aplikasi Reddit pihak ketiga penutupan).

Dalam sebuah wawancara dengan The Verge hari ini, Huffman mendukung perubahan yang menyebabkan Google untuk sementara menjadi satu-satunya mesin pencari yang mampu menampilkan diskusi terbaru dari Reddit. Reddit dan Google menandatangani Kesepakatan pelatihan AI pada bulan Februari dikatakan bernilai $60 juta per tahun. Tidak jelas berapa banyak Kesepakatan OpenAI Reddit bernilai. Huffman berkata:

Tanpa perjanjian ini, kami tidak memiliki suara atau pengetahuan apa pun terkait bagaimana data kami ditampilkan dan untuk apa data itu digunakan, yang mana menempatkan kami dalam posisi untuk memblokir orang-orang yang tidak bersedia menyetujui bagaimana kami ingin data kami digunakan atau tidak digunakan.

Menurut The Verge, Huffman mengklaim bahwa Microsoft, AntropikDan Kebingungan belum bernegosiasi. Ketiga perusahaan belum mengomentari wawancara Huffman.

“(Sungguh) merepotkan untuk memblokir perusahaan-perusahaan ini,” kata Huffman kepada The Verge.

Seseorang yang mengetahui masalah ini sebelumnya memberi tahu Ars bahwa Microsoft telah menolak untuk membuat perjanjian yang mematuhi aturan privasi data Reddit. Saat berbicara dengan The Verge, Huffman mengklaim Microsoft sebelumnya menggunakan data dari Reddit untuk pelatihan AI dan ringkasan hasil Bing, tetapi tidak memberi tahu Reddit. Ia juga mengklaim bahwa data dari Reddit telah “dijual melalui Bing API ke mesin pencari lain,” menurut The Verge.

Debat AI

Seorang juru bicara Microsoft mengatakan kepada saya minggu lalu bahwa “Microsoft menghormati standar robots.txt dan kami menghormati arahan yang diberikan oleh situs web yang tidak ingin konten di halaman mereka digunakan dengan model AI generatif kami.” Namun seperti yang ditunjukkan The Verge, Jordi Ribas, VP perusahaan untuk pencarian dan AI di Microsoft, menulis di X pada tanggal 29 Juli untuk menekankan bagaimana perubahan pada Reddit menguntungkan Google yang “berdampak pada persaingan dari Bing dan mesin pencari yang didukung Bing.”

Huffman juga dilaporkan merujuk pada bulan Juni wawancara CNBC di mana Mustafa Suleyman, CEO Microsoft AI, berkata: “Menurut saya, sehubungan dengan konten yang sudah ada di web terbuka, kontrak sosial konten tersebut sejak tahun 90-an adalah bahwa konten tersebut merupakan penggunaan yang wajar. Siapa pun dapat menyalinnya, membuat ulang, dan memperbanyaknya. Itu adalah perangkat lunak gratis, jika Anda mau. Itulah pemahamannya.” Suleyman menambahkan bahwa komentarnya tidak merujuk pada jenis konten web tertentu, seperti organisasi berita.

“Microsoft, Anthropic, dan Perplexity pernah bertindak seolah-olah semua konten di internet dapat mereka gunakan secara gratis. Itulah posisi mereka yang sebenarnya,” kata Huffman.

Reddit belum mengungkapkan berapa banyak uang yang dibutuhkan untuk transaksi yang memungkinkan pengikisan dari Microsoft, Perplexity, Anthropic, atau perusahaan yang lebih kecil. Juru bicara Reddit Tim Rathschmidt mengatakan kepada Ars minggu lalu bahwa Reddit telah berbicara “dengan beberapa mesin pencari” dan bahwa Reddit “terbuka untuk bekerja dengan mitra besar dan kecil.”

Kemungkinan besar Reddit menargetkan transaksi AI besar, yang dipandang sebagai bagian penting dari bisnisnyaColin Hayhurst, CEO mesin pencari Mojeek, mengatakan kepada Ars minggu lalu bahwa Reddit tidak menanggapi emailnya tentang pemblokiran Mojeek hingga laporan 404 Media keluar.

Upaya Reddit untuk menemukan sumber pendapatan baru karena berupaya untuk menjadi menguntungkan untuk pertama kalinya telah dipenuhi dengan kendala, termasuk protes pengguna dalam menanggapi perubahan aturan API Reddit. Perusahaan ini berupaya mencapai kesepakatan di saat penerbit, industri musik, dan lain-lain bergulat dengan legalitas bot AI dan berupaya menetapkan preseden. Ketergantungan Reddit pada konten gratis yang dibuat pengguna membawa kerumitan lebih lanjut pada perdebatan ini.

Advance Publications, yang memiliki induk perusahaan Ars Technica, Condé Nast, adalah pemegang saham terbesar Reddit.

Sumber