Letakkan “Google” dan “Reddit” dalam kalimat yang sama dan Anda pasti akan mendengar banyak keluhan dari mereka yang berkecimpung dalam bisnis penerbitan daring. Nah, sekarang kita mungkin mendengar lebih banyak keluhan dari pengguna internet rata-rata, karena sepertinya Google adalah satu-satunya mesin pencari yang saat ini dapat menggunakan Reddit untuk menempatkan posting baru dalam hasil pencariannya.
404 Media mencatat hal ini dan kemarin menunjukkan bahwa mesin pencari selain Google, seperti Bing dan DuckDuckGo, tidak menampilkan hasil Reddit apa pun dari minggu lalu dalam hasil pencarian mereka. Tampaknya memang demikian, dan Anda dapat mengujinya sendiri dengan membuka mesin pencari lain seperti DuckDuckGo, mencari “site:reddit.com” dan mengaturnya agar hanya menampilkan hasil dari minggu lalu. Pada saat penulisan, tidak ada hasil yang muncul untuk pencarian seperti itu di DuckDuckGo, tetapi ada di Google.
Hal ini tampaknya terjadi karena adanya perubahan pada berkas robots.txt Reddit. Robots.txt adalah berkas yang dimiliki hampir setiap situs web yang memberi tahu bot, seperti bot mesin pencari, halaman mana di situs yang “tidak boleh” mereka gunakan untuk mengikis. Selain mencegah mesin pencari mengikis beberapa halaman, berkas ini berguna bagi situs web yang ingin mencegah data dikikis untuk pelatihan AI dengan melarang perayap AI.
Namun, Reddit tampaknya baru-baru ini mengubahnya untuk melarang bot apa pun untuk melakukan scraping pada situs web tersebut. Anda tidak perlu mempercayai kata-kata kami, Anda dapat memeriksanya sendiri dengan mengunjungi https://www.reddit.com/robots.txt. Beberapa baris terbawah pada halaman tersebut pada dasarnya memberi tahu bot mana pun bahwa bot tersebut tidak diizinkan untuk mengambil data dari halaman Reddit mana pun. Dan jika tidak ada pengambilan data, maka tidak akan ditampilkan dalam hasil pencarian. Begitulah cara kerja mesin pencari—untuk menyederhanakannya, mereka mengambil data, memberi peringkat, dan menampilkannya saat pengguna mencari istilah terkait.
Tetapi Google masih dapat menampilkan hasil Reddit baru di hasil pencarian, yang berarti ia entah bagaimana dapat mengakses informasi Reddit meskipun robots.txt tidak mengizinkannya.
Jika kita mulai bertanya-tanya apakah alasan di balik semua ini ada hubungannya dengan Google bermitra dengan Reddit—kemitraan yang memberi Google akses tunggal ke konten situs Reddit untuk pelatihan AI—kami memiliki kepastian berikut.
Tim Rathschmidt, juru bicara Reddit, mengatakan The Verge “Hal ini sama sekali tidak terkait dengan kemitraan terkini kami dengan Google,” lanjutnya, “Kami telah berdiskusi dengan beberapa mesin pencari. Kami belum dapat mencapai kesepakatan dengan semuanya, karena beberapa tidak dapat atau tidak mau membuat janji yang dapat diberlakukan terkait penggunaan konten Reddit, termasuk penggunaan mereka untuk AI.”
Namun, menurutku, hal ini terdengar seperti masalah ini hanya secara tidak langsung karena kemitraan Reddit dengan Google. Jika kontrak kemitraan memberikan Google hak eksklusif atas data Reddit untuk pelatihan AI, maka masuk akal jika Reddit tidak akan mengizinkan mesin pencari lain untuk mengambil data situs web tersebut jika “tidak dapat mencapai kesepakatan.”
Jika ada, penjelasan ini mendorong hal-hal mundur satu tingkat dan membuat saya berpikir hanya ada satu lagi kekurangan yang menentang kemitraan Google-Reddit yang asli. Kekurangannya adalah Reddit tampaknya sekarang tidak dapat mengizinkan mesin pencari lain untuk mengambil situs mereka kecuali mereka bersedia membuat janji “yang dapat diberlakukan” tentang penggunaan konten Reddit untuk AI. (Tebakan Anda sama bagusnya dengan tebakan saya tentang apa arti “dapat diberlakukan”, di sini.)
CEO Game Epik Tim Sweeney mengatakan “ini adalah bagian dari percepatan monopoli yang membingungkan yang meluas untuk semakin menghalangi persaingan dan mengambil keuntungan dari pengguna.”
Ini adalah bagian dari percepatan monopoli yang membingungkan yang meluas untuk semakin menghalangi persaingan dan mengambil keuntungan dari pengguna. Mesin pencari biasanya menyediakan tautan ke konten yang relevan. Sekarang mereka mengirim spam kepada pengguna dengan iklan yang dicampur dengan konten yang diambil dan dicuci oleh AI tanpa atribusi. https://t.co/xMvzir3DPA24 Juli 2024
Ngomong-ngomong, semua ini terjadi beberapa bulan setelah Google mulai mendorong thread Reddit ke peringkat atas hasil pencariannya untuk berbagai istilah, sebuah keputusan yang Penghubung Penelusuran Google Danny Sullivan menjelaskan tentang X (melalui Meja Bundar SEO) karena “pencari sebenarnya tampaknya menyukainya. Mereka mencarinya secara proaktif. Masuk akal bagi kami untuk menunjukkannya agar hasil pencarian tetap relevan dan memuaskan bagi semua orang.”
Sudah ada banyak bicara di dunia penerbitan tentang betapa dahsyatnya perubahan yang mendorong Reddit ini telah atau dapat berdampak buruk bagi beberapa penerbitan kecil dan situs independen, tetapi tidak banyak yang mempermasalahkannya dari pengguna akhir. Itu mungkin karena Google benar dan orang-orang memang menginginkan Reddit berada di peringkat atas dalam hasil pencarian mereka.
Yah, mungkin masalah khusus itu sebagian besar merupakan masalah bagi penerbit, tetapi masalah terbaru ini tentu lebih menjadi masalah bagi pengguna akhir. Kecuali jika pengguna akhir merasa baik-baik saja dengan monopoli pencarian yang semakin besar oleh Google.
Pikirkan seperti ini: Jika Google benar dan pengguna akhir benar-benar Mengerjakan sangat peduli dengan hasil Reddit dalam pencarian mereka, maka tampaknya Google sekarang memiliki akses mesin pencari eksklusif ke salah satu hal yang paling diperhatikan oleh pengguna akhirnya. Mengapa ada orang yang mencari di tempat lain?
Belum lagi risiko kemitraan yang sudah ada yang memungkinkan Google mendapatkan akses eksklusif ke Reddit untuk pelatihan AI, dengan Reddit yang bisa dibilang sebagai salah satu ruang publik digital terbesar di dunia. Mengenai hal ini, orang tidak bisa tidak bertanya-tanya apa yang dilakukan oleh badan-badan pemerintah AS, Inggris, dan Uni Eropa yang baru saja setuju untuk bekerja untuk mencegah monopoli dalam industri AI memanfaatkannya.