Podcast hanya dengan mengklik satu tombol—alat AI baru dari Google dapat melakukannya. Ini disebut NotebookLM dan pada dasarnya adalah bot ringkasan. Masukkan dokumen, tekan hasilkan, dan keluarlah dokumen pengarahan, FAQ, atau panduan belajar. Terlebih lagi, ini dapat menghasilkan podcast yang meliput isi dokumen, dibawakan oleh makhluk fana dengan aksen Amerika yang riang gembira.
Ambil contoh, artikel yang saya tulis pada tahun 2023 berjudul “Cache adalah raja dalam merancang CPU gaming untuk 20 tahun ke depan.” Di mana saya berbicara dengan beberapa pakar teknik silikon tentang apa yang akan terjadi selanjutnya dalam desain chip. Saya memasukkan artikel tersebut ke NotebookLM, menunggu sekitar empat menit, dan muncullah podcast berdurasi 10 menit.
Dengarkan dalam embed Soundcloud di bawah ini.
“Apa-apaan ini!”
Anda harus memaafkan sumpah serapah itu, tetapi itulah reaksi jujur saya saat mendengarnya untuk pertama kalinya. Dokumen yang diringkas dengan baik adalah satu hal, tetapi irama alami percakapan dan emosi yang hiduplah yang membuat saya teringat setelah mendengarkannya.
Mereka (saya sudah bertindak seolah-olah mereka adalah orang sungguhan) bahkan memperkenalkan podcast… sebagai podcast. Saya harus mengingatkan diri sendiri ketika mendengarkan bahwa mereka bukanlah orang sungguhan—mereka adalah produk saya yang memasukkan hyperlink ke dalam kotak di situs web. Sebuah komputer yang berpura-pura menjadi dua manusia yang berbagi pikiran dan perasaan. Aku tidak tahu kenapa tapi ini terasa sangat aneh bagiku.
Saya bukan satu-satunya yang merasakan hal ini tentang alat AI baru. Kami memainkan versi yang dibuat di kami Ulasan RTX 4090 kepada seluruh tim PC Gamer dan menerima tanggapan seperti:
“Ini benar-benar memicu krisis eksistensial.”
Dan:
“Ini sungguh menakutkan.”
Dan:
“interupsi dan tanggapan dari co-host membuatku takut.”
Dan:
“Aku akan pindah ke hutan, aku tidak tahan.”
Maksud saya adalah, NotebookLM sangat mengesankan sekaligus menakutkan. Terlebih lagi, analogi dan referensi yang dibuat sepanjang rekaman tidak diambil begitu saja dari pokok bahasannya—dalam hal ini, artikel PC Gamer. Mereka sebagian besar dibuat oleh AI.
Misalnya referensi bagaimana 3D V-Cache seperti membangun gedung pencakar langit, bukan gudang yang lebih besar. Saya berharap saya bisa memikirkannya, tapi hanya itu yang dihasilkan AI. Dan itu hanyalah alasan lain mengapa semuanya sangat bagus.
Padahal, podcast adalah tentang pembawa acara dan juga kontennya. Dan sejauh ini kami belum memiliki 'host' lain (AI vocaloids) yang menyuarakan apa pun yang kami unggah ke NotebookLM. Itu pasti akan menjadi sedikit tipis seiring berjalannya waktu. Belum lagi kemungkinan besar tidak akan ada kesalahan lucu dengan dua bot yang diprogram Google di belakang mikrofon.
Saya rasa yang ingin saya katakan adalah bahwa hal ini tidak terasa seperti ancaman nyata dan kredibel terhadap kesuksesan podcast, atau penggantinya. Itu Log Obrolan Pemain PC aman di lain hari. Meskipun seperti yang telah kita lihat pada bentuk-bentuk generasi AI lainnya, hal ini masih dapat mengubah dinamika dari apa yang dianggap layak untuk dilakukan. Misalnya, karya seni yang dihasilkan AI tidak serta merta menghapus semua karya seni buatan manusia, tentu saja tidak, tapi Anda juga mungkin tidak akan melukis 300 gambar menakjubkan hanya untuk menjalankan satu kampanye D&D untuk teman-teman Anda. Anda dapat melakukannya dengan AI, jika Anda tidak sepenuhnya menentang penggunaannya, dan itu juga akan terjadi sepenuhnya adil.
Hal yang sama berlaku di sini. Saya tidak akan merekam podcast untuk setiap artikel yang pernah saya tulis, tetapi apakah saya bisa melakukannya dengan menekan beberapa tombol? Sesuatu yang sama sekali tidak sepadan dengan usaha yang dilakukan beberapa bulan yang lalu, kini hampir tidak ada usaha sama sekali.
Jangan khawatir, saya akan memberi Anda ratusan artikel tentang spesifikasi kartu grafis yang sudah lama dirilis. Tapi Anda mengerti idenya. Saat ini, banyak hal yang mungkin terjadi, namun tidak dapat dilakukan beberapa bulan yang lalu.
Namun ada seekor gajah di dalam ruangan, dan ia berpura-pura menjadi manusia dengan pikiran, emosi, dan pita suara. Alat bahasa alami yang sangat mengesankan ini, karena begitu mudah dan mudah diakses, adalah alat yang berbahaya jika digunakan oleh orang yang salah. Betapa mudahnya memancing perhatian seseorang jika Anda dapat menyuarakan teks apa pun, dokumen apa pun, dengan nada percakapan manusiawi yang halus. Sekarang itu menakutkan.
Namun sebagai bukti konsep tentang kemampuan AI, saya tidak menemukan apa pun yang dapat membangkitkan respons seperti NotebookLM.
Jadi, apa itu NotebookLM?
NotebookLM adalah alat gratis yang tersedia untuk digunakan di NotebookLM.google. Ini memiliki nama yang terdengar sangat membosankan, meskipun secara fungsional cukup menarik.
Ini dibuat berdasarkan model AI Gemini Google—model yang sama yang diluncurkan ke ponsel Android baru dan digunakan untuk menghasilkan cuplikan AI dalam penelusuran web yang mungkin saya sarankan. menghancurkan bisnis internet. Namun, NotebookLM dimaksudkan untuk menjadi teman belajar—AI yang mampu meringkas dokumen, mendengarkan audio, dan menghemat waktu Anda dalam membuat catatan. Hal ini bisa saja mengubah cara saya merevisi ujian di sekolah, namun saya lahir 20 tahun terlalu dini—sangat meleset.
Ini telah tersedia di AS hingga tahun 2024, meskipun peningkatan baru-baru ini selama musim panas dan peluncuran global telah menjadikannya lebih banyak pengguna akhir-akhir ini.
Fitur podcast, yang disebut “Ikhtisar Audio” juga merupakan tambahan yang lebih baru, ditambahkan ke perangkat lunak pada bulan September.
Untuk saat ini, perangkat lunak tersebut hanya mampu berbicara dalam bahasa Inggris, dan catatan di postingan blog Google tentang peluncurannya menyatakan bahwa perangkat lunak tersebut “terkadang menimbulkan akurasi”. Hal ini wajar saja, karena semua model AI, bahkan yang terbaik sekalipun, terkadang cenderung mengada-ada. Ini sering disebut sebagai “halusinasi” tetapi sebenarnya itu hanya istilah yang terdengar mewah ketika AI agak kacau (buruk).
Salah satu fitur yang tampaknya mengarah ke Tinjauan Audio adalah kemampuan untuk menginterupsi pembicara dan, diasumsikan, mengubah arah percakapan atau mengeluarkan koreksi saat itu juga. Ini belum bisa dipastikan, namun Google mencatat dalam posting blognya bahwa “Anda belum dapat mengganggu mereka”, yang merupakan hal yang agak aneh untuk dikatakan jika itu bukan fitur yang dimaksudkan pada suatu saat.
Mari kita pikirkan sejenak: Kemampuan untuk menyela pembawa acara podcast di tengah percakapan dan memberi tahu mereka apa yang Anda ingin mereka bicarakan—ini memberikan pertunjukan langsung yang aneh dan sangat personal dengan tawaran pasif-agresif…
Google bukan satu-satunya perusahaan yang bermain-main dengan bot bertenaga AI yang terdengar seperti manusia. OpenAI juga hadir di pasaran dengan asisten suaranya sendiri yang sesuai dengan yang ada di film Dia. Itu adalah kontak manusia-ke-bot, tapi tidak kalah anehnya.
Tidak diragukan lagi, hal-hal AI percakapan ini akan berhasil nyata aneh, nyata cepat.