Home News Apa yang Terjadi Saat Kita Menabrak 'Tembok Data'?

Apa yang Terjadi Saat Kita Menabrak 'Tembok Data'?

31 July 2024

115

Prompt adalah rangkuman mingguan tentang perusahaan rintisan AI yang paling diminati, terobosan terbesar, dan transaksi bisnis. Untuk mendapatkannya di kotak masuk Anda, berlangganan di sini.

Selamat datang kembali di The Prompt.

Dengan Olimpiade yang sedang berlangsung, perusahaan yang memasang iklan selama pertandingan mencari cara untuk menghubungkan bisnis mereka dengan atletik — dan terkadang itu berlebihan. Dalam iklan terbaru Google, seorang ayah beralih ke chatbot AI Google Gemini untuk menulis surat dari putrinya kepada atlet favoritnya. Orang-orang terkejut Google akan menyarankan untuk mengganti elemen manusia dari surat yang ditulis penggemar setia dengan AI: komentator daring mencatat bahwa iklan tersebut mengambil “sepotong kecil jiwaku“,” “membuatku ingin berteriak” dan “sesuatu yang tampaknya tidak diinginkan oleh siapapun“.”

Sekarang mari kita masuk ke berita utama.

PERMAINAN BESAR

Pada hari Kamis, OpenAI mengumumkan bahwa mereka sedang menguji prototipe mesin pencari baru yang disebut PencarianGPTAlat yang dibangun di atas model GPT-4 ini akan mencari dan meringkas informasi waktu nyata dari seluruh web. OpenAI mengatakan bahwa mereka bermitra dengan penerbit seperti News Corp dan The Atlantic untuk mencari sumber konten dan bahwa jawabannya akan “mengutip secara mencolok” sumber di akhir tanggapan.

SearchGPT bisa menjadi tantangan nyata bagi raksasa pencarian Google, yang sekarang menyediakan Ringkasan yang ditulis AI di bagian atas hasil pencarian, dan startup pencarian AI yang baru lahir Kebingunganyang juga mengambil berita dari artikel dalam respons AI terhadap permintaan pencarian. Setelah Majalah Forbes melaporkan bahwa Perplexity telah menerbitkan ulang karya jurnalistik dari beberapa outlet berita tanpa mencantumkan sumber yang tepat, perusahaan tersebut mengumumkan hari ini bahwa mereka bermitra dengan penerbit termasuk Time, Fortune, dan Texas Tribune dan meluncurkan “program pembagian pendapatan,” di mana merek akan mensponsori pertanyaan lanjutan atau relevan dan penerbit yang disebutkan dalam jawaban tersebut akan menerima bagian yang tidak disebutkan dari pendapatan yang diperoleh Perplexity.

KINERJA PUNCAK

Membangun aplikasi sekarang semudah menulis perintah berbasis teks. Meja Udarayang alat kode rendahnya telah membantu menyiapkan 50 juta aplikasi, telah meluncurkan alat AI generatif baru yang disebut Airtable Cobuilder, yang menggunakan model GPT-4 OpenAI dan informasi tentang jabatan dan perusahaan seseorang untuk menyarankan dan membuat aplikasi yang relevan.

PENAWARAN AI MINGGU INI

Platform logistik AI Altana mengumpulkan $200 juta dengan valuasi $1 miliar, Majalah Forbes dilaporkan. Didirikan pada tahun 2019, Altana menggunakan kecerdasan buatan untuk menganalisis dan menghasilkan wawasan dari peta rantai pasokan. Perusahaan ini juga menggunakan AI generatif untuk memungkinkan pengguna mengajukan pertanyaan tentang hambatan dalam rantai pasokan mereka, sehingga mereka dapat menemukan kerentanan dan menindaklanjutinya.

Yang juga perlu diperhatikan: Startup AI yang legal Harvey mengumpulkan investasi sebesar $100 juta dengan valuasi sebesar $1,5 miliar, dan merancang startup Kanvas memperoleh generator teks-ke-gambar Leonardo AI.

MENYELAM DALAM

AI mungkin akan segera menghadapi pertanyaan eksistensial: Dari mana data akan berasal?

Ilustrasi oleh Alex Castro untuk Forbes

Pada tahun 2011, Marc Andreessen, yang perusahaan modal venturanya Andreessen Horowitz telah berinvestasi di beberapa perusahaan rintisan terbesar di bidang AI, menulis bahwa “perangkat lunak sedang menguasai dunia.” Lebih dari satu dekade kemudian, hal itu benar-benar terjadi.

Kecerdasan buatan, khususnya model bahasa besar yang mendukungnya, adalah konsumen data yang rakus. Namun, data tersebut terbatas dan jumlahnya semakin menipis. Perusahaan telah memanfaatkan segala cara dalam upaya mereka untuk melatih AI yang semakin canggih: video YouTube transkrip dan subtitle, postingan publik di Facebook dan Instagram, buku dan artikel berita yang dilindungi hak cipta — terkadang tanpa izinterkadang dengan kesepakatan lisensiChatGPT OpenAI, chatbot yang membantu arus utama AI, telah dilatih di seluruh internet publiksekitar 300 miliar kata termasuk seluruh Wikipedia dan Reddit. Dalam beberapa kasus, tidak akan ada yang tersisa.

Para peneliti menyebut hal ini sebagai “menabrak tembok data.” Dan mereka mengatakan hal ini mungkin terjadi paling cepat tahun 2026.

Hal ini membuat penciptaan lebih banyak data pelatihan AI menjadi pertanyaan bernilai miliaran dolar — pertanyaan yang sedang dicari cara baru untuk dijawab oleh sekelompok startup baru.

Satu kemungkinan: menciptakan data buatan. Itulah pendekatan perusahaan rintisan Gretel yang berusia lima tahun terhadap masalah data AI. Perusahaan itu membuat apa yang dikenal sebagai “data sintetis” — data yang dihasilkan AI yang sangat mirip dengan informasi faktual, tetapi sebenarnya tidak nyata.

Namun, data sintetis memiliki keterbatasan. Data sintetis dapat membesar-besarkan bias dalam kumpulan data asli dan gagal menyertakan outlier, pengecualian langka yang hanya akan Anda lihat dalam data nyata. Hal itu dapat memperburuk kecenderungan AI untuk berhalusinasi. Atau model yang dilatih pada data palsu dapat gagal menghasilkan sesuatu yang baru. Golshan menyebut ini sebagai “spiral kematian”, tetapi lebih dikenal sebagai “keruntuhan model”. Ia mengharuskan pelanggan baru untuk memberikan Gretel sejumlah data nyata dan berkualitas tinggi untuk menghindarinya. “Data sampah yang aman tetaplah data sampah,” kata Golshan Forbes.

Baca cerita selengkapnya di Majalah Forbes.

DEMO MINGGUAN ANDA

Platform media sosial milik Elon Musk, X diam-diam mengaktifkan pengaturan default yang memberikan izin untuk menggunakan posting dan interaksi publik untuk melatih Grok, model bahasa besar yang dikembangkan oleh startup milik Musk lainnya, xAI. Chatbot AI lainnya seperti ChatGPT milik OpenAI juga telah dilatih pada data publik dari posting Twitter. Berita baiknya? Anda dapat mencegah posting X Anda dicuri oleh menonaktifkan fitur di tab privasi dan pengaturan.

ULANGAN

Mantan quarterback NFL ini telah meluncurkan perusahaan AI yang bertujuan membantu orang membuat dan menerbitkan cerita melalui alat AI generatif yang dapat mengembangkan karakter dan mengedit dialog.

Tom Brady
Colin Kaepernick
Dan Marino
Patrick Mahomes

Periksa apakah Anda sudah melakukannya dengan benar Di Sini.

PERILAKU MODEL

Sebuah perusahaan rintisan baru bernama Friend yang didirikan oleh Avi Schiffmann, seorang dropout dari Harvard, menjual Kalung AI seharga $99 untuk “memerangi kesepian.” Ya, Anda benar. Liontin “alway-listening” pada kalung itu bereaksi secara langsung terhadap apa pun yang dilakukan pemakainya; jika Anda mengetuknya, ia akan mengirimi Anda pesan singkat. Sebuah cuplikan teknologi itu menunjukkan kasus penggunaan seperti mengobrol santai dengannya tentang seberapa enak falafel Anda atau seberapa buruk keterampilan bermain gim Anda.

Sumber

Apa yang Terjadi Saat Kita Menabrak 'Tembok Data'?

PERMAINAN BESAR

KINERJA PUNCAK

PENAWARAN AI MINGGU INI

MENYELAM DALAM

DEMO MINGGUAN ANDA

ULANGAN

PERILAKU MODEL

Recent Posts

5 Faktor X pada Pemilu 2024

Hasil WWE NXT: Pemenang, Nilai Langsung, Reaksi, dan Sorotan Setelah Malapetaka...

Pelayaran Gerhana Matahari Seabourn | Buka peti

'Ini Perasaan Terbaik Di Dunia Untuk…' Selena Gomez Mengekspresikan Kegembiraannya Membawa...

Colorado secara tidak sengaja memasukkan kata sandi sistem pemungutan suara secara...

Dia bilang dia keguguran. Kemudian dia ditangkap.

Kategori