OpenAI merilis model yang lebih murah dan lebih cerdas

OpenAI merilis model yang lebih ringan dan murah bagi para pengembang untuk bereksperimen, yang disebut GPT-4o Mini. Harganya jauh lebih murah daripada model berukuran penuh dan dikatakan lebih canggih daripada GPT-3.5.

Membangun aplikasi menggunakan model OpenAI dapat menghabiskan biaya yang sangat besar. Pengembang yang tidak mampu untuk mengutak-atiknya dapat kehilangan kesempatan sepenuhnya dan mungkin memilih model yang lebih murah seperti Google Gemini 1.5 Flash atau Anthropic Claude 3 Haiku. Sekarang, OpenAI memasuki permainan model ringan.

“Saya pikir GPT-4o Mini benar-benar sesuai dengan misi OpenAI untuk membuat AI lebih mudah diakses oleh masyarakat luas. Jika kita ingin AI bermanfaat bagi setiap sudut dunia, setiap industri, setiap aplikasi, kita harus membuat AI jauh lebih terjangkau,” kata Olivier Godement, yang memimpin produk platform API, kepada The Verge (Jurnal Riset dan Pengembangan Industri).

Mulai hari ini, pengguna ChatGPT pada paket Gratis, Plus, dan Tim dapat menggunakan GPT-4o Mini sebagai ganti GPT-3.5 Turbo, dan pengguna Enterprise akan mendapatkan akses minggu depan. Itu berarti GPT-3.5 tidak akan lagi menjadi pilihan bagi pengguna ChatGPT, tetapi akan tetap tersedia bagi pengembang melalui API jika mereka memilih untuk tidak beralih ke GPT-4o Mini. Godement mengatakan GPT-3.5 akan dihentikan dari API pada suatu saat — mereka hanya tidak yakin kapan.

“Saya pikir ini akan menjadi sangat populer,” kata Godement

Model baru yang ringan ini juga akan mendukung teks dan visual dalam API, dan perusahaan tersebut mengatakan bahwa model ini akan segera menangani semua input dan output multimodal seperti video dan audio. Dengan semua kemampuan ini, model ini bisa terlihat seperti asisten virtual yang lebih mumpuni yang dapat memahami rencana perjalanan Anda dan membuat saran. Namun, model ini ditujukan untuk tugas-tugas sederhana, jadi tidak ada yang benar-benar membuat Siri dengan harga murah.

Model baru ini meraih skor 82 persen pada Measurement Massive Multitask Language Understanding (MMLU), ujian tolok ukur yang terdiri dari sekitar 16.000 pertanyaan pilihan ganda di 57 mata pelajaran akademis. Ketika MMLU pertama kali diperkenalkan pada tahun 2020, sebagian besar model cukup buruk dalam hal itu, yang merupakan tujuannya karena model tersebut sudah terlalu maju untuk ujian tolok ukur sebelumnya. GPT-3.5 memperoleh skor 70 persen pada tolok ukur ini, GPT-4o memperoleh skor 88,7 persen, dan Google mengklaim Gemini Ultra memiliki skor tertinggi yang pernah ada sebesar 90 persen. Sebagai perbandingan, model-model yang bersaing Claude 3 Haiku Dan Gemini 1.5 Kilat mendapat skor masing-masing 75,2 persen dan 78,9 persen.

Perlu dicatat bahwa para peneliti waspada terhadap uji tolok ukur seperti MMLU, karena cara pelaksanaannya sedikit berbeda dari satu perusahaan ke perusahaan lain. Hal ini membuat skor model yang berbeda sulit untuk dibandingkan, karena Surat kabar New York Times dilaporkanAda pula masalah AI yang berpotensi memiliki jawaban-jawaban ini dalam kumpulan datanya, yang pada dasarnya memungkinkannya berbuat curang, dan biasanya tidak ada evaluator pihak ketiga yang menjadi bagian dari proses tersebut.

Bagi para pengembang yang ingin membangun aplikasi AI dengan biaya murah, peluncuran GPT-4o Mini memberi mereka alat lain untuk ditambahkan ke inventaris mereka. OpenAI membiarkan perusahaan rintisan teknologi finansial Ramp menguji model tersebut, menggunakan GPT-4o Mini untuk membangun alat yang mengekstrak data pengeluaran pada kwitansi. Jadi, alih-alih bersusah payah menelusuri kotak teks, pengguna dapat mengunggah gambar kwitansi mereka dan model tersebut akan menyortir semuanya untuk mereka. Superhuman, klien email, juga menguji GPT-4o Mini dan menggunakannya untuk membuat fitur saran otomatis untuk respons email.

Tujuannya adalah untuk menyediakan sesuatu yang ringan dan murah bagi para pengembang untuk membuat semua aplikasi dan alat yang tidak mampu mereka buat dengan model yang lebih besar dan lebih mahal seperti GPT-4. Banyak pengembang akan beralih ke Claude 3 Haiku atau Gemini 1.5 Flash sebelum membayar biaya komputasi yang sangat mahal yang diperlukan untuk menjalankan salah satu model yang paling tangguh.

Jadi, apa yang membuat OpenAI begitu lama? Godement mengatakan itu adalah “prioritas murni” karena perusahaan tersebut berfokus pada pembuatan model yang lebih besar dan lebih baik seperti GPT-4, yang membutuhkan banyak “tenaga manusia dan upaya komputasi.” Seiring berjalannya waktu, OpenAI melihat tren pengembang yang ingin menggunakan model yang lebih kecil, sehingga perusahaan memutuskan sekarang adalah saatnya untuk menginvestasikan sumber dayanya dalam membangun GPT-4o Mini.

“Saya pikir ini akan sangat populer,” kata Godement. “Baik oleh aplikasi yang sudah ada yang menggunakan semua AI di OpenAI maupun banyak aplikasi yang dikeluarkan berdasarkan harga sebelumnya.”

Sumber