OpenAI Pangkas Biaya Penggunaan AI dengan Model “Mini”

OpenAI hari ini mengumumkan model “mini” dengan harga murah yang menurutnya akan memungkinkan lebih banyak perusahaan dan program untuk memanfaatkannya kecerdasan buatanModel baru tersebut, yang disebut GPT-4o mini dan tersedia mulai hari ini, 60 persen lebih murah daripada model OpenAI yang paling murah saat ini, sekaligus menawarkan kinerja yang lebih tinggi, kata perusahaan tersebut.

Buka AI menggambarkan langkah tersebut sebagai bagian dari upaya untuk membuat AI “dapat diakses seluas mungkin,” tetapi hal itu juga mencerminkan meningkatnya persaingan di antara penyedia cloud AI serta meningkatnya minat pada model AI sumber terbuka yang kecil dan gratis. Meta diharapkan untuk meluncurkan versi terbesar dari penawaran gratisnya yang sangat mumpuni, Llama 3, minggu depan.

“Tujuan utama OpenAI adalah membangun dan mendistribusikan AI dengan aman dan membuatnya dapat diakses secara luas,” kata Olivier Godement, seorang manajer produk di OpenAI yang bertanggung jawab atas model baru tersebut, kepada WIRED. “Menyediakan kecerdasan dengan biaya yang lebih rendah adalah salah satu cara paling efisien bagi kami untuk melakukannya.”

Godement mengatakan perusahaan mengembangkan penawaran yang lebih murah dengan meningkatkan arsitektur model dan menyempurnakan data pelatihan serta aturan pelatihan. OpenAI mengatakan GPT-4o mini mengungguli model “kecil” lain di pasaran dalam beberapa tolok ukur umum.

OpenAI telah mendapatkan pijakan yang signifikan di pasar AI cloud berkat kemampuan chatbotnya yang luar biasa, ObrolanGPTyang memulai debutnya pada akhir tahun 2022. Perusahaan ini memungkinkan orang luar mengakses model bahasa besar yang mendukung ChatGPT, yang disebut GPT-4o, dengan biaya tertentu. Perusahaan ini juga menawarkan model yang kurang bertenaga, yang disebut GPT-3.5 Turbo, dengan biaya sekitar sepersepuluh dari biaya GPT-4o.

Minat terhadap model bahasa yang dipicu oleh kesuksesan ChatGPT telah mendorong para pesaing untuk mengembangkan penawaran serupa. Google, pelopor dalam AI, telah melakukan upaya besar untuk membangun dan mengomersialkan model bahasa dan chatbot berskala besar dengan nama merek Gemini. Perusahaan rintisan seperti Anthropic, Cohere, dan AI21 telah mengumpulkan dana jutaan dolar untuk mengembangkan dan memasarkan model bahasa berskala besar mereka sendiri kepada pelanggan bisnis dan pengembang.

Membangun model bahasa besar dengan kinerja tertinggi membutuhkan sumber daya finansial yang besar, tetapi beberapa perusahaan telah memilih untuk membuka sumber kreasi mereka untuk menarik pengembang ke ekosistem mereka. Model AI sumber terbuka yang paling menonjol adalah Llama milik Meta; dapat diunduh dan digunakan secara gratis, tetapi lisensinya memberlakukan batasan tertentu pada penggunaan komersial.

April ini, Meta mengumumkan Llama 3model gratisnya yang paling canggih. Perusahaan merilis versi kecil model dengan 8 miliar parameter—ukuran kasar portabilitas dan kompleksitas model—serta versi yang lebih canggih, berukuran sedang, dengan 70 miliar parameter. Model berukuran sedang ini mendekati penawaran terbaik OpenAI pada beberapa skor tolok ukur.

Beberapa sumber mengonfirmasi kepada WIRED bahwa Meta berencana untuk merilis versi terbesar Llama 3, dengan 400 miliar parameter, pada 23 Juli, meskipun mereka mengatakan tanggal rilis dapat berubah. Tidak jelas seberapa hebat versi Llama 3 ini, tetapi beberapa perusahaan telah mengalihkan perhatian mereka ke model AI sumber terbuka karena lebih murah dan dapat disesuaikan, serta menawarkan kontrol lebih besar atas model dan data yang dimasukkan.

Godement mengakui bahwa kebutuhan pelanggan terus berkembang. “Yang semakin sering kami lihat di pasar adalah pengembang dan bisnis menggabungkan model kecil dan besar untuk membangun pengalaman produk terbaik dengan harga dan latensi yang sesuai bagi mereka,” katanya.

Godement mengatakan penawaran cloud OpenAI menyediakan model yang telah melalui pengujian keamanan lebih banyak kepada pelanggan dibandingkan pesaing. Ia menambahkan bahwa OpenAI pada akhirnya dapat mengembangkan model yang dapat dijalankan pelanggan di perangkat mereka sendiri. “Jika kami melihat permintaan yang besar, kami mungkin akan membuka pintu itu,” katanya.

Sumber