Mistral meluncurkan Pixtral 12B, model AI multimodal yang dapat memproses teks dan gambar

Mistral AIperusahaan rintisan kecerdasan buatan yang berkantor pusat di Paris, hari ini meluncurkan model AI canggih terbarunya yang mampu memproses gambar dan teks.

Model baru ini, yang disebut Pixtral 12B, menggunakan sekitar 12 miliar parameter dan merupakan model pertama yang mampu melakukan pengkodean penglihatan, sehingga memungkinkannya untuk “melihat” gambar di samping teks.

Model baru ini didasarkan pada Mistral Nemo 12Bmodel AI yang sebelumnya dirilis oleh perusahaan yang mampu memahami teks, dengan tambahan adaptor penglihatan dengan 400 juta parameter. Adaptor ini memungkinkan pengguna untuk menambahkan gambar melalui URL atau mengodekannya melalui base64 dalam teks yang dimasukkan.

Banyak model bahasa AI besar lainnya juga telah menambahkan kapabilitas multimoda yang memungkinkan pengguna memasukkan gambar seperti keluarga Claude dari Anthropic PBC, GPT-4o dari OpenAI, dan Gemini dari Google LLC. Penambahan kapabilitas penalaran gambar ke Pixtral 12B akan memberinya kemampuan serupa untuk menjawab pertanyaan tentang gambar, menyediakan teks, menghitung objek, dan banyak lagi.

Perusahaan merilis parameter dan kode melalui tautan torrent di Bahasa Indonesia: GitHub dan platform distribusi AI Wajah PelukanPerusahaan telah mendorong para pengembang untuk mulai mengunduh dan menggunakannya.

Kini setelah model tersebut tersedia untuk diunduh, para pengembang akan dapat menyempurnakan dan melatih model tersebut untuk keperluan mereka sendiri. Perusahaan tersebut menawarkan beberapa modelnya sebagai sumber terbuka di bawah lisensi Apache 2.0 tanpa batasan. Untuk model lainnya, Mistral menawarkan lisensi pengembangan yang gratis untuk pengembangan, tetapi memerlukan lisensi berbayar untuk aplikasi komersial, tetapi tidak untuk penggunaan penelitian. Perusahaan tersebut belum menjelaskan lisensi apa yang akan digunakan Pixtral 12B.

Sophia Yang, kepala hubungan pengembang Mistral, mengatakan dalam sebuah pernyataan posting di Xitu Model ini akan segera tersedia untuk pengujian pada platform chatbot dan antarmuka pemrograman aplikasi Mistral, Le Chat dan Le Platforme.

Gambar: Bahasa Indonesia:

Suara dukungan Anda penting bagi kami dan membantu kami menjaga konten tetap GRATIS.

Satu klik di bawah ini mendukung misi kami untuk menyediakan konten yang gratis, mendalam, dan relevan.

Bergabunglah dengan komunitas kami di YouTube

Bergabunglah dengan komunitas yang mencakup lebih dari 15.000 pakar #CubeAlumni, termasuk CEO Amazon.com Andy Jassy, ​​pendiri dan CEO Dell Technologies Michael Dell, CEO Intel Pat Gelsinger, dan banyak tokoh dan pakar lainnya.

“TheCUBE adalah mitra penting bagi industri ini. Kalian benar-benar menjadi bagian dari acara kami dan kami sangat menghargai kedatangan kalian dan saya tahu orang-orang juga menghargai konten yang kalian buat” – Andy Jassy

TERIMA KASIH

Sumber