Meta Sesumbar Bahwa Video AI-nya Bisa 'Mengungguli' Saingannya Seperti OpenAI
  • Meta baru saja meluncurkan Movie Gen, generator video AI untuk bersaing dengan Sora OpenAI.
  • Movie Gen dapat membuat video dengan audio yang menyertainya menggunakan perintah teks. Itu juga dapat diedit dengan cepat.
  • Meta bergabung dalam perlombaan pembuatan video lebih lambat dari OpenAI dan Google.

Meta merilis alat penghasil video AI baru pada hari Jumat yang juga merupakan upaya terbaru perusahaan dalam pertarungannya dengan OpenAI untuk supremasi AI.

“Hari ini, kami sangat bersemangat untuk meluncurkan Meta Movie Gen, terobosan penelitian AI generatif kami untuk media, yang mencakup modalitas seperti gambar, video, dan audio,” kata perusahaan itu dalam sebuah pernyataan. siaran pers. “Movie Gen mengungguli model serupa di industri dalam tugas-tugas ini ketika dievaluasi oleh manusia.”

Dalam siaran persnya, Meta menyebut Movie Gen sebagai “rangkaian model penceritaan paling canggih dan imersif,” termasuk pembuatan video, pembuatan audio, pembuatan video yang dipersonalisasi, dan pengeditan video. Model-model tersebut dilatih menggunakan data yang tersedia untuk umum dan data berlisensi, kata perusahaan itu.

Dengan perintah teks, Movie Gen dapat membuat video berdurasi hingga 16 detik pada 16 frame per detik sambil memikirkan “tentang gerakan objek, interaksi subjek-objek, dan gerakan kamera”. Pengguna dapat mengunggah foto dirinya untuk dimasukkan ke dalam video yang dipersonalisasi, dan Movie Gen dapat mengedit video dengan instruksi teks dari pengguna.

Contoh video Meta menunjukkan perspektif bawah air dari bayi kuda nil (Moo Deng referensi, siapa saja?) dengan senang hati berenang-renang di pemandangan perairan yang tenang.

Yang lain menunjukkan seekor koala di atas papan selancar dan petunjuk yang menyertainya: “Seekor beruang koala berbulu halus sedang berselancar. Ia memiliki bulu abu-abu dan putih serta hidung bulat. Papan selancar berwarna kuning. Beruang koala memegang papan selancar dengan cakarnya. Koala ekspresi wajah beruang terfokus. Matahari bersinar.”

Dengan pembuatan audio, pengguna dapat “membuat dan memperluas efek suara, musik latar, atau keseluruhan soundtrack” hingga berdurasi 45 detik, kata siaran persnya. Contoh klip ular merayap melalui kawasan hutan termasuk prompt: “Dedaunan gemeresik dan ranting patah, dengan trek musik orkestra.”

Meta sedikit terlambat dalam permainan generasi audio dan video karena pesaing utama seperti OpenAI dan Google telah mengklaim pijakan di bidang ini. Buka Ai meluncurkan Soragenerator videonya, pada bulan Februari, dan Google mengikutinya dengan Veo pada bulan Mei.

Meta, bagaimanapun, telah memberi OpenAI kehabisan uang dalam perlombaan senjata AI. Meskipun ChatGPT OpenAI memulai debutnya pertama kali dan meluncurkan perusahaan tersebut ke ketenaran di seluruh dunia, iterasi terbaru dari model Llama Meta telah diterima dengan baik. Banyak melihat Llama 3.1yang dirilis pada bulan Juli, lebih unggul dari GPT-4o OpenAI, yang dirilis tidak lama sebelumnya.

Meta mengatakan bahwa “model tercanggih” barunya mengungguli pesaing dalam perbandingan manusia A/B. Untuk pembuatan video, Meta yang disurvei lebih memilih Movie Gen OpenAI Sorakata siaran pers perusahaan. Meta tidak membagikan perbandingan A/B dengan Google Veo, yang juga menawarkan efek suara dan musik, namun Meta mengatakannya secara panjang lebar. makalah penelitian bahwa mereka yakin model pembuatan video-ke-audio Google mungkin lebih terbatas panjangnya dibandingkan model Meta.

Meta, OpenAI, dan Google tidak segera menanggapi permintaan komentar.

LEAVE A REPLY

Please enter your comment!
Please enter your name here