Pembuatan gambar AI baru saja mengambil langkah maju yang besar

Kita telah hidup dengan gambar yang dihasilkan AI selama beberapa waktu, tetapi minggu ini, beberapa pemain utama mengambil beberapa langkah maju yang besar. Secara khusus, saya berbicara tentang pembaruan signifikan pada tengah perjalananModel baru Google, dan Grok.

Setiap perusahaan menunjukkan teknologi yang berkembang dengan kecepatan dan arah yang berbeda-beda. Masih banyak peluang yang terbuka, dan setiap perusahaan menunjukkan seberapa jauh kemajuan telah dicapai.

Midjourney hadir di web

Profesor Dumbledore di tepi kolam renang dalam Harry Potter karya Wes Anderson.
Gambar AI yang dibuat di Midjourney. Saluran/Midjourney

Mari kita mulai dengan Midjourney, yang diam-diam meluncurkan editor web baru Kamis malam yang menggabungkan sejumlah alat manipulasi gambar yang berguna ke dalam satu antarmuka pengguna.

Sebelumnya, fungsi seperti pembingkaian ulang, pengecatan ulang (menambahkan aset yang dihasilkan AI ke atau memodifikasi gambar yang sudah ada), penggeseran, ekstensi kanvas (memperluas batas gambar dan menghasilkan konten untuk diisi), dan pembesaran gambar semuanya memerlukan alat khusus untuk digunakan dan terletak di beberapa menu, yang mengharuskan kreator untuk terus beralih maju mundur. UI baru ini menawarkan proses penyuntingan yang lebih koheren dan efisien, yang sangat berbeda dari awal program di Discord.

Midjourney baru saja merilis editor web mereka!!

Ini sebenarnya salah satu fitur paling keren yang telah mereka luncurkan selama beberapa waktu

pada dasarnya memungkinkan Anda melakukan inpainting, panning, zooming dan lebih banyak lagi dalam satu langkah

sangat sangat kuat foto.twitter.com/Wgyi9ElE5N

—Nick St.Pierre (@nickfloats) 16 Agustus 2024

Editor web baru dirancang untuk membuat pengeditan gambar yang dihasilkan AI lebih mudah dan lebih lancar, CEO Midjourney David Holz di Discord baru-baru ini. “Menurut kami, ini membuat pengeditan gambar MJ Anda jauh lebih mudah daripada sebelumnya dan merupakan langkah maju yang besar,” tulisnya.

Meskipun Midjourney terus bermigrasi dari Discord menuju aplikasi berbasis web, perusahaan tersebut juga mengumumkan bahwa mereka akan mencerminkan pesan dari saluran populer seperti “daily-theme,” “prompt-craft,” dan “general-1” antara ruang web dan saluran Discord sehingga orang dapat mengikuti utas tersebut dari platform mana pun yang mereka sukai. Perusahaan tersebut juga memperkenalkan alat seleksi baru yang bekerja seperti kuas digital, dan yang telah menggantikan alat seleksi persegi dan laso.

Editor baru ini tersedia untuk semua pengguna Midjourney yang telah membuat lebih dari 10 gambar di platform tersebut. Reaksi awal dari komunitas kreator sebagian besar positif.

Editor datang dua minggu setelahnya peluncuran Midjourney 6.1yang meningkatkan kualitas dan koherensi gambar (seperti jumlah jari yang benar), serta secara signifikan meningkatkan waktu pemrosesan dan pemahaman akurasi teks dalam perintah gambarnya.

Grok-2 melepaskan monster itu

Pembaruan Midjourney juga hadir hanya dua hari setelah rilis Grok-2 oleh startup xAI milik Elon Musk, yang merupakan hal besar berikutnya yang terjadi minggu ini.

Kemampuan pembuatan gambar Grok didukung oleh model Flux.1 dari Black Forrest Lab, yang popularitasnya berkembang pesat karena kualitas gambarnya yang mengesankan dan penggunaannya yang bebas.

24 jam sejak peluncuran Grok 2.0 dan kemampuan pembuatan gambarnya!

Saya telah menyiapkan 9 contoh ini agar Anda dapat memanfaatkannya semaksimal mungkin + akses ke pustaka perintah enless!

(Tandai ini untuk nanti) foto.twitter.com/7EDYSogfV2

— TechHalla (@techhalla) 15 Agustus 2024

Kontroversi terbesar dengan Grok-2 bukan hanya kualitasnya, yang cukup bagus, tetapi juga pedomannya yang tampaknya tidak jelas. Tidak seperti banyak generator gambar AI lainnya, Grok-2 tampaknya memiliki sangat sedikit pedoman seputar kekayaan intelektual, kekerasan, dan konten eksplisit lainnya. Ini bukan pertama kalinya generator gambar AI mengalami kesalahan seperti ini, tetapi dengan Grok, hal itu terasa disengaja, dengan Musk menyebutnya sebagai “AI paling menyenangkan di dunia.”

Orang-orang telah menguji batas-batasnya dan menciptakan berbagai macam citra yang mengerikan dan aneh, yang mengingatkan kita pada hari-hari awal pembuatan citra AI. Namun, jika Anda percaya pada retorika Musk, kurangnya pedoman Grok-2 tampaknya disengaja dan dapat membentuk bagaimana teknologi ini berevolusi di masa depan.

Google bersaing dengan Imagen 3

Gambar AI yang dihasilkan oleh model Imagen-3 milik Google. Google

Terakhir, Google mengumumkan Model AI Gambar 3yang mana dirilis untuk semua pengguna AS pada hari KamisGoogle menyebutnya sebagai “model teks-ke-gambar dengan kualitas tertinggi,” yang kini mampu menghasilkan “detail yang lebih baik, pencahayaan yang lebih kaya, dan sedikit artefak yang mengganggu daripada model kami sebelumnya.” Google juga mengatakan bahwa Imagen-3 lebih baik dalam merender teks dan kini hadir dalam versi yang berbeda, dibuat untuk tugas yang sedang dikerjakan, seperti sesuatu yang ringan seperti sketsa cepat atau sesuatu yang jauh lebih terperinci dan beresolusi tinggi.

Untuk saat ini, Imagen 3 hanya tersedia melalui AI Test Kitchen milik Google, sebagai bagian dari ImageFX. Saat ini, aplikasi ini masih dalam versi beta tertutup, yang berarti Anda harus bergabung dalam daftar tunggu jika belum menjadi peserta.




Sumber