Black Forest Labs Open-Source FLUX.1: Sebuah Transformator Aliran Terbalik dengan 12 Miliar Parameter yang Mampu Menghasilkan Gambar dari Deskripsi Teks

Dalam pengumuman penting, Black Forest Labs telah muncul sebagai pemain baru dalam lanskap AI generatif. Dengan akar yang kuat dalam komunitas penelitian, perusahaan inovatif ini bertujuan untuk merevolusi bidang model pembelajaran mendalam generatif, terutama berfokus pada media seperti gambar dan video. Misi mereka jelas: untuk mendorong batasan kreativitas, efisiensi, dan keberagaman dalam konten yang dihasilkan AI. Black Forest Labs membayangkan AI generatif sebagai landasan teknologi masa depan dan berkomitmen untuk membuat model mereka dapat diakses oleh khalayak luas. Dengan melakukan hal itu, mereka berharap untuk mendidik masyarakat dan menumbuhkan kepercayaan terhadap keamanan model canggih ini. Sebagai penawaran perdana mereka, Laboratorium Hutan Hitam telah meluncurkan rangkaian FLUX.1kumpulan model mutakhir yang dirancang untuk mendefinisikan ulang kemungkinan sintesis teks ke gambar.

Sumber Gambar: https://blackforestlabs.ai/announcing-black-forest-labs/

Rangkaian FLUX.1 merupakan lompatan maju yang signifikan dalam sintesis teks ke gambar. Koleksi model yang inovatif ini menetapkan tolok ukur baru dalam beberapa area utama:

• Detail gambar: Menghasilkan visual yang sangat tajam dan rumit

• Kepatuhan yang cepat: Menerjemahkan deskripsi teks secara akurat ke dalam representasi visual

• Keragaman gaya: Menawarkan berbagai pilihan artistik dan gaya

• Kompleksitas pemandangan: Menangani komposisi gambar yang rumit dan beraneka ragam

Untuk memenuhi berbagai kebutuhan pengguna, FLUX.1 tersedia di tiga varian berbeda:

• FLUX.1 (pro): Model unggulan, menawarkan kinerja tingkat atas untuk aplikasi profesional

• FLUX.1 (dev): Model bobot terbuka untuk penggunaan non-komersial, menyeimbangkan kualitas dan efisiensi

• FLUX.1 (schnell): Model cepat yang dirancang untuk pengembangan lokal dan proyek pribadi

Sumber Gambar: https://blackforestlabs.ai/announcing-black-forest-labs/

Setiap varian dapat diakses melalui platform dan opsi lisensi yang berbeda, memastikan bahwa pengguna dari berbagai latar belakang dapat memanfaatkan kekuatan FLUX.1 untuk kebutuhan spesifik mereka.

Sumber Gambar: https://blackforestlabs.ai/announcing-black-forest-labs/

Berdasarkan fondasi pencocokan aliran, model FLUX.1 menggunakan arsitektur hibrida yang canggih. Desain ini menggabungkan blok transformator difusi multimoda dan paralel, yang diskalakan ke skala yang mengesankan 12 miliar parameterIntegrasi penempatan posisi putar dan lapisan perhatian paralel meningkatkan kinerja dan efisiensi perangkat keras, yang membedakan FLUX.1 dari model difusi canggih sebelumnya di bidang AI generatif.

FLUX.1 telah memantapkan dirinya sebagai pelopor dalam teknologi sintesis gambar, yang menetapkan tolok ukur baru di berbagai kelas model. Varian FLUX.1 (pro) dan (dev) telah melampaui pesaing populer seperti Midjourney v6.0, DALL·E 3 (HD), dan SD3-Ultra dalam aspek-aspek penting seperti kualitas visual, kepatuhan cepat, fleksibilitas ukuran dan rasio aspek, tipografi, dan keragaman output. Bahkan model FLUX.1 (schnell), yang dirancang untuk pemrosesan cepat, tidak hanya mengungguli pesaing langsungnya tetapi juga model non-distilled yang tangguh. Kekuatan utama rangkaian FLUX.1 adalah kemampuannya untuk mempertahankan spektrum penuh keragaman output dari prapelatihan, yang menawarkan kemungkinan kreatif yang ditingkatkan secara signifikan dibandingkan dengan model canggih yang ada di lapangan.

Sumber Gambar: https://blackforestlabs.ai/announcing-black-forest-labs/

FLUX.1 menawarkan beberapa fitur utama yang membedakannya dalam lanskap AI generatif:

• Kualitas output premium dan kepatuhan cepat dan tepat, menyaingi alternatif sumber tertutup

• FLUX.1 (schnell) menggunakan distilasi difusi adversarial laten, memungkinkan pembuatan gambar berkualitas tinggi hanya dalam 1-4 langkah

• Dirilis di bawah lisensi Apache 2.0, memungkinkan penggunaan serbaguna di seluruh aplikasi pribadi, ilmiah, dan komersial.

Fitur-fitur ini bersatu untuk menjadikan FLUX.1 alat yang tangguh dan mudah diakses untuk berbagai kebutuhan sintesis gambar.

Untuk memfasilitasi adopsi dan pengembangan, Black Forest Labs telah menyediakan implementasi referensi dan kode sampel untuk FLUX.1 (schnell) dalam repositori GitHub khusus. Sumber daya ini berfungsi sebagai titik awal yang sangat baik bagi para pengembang dan kreator yang ingin memanfaatkan kemampuan FLUX.1 (schnell) dalam proyek mereka, mendorong inovasi dan eksperimen dengan model teks-ke-gambar yang canggih ini.

Berdasarkan sifat FLUX.1 yang mudah diakses, Black Forest Labs telah menyederhanakan proses pengaturan lokal. Bagi mereka yang ingin bereksperimen dengan model tersebut pada mesin mereka sendiri, panduan langkah demi langkah berikut menyediakan metode instalasi yang mudah:

Proses pengaturan yang sederhana ini memungkinkan pengembang dan penggemar untuk dengan cepat mengintegrasikan FLUX.1 ke dalam lingkungan lokal mereka, memfasilitasi eksplorasi dan pengembangan langsung dengan model teks-ke-gambar yang canggih ini.

Meskipun FLUX.1 merupakan kemajuan signifikan dalam sintesis teks ke gambar, penting untuk mengakui keterbatasan dan tujuan penggunaannya. Model ini tidak dirancang untuk memberikan informasi faktual dan dapat secara tidak sengaja memperkuat bias sosial. Kualitas outputnya dapat bervariasi tergantung pada gaya permintaan. Pengguna harus mematuhi pedoman etika yang ketat, menghindari aktivitas ilegal, eksploitasi anak di bawah umur, penyebaran informasi palsu, pelecehan, pembuatan konten tanpa persetujuan, atau pengambilan keputusan otomatis yang memengaruhi hak individu. Model ini tidak boleh digunakan untuk kampanye disinformasi skala besar atau untuk menghasilkan informasi identitas pribadi yang dapat merugikan orang lain. Pembatasan ini memastikan penggunaan alat AI yang canggih ini secara bertanggung jawab.

Black Forest Labs telah memperkenalkan FLUX.1, serangkaian model sintesis teks ke gambar yang canggih. Tersedia dalam tiga varian ((pro), (dev), dan (schnell)), FLUX.1 menetapkan tolok ukur baru dalam hal detail gambar, kepatuhan cepat, keragaman gaya, dan kompleksitas pemandangan. Model tersebut menggunakan arsitektur hibrida dengan 12 miliar parameter, melampaui pesaing seperti Midjourney v6.0 dan DALL·E 3 dalam berbagai aspek. FLUX.1 dirilis di bawah lisensi Apache 2.0, yang memungkinkan aplikasi serbaguna. Meskipun canggih, pengguna harus mematuhi pedoman etika untuk memastikan penggunaan yang bertanggung jawab. Black Forest Labs bertujuan untuk merevolusi AI generatif dan membuatnya dapat diakses oleh khalayak luas.


Lihat di sini Detail, Bahasa Indonesia: GitHub FLUX.1 (pro)Bahasa Indonesia: FLUX.1 (pengembangan)Dan FLUX.1 (cepat). Semua penghargaan atas penelitian ini diberikan kepada para peneliti proyek ini. Jangan lupa untuk mengikuti kami di Twitter dan bergabunglah dengan kami Saluran Telegram Dan LinkedIn Hijaunaik. Jika Anda menyukai pekerjaan kami, Anda akan menyukai kami buletin..

Jangan Lupa untuk bergabung dengan kami 47rb+ ML SubReddit

Temukan Yang Akan Datang Webinar AI di sini


Asjad adalah konsultan magang di Marktechpost. Ia sedang menempuh pendidikan B.Tech di bidang teknik mesin di Institut Teknologi India, Kharagpur. Asjad adalah penggemar pembelajaran mesin dan pembelajaran mendalam yang selalu meneliti penerapan pembelajaran mesin dalam perawatan kesehatan.



Sumber