HyperWrite meluncurkan Reflection 70B, LLM sumber terbuka paling canggih

Bergabunglah dengan buletin harian dan mingguan kami untuk mendapatkan informasi terkini dan konten eksklusif tentang liputan AI terdepan di industri. Pelajari lebih lanjut


Ada raja baru di kota ini: Matt Shumer, salah satu pendiri dan CEO startup penulisan AI Tulisan Hiperhari ini meluncurkan Reflection 70B, model bahasa besar (LLM) baru berdasarkan Llama 3.1-70B Instruct sumber terbuka Meta yang memanfaatkan teknik koreksi kesalahan mandiri baru dan menawarkan kinerja unggul pada tolok ukur pihak ketiga.

Seperti yang diumumkan Shumer di sebuah posting di jejaring sosial XReflection-70B sekarang tampaknya menjadi “model AI sumber terbuka terbaik di dunia.”

Dia mengunggah grafik berikut yang menunjukkan kinerja acuannya di sini:

HyperWrite meluncurkan Reflection 70B, LLM sumber terbuka paling canggih

Reflection 70B telah diuji secara ketat di beberapa benchmark, termasuk MMLU dan HumanEval, menggunakan LLM Decontaminator dari LMSys untuk memastikan hasilnya bebas dari kontaminasi. Benchmark ini menunjukkan Reflection secara konsisten mengungguli model dari seri Llama Meta dan bersaing secara langsung dengan model komersial teratas.

Kamu bisa coba sendiri di sini sebagai demo di situs web “taman bermain”, tetapi sebagai Shumer mencatat pada Xpengumuman raja baru model AI sumber terbuka telah membanjiri situs demo dengan lalu lintas dan timnya berusaha keras untuk menemukan cukup GPU (unit pemrosesan grafis, chip berharga dari Nvidia dan lainnya yang digunakan untuk melatih dan menjalankan sebagian besar model AI generatif) untuk memenuhi permintaan.

Bagaimana Reflection 70B berbeda

Shumer menekankan bahwa Reflection 70B tidak hanya kompetitif dengan model papan atas tetapi juga menghadirkan kemampuan unik, khususnya, identifikasi dan koreksi kesalahan.

Seperti yang disampaikan Shumer kepada VentureBeat melalui DM: “Saya telah memikirkan ide ini selama berbulan-bulan. LLM berhalusinasi, tetapi tidak dapat memperbaiki arah. Apa yang akan terjadi jika Anda mengajarkan LLM cara mengenali dan memperbaiki kesalahannya sendiri?”

Oleh karena itu dinamakan “Reflection” — sebuah model yang dapat merefleksikan teks yang dihasilkan dan menilai keakuratannya sebelum mengirimkannya sebagai output kepada pengguna.

Keunggulan model ini terletak pada teknik yang disebut penyetelan refleksi, yang memungkinkannya mendeteksi kesalahan dalam penalarannya sendiri dan memperbaikinya sebelum menyelesaikan respons.

Refleksi 70B memperkenalkan beberapa token khusus baru untuk penalaran dan koreksi kesalahan, sehingga memudahkan pengguna untuk berinteraksi dengan model dengan cara yang lebih terstruktur. Selama inferensi, model mengeluarkan penalarannya dalam tag khusus, yang memungkinkan koreksi waktu nyata jika mendeteksi kesalahan.

Situs demo taman bermain menyertakan petunjuk yang disarankan untuk digunakan pengguna, yang menanyakan Reflection 70B berapa banyak huruf “r” yang terdapat dalam kata “Strawberry” dan angka mana yang lebih besar, 9,11 atau 9,9, dua masalah sederhana yang gagal diselesaikan dengan benar oleh banyak model AI — termasuk model milik sendiri terkemuka. Pengujian kami terhadap model ini berjalan lambat, tetapi Reflection 70B akhirnya memberikan respons yang benar setelah 60+ detik.

Hal ini membuat model ini sangat berguna untuk tugas-tugas yang membutuhkan akurasi tinggi, karena model ini memisahkan penalaran ke dalam beberapa langkah yang berbeda untuk meningkatkan presisi. Model ini tersedia untuk diunduh melalui repositori kode AI. Wajah Pelukandan akses API akan tersedia hari ini melalui penyedia layanan GPU Laboratorium Hiperbolik.

Model yang lebih kuat dan lebih besar sedang dalam perjalanan

Peluncuran Reflection 70B hanyalah awal dari seri Reflection. Shumer telah mengumumkan bahwa model yang lebih besar, Reflection 405B, akan tersedia minggu depan.

Ia juga mengatakan kepada VentureBeat bahwa HyperWrite sedang berupaya mengintegrasikan model Reflection 70B ke dalam produk asisten penulisan AI utamanya.

“Kami tengah menjajaki sejumlah cara untuk mengintegrasikan model tersebut ke dalam HyperWrite — saya akan segera berbagi informasi lebih lanjut tentang hal ini,” janjinya.

Reflection 405B diharapkan dapat mengungguli bahkan model-model sumber tertutup teratas di pasaran saat ini. Shumer juga mengatakan HyperWrite akan merilis laporan yang merinci proses pelatihan dan tolok ukur, yang memberikan wawasan tentang inovasi yang mendukung model-model Reflection.

Model dasar untuk Reflection 70B dibangun di atas Llama 3.1 70B Instruct milik Meta dan menggunakan format obrolan Llama bawaan, yang memastikan kompatibilitas dengan alat dan jalur yang ada.

Shumer memuji Glaive karena memungkinkan pelatihan model AI yang cepat

Kontributor utama keberhasilan Reflection 70B adalah data sintetis yang dihasilkan oleh Glaive, perusahaan rintisan yang mengkhususkan diri dalam pembuatan kumpulan data khusus kasus penggunaan.

Platform Glaive memungkinkan pelatihan cepat model bahasa kecil yang sangat terfokus, membantu mendemokratisasi akses ke perangkat AI. Didirikan oleh insinyur Belanda Sahil Chaudhary, Pedang berfokus pada penyelesaian salah satu hambatan terbesar dalam pengembangan AI: ketersediaan data spesifik tugas berkualitas tinggi.

Pendekatan Glaive adalah menciptakan kumpulan data sintetis yang disesuaikan dengan kebutuhan spesifik, yang memungkinkan perusahaan menyempurnakan model dengan cepat dan terjangkau. Perusahaan tersebut telah menunjukkan keberhasilan dengan model yang lebih kecil, seperti model parameter 3B yang mengungguli banyak alternatif sumber terbuka yang lebih besar pada tugas-tugas seperti HumanEval. Spark Capital memimpin putaran awal pendanaan senilai $3,5 juta untuk Glaive lebih dari setahun yang lalu, mendukung visi Sahil untuk menciptakan ekosistem AI yang dikomoditisasi di mana model spesialis dapat dilatih dengan mudah untuk tugas apa pun.

Dengan memanfaatkan teknologi Glaive, tim Reflection mampu menghasilkan data sintetis berkualitas tinggi dengan cepat untuk melatih Reflection 70B. Shumer memuji Sahil dan platform Glaive AI karena mempercepat proses pengembangan, dengan data yang dihasilkan dalam hitungan jam, bukan minggu.

Secara keseluruhan, proses pelatihan memakan waktu tiga minggu, menurut Shumer dalam pesan langsung kepada VentureBeat. “Kami melatih lima iterasi model selama tiga minggu,” tulisnya. “Kumpulan data sepenuhnya dibuat khusus, dibuat menggunakan sistem pembuatan data sintetis Glaive.”

HyperWrite adalah perusahaan rintisan AI langka di Long Island

Sekilas, Reflection 70B tampak seperti muncul entah dari mana. Namun, Shumer telah berkecimpung di dunia AI selama bertahun-tahun.

Dia mendirikan perusahaannya, awalnya bernama Otherside AI, pada tahun 2020 bersama Jason KuperbergAwalnya berpusat di Melville, New York, sebuah dusun sekitar satu jam perjalanan ke timur Kota New York di Long Island.

Aplikasi ini mendapatkan perhatian dari produk andalannya, HyperWrite, yang dimulai sebagai ekstensi Chrome bagi konsumen untuk membuat email dan tanggapan berdasarkan poin-poin penting, tetapi telah berkembang untuk menangani tugas-tugas seperti menyusun esai, meringkas teks, dan bahkan mengatur email. HyperWrite menghitung dua juta pengguna pada November 2023 dan menjadikan duo pendiri tersebut mendapat tempat di Majalah Forbes'Daftar tahunan “30 Under 30”yang akhirnya memacu Shumer dan Kuperberg beserta tim mereka yang berkembang untuk mengubah nama perusahaan menjadi seperti itu.

Putaran terbaru HyperWrite, diungkapkan pada bulan Maret 2023mendapat suntikan dana sebesar $2,8 juta dari investor termasuk Madrona Venture Group. Dengan pendanaan ini, HyperWrite telah memperkenalkan fitur-fitur baru yang digerakkan oleh AI, seperti mengubah peramban web menjadi pelayan virtual yang dapat menangani berbagai tugas mulai dari memesan tiket pesawat hingga mencari kandidat pekerjaan di LinkedIn.

Shumer mencatat bahwa akurasi dan keamanan tetap menjadi prioritas utama bagi HyperWrite, terutama saat mereka mengeksplorasi tugas-tugas otomatisasi yang kompleks. Platform tersebut masih menyempurnakan alat asisten pribadinya dengan memantau dan melakukan penyempurnaan berdasarkan masukan pengguna. Pendekatan yang hati-hati ini, serupa dengan penalaran terstruktur dan refleksi yang tertanam dalam Reflection 70B, menunjukkan komitmen Shumer terhadap presisi dan tanggung jawab dalam pengembangan AI.

Apa yang selanjutnya untuk HyperWrite dan keluarga model Reflection AI?

Ke depannya, Shumer memiliki rencana yang lebih besar untuk seri Reflection. Dengan peluncuran Reflection 405B yang akan segera dilakukan, ia yakin seri ini akan melampaui kinerja LLM milik sendiri atau sumber tertutup seperti GPT-4o milik OpenAI, yang saat ini menjadi pemimpin global, dengan margin yang signifikan.

Ini merupakan berita buruk tidak hanya bagi OpenAI — yang dilaporkan tengah berupaya untuk mendapatkan putaran investasi swasta baru yang signifikan dari seperti Nvidia dan Apple — tetapi penyedia model sumber tertutup lainnya seperti Antropik dan bahkan Microsoft.

Tampaknya sekali lagi dalam ruang AI generasi yang bergerak cepat, keseimbangan kekuatan telah bergeser.

Untuk saat ini, peluncuran Reflection 70B menandai tonggak penting bagi AI sumber terbuka, yang memberikan akses kepada pengembang dan peneliti ke alat canggih yang menyaingi kemampuan model milik sendiri. Seiring dengan terus berkembangnya AI, pendekatan unik Reflection terhadap penalaran dan koreksi kesalahan dapat menetapkan standar baru untuk apa yang dapat dicapai oleh model sumber terbuka.


Sumber