Apple tidak menggunakan GPU Nvidia untuk model AI-nya, melainkan menggunakan ribuan TPU Google

Apple telah mengungkapkan bahwa mereka tidak menggunakan akselerator perangkat keras Nvidia untuk mengembangkan produk mereka yang baru-baru ini diungkapkan Kecerdasan Apple Fitur. Menurut keterangan resmi Apple makalah penelitian (PDF), namun sebaliknya mengandalkan Google TPU untuk mengolah data pelatihan di balik Model Bahasa Apple Intelligence Foundation.

Pengepakan sistem Google TPU v4 dan chip TPUv5 berperan penting dalam pembuatan Apple Foundation Models (AFM). Model-model ini, model AFM-server dan AFM-on-device, dirancang untuk mendukung fitur-fitur Apple Intelligence online dan offline yang diperkenalkan kembali di WWDC 2024 pada bulan Juni.

(Kredit gambar: makalah penelitian Apple)

Server AFM merupakan LLM terbesar Apple, dan karenanya tetap online saja. Menurut makalah penelitian yang baru-baru ini dirilis, server AFM Apple dilatih pada 8.192 chip TPUv4 yang “disediakan sebagai 8 × 1.024 irisan chip, yang mana irisan-irisan tersebut dihubungkan bersama oleh jaringan pusat data (DCN).” Pra-pelatihan merupakan proses tiga tahap, dimulai dengan token 6,3T, dilanjutkan dengan token 1T, dan kemudian pemanjangan konteks menggunakan token 100B.

Sumber