Meta Rilis Llama 3.1 405B: Model AI Gratis dan Open-Source Setara GPT-4

Ilustrasi Meta Llama 3.1 | www.analyticsvidhya.com.

DEAL TECHNO | Meta, perusahaan induk dari Facebook, Instagram, dan WhatsApp, baru saja meluncurkan model bahasa besar terbaru mereka, Llama 3.1 405B, pada Selasa (23/7/2024). Llama 3.1 405B diklaim sebagai model bahasa besar gratis dan open-source pertama di dunia yang memiliki performa setara dengan model kecerdasan buatan kelas atas seperti GPT-4 dan GPT-4o dari OpenAI, Claude 3.5 Sonnet, serta Google Gemini 1.5 Pro. Karena gratis, pengguna dapat mengunduh Llama 3.1 405B di komputer mereka dan menjalankannya tanpa biaya tambahan, meskipun membutuhkan spesifikasi komputer yang tinggi.

Open-source berarti bahwa pengguna dapat memodifikasi atau menyempurnakan model bahasa besar ini, berbeda dengan model bisnis perusahaan AI lainnya seperti OpenAI yang memonetisasi model bahasa besarnya. Kehadiran model bahasa besar Llama 3.1 405B diumumkan melalui blog resmi Meta. “Kami merilis Meta Llama 3.1 405B secara publik, yang kami yakini merupakan model bahasa terbuka terbesar dan paling mumpuni di dunia,” tulis Meta dalam blog resminya. “Llama 3.1 405B adalah model bahasa besar pertama yang tersedia secara terbuka, yang menyaingi model AI teratas dalam hal kemampuan tercanggih seperti pengetahuan umum, kemampuan pengendalian, matematika, penggunaan alat, dan terjemahan multi-bahasa,” tambah Meta.

Read More

Pengujian Meta menunjukkan bahwa Llama 3.1 405B mampu mengalahkan Nemotron 4 340B Instruct, GPT-4, GPT-4o, dan Claude 3.5 Sonnet dalam pengujian IFEval, GSM8K, ARC Challenge, Nexus, serta ZeroSCROLLS/QuALITY. Hal ini dimungkinkan karena Llama 3.1 405B memiliki 405 miliar parameter dan dilatih menggunakan lebih dari 15 triliun token data, dengan dukungan 16.000 unit pengolah grafis (GPU) Nvidia H100. Penting dicatat bahwa hasil benchmark ini merupakan evaluasi dari Meta dan tidak mempertimbangkan pengalaman subjektif dalam berinteraksi dengan model bahasa AI.

Meta memastikan bahwa Llama 3.1 405B sangat berguna untuk berbagai aplikasi, termasuk peringkasan teks panjang, agen percakapan multibahasa, asisten coding, dan pembuatan data sintetis yang dapat digunakan untuk melatih model bahasa AI di masa depan. Pembuatan data sintetis ini didukung secara resmi oleh lisensi Meta Llama 3.1 untuk pertama kalinya. Meta juga bekerja sama dengan Amazon, Databricks, Nvidia, IBM, dan perusahaan lainnya untuk meluncurkan berbagai layanan yang membantu developer atau perusahaan menyempurnakan dan melatih model AI mereka sendiri.

Selain Llama 3.1 405B, Meta juga meluncurkan peningkatan untuk model Llama 8B dan 70B. Kini, kedua model ini dilengkapi dengan dukungan multibahasa dan kapasitas memori LLM yang diperluas hingga 128.000 token. Model bahasa besar Llama 3.1 405B, 8B, dan 70B dapat diunduh melalui situs resmi Meta. Llama 3.1 405B juga dapat dicoba melalui chatbot Meta AI, meskipun saat ini Indonesia belum mendapatkan akses ke Meta AI tersebut.

Dengan peluncuran Llama 3.1 405B, Meta menunjukkan komitmennya dalam menyediakan teknologi AI yang unggul dan dapat diakses oleh semua orang secara gratis dan open-source, mendorong inovasi dan kolaborasi dalam komunitas pengembang AI global. (wam)

Related posts

Leave a Reply

Your email address will not be published. Required fields are marked *