// skor model
Papan Skor Model LLM
Model bahasa besar dinilai dari pemakaian nyata: penalaran, coding, kecepatan, harga — dan satu hal yang tidak diukur benchmark global: kualitas bahasa Indonesianya.
Review Lengkap
Claude Opus 4.5
Raja coding dan agentic task — andalan para power user
Model flagship Anthropic yang menjadi standar emas untuk tugas coding dan agentic. Kemampuannya mengerjakan tugas panjang multi-langkah — refactor besar, debugging lintas file, riset mendalam — masih sulit ditandingi.
GPT-5
Generalis terkuat dengan ekosistem terluas
Model andalan OpenAI dengan sistem routing pintar yang memilih sendiri kapan perlu 'berpikir keras'. Ekosistemnya — ChatGPT, API, integrasi pihak ketiga — tetap yang paling luas di industri.
Gemini 3
Multimodal monster dengan context window raksasa
Lompatan besar Google: penalaran frontier, kemampuan multimodal (video, audio, gambar) terbaik, dan context window jutaan token. Integrasinya dengan ekosistem Google membuatnya sulit diabaikan.
DeepSeek V3.x / R1
Open-weight disruptor: performa frontier, harga kaki lima
Model dari Tiongkok yang mengguncang industri: kemampuan mendekati model frontier dengan harga API sepersekian, dan bobotnya terbuka untuk di-host sendiri. Pilihan rasional untuk volume besar.
Qwen 3
Keluarga model open terlengkap — dari laptop sampai data center
Keluarga model open-weight Alibaba dengan rentang ukuran terlengkap, dukungan multibahasa kuat (termasuk Indonesia), dan varian coding yang sangat kompeten. Favorit komunitas self-host.
Llama 4
Fondasi ekosistem open dari Meta — standar de facto industri
Generasi terbaru keluarga Llama dengan arsitektur MoE dan kemampuan multimodal. Bukan yang tertajam di setiap benchmark, tapi ekosistem dan dukungannya tetap yang paling luas di dunia open model.