Review Model LLM

OpenAIProprietaryMultimodal

GPT-5

Generalis terkuat dengan ekosistem terluas

9.2

Model andalan OpenAI dengan sistem routing pintar yang memilih sendiri kapan perlu 'berpikir keras'. Ekosistemnya — ChatGPT, API, integrasi pihak ketiga — tetap yang paling luas di industri.

GoogleProprietaryMultimodal

Gemini 3

Multimodal monster dengan context window raksasa

9.1

Lompatan besar Google: penalaran frontier, kemampuan multimodal (video, audio, gambar) terbaik, dan context window jutaan token. Integrasinya dengan ekosistem Google membuatnya sulit diabaikan.

AlibabaProprietaryMultimodal

Qwen3.7 Plus

Varian multimodal Qwen3.7 — visi, penalaran, dan tool-use dalam satu agen

8.7

Varian multimodal dari keluarga Qwen3.7 yang dirancang sejak lahir untuk kerja agentic: membaca gambar dan video, penalaran multi-langkah, eksekusi tool, dan iterasi mandiri lewat loop RL di platform Bailian. Intelligence index 53,3 (sumber: Artificial Analysis) menempatkannya di papan atas model proprietary dari laboratorium non-AS — dengan harga API yang ramah untuk pasar Indonesia.

XiaomiProprietaryReasoning

MiMo-V2.5-Pro

Xiaomi naik kelas — model proprietary dengan intelligence frontier dan harga agresif

8.7

MiMo-V2.5-Pro adalah flagship proprietary Xiaomi yang menempatkan perusahaan perangkat keras ini di papan atas laboratorium non-AS. Intelligence index 53,8 (sumber: Artificial Analysis) sejajar dengan Qwen3.7 Plus dan Grok 4 — tapi dengan harga API hampir setengah dari frontier Barat. Strateginya jelas: Xiaomi pakai model ini untuk memperkuat ekosistem MiAI dan perangkat pintar mereka, sambil membuka akses ke developer lewat API publik.

Zhipu AIOpen WeightCoding

GLM-4.6

Kuda hitam coding dari Zhipu — alternatif murah yang serius

8.6

Model open-weight dari Zhipu AI (Z.ai) yang melejit sebagai alternatif murah di tool coding agentic. Untuk pekerjaan kode sehari-hari, jarak rasanya ke model proprietary mahal makin tipis — dengan biaya langganan yang jauh lebih ringan.

AlibabaProprietaryAgentic

Qwen3.6 Max Preview

Flagship proprietary Alibaba April 2026 — fokus agentic coding dan top-2 dunia untuk programming

8.6

Qwen3.6 Max Preview adalah flagship proprietary Alibaba yang dirilis 20 April 2026, dirancang sejak lahir untuk kerja agentic berdurasi panjang. Intelligence index 51,8 (sumber: Artificial Analysis) menaruhnya di papan atas laboratorium Asia dan mendudukkannya di peringkat kedua dunia untuk benchmark pemrograman. Bedanya dengan saudara Qwen3.7 Plus: Max adalah varian penalaran murni tanpa beban multimodal, dengan fokus ke engineering multi-langkah dan tool-use intensif — serta positioning harga premium yang mencerminkan kelas flagship.

Grok 4

Model nyeleneh dari xAI dengan mata yang selalu memantau X

8.5

Model flagship xAI dengan penalaran kuat dan keunggulan unik: akses real-time ke linimasa X. Gayanya yang santai dan kadang nyeleneh membuatnya terasa berbeda dari asisten AI lain yang serba sopan.

xAIProprietaryReal-time

GLM-5.2 (max)

Flagship terbaru Z AI — lompatan coding kelas atas dengan harga mid-tier

8.5

GLM-5.2 (max) adalah iterasi flagship Z AI yang kembali ke papan atas dengan coding index 68,8 — salah satu skor tertinggi di benchmark Artificial Analysis, di atas Claude Opus 4.5 dan setara dengan frontier proprietary Barat di kelas coding. Intelligence index 51,1 menaruhnya di papan tengah-atas proprietary Asia, dengan harga API $1,40 per juta token input yang bermain di kelas mid-tier. Kombinasi coding superior dan harga yang lebih masuk akal dari frontier Barat menjadikannya opsi menarik untuk pipeline engineering serius.

Z AIProprietaryCoding

GLM-5 (Reasoning)

Model reasoning Z AI yang dirancang untuk kerja agentic panjang dan engineering multi-langkah

8.4

Generasi kelima keluarga GLM dari Z AI (Zhipu) yang fokus ke pekerjaan agentic berdurasi panjang: penalaran multi-langkah, eksekusi tool dalam loop, dan rekayasa sistem kompleks. Intelligence index 49,8 (sumber: Artificial Analysis) menaruhnya di papan atas laboratorium Asia, bersaing head-to-head dengan Qwen3.7 Plus dan MiMo-V2.5-Pro — dengan positioning harga yang lebih premium dari keduanya.

Z AIProprietaryReasoning

MetaOpen WeightMultimodal

Muse Spark

Model eksperimental Meta untuk generasi kreatif multimodal

8.2

Muse Spark adalah keluarga model eksperimental dari Meta yang fokus pada generasi kreatif multimodal — teks, gambar, dan audio dalam satu pipeline. Intelligence index 52 dan bobot terbuka menjadikannya pilihan menarik untuk eksplorasi pipeline generasi konten di infrastruktur sendiri. Bukan model penalaran terkuat, tapi kelebihannya ada pada kelancaran dan integrasi multimodal.

XiaomiOpen WeightReasoning

MiMo-V2.5

Flagship open-weight Xiaomi — 1M konteks, harga paling murah di kelas frontier proprietary

8.2

MiMo-V2.5 adalah rilis open-weight flagship Xiaomi yang diumumkan 22 April 2026 — berbeda dari MiMo-V2.5-Pro proprietary, model ini tersedia di Hugging Face dengan lisensi MIT dan harga API paling agresif di kelasnya: $0,14 per juta token input dan $0,28 output. Intelligence index 40,1 (sumber: Artificial Analysis) menaruhnya di papan menengah proprietary, tapi kombinasi konteks 1M token, throughput 89 tokens/detik, dan lisensi yang benar-benar terbuka menjadikannya opsi menarik untuk deployment on-premise dan pipeline agentik skala besar di Indonesia.

MiMo-V2-Pro

Model 1T parameter Xiaomi yang lahir untuk era agent — fondasi sebelum V2.5-Pro

8.1

MiMo-V2-Pro adalah flagship proprietary Xiaomi yang rilis Maret 2026 dan memperkenalkan arsitektur hybrid attention 1T parameter (42B aktif) — pondasi yang kemudian dikembangkan V2.5-Pro. Intelligence index 40,3 (sumber: Artificial Analysis) menaruhnya di papan tengah atas, dengan kekuatan utama di tugas agentic panjang dan software engineering multi-langkah. Model ini sempat jadi misteri publik ketika muncul anonim di OpenRouter dengan nama sandi 'Hunter Alpha' sebelum Xiaomi mengakui sebagai model mereka.

XiaomiProprietaryAgentic

NVIDIAProprietaryReasoning

Nemotron 3 Ultra 550B A55B (Reasoning)

Hybrid MoE NVIDIA 550B dengan 55B aktif — reasoning cepat dan throughput tinggi

8.1

Nemotron 3 Ultra 550B A55B (Reasoning) adalah iterasi reasoning flagship NVIDIA dengan arsitektur hybrid Mixture-of-Experts — total 550 miliar parameter, hanya 55 miliar aktif per token. Intelligence index 37,8 (sumber: Artificial Analysis) menempatkannya di papan tengah proprietary, dengan coding index 49,3 dan throughput output 148,3 tokens/detik yang menjadi pembeda utama. Kombinasi harga API $0,68 per juta token input dan TTFT 0,899 detik menjadikannya opsi menarik untuk pipeline reasoning yang butuh latensi rendah.

TencentProprietaryReasoning

Hy3

Flagship Hunyuan reasoning generasi ketiga Tencent — coding dan tool-use kelas atas

8.1

Flagship reasoning terbaru dari keluarga Hunyuan Tencent — arsitektur MoE generasi ketiga dengan intelligence index 41,2 dan coding index 58,8 (sumber: Artificial Analysis). Diferensiasi utamanya: reasoning configurability, tool-use agentik yang solid, dan harga API agresif di kisaran $0,123 input / $0,430 output per juta token — dikelola lewat Tencent Cloud dan endpoint partner regional Asia Tenggara.

DeepSeek V3.x / R1

Open-weight disruptor: performa frontier, harga kaki lima

DeepSeekOpen WeightReasoning

Model dari Tiongkok yang mengguncang industri: kemampuan mendekati model frontier dengan harga API sepersekian, dan bobotnya terbuka untuk di-host sendiri. Pilihan rasional untuk volume besar.

Qwen 3

Keluarga model open terlengkap — dari laptop sampai data center

AlibabaOpen WeightMultilingual

Keluarga model open-weight Alibaba dengan rentang ukuran terlengkap, varian coding yang sangat kompeten, dan opsi MoE untuk skala server. Favorit komunitas self-host.

Kimi K2

MoE open-weight raksasa yang jago kerja agentic — dengan harga kaki lima

Moonshot AIOpen WeightAgent

Model mixture-of-experts raksasa dari Moonshot AI yang dirancang sejak awal untuk tool-use dan kerja agentic. Kemampuan coding-nya menempel ketat ke model proprietary papan atas, dengan harga API yang jauh lebih ramah dan bobot yang terbuka.

MiniMax-M3

Flagship MiniMax berikutnya — intel kelas atas Asia dengan harga agresif

MiniMax-M3 adalah lonjakan generasi berikutnya dari laboratorium MiniMax — lompatan dari saudara kelas menengah M2.7 ke ambang kelas atas Asia. Intelligence index 44,4 (sumber: Artificial Analysis) menempatkan M3 sejajar dengan frontier proprietary yang lebih mapan di papan tengah-atas, dengan harga API $0,30 per juta token input yang tetap di kuadran agresif. Kombinasi coding index 43,4 dan throughput 69,17 tokens/detik menjadikannya model value-for-money yang menarik untuk pipeline produksi yang butuh kecepatan.

GLM-5-Turbo

Varian speed-optimized Z.ai — agentik ringan untuk long execution chain dengan harga mid-range

GLM-5-Turbo adalah varian speed-optimized dari keluarga GLM-5 yang dirilis Z.ai (sebelumnya Zhipu AI) pada 15 Maret 2026. Model ini mengambil trade-off yang berbeda dari GLM-5.1 atau GLM-5.2: mengorbankan sedikit kedalaman penalaran demi throughput tinggi dan latensi rendah, sambil tetap mempertahankan thinking modes selektif yang menjadi ciri keluarga GLM-5. Intelligence index 38,1 (sumber: Artificial Analysis) menaruhnya di papan menengah proprietary Asia, tapi kombinasi harga $1,20 input per juta token, throughput 43 tps, dan integrasi native dengan Claude Code lewat endpoint Anthropic-compatible menjadikannya opsi pragmatis untuk pipeline agentik volume-tinggi yang perlu iterasi cepat.

Z.aiProprietaryAgentik

GLM-5.1 (Non-reasoning)

Varian non-reasoning GLM-5.1 dari Z AI — token throughput cepat dengan harga mid-range untuk workload agentik volume-tinggi

Z AIProprietaryGeneralist

Varian non-reasoning dari keluarga GLM-5.1 Z AI (Zhipu) yang memprioritaskan token throughput cepat dengan harga mid-range, dirancang untuk pipeline agentik volume-tinggi yang tidak butuh chain-of-thought panjang. Intelligence index 35,4 (sumber: Artificial Analysis) menempatkannya di papan tengah laboratorium Asia, di bawah GLM-5 Reasoning (49,8) dan GLM-5.2 max, tapi dengan positioning yang berbeda: responsiveness di atas penalaran murni.

Inkling

Open-weights debut Thinking Machines — fleksibel, bisa di-host sendiri

Thinking MachinesOpen WeightInference

Model open-weights pertama dari Thinking Machines, lab AI yang didirikan oleh Mira Murati setelah hengkang dari OpenAI. Intelligence index 40,7 dan coding index 52,1 (sumber: Artificial Analysis) menempatkannya di papan atas kelas menengah atas — dan yang menarik adalah arsitekturnya: dirancang agar bisa di-host sendiri dengan biaya inference jauh di bawah frontier proprietary.

MiniMax-M2.7

Model kelas menengah MiniMax — intel papan tengah dengan harga paling agresif di keluarganya

MiniMax-M2.7 adalah model kelas menengah dari MiniMax yang bermain di kuadran harga paling agresif di keluarga M-series. Intelligence index 38,1 (sumber: Artificial Analysis) menempatkannya di papan tengah industri — di bawah frontier proprietary Asia (Qwen3.7 Plus, MiMo-V2.5-Pro, GLM-5), tapi dengan harga API $0,30 per juta token input yang nyaris menyentuh level open-weight. Kombinasi coding index 41,9 dan harga segini menempatkan M2.7 sebagai opsi volume-tinggi untuk pipeline engineering yang sensitif dolar.

JT-4.1 Flash 236B A21B

MoE raksasa China Mobile — papan tengah benchmark dengan konteks 256K

China MobileProprietaryMoE

Varian Flash dari keluarga JT-4.1 (Jiutian) milik China Mobile — operator telekomunikasi milik negara China yang merilis model ini pada 9 Juli 2026. Intelligence index 38,8 dan coding index 52,4 (sumber: Artificial Analysis) menempatkannya di papan tengah benchmark agregat, jauh di atas median non-reasoning di kelas harga yang sama, dengan jendela konteks 256K token dan arsitektur MoE yang diklaim 236B parameter total / 21B aktif per AA.

NVIDIA Nemotron 3 Super 120B A12B (Reasoning)

Varian MoE reasoning NVIDIA dengan efisiensi tinggi dan harga API sangat agresif

NVIDIAProprietaryReasoning

Varian MoE reasoning dari keluarga Nemotron 3 NVIDIA, dirancang untuk workload penalaran berat dengan efisiensi tinggi lewat aktivasi sparse 12B dari total 120B parameter. Intelligence index 25,4 dan coding index 37,7 (sumber: Artificial Analysis) menempatkannya di papan menengah atas dengan diferensiasi jelas pada rasio harga/performa: $0,25/M input dan $0,775/M output, salah satu yang paling agresif untuk model dengan kemampuan reasoning terukur.

Agnes 2.5 Pro Alpha

Sapiens AI agresif di ceruk developer — coding solid, harga Asia-friendly

Sapiens AIProprietaryCoding

Model andalan Sapiens AI yang bermain di ceruk harga agresif dengan coding index 58,8 (sumber: Artificial Analysis) — salah satu skor coding terbaik di papan API di bawah $1 per juta token. Intelligence index 38,8 menaruhnya di mid-tier proprietary, tapi untuk workload backend dan tooling developer, value proposition-nya sulit diabaikan.

Llama 4

Fondasi ekosistem open dari Meta — standar de facto industri

MetaOpen WeightMultimodal

Generasi terbaru keluarga Llama dengan arsitektur MoE dan kemampuan multimodal. Bukan yang tertajam di setiap benchmark, tapi ekosistem dan dukungannya tetap yang paling luas di dunia open model.

Qwen3.5 397B A17B (Reasoning)

MoE hybrid Alibaba 397B dengan 17B aktif — penalaran solid di kelas harga paling efisien

AlibabaProprietaryReasoning

Qwen3.5 397B A17B (Reasoning) adalah varian reasoning dari keluarga Qwen3.5 Alibaba dengan arsitektur Mixture-of-Experts (MoE) hybrid: total 397 miliar parameter, namun hanya 17 miliar parameter aktif per token — desain yang menurunkan biaya inferens tanpa mengorbankan kualitas penalaran. Intelligence index 33,7 (sumber: Artificial Analysis) menaruhnya di papan tengah, tapi coding index 48,2 menunjukkan kekuatan utama model ini di kelas harganya, dengan API $0,60 per juta token input yang bermain di kuadran paling efisien untuk proprietary reasoning.

Ring-2.6-1T

Flagship trillion-parameter InclusionAI — arsitektur ring attention 1T dengan harga paling agresif di kelas reasoning

InclusionAIProprietaryReasoning

Ring-2.6-1T adalah iterasi flagship dari InclusionAI — laboratorium AI milik Ant Group — dengan arsitektur trillion-parameter (1T total) yang menggunakan pola ring attention untuk menangani context panjang secara efisien. Intelligence index 30,6 (sumber: Artificial Analysis) menempatkannya di papan tengah proprietary Asia, tapi kombinasi coding index 42,8, throughput output 137,5 tokens/detik, dan harga API $0,30 per juta token input menjadikannya model value-for-money yang menarik untuk pipeline reasoning volume-tinggi di Indonesia.

MiMo-V2-Omni-0327

Omni foundation Xiaomi — persepsi multimodal terpadu (gambar, video, audio, teks) dengan tool calling agentik native

XiaomiProprietaryMultimodal

MiMo-V2-Omni-0327 adalah omni foundation model dari Xiaomi — laboratorium yang sebelumnya merilis MiMo-V2.5-Pro untuk reasoning teks. Varian Omni ini memperluas arsitektur ke multimodal terpadu: encoder gambar, video, dan audio digabung ke satu backbone bersama, dengan tool calling agentik native dan structured function execution. Intelligence index 36,4 (sumber: Artificial Analysis) menaruhnya di papan menengah proprietary Asia, tapi kombinasi persepsi lintas-modalitas dan harga API $0,40 input per juta token menjadikannya opsi pragmatis untuk pipeline agentik multimodal volume-tinggi.

KAT Coder Pro V2

Flagship agentic coding Kuaishou - 73,4% SWE-Bench Verified dengan harga agresif

KAT Coder Pro V2 adalah model flagship agentic coding dari KwaiKAT (divisi riset AI Kuaishou) yang dirilis 27 Maret 2026, diposisikan khusus untuk software engineering agentik dan frontend aesthetic generation. Intelligence index 35,4 (sumber: Artificial Analysis) menaruhnya di papan menengah, tapi skor SWE-Bench Verified 73,4% - sejajar dengan GPT-5 High dan Claude Sonnet 4.5 - menjadikannya salah satu model coding paling kompetitif di kelas harga $0,30 per juta token input dan $1,20 output.

KwaiKATProprietaryCoding

Hy3-preview (Reasoning)

Flagship MoE 295B Tencent Hunyuan — reasoning configurable, throughput tinggi, harga paling agresif di kelas open-weight besar

TencentOpen WeightReasoning

Hy3-preview (Reasoning) adalah model flagship Hunyuan terbaru dari Tencent yang dirilis 22 April 2026 — arsitektur Mixture-of-Experts 295B parameter dengan hanya 21B aktif per forward pass, dirancang khusus untuk reasoning mendalam, agentic workflow, dan problem-solving STEM. Intelligence index 33,6 (sumber: Artificial Analysis) menempatkannya di papan tengah laboratorium Asia, tapi throughput output 150 tps dan harga API $0,12 input menjadikannya salah satu kombinasi harga/performa paling menarik di kelas model besar open-weight.

o3

Model reasoning klasik OpenAI dengan spesialisasi matematika dan sains tingkat olimpiade

OpenAIProprietaryReasoning

Model reasoning ikonik OpenAI yang menaruh dasar penalaran multi-langkah skala besar dengan skor matematika 88,3 - angka yang menempatkannya di papan atas benchmark numerik dibanding frontier reasoning 2026. Intelligence index 30,4 (sumber: Artificial Analysis) memang bukan yang tertinggi di kelasnya, tapi kombinasi kecepatan 154 token/detik dan tradisi OpenAI dalam penalaran terstruktur menjadikan o3 titik masuk yang menarik untuk riset dan pipeline agen yang butuh verifikasi bertahap.

Step 3.7 Flash

Model kilat dari StepFun — harga agresif, throughput tinggi

StepFunProprietaryFast Inference

Model 'Flash' kelas menengah dari StepFun yang menonjol lewat harga sangat agresif ($0,20 input, $1,15 output per juta token) dan throughput 393 token/detik — jauh di atas rata-rata frontier. Intelligence index 30,3 dan coding index 39,6 menempatkannya di papan tengah benchmark, menjadikannya menarik untuk workload volume tinggi yang tidak menuntut penalaran frontier.

Qwen3 Coder Next

Specialist coding agent dari Alibaba — throughput tinggi di kelas harga agresif

Varian specialist coding dari keluarga Qwen3 — lini model open-weight Alibaba yang kini punya varian proprietary API khusus coding agent. Intelligence index 21,1 dan coding index 36,2 (sumber: Artificial Analysis) menempatkannya sebagai model papan tengah dengan trade-off khas: penalaran umum biasa, tapi kemampuan coding dan kecepatan throughput di atas rata-rata kelas harga. Dipasarkan lewat harga API $0,35/M input dan $1,20/M output — kompetitif untuk workload volume.

AlibabaProprietaryCoding

Cohere North Mini Code

Varian coding Cohere yang ultra-murah dan cepat untuk workflow agent

Varian specialist coding dari keluarga Command R+ North Cohere, dirilis lewat API North platform Cohere, dan partner enterprise Cohere. Intelligence index 20,6 dan coding index 36,5 (sumber: Artificial Analysis) menaruhnya di papan tengah dengan trade-off khas Cohere: penalaran umum biasa, tapi kemampuan coding, throughput, dan harga paling agresif di kelas papan tengah. Dipasarkan dengan tier harga khusus untuk workload coding agentik — menarik untuk developer yang perlu budget ketat.

CohereProprietaryCoding

Mercury 2

Diffusion LLM dari Inception — reasoning model dengan kecepatan 1000+ token/detik

InceptionProprietaryDiffusion LLM

Mercury 2 adalah model penalaran generasi kedua dari Inception yang menggunakan arsitektur diffusion language model (dLLM) — pendekatan yang berbeda dari LLM auto-regresif dominan industri. Kecepatan outputnya yang nyaris 1200 token/detik menjadikannya model penalaran tercepat yang masuk katalog Artificial Analysis, meski intelligence index 21,4 menempatkannya di papan bawah-tengah benchmark standar.

Motif 3 (Beta)

Model open-weight baru Motif Technologies — Coding 62 di kelas intel mid

Motif TechnologiesOpen WeightCoding

Model open-weight dari Motif Technologies yang menonjol di dimensi coding: skor 62 di coding index (sumber: Artificial Analysis) menempatkannya di papan atas kelas mid-range, jauh di atas rata-rata model open-weight sekelas intelligence index 44,1. Trade-off jelas: penalaran umum masih di bawah frontier, tapi untuk workload coding agentik dengan biaya rendah, value proposition-nya sulit diabaikan.

Nex-N2-Pro

Flagship Nex AGI — keseimbangan penalaran, coding agentik, dan harga mid-range

Nex-N2-Pro adalah model flagship dari Nex AGI yang dirilis 2 Juni 2026, diposisikan untuk keseimbangan penalaran umum dan coding agentik di kelas mid-range proprietary. Intelligence index 41 dan coding index 59,1 (sumber: Artificial Analysis) menaruhnya di papan menengah — di bawah frontier Barat untuk penalaran murni, tapi cukup solid untuk engineering task dan workflow multi-langkah, dengan harga $0,50 per juta token input dan $2,50 output yang kompetitif dibanding peer proprietary papan menengah.

Nex AGIProprietaryCoding

MiniMax-M2.5

Varian efisiensi M-series — throughput output tercepat di keluarganya dengan harga $0,30 input

MiniMax-M2.5 adalah varian efisiensi M-series MiniMax yang dirilis 12 Februari 2026 — sebelum saudara M2.7 (Maret 2026) dan M3 — dengan positioning berbeda: throughput output 175,19 tokens/detik menjadikannya model tercepat di keluarga M-series, jauh meninggalkan M2.7 (31,7 tps) yang keluar sebulan kemudian. Intelligence index 33,7 (sumber: Artificial Analysis) menaruhnya di papan tengah ke bawah, di bawah M2.7 (38,1) dan M3 (44,4), tapi kombinasi harga API $0,30 input dan kecepatan tinggi menjadikannya opsi menarik untuk chat interaktif volume-tinggi di mana responsivitas lebih diprioritaskan dari penalaran murni terberat.

GLM 5V Turbo (Reasoning)

Varian multimodal cepat Z AI untuk dokumen visual dan reasoning ringan

Varian ringkas dari keluarga GLM 5V Z AI yang memadukan pemahaman visual multimodal dengan mode reasoning. Intelligence index 34,5 menempatkannya di papan tengah, tapi spesialisasinya ada pada pemrosesan gambar, grafik, dan diagram — use case yang ramai di kalangan analis dan pelajar Indonesia.

Z AIProprietaryVision

Command A+

Flagship enterprise Cohere dengan context window 256K dan lisensi terbuka

CohereOpen WeightEnterprise

Flagship open-weight terbaru Cohere dengan intelligence index 22,5 dan coding index 27,8 (sumber: Artificial Analysis). Diferensiasi utamanya: jendela konteks 256K token, throughput 188,4 token/detik, dan lisensi terbuka yang memungkinkan self-host enterprise — angka intelligence agregat masih di bawah frontier Barat (Gemini 3 57,2, GPT-5 44,6, Claude Opus 4,5 memimpin 43,1+), tapi arsitektur dan karakteristik deployment-nya menarik untuk pasar enterprise dan region dengan kedaulatan data ketat.

o3-pro

Varian reasoning dalam OpenAI o-series — penalaran paling dalam, harga paling premium

OpenAIProprietaryReasoning

o3-pro adalah varian reasoning paling berat OpenAI untuk aplikasi yang butuh chain-of-thought panjang dan konsisten — sains, matematika, dan riset multi-langkah. Intelligence index 32,5 (sumber: Artificial Analysis) bukan yang tertinggi di pasaran, tapi pola penalaran deliberatif dan konsistensi jawaban panjang membuatnya andalan untuk use case reasoning murni, bukan volume tinggi.

MiMo-V2-Omni

Model omni-modal Xiaomi dengan audio 10 jam dan multimodal

XiaomiProprietaryOmni-Modal

Model omni-modal flagship Xiaomi yang menyatukan pemahaman teks, gambar, video, dan audio dalam satu arsitektur unified. Intelligence index 35 (sumber: Artificial Analysis) menempatkan MiMo-V2-Omni di papan tengah, tapi spesialisasinya jelas: audio 10 jam kontinyu, BigBench Audio 94,0, dan kemampuan agentic multimodal yang dirancang untuk Browser-Use dan otomasi GUI.

Nova 2.0 Pro Preview (medium)

Reasoning model Amazon — performa matematika tinggi dengan harga mid-tier

AmazonProprietaryReasoning

Varian reasoning menengah dari keluarga Amazon Nova 2.0 — lini model AI terbaru Amazon Web Services yang menonjol lewat math index tinggi (89, sumber: Artificial Analysis) untuk kelas harganya, dikompensasi dengan intelligence index agregat 21,8 yang lebih rendah dari frontier papan atas. Cocok untuk workload matematika, coding, dan reasoning terapan dengan integrasi native AWS.

gpt-oss-120b (high)

Open-weight flagship OpenAI — frontier reasoning dengan lisensi terbuka

OpenAIOpen WeightReasoning

Model open-weight flagship dari OpenAI dengan intelligence index 23,8 dan coding index 30,4 (sumber: Artificial Analysis) — angka intelligence agregat masih di bawah frontier Barat proprietary (Gemini 3 57,2, GPT-5 44,6, Claude Opus 4.5 43,1+), tapi coding index-nya mendekati frontier dan math index 93,4 (sumber: AA) menjadikannya salah satu skor matematika tertinggi di keluarga open weight. Dipasarkan lewat harga API paling murah di antara model kelas atas: $0,15/M input dan $0,60/M output.

KAT Coder Pro V1

Pendahulu KAT Coder Pro V2 - SWE-Bench 73,4% pertama dari KwaiKAT dengan harga paling agresif

7.5

KAT Coder Pro V1 adalah model agentic coding pertama dari KwaiKAT (divisi riset AI Kuaishou) yang dirilis 10 November 2025, diposisikan khusus untuk software engineering agentik dengan SWE-Bench Verified 73,4% - angka yang sama dengan penerusnya V2. Intelligence index 34,6 (sumber: Artificial Analysis) menaruhnya di papan menengah, tapi skor SWE-Bench 73,4% di kelas harga API $0,21-$0,30 per juta token input menjadikannya pilihan entry-level paling menarik di keluarga KAT Coder untuk developer yang baru eksplorasi agentic coding dengan budget ketat.

KwaiKATProprietaryCoding

China MobileProprietaryInference

JT-35B-Flash

Model cepat dari China Mobile — telco raksasa serius di AI lokal

7.5

Model bahasa besar dari China Mobile, operator telekomunikasi terbesar di dunia. Intelligence index 28,4 (sumber: Artificial Analysis) menempatkan JT-35B-Flash di kelas mid-tier, dan positioning-nya jelas: fokus pada inference cepat dan deployment enterprise untuk pasar domestik China. Bukan model yang mengejar frontier, tapi calon pemain infrastruktur yang patut dipantau.

MiniMax-M2

Model dasar MiniMax M-series — rilis awal 2026 dengan harga agresif untuk eksperimen volume

7.4

MiniMax-M2 adalah varian entry-level dari keluarga M-series MiniMax — rilis awal Oktober 2025 yang menjadi basis arsitektur bagi saudara-saudara M2.1, M2.5, M2.7, dan M3. Intelligence index 28,3 (sumber: Artificial Analysis) menaruhnya di papan bawah-tengah industri, di bawah saudara M2.7 (38,1) dan M3 (44,4), tapi harga API $0,30 per juta token input tetap sama agresifnya dengan seluruh keluarga M-series. Cocok untuk eksperimen volume tinggi di mana biaya inference per token adalah variabel utama, bukan performa mutlak.

Z AIProprietaryInferensi Cepat

GLM-4.7 (Non-reasoning)

Varian non-reasoning GLM-4.7 dari Z AI — throughput ekstrem dengan harga kelas bawah

7.4

Varian non-reasoning dari keluarga GLM-4.7 Z AI (Zhipu), di-positioning sebagai model throughput-tinggi dengan harga agresif untuk workload inference volume besar. Intelligence index 26,6 (sumber: Artificial Analysis) menaruhnya di papan tengah ke bawah proprietary Asia, tapi trade-off-nya jelas: bukan untuk penalaran murni terberat, melainkan untuk pipeline responsivitas-tinggi yang mengukur user experience lewat latensi dan biaya per token, bukan skor benchmark absolut.

XiaomiProprietaryReasoning

MiMo-V2-Flash (Reasoning)

Varian cepat reasoning Xiaomi dengan harga paling agresif di Agent Era

7.3

Varian ringan reasoning dari keluarga MiMo-V2 Xiaomi yang menawarkan harga input 10 sen dan output 30 sen per juta token — titik masuk paling murah di lini Agent Era. Intelligence index 31,2 dan skor matematika 96,3 menjadi kombinasi menarik untuk tugas penalaran numerik volume tinggi di pasar Indonesia.

MiniMax-M2.1

Pintu masuk paling murah di keluarga M-series — penalaran solid dengan harga paling agresif

7.3

Varian entry-level dari keluarga M-series MiniMax yang membawa harga paling agresif di lini M — $0,30 input dan $1,20 output per juta token. Intelligence index 31,4 (sumber: Artificial Analysis) dan math index 82,7 menjadi kombinasi menarik untuk workload penalaran numerik volume tinggi di pasar Indonesia, dengan throughput output 71,6 token/detik yang cukup responsif untuk chat interaktif.

OpenAIProprietaryReasoning

o1

Generasi pertama reasoning model OpenAI - pionir chain-of-thought yang membuka era penalaran eksplisit di industri LLM

7.2

o1 adalah model pertama OpenAI yang secara eksplisit dirancang untuk penalaran chain-of-thought - dirilis dalam bentuk preview pada September 2024 dan versi penuh Desember 2024, o1 memperkenalkan paradigma baru di industri LLM: model yang 'berpikir keras' sebelum menjawab, dengan internal reasoning trace yang lebih panjang dibanding GPT-4o. Intelligence index 23,4 (sumber: Artificial Analysis) membuatnya tampak tertinggal dibanding frontier reasoning 2026 (Claude Opus 4.5, GPT-5, GLM-5.2, MiMo-V2.5-Pro di 43-58), tapi signifikansi historisnya - model yang mempopulerkan reasoning sebagai kategori produk terpisah - menjadikannya layak dicatat di arsip Wawasan AI sebagai tonggak transisi dari era LLM generik ke era penalaran eksplisit.

Mistral AIEropaEnterprise

Mistral Large / Medium

Juara Eropa: efisien, enterprise-ready, dan punya Le Chat

7.0

Lini model andalan Mistral AI, satu-satunya pemain frontier dari Eropa. Filosofinya jelas: performa kompetitif dari model yang lebih kecil dan efisien, dengan opsi deployment fleksibel yang disukai enterprise — plus asisten Le Chat yang sangat responsif.

Gemma 3

Model open kecil terbaik — multimodal yang muat di laptop kentang

6.8

Keluarga model open kecil dari Google yang dirancang untuk perangkat terbatas: dari ponsel sampai laptop tanpa GPU. Kemampuan multibahasa dan multimodalnya mengejutkan untuk ukurannya — pintu masuk terbaik ke dunia AI lokal.

GoogleOpen WeightLokal