Review Model

Qwen3.7 Plus

Varian multimodal Qwen3.7 — visi, penalaran, dan tool-use dalam satu agen

AlibabaProprietaryMultimodalAgent

Editorial Wawasan AI · Diperbarui 13 Juni 2026

8.7/ 10

Varian multimodal dari keluarga Qwen3.7 yang dirancang sejak lahir untuk kerja agentic: membaca gambar dan video, penalaran multi-langkah, eksekusi tool, dan iterasi mandiri lewat loop RL di platform Bailian. Intelligence index 53,3 (sumber: Artificial Analysis) menempatkannya di papan atas model proprietary dari laboratorium non-AS — dengan harga API yang ramah untuk pasar Indonesia.

Skor Rinci

Penalaran8.8
Coding8.4
Kecepatan8.2
Harga/Performa9.0

Kelebihan

  • +Multimodal native — memahami gambar dan video, bukan hanya teks
  • +Lima kemampuan agentic terpadu: penalaran, self-programming, tool-use, verifikasi, iterasi
  • +Vision Arena #16 saat preview — laboratorium Alibaba masuk 5 besar global untuk visi
  • +Harga API terjangkau ($0,40 input / $1,16 output per 1M token) untuk kelas multimodal frontier

Kekurangan

  • Visi membaca saja, tidak menghasilkan gambar atau video — beda dengan keluarga model kreatif
  • Akses penuh lewat Bailian/Model Studio — butuh kartu pembayaran internasional
  • Ekosistem plugin dan integrasi pihak ketiga belum setinggi OpenAI atau Anthropic

Ulasan Lengkap

Qwen3.7 Plus adalah saudara multimodal dari Qwen3.7-Max. Alibaba merancang keluarga 3.7 sejak awal untuk era agen: penalaran multi-langkah, penggunaan tool, dan iterasi mandiri sampai tugas benar-benar selesai. Bedanya, Plus menambahkan pemahaman gambar dan video — kemampuan yang dulu terpisah dari model penalaran murni. Hasilnya adalah model yang bisa membaca tangkapan layar, menavigasi antarmuka, lalu mengeksekusi perintah di dalamnya.

Dalam pengujian editorial lewat Vision Arena, Qwen3.7-Plus-Preview sempat menduduki peringkat #16 dunia untuk kemampuan visi — menjadikan laboratorium Alibaba sebagai salah satu dari lima besar global di kategori ini. Untuk kasus Indonesia yang banyak melibatkan dokumen visual, foto produk, atau bukti screenshot, kemampuan visinya terasa langsung berguna: alih-alih OCR terpisah lalu lempar ke LLM, semua terjadi dalam satu model. (Sumber: Artificial Analysis.)

Soal harga, di sinilah Plus terasa berbeda dari frontier multimodal Barat: API $0,40 per juta token input dan $1,16 output. Untuk kelas multimodal proprietary, ini di kuadran bawah — dan bagi developer Indonesia yang menghitung dolar, selisihnya langsung terasa. Intelligence index 53,3 di benchmark Artificial Analysis menempatkannya di atas model open-weight pada umumnya, meski masih di bawah frontier kelas atas seperti Claude Opus atau GPT-5. Untuk kerja agentic harian Plus sangat mumpuni; untuk penalaran paling berat, Max masih lebih tajam.

Kelemahan yang teridentifikasi: Qwen3.7 Plus tidak menghasilkan gambar atau video — fokusnya murni pemahaman. Untuk pipeline kreatif, keluarga Wan atau model difusi terpisah masih diperlukan. Juga, aksesnya lewat Bailian/Model Studio Alibaba Cloud yang, meski punya tier gratis, untuk pemakaian serius tetap butuh kartu pembayaran internasional. Strategi pemakaian yang masuk akal: Plus untuk agen GUI dan otomasi dokumen, Max untuk penalaran murni, dan Qwen open-weight untuk workload volume tinggi yang sensitif data.

Verdict

Qwen3.7 Plus adalah pilihan rasional untuk agen multimodal yang tidak perlu membuat gambar. Untuk otomasi yang 'melihat layar' dan bertindak — RPA, GUI agent, OCR pipeline — ini salah satu model paling menarik tahun ini.

Situs Resmi

Bacaan Terkait