AI summary
GPT-5.4 memiliki efisiensi token yang lebih baik dan hasil benchmark yang mengesankan. Model ini dirancang untuk mengurangi kesalahan dan halusinasi dalam output. Sistem Tool Search baru mempercepat proses permintaan API dengan lebih efisien. OpenAI meluncurkan GPT-5.4, model kecerdasan buatan frontier terbaru yang dioptimalkan untuk pekerjaan profesional dengan versi standar, reasoning, dan performa tinggi. Model ini menghadirkan konteks luas hingga 1 juta token pada API, memungkinkan pemrosesan informasi dalam jumlah sangat besar. Peningkatan token efisiensi membuat model lebih hemat dalam penggunaan sumber daya dibanding versi sebelumnya.GPT-5.4 mencetak rekor benchmark di OSWorld-Verified, WebArena Verified, dan memperoleh nilai 83% di GDPval untuk knowledge work. Model ini juga unggul dalam tes APEX-Agents Mercor yang menguji kemampuan bidang hukum dan finansial. OpenAI mengklaim model ini 33% lebih sedikit klaim salah dan 18% lebih sedikit kesalahan di dalam jawaban dibanding GPT 5.2.Pembaruan sistem pemanggilan alat API dengan Tool Search memungkinkan penghematan token signifikan saat banyak alat digunakan. Versi Thinking model menunjukkan kemampuan mengurangi penipuan pada chain-of-thought sehingga keselamatan dan keandalan reasoning model meningkat. Perkembangan ini menandakan potensi GPT-5.4 untuk menjadi standar AI profesional masa depan yang efisien dan bisa dipercayai.
GPT-5.4 menandai kemajuan signifikan dalam AI profesional dengan pendekatan pragmatis yang mengutamakan efisiensi dan keakuratan. Namun, meski mengurangi kesalahan, model ini belum sepenuhnya bebas dari risiko hallucination sehingga pemantauan dan evaluasi berkelanjutan tetap krusial.