Rangkuman Berita - OpenAI Luncurkan Flex Processing untuk Kurangi Biaya Penggunaan Model AI

Amerika Serikat - OpenAI meluncurkan Flex processing, opsi API baru yang menawarkan harga penggunaan model AI lebih rendah dengan waktu respons yang lebih lambat dan ketidaktersediaan sumber daya sesekali. Flex processing tersedia dalam versi beta untuk model reasoning o3 dan o4-mini yang baru dirilis oleh OpenAI. Opsi ini ditujukan untuk tugas prioritas rendah dan non-produksi seperti evaluasi model, pengayaan data, dan beban kerja asinkron.

Flex processing mengurangi biaya API hingga setengahnya. Untuk model o3, biaya Flex processing adalah Rp 82.22 ribu ($5) /M input tokens dan Rp 328.90 ribu ($20) /M output tokens dibandingkan dengan standar Rp 164.45 ribu ($10) /M input tokens dan Rp 657.80 ribu ($40) /M output tokens. Untuk model o4-mini, biaya Flex processing adalah Rp 9.04 ribu ($0.55) /M input tokens dan Rp 36.18 ribu ($2.20) /M output tokens dibandingkan dengan standar Rp 18.09 ribu ($1.10) /M input tokens dan Rp 72.36 ribu ($4.40) /M output tokens.

Peluncuran Flex processing dilakukan saat harga AI frontier terus meningkat dan saingan merilis model yang lebih murah dan efisien. Google baru-baru ini meluncurkan Gemini 2.5 Flash, model reasoning yang lebih murah dan efisien. OpenAI juga mengumumkan bahwa pengguna di tier 1-3 harus menyelesaikan proses verifikasi ID untuk mengakses model o3.

Pertanyaan Terkait

Apa itu Flex processing yang diluncurkan oleh OpenAI?

Flex processing adalah opsi API yang menawarkan harga penggunaan model AI yang lebih rendah dengan waktu respons yang lebih lambat.

Apa tujuan dari Flex processing?

Tujuan dari Flex processing adalah untuk menyediakan opsi yang lebih hemat biaya untuk tugas-tugas non-produksi dan prioritas rendah.

Bagaimana biaya penggunaan model o3 dan o4-mini dengan Flex processing?

Dengan Flex processing, biaya penggunaan model o3 adalah $5/M input tokens dan $20/M output tokens, sedangkan untuk o4-mini adalah $0.55/M input tokens dan $2.20/M output tokens.

Apa yang dilakukan Google baru-baru ini terkait model AI?

Google baru-baru ini meluncurkan model Gemini 2.5 Flash yang menawarkan kinerja lebih baik dengan biaya yang lebih rendah.

Apa yang diperlukan oleh pengembang untuk mengakses model o3?

Pengembang di tier 1-3 harus menyelesaikan proses verifikasi ID untuk mengakses model o3.

Rangkuman Berita: OpenAI Luncurkan Flex Processing untuk Kurangi Biaya Penggunaan Model AI

Mengumumkan peluncuran Flex processing oleh OpenAI untuk mengurangi biaya penggunaan model AI.

Pertanyaan Terkait

Rangkuman Berita Serupa

OpenAI Luncurkan Model AI Penalaran Baru dengan Integrasi Gambar

Gemini 2.5 Pro adalah model AI termahal yang pernah ada dari Google.

DeepSeek memangkas harga API hingga 75% untuk penggunaan malam hari di tengah keterbatasan server.

Para peneliti menciptakan pesaing terbuka untuk model 'penalaran' o1 milik OpenAI dengan biaya kurang dari Rp 822.25 ribu ($50) .

OpenAI merilis model penalaran o3-mini setelah kegilaan DeepSeek.

OpenAI meluncurkan o3-mini, model 'penalaran' terbarunya.