Courtesy of TechCrunch
Ikhtisar 15 Detik
- OpenAI meluncurkan Flex processing untuk bersaing dengan perusahaan AI lain.
- Biaya penggunaan model AI dapat dikurangi hingga setengah dengan Flex processing.
- Verifikasi ID diperlukan untuk akses ke model o3 bagi pengembang di tier tertentu.
Amerika Serikat - OpenAI meluncurkan Flex processing, opsi API baru yang menawarkan harga penggunaan model AI lebih rendah dengan waktu respons yang lebih lambat dan ketidaktersediaan sumber daya sesekali. Flex processing tersedia dalam versi beta untuk model reasoning o3 dan o4-mini yang baru dirilis oleh OpenAI. Opsi ini ditujukan untuk tugas prioritas rendah dan non-produksi seperti evaluasi model, pengayaan data, dan beban kerja asinkron.
Flex processing mengurangi biaya API hingga setengahnya. Untuk model o3, biaya Flex processing adalah Rp 82.22 ribu ($5) /M input tokens dan Rp 328.90 ribu ($20) /M output tokens dibandingkan dengan standar Rp 164.45 ribu ($10) /M input tokens dan Rp 657.80 ribu ($40) /M output tokens. Untuk model o4-mini, biaya Flex processing adalah Rp 9.04 ribu ($0.55) /M input tokens dan Rp 36.18 ribu ($2.20) /M output tokens dibandingkan dengan standar Rp 18.09 ribu ($1.10) /M input tokens dan Rp 72.36 ribu ($4.40) /M output tokens.
Peluncuran Flex processing dilakukan saat harga AI frontier terus meningkat dan saingan merilis model yang lebih murah dan efisien. Google baru-baru ini meluncurkan Gemini 2.5 Flash, model reasoning yang lebih murah dan efisien. OpenAI juga mengumumkan bahwa pengguna di tier 1-3 harus menyelesaikan proses verifikasi ID untuk mengakses model o3.
Pertanyaan Terkait
Q
Apa itu Flex processing yang diluncurkan oleh OpenAI?A
Flex processing adalah opsi API yang menawarkan harga penggunaan model AI yang lebih rendah dengan waktu respons yang lebih lambat.Q
Apa tujuan dari Flex processing?A
Tujuan dari Flex processing adalah untuk menyediakan opsi yang lebih hemat biaya untuk tugas-tugas non-produksi dan prioritas rendah.Q
Bagaimana biaya penggunaan model o3 dan o4-mini dengan Flex processing?A
Dengan Flex processing, biaya penggunaan model o3 adalah $5/M input tokens dan $20/M output tokens, sedangkan untuk o4-mini adalah $0.55/M input tokens dan $2.20/M output tokens.Q
Apa yang dilakukan Google baru-baru ini terkait model AI?A
Google baru-baru ini meluncurkan model Gemini 2.5 Flash yang menawarkan kinerja lebih baik dengan biaya yang lebih rendah.Q
Apa yang diperlukan oleh pengembang untuk mengakses model o3?A
Pengembang di tier 1-3 harus menyelesaikan proses verifikasi ID untuk mengakses model o3.