AI summary
Google Cloud berinvestasi dalam spesialisasi infrastruktur AI untuk mengoptimalkan kinerja dan biaya. TPU 8t dan TPU 8i menawarkan solusi terpisah untuk pelatihan dan inferensi, meningkatkan efisiensi operasional. Katalog Pengetahuan dan lakehouse lintas cloud dirancang untuk meningkatkan keandalan agen AI dalam pengolahan data. Google Cloud mengumumkan berbagai inovasi teknologi di konferensi Next 2026 termasuk pembagian chip TPU generasi ke-8 ke dalam TPU 8t dan TPU 8i, platform Gemini Enterprise Agent baru, serta integrasi data lintas cloud. Strategi ini menempatkan Google sebagai pemain infrastruktur AI khusus yang menargetkan pemisahan beban pelatihan dan inferensi AI agar lebih efisien dan hemat biaya.Pengumuman didukung oleh rencana investasi modal hingga 185 miliar dolar AS untuk 2026, peningkatan performa signifikan dari TPU generasi sebelumnya, serta upaya menciptakan interoperabilitas data menggunakan Apache Iceberg dan koneksi lintas cloud tanpa migrasi penuh. Google melaporkan pertumbuhan pemakaian token AI yang sangat pesat oleh pelanggannya, menegaskan permintaan akan teknologi ini.Meskipun Google menampilkan narasi infrastruktur terpadu yang solid, tantangan seperti kesiapan teknologi, migrasi dari platform lama, dan standar katalog data lintas vendor masih menjadi kendala. CXO disarankan untuk mengaudit penggunaan AI mereka dan memisahkan anggaran pelatihan, inferensi, dan orkestrasi agen agar pengambilan keputusan vendor lebih cermat dan menghindari komitmen mahal yang prematur.
Langkah Google untuk memecah TPU menjadi dua chip terpisah adalah sebuah inovasi tepat yang sangat memperhatikan kebutuhan spesifik antara pelatihan dan inferensi AI, yang selama ini sering kali dipaksa menjadi satu solusi. Namun, tantangan terbesar sebenarnya ada pada kemampuan Google untuk meyakinkan perusahaan agar mengadopsi seluruh tumpukan mereka mengingat banyaknya investasi dan kompleksitas migrasi yang ada.