AI summary
Gemini 2.5 adalah model AI baru dari Google yang mampu berinteraksi dengan web seperti pengguna manusia. Model ini dirancang untuk tugas-tugas yang tidak memiliki API atau koneksi langsung. Demo menunjukkan kemampuan Gemini 2.5 dalam menyelesaikan berbagai tugas yang kompleks di browser. Google baru saja mengumumkan model AI terbaru bernama Gemini 2.5 Computer Use. Model ini dirancang untuk membantu AI berinteraksi dengan website melalui browser, sehingga AI bisa menyelesaikan tugas seperti mengisi formulir atau membuka halaman tertentu secara otomatis. Ini sangat berguna untuk situs yang tidak punya API khusus untuk diakses oleh aplikasi lain.Gemini 2.5 memiliki kemampuan memahami visual dan melakukan penalaran untuk mengeksekusi permintaan pengguna. Dengan kata lain, AI ini dapat melihat isi halaman dan menentukan langkah apa yang harus dilakukan untuk memenuhi permintaan tersebut, misalnya memilih tombol yang tepat atau memasukkan data ke kolom yang benar.Berbeda dengan sistem sebelumnya dari OpenAI dan Anthropic, Gemini hanya diizinkan mengendalikan browser dan tidak punya akses ke sistem komputer secara penuh. Google juga menyebutkan bahwa model ini baru mendukung 13 jenis aksi, termasuk mengetik, membuka browser, dan drag-drop.Model ini sudah bisa dicoba oleh pengembang lewat Google AI Studio dan Vertex AI. Google juga menyediakan demo interaktif di Browserbase, di mana kita bisa melihat bagaimana AI menyelesaikan tugas-tugas seperti bermain game 2048 atau mencari diskusi populer di Hacker News secara otomatis.Google mengklaim bahwa Gemini 2.5 lebih unggul dibanding alternatif lain lewat berbagai tes web dan mobile. Model ini membuka peluang baru untuk otomatisasi berbagai aktivitas di internet, seperti pengujian UI dan pengelolaan konten, tanpa perlu akses API khusus.
Gemini 2.5 adalah langkah maju yang penting dalam evolusi AI agen untuk pemakaian dunia nyata, khususnya dalam mengakses web tanpa API. Meski saat ini belum mendukung kontrol OS level desktop, fokusnya pada browser memperlihatkan pendekatan yang realistis dan pragmatis untuk mempercepat adopsi teknologi AI dalam skala luas.