Google Gemini 2.5: AI Baru yang Bisa Jelajah dan Operasikan Website Secara Otomatis
Courtesy of TheVerge

Google Gemini 2.5: AI Baru yang Bisa Jelajah dan Operasikan Website Secara Otomatis

Memperkenalkan model AI yang dapat menggunakan browser untuk menyelesaikan tugas di web dengan cara yang menyerupai manusia, sehingga memperluas kemampuan otomatisasi AI di lingkungan digital yang tidak menyediakan akses API langsung.

08 Okt 2025, 05.43 WIB
277 dibaca
Share
Ikhtisar 15 Detik
  • Gemini 2.5 adalah model AI baru dari Google yang mampu berinteraksi dengan web seperti pengguna manusia.
  • Model ini dirancang untuk tugas-tugas yang tidak memiliki API atau koneksi langsung.
  • Demo menunjukkan kemampuan Gemini 2.5 dalam menyelesaikan berbagai tugas yang kompleks di browser.
Mountain View, Amerika Serikat - Google baru saja mengumumkan model AI terbaru bernama Gemini 2.5 Computer Use. Model ini dirancang untuk membantu AI berinteraksi dengan website melalui browser, sehingga AI bisa menyelesaikan tugas seperti mengisi formulir atau membuka halaman tertentu secara otomatis. Ini sangat berguna untuk situs yang tidak punya API khusus untuk diakses oleh aplikasi lain.
Gemini 2.5 memiliki kemampuan memahami visual dan melakukan penalaran untuk mengeksekusi permintaan pengguna. Dengan kata lain, AI ini dapat melihat isi halaman dan menentukan langkah apa yang harus dilakukan untuk memenuhi permintaan tersebut, misalnya memilih tombol yang tepat atau memasukkan data ke kolom yang benar.
Berbeda dengan sistem sebelumnya dari OpenAI dan Anthropic, Gemini hanya diizinkan mengendalikan browser dan tidak punya akses ke sistem komputer secara penuh. Google juga menyebutkan bahwa model ini baru mendukung 13 jenis aksi, termasuk mengetik, membuka browser, dan drag-drop.
Model ini sudah bisa dicoba oleh pengembang lewat Google AI Studio dan Vertex AI. Google juga menyediakan demo interaktif di Browserbase, di mana kita bisa melihat bagaimana AI menyelesaikan tugas-tugas seperti bermain game 2048 atau mencari diskusi populer di Hacker News secara otomatis.
Google mengklaim bahwa Gemini 2.5 lebih unggul dibanding alternatif lain lewat berbagai tes web dan mobile. Model ini membuka peluang baru untuk otomatisasi berbagai aktivitas di internet, seperti pengujian UI dan pengelolaan konten, tanpa perlu akses API khusus.
Referensi:
[1] https://theverge.com/news/795463/google-computer-use-gemini-ai-model-agents

Analisis Ahli

Andrew Ng
"Inovasi seperti Gemini 2.5 menunjukkan kemajuan signifikan dalam AI untuk interaksi manusia-mesin yang lebih natural dan efisien, mengurangi kebutuhan akan integrasi sistem yang rumit."
Fei-Fei Li
"Memungkinkan AI memahami dan beroperasi dengan antarmuka manusia adalah kunci untuk memperluas kegunaan teknologi AI melampaui laboratorium ke kehidupan sehari-hari."

Analisis Kami

"Gemini 2.5 adalah langkah maju yang penting dalam evolusi AI agen untuk pemakaian dunia nyata, khususnya dalam mengakses web tanpa API. Meski saat ini belum mendukung kontrol OS level desktop, fokusnya pada browser memperlihatkan pendekatan yang realistis dan pragmatis untuk mempercepat adopsi teknologi AI dalam skala luas."

Prediksi Kami

Kemungkinan besar, teknologi seperti Gemini 2.5 akan menjadi standar baru dalam mengotomatisasi tugas web yang sebelumnya hanya bisa dilakukan manusia, memperkuat integrasi AI di pekerjaan sehari-hari dan membuka inovasi pada layanan pelanggan serta pengujian perangkat lunak.

Pertanyaan Terkait

Q
Apa itu model Gemini 2.5?
A
Model Gemini 2.5 adalah model AI yang dirancang untuk menjelajahi dan berinteraksi dengan web melalui browser.
Q
Apa fungsi utama dari model AI ini?
A
Fungsi utama dari model AI ini adalah untuk melakukan tugas-tugas dalam antarmuka yang dirancang untuk pengguna manusia, seperti mengisi dan mengirimkan formulir.
Q
Bagaimana Gemini 2.5 berbeda dari ChatGPT Agent?
A
Gemini 2.5 hanya memiliki akses ke browser, sementara ChatGPT Agent dapat menyelesaikan tugas di lingkungan komputer yang lebih luas.
Q
Di mana pengembang dapat mengakses Gemini 2.5 Computer Use?
A
Pengembang dapat mengakses Gemini 2.5 Computer Use melalui Google AI Studio dan Vertex AI.
Q
Apa yang ditunjukkan oleh demo yang disediakan oleh Google?
A
Demo yang disediakan oleh Google menunjukkan kemampuan model ini dalam menyelesaikan berbagai tugas, seperti memainkan permainan 2048 atau menjelajahi Hacker News.