Menjelang acara tahunan I/O yang sangat dinantikan, Google merilis video teaser pada [tanggal redaksi] yang memamerkan fungsionalitas AI multimodal baru yang pasti membuat pembuat Rabbit’s R1 ketar-ketir.
Video tersebut menampilkan pengguna yang mengarahkan kamera ponsel (Android) mereka ke panggung I/O dan bertanya, “Menurutmu apa yang sedang terjadi di sini?” Model AI Google, Gemini, menjawab, “Sepertinya orang-orang sedang bersiap untuk acara besar, mungkin konferensi atau presentasi.” Kemudian, Gemini mengajukan pertanyaan sendiri: “Apakah ada sesuatu yang menarik perhatian Anda?”
Ketika pengguna bertanya kepada Gemini tentang arti huruf besar di panggung, Gemini dengan tepat mengidentifikasi konferensi developer Google I/O. Pertanyaan itu kemungkinan membantu AI mendapatkan informasi kontekstual, yang pada gilirannya memposisikannya untuk memberikan jawaban yang lebih berguna. Chatbot kemudian menindaklanjuti dengan pertanyaan lain: “Apakah Anda pernah menghadiri Google I/O?” Percakapan tersebut tampak natural dan mudah, setidaknya dalam video.
Pada peluncuran demo R1 bulan April lalu, Rabbit memamerkan teknologi AI multimodal serupa yang dipuji banyak orang sebagai fitur menarik. Video teaser Google membuktikan bahwa perusahaan telah bekerja keras dalam mengembangkan fungsi serupa untuk Gemini yang, dari pandangan sekilas, bahkan mungkin lebih baik.
Google dan Rabbit tidak sendirian. Hari ini juga, OpenAI memamerkan pembaruannya sendiri selama streaming langsung OpenAI Spring Update, termasuk GPT-4o, model AI terbarunya yang sekarang memberi kekuatan pada ChatGPT untuk “melihat, mendengar, dan berbicara.” Selama demo, presenter menunjukkan berbagai hal kepada AI melalui kamera smartphone mereka, termasuk soal matematika yang ditulis tangan, dan ekspresi wajah presenter, dengan AI mengidentifikasi hal-hal ini dengan benar melalui percakapan bolak-balik yang serupa dengan penggunanya.
Dengan pembaruan Gemini di seluler dengan fitur ini, teknologi Google dapat melompat ke barisan terdepan dalam perlombaan asisten AI, terutama dengan gaya bicara Gemini yang terdengar sangat natural dan pertanyaan lanjutan. Meskipun luasnya kemampuan yang tepat akan diungkapkan di I/O, perkembangan ini tentu menempatkan Rabbit di posisi yang sulit, membuat salah satu fitur unggulannya pada dasarnya menjadi mubazir.
Seperti demo mana pun yang tidak ditampilkan secara langsung, Anda harus melihatnya dengan skeptis. Namun, rilis strategis video ini hanya satu jam sebelum streaming langsung OpenAI menunjukkan bahwa Google akan memiliki lebih banyak hal untuk dibicarakan tentang Gemini minggu ini.