Bing Chat, ChatGPT, dan alat AI generatif serupa lainnya sebagian besar difokuskan untuk memahami konten teks dan memberikan jawaban. Namun, ini juga sangat membantu untuk memahami gambar, dan itulah yang sekarang diluncurkan Microsoft ke Bing Chat AI.
Dalam posting blog baru-baru ini, Microsoft mengumumkan fitur baru untuk Bing Chat, yang disebut Pencarian Visual. Dengan Pencarian Visual, Anda dapat mengunggah gambar atau memilih gambar yang ada di web, dan Bing akan mencoba memahaminya dan menggunakan konteks tersebut sebagai respons. Video demo Microsoft (disematkan di bawah) menunjukkan seseorang yang mengunggah maket formulir web yang digambar tangan, dan meminta Bing untuk membuat kode HTML dan CSS agar berfungsi.
Microsoft menjelaskan dalam posting blog, “Baik Anda bepergian ke kota baru untuk berlibur dan bertanya tentang arsitektur bangunan tertentu atau di rumah mencoba memikirkan ide makan siang berdasarkan isi lemari es Anda, unggah gambar ke Bing Chat dan gunakan untuk memanfaatkan pengetahuan web untuk memberi Anda jawaban.”nb sp
Software yang dapat mendeteksi konten gambar bukanlah hal baru. Google Lens telah mampu mengidentifikasi orang, hewan, tumbuhan, bangunan terkenal, dan objek lain dalam foto sejak 2017, dan Google Goggles pendahulunya yang lebih terbatas sudah ada sejak 2010. Microsoft menggunakan fitur deteksi gambar GPT-4, yang merupakan model bahasa yang sama yang digunakan oleh versi premium ChatGPT. Namun, input gambar belum tersedia di ChatGPT, jadi ini adalah pertama kalinya kami melihat fitur tersebut tersedia secara luas.
Saya mencoba Pencarian Visual dengan beberapa foto, dan hasilnya mengesankan. Meminta Bing untuk mendeskripsikan gambar memberi Anda respons yang jauh lebih mendetail daripada yang Anda dapatkan dari Google Lens. Misalnya, saat mengupload foto anjing saya, dia menjawab, “Ini adalah foto anjing hitam dan cokelat yang sedang duduk di atas permadani berbulu cokelat. Anjing itu memakai kalung merah dengan label perak. Anjing itu menatap kamera dengan telinga terangkat. Latar belakang terdiri dari sofa putih dengan bantal biru dan putih. Foto diambil dari sudut yang tinggi.” Itu juga dengan benar menafsirkan bahwa gambar diunggah sebagai sideways.
Anda dapat mencoba fitur tersebut dengan membuka Bing Chat di Microsoft Edge (Microsoft masih memblokirnya di browser lain) dan mengklik ikon garis besar kamera di bidang teks.
Sumber: Microsoft