OpenAI memamerkan Sora, model AI generatif teks-ke-video pertamanya. Sora dapat mengubah perintah teks atau gambar sederhana menjadi satu menit video beresolusi tinggi. Itu juga dapat “memperluas” atau memasukkan bingkai ke dalam video yang ada. Namun, OpenAI masih memutuskan apakah akan menawarkan Sora sebagai produk.
Ini bukan AI teks-ke-video pertama, tapi mungkin yang paling mengesankan. Video generatif dari Google dan Meta beresolusi rendah, terputus-putus, dan sangat mengerikan. Sementara itu, model Sora menghasilkan video 1080p dengan frame rate yang halus, dan keluarannya mungkin disalahartikan sebagai video sebenarnya.
Contoh awal keluaran Sora tersedia di situs web OpenAI. Berdasarkan contoh-contoh ini, kita dapat melihat bahwa AI memiliki pemahaman yang baik tentang proporsi tubuh manusia, pencahayaan fotorealistik, dan sinematografi kreatif. Sora juga pandai menggambar binatang realistis, dan bisa meniru ketidaksempurnaan film lama.
Tentu saja keluaran Sora jauh dari kata sempurna. Semua subjeknya memiliki kualitas tanpa bobot yang aneh, dan jika Anda perhatikan lebih dekat, Anda akan menemukan beberapa keunikan dalam pembuatan gambar AI. OpenAI mengakui bahwa Sora dapat terkena untung-untungan dan memberikan beberapa contoh “buruk” dari keluaran AI, termasuk video seorang pria berlari mundur di atas treadmill.
Model Sora memiliki “pemahaman bahasa yang mendalam” dan dapat “mengekspresikan emosi yang hidup” dalam keluarannya. Namun, Sora tidak memerlukan prompt yang panjang atau rumit. Beberapa contoh yang diberikan oleh OpenAI didasarkan pada perintah kalimat tunggal yang terbuka. Tidak jauh berbeda dengan fitur pembuatan gambar ChatGPT.
Sayangnya, OpenAI belum memamerkan kemampuan gambar-ke-video Sora. Kami juga penasaran dengan fitur perluasan video dan penyisipan bingkai pada AI—jika fitur ini efektif, Sora dapat menjadi alat yang berguna untuk mengedit atau memulihkan video.
Kami juga hanya tahu sedikit tentang data pelatihan Sora. OpenAI mengatakan bahwa mereka menggunakan sekitar 10.000 jam video “berkualitas tinggi”, tapi itu saja. Informasi lebih lanjut mungkin diungkapkan dalam buku putih Sora OpenAI, yang akan diterbitkan pada akhir tanggal 15 Januari.
Bagaimanapun, Sora perlu mengatasi beberapa rintangan sebelum menjadi produk nyata. OpenAI berkonsultasi dengan “pembuat kebijakan, pendidik, dan seniman” untuk lebih memahami kekhawatiran masyarakat. Mereka juga bekerja sama dengan para ahli yang dapat mengukur potensi Sora dalam “misinformasi, konten kebencian, dan bias.” Jika OpenAI memutuskan untuk membawa Sora ke publik, keluaran AI akan disertai dengan metadata C2PA untuk memudahkan identifikasi.
Sumber: OpenAI
Itulah konten tentang Model Text-to-Video Pertama OpenAI Telah Hadir, tetapi Anda Tidak Dapat Menggunakannya, semoga bermanfaat.