Samsung deepfake yapay zekâsı tek bir fotoğraftan video oluşturuyor

Yapay zekâ teknolojileri, sağlık sektöründen sesli asistanlara kadar yüzlerce farklı sektör tarafından aktif olarak kullanılıyor. Evet; bu teknoloji insanlığın yararına kullanıldığında herhangi bir sorun yok. Ancak sonuçlar bazen ürkütücü boyuta ulaşabiliyor. 

Facebook’un profil fotoğrafınızı çalarak bir video oluşturduğunu düşünün. Neyse ki kötü adamlar henüz bu teknolojiye sahip değiller. Fakat Samsung bunun nasıl gerçekleştirileceğini buldu. Güney Koreli şirket, son olarak tek bir fotoğrafla video klip yapmayı sağlayan bir yapay zekâ geliştirdi.

Deepfake olarak da geçen bu kavram, insanların tek bir fotoğrafından yola çıkarak video oluşturulmasını sağlıyor. Yani az önceki örnekte olduğu gibi internet bir fotoğrafınız bulunduktan sonra istenildiği gibi oynanıp video haline getirilebiliyor. 

Mona Lisa’nın tek bir fotoğrafını analiz eden Samsung’un deepfake yapay zekâsı ortaya korkutucu boyutta – gerçek gibi görünen – bir video çıkarıyor.

Bu teknoloji elbette klasik bir portre oluşturmak ya da eğlenceli bir video üretmek için kullanılabilir. Ancak yukarıda yeni teknolojiyi göstermek için canlandırılan üç farklı video yer alıyor. Mona Lisa’nın yalnızca tek bir hareketsiz görüntüsünden elde edilen bu video, Rusya’daki bir Samsung yapay zekâ laboratuvarında oluşturuldu.

Bu tür teknikler üzerinde uzmanlaşmış bir Dartmouth araştırmacısı olan Hany Farid’e göre bu tip yapay zekâ teknolojilerinin dezavantajı yanlış bilgilendirme, seçimleri değiştirme ve sahtekarlık riskleri oluşturuyor.

Deepfake videoları genellikle birinin sahte videosunu üretmek için çok fazla görüntü gerektiriyor. Ancak Samsung tarafından geliştirilen yapay zekâ sistemitek bir resimden yola çıkarak sahte bir video klip oluşturabiliyor.

Farid kısaca geçen seneye oranla bu ve ilgili tekniklerin çok daha az veri gerektirdiğinden bahsediyor. Yani aslında çok daha az veriyle sofistike ve çekici içerik üretilebiliyor. Samsung’un süreci görsel aksaklıklar yaratsa da bu sonuç gerçeğinden ayırt edilemeyecek kadar multimedya içeriğin oluşmasına yol açıyor.

Samsung’un sistemi, Alexandar Graham Bell’in de dediği gibi “her şeyden önce, hazırlık başarının anahtarıdır” cümlesinden ilham alan bir yapı üzerine kurgulanmış. Sistem, insan yüzlerinin nasıl hareket ettiğini öğrenmek için birçok videoyu izliyor. Daha sonrasında uzun bir meta-öğrenme aşaması başlıyor. Ardından makul derecede gerçekçi, hareketli bir video üretmek için öğrenilen her şey fotoğrafa uygulanıyor. Yani aslına bakılırsa çok gerçekçi sonuçlar için yeterince fazla veri olması yetiyor.