Kahkaha

Bayıldım

Cool

Kızgın

Mahcup

Öğretici

Şaşkın

Suskun

Tatlı

Üzgün

Süper

Google DeepMind ses efektleri ve diyalog teknolojisini gösterdi

Ana Sayfa » Teknoloji » Google DeepMind ses efektleri ve diyalog teknolojisini gösterdi
Google DeepMind ses efektleri ve diyalog teknolojisini gösterdi

Google’ın yapay zeka laboratuvarı DeepMind, videolar için ses efektleri ve diyaloglar oluşturabilen yeni bir teknoloji geliştirdiğini açıkladı. Bu yenilikçi teknoloji, videoların ham piksellerini ve metin girdilerini kullanarak, görsel sahnelere uygun ses efektleri yaratabiliyor. DeepMind ekibi, bu projeyi “video-ile-ses” (V2A) teknolojisi olarak adlandırdı ve bu teknoloji, Google Veo ve OpenAI Sora gibi diğer video oluşturma araçlarıyla birlikte kullanılabiliyor.

Google DeepMind’ın Video-İle-Ses teknolojisi

DeepMind ekibi, blog yazılarında bu teknolojinin işleyişi hakkında detaylı bilgi verdi. Sistem, videoların ham piksellerini analiz ederek bu görsel veriyi metin girdileri ile birleştiriyor ve böylece ekranda olup bitenlere uygun ses efektleri oluşturabiliyor. Bu özellik, geleneksel sesli film ve sessiz film gibi farklı video türlerine de uygulanabiliyor.

Teknolojinin eğitimi, video, ses ve yapay zeka tarafından oluşturulan detaylı ses ve diyalog açıklamaları içeren anotasyonlar ile gerçekleştirildi. Bu sayede, teknoloji görsel sahneler ile spesifik sesleri ilişkilendirmeyi öğrendi. Bu özellik, DeepMind’ın mevcut video-ile-ses çözümlerinden farklı olmasını sağlıyor çünkü sistem, ham pikselleri anlayabiliyor ve metin girdisi eklemek isteğe bağlı.

Metin girdisi isteğe bağlı olsa da, kullanıcılar metin girdisi kullanarak nihai ürünü daha da şekillendirebiliyor ve daha gerçekçi ve doğru ses efektleri oluşturabiliyor. Pozitif girdiler kullanılarak istenen seslerin oluşturulması sağlanırken, negatif girdiler ile istenmeyen seslerden kaçınılabilir. Örneğin, “sinematik, gerilim, korku filmi, müzik, gerginlik, beton üzerinde ayak sesleri” gibi bir girdi kullanıldığında, sistem bu girdiye uygun sesler üretebiliyor.

Araştırmacılar, V2A teknolojisinin mevcut sınırlamaları üzerinde çalıştıklarını kabul ediyorlar. Örneğin, kaynak videoda bozulmalar olduğunda, çıkış sesinin kalitesinde düşüş yaşanabiliyor. Ayrıca, oluşturulan diyalogların dudak senkronizasyonu üzerinde de geliştirmeler yapılması gerekiyor. DeepMind ekibi, teknolojinin piyasaya sürülmeden önce titiz güvenlik değerlendirmeleri ve testlerden geçirileceğini de taahhüt ediyor.

Sonuç olarak, DeepMind’ın bu yeni teknolojisi, videolar için ses efektleri ve diyaloglar oluşturma sürecinde devrim niteliğinde bir adım olabilir. Bu teknoloji, video prodüksiyon süreçlerini daha verimli ve yaratıcı hale getirebilir, aynı zamanda sessiz filmleri ve diğer geleneksel video türlerini de yeniden canlandırabilir. DeepMind’ın bu yenilikçi çalışması, yapay zekanın medya ve eğlence sektöründeki potansiyelini bir kez daha gözler önüne seriyor.

Google DeepMind ses efektleri ve diyalog teknolojisini gösterdi - Yorumlar

YORUMLARINIZI PAYLAŞIN

 

Yapılan Yorumlar

SOSYAL MEDYADA BİZSitemizin sosyal medya hesapları

ÖNE ÇIKAN KATEGORİLER

RASTGELE İÇERİKLER

Huawei nova 12 SE ve nova 12s Türkiye’de satışta Yapay zekâ öğrencilere ve çalışanlara neler sağlar? AIDA64 Extreme – Tam Sürüm Ücretsiz Lisans İndir Xiaomi 15 özellikleri sızdırıldı Google Gemini Mesajlar uygulamasında MediaMarkt Türkiye 2024 yatırım ve strateji planlarını duyurdu

FACEBOOK'TA BİZ

TemaFabrika

Hoşgeldiniz

Eski Kafa Herkes Burada - Tüm Hakları Saklıdır