Alibaba Cloud, video üretimi için geliştirdiği yeni yapay zekâ modelleri setini açık kaynaklı olarak tüm kullanıcıların erişimine sundu. Bu set, 14 milyar ve 1,3 milyar parametreye sahip iki farklı sürüm dahil olmak üzere toplam dört model içeriyor. Modeller, yüksek doğruluk ve görev performansıyla öne çıkarak rakiplerini geride bırakıyor.
Yeni modeller, metin açıklamaları ve grafiklerden son derece gerçekçi video içerikleri üretebiliyor. Özellikle hareketlerin doğallığı ve görüntü detaylarının kalitesi dikkat çekiyor. Ayrıca, ilk kez Çince ve İngilizce dillerinde metin efektleri desteği de sunuluyor. Gelişmiş fizik hesaplamaları ve piksel düzeyinde detaylandırma sayesinde, ortaya çıkan videolar oldukça gerçekçi bir yapıya sahip oluyor.
VBench platformunda gerçekleştirilen testlerde, Wan2.1 modeli %86,22 doğruluk oranıyla ilk sıraya yerleşti. Bu model aynı zamanda Hugging Face üzerinde ilk 5’e giren tek açık kaynak kodlu araç olma özelliği taşıyor. 14 milyar parametreli versiyon, zengin detaylara sahip ve dinamik sahneler içeren videolar üretmek için tasarlanmışken; 1,3 milyar parametreli versiyon, yalnızca 4 dakika içinde bir dizüstü bilgisayarda 480p kalitesinde 5 saniyelik video oluşturabiliyor.
Wan2.1, LTX ve Hunyuan gibi rakipleriyle karşılaştırıldığında, metin ve grafik temelli veri girişleri üzerinden daha yüksek video üretim kalitesi sunuyor. Her ne kadar bazı rakiplerine göre işlem süresi daha uzun olsa da, ortaya çıkan nihai içerikler bu farkı başarıyla kapatıyor.
İşte https://wan.video/ web sitesi üzerinden oluşturmuş olduğum videoyu aşağıya bırakıyorum sizde ücretsiz şekilde iyi bir prompt girerek videodunuz oluşturabilirsiniz.
Model, gelişmiş bir teknik temel olan video-VAE (varyasyonel otomatik kodlayıcı) teknolojisini kullanıyor. Bu teknoloji sayesinde, yüksek kaliteli görseller üretmek mümkün hale geliyor. Özellikle karmaşık vücut hareketlerinin, sahne geçişlerinin ve fiziksel etkileşimlerin gerçekliğe yakın şekilde yansıtılması sağlanıyor.
Wan2.1 modellerinin tüm versiyonları, Model Scope ve Hugging Face platformlarında indirilebilir durumda. Ayrıca, resmi Wan projesi web sitesi üzerinden de erişim mümkün. Bu modeller, küresel çapta bilimsel araştırmalar, teknik geliştirmeler ve ticari projelerde kullanılabilecek şekilde sunuluyor.
23 Nisan 2025 itibarıyla yeni bir arayüz güncellemesi ile birlikte Relax Mode özelliği kullanıma açılacak. Bu mod sayesinde kullanıcılar, ücretsiz olarak video ve görsel içerikler oluşturabilecek. Daha hızlı işlem süresi ve gelişmiş özelliklere erişim isteyen kullanıcılar için ise aylık bonuslar, gelişmiş araçlar ve gerçek zamanlı öncelikli veri işleme imkânı sunan özel bir üyelik sistemi devreye girecek.