AIReview & Tutorial

Alibaba Cloud Buka Akses Open-Source untuk Model AI Video Generator

×

Alibaba Cloud Buka Akses Open-Source untuk Model AI Video Generator

Sebarkan artikel ini
Image Credit Alibaba Cloud Pressroom - Ilustrasi. Maskot Alibaba Cloud.
Image Credit Alibaba Cloud Pressroom - Ilustrasi. Maskot Alibaba Cloud.

INDONESIAUPDATES.COM, TEKNOLOGI – Alibaba Cloud secara resmi mengumumkan pembukaan akses open-source untuk model kecerdasan buatan (AI) penghasil konten video sebagai bagian dari komitmen mereka dalam mendukung komunitas open-source global.

Dalam keterangan pers yang dirilis pada Rabu (27/2), Alibaba Cloud membuka akses terhadap empat model dari seri Wan2.1, yakni versi terbaru dari model dasar video Tongyi Wanxiang (Wan). Keempat model tersebut—T2V-14B, T2V-1.3B, I2V-14B-720P, dan I2V-14B-480P—memiliki parameter masing-masing 14 miliar dan 1,3 miliar yang memungkinkan pembuatan gambar serta video berkualitas tinggi dari input teks maupun gambar.

Dapat Diakses di Model Scope dan Hugging Face

Model Wan2.1 kini tersedia melalui komunitas model AI Alibaba Cloud, Model Scope, serta platform AI kolaboratif Hugging Face. Langkah ini memungkinkan akademisi, peneliti, dan institusi komersial di seluruh dunia untuk mengakses teknologi ini secara gratis dan menggunakannya sesuai kebutuhan.

Alibaba Cloud menegaskan bahwa model ini mampu menghasilkan visual realistis dengan gerakan yang lebih akurat, meningkatkan ketajaman pixel, serta mengikuti prinsip fisika untuk menciptakan gerakan yang lebih alami. Dengan keunggulan tersebut, Wan2.1 berhasil menduduki posisi teratas dalam VBench leaderboard, sebuah tolok ukur komprehensif untuk model pembuat video AI.

Model Open-Source Terbaik di VBench

Berdasarkan evaluasi VBench, seri Wan2.1 mencatat skor keseluruhan sebesar 86,22 persen, menjadikannya model generasi video open-source satu-satunya yang masuk dalam lima besar leaderboard di Hugging Face. Model ini unggul dalam aspek dinamika gerakan, hubungan spasial, warna, serta interaksi multi-objek.

“Dengan membuka akses model ini, kami berharap lebih banyak bisnis dan pengembang dapat memanfaatkan teknologi AI untuk menciptakan konten video berkualitas tinggi dengan biaya yang lebih efisien,” ujar juru bicara Alibaba Cloud dalam pernyataannya.

Keunggulan Masing-Masing Model

Setiap model dalam seri Wan2.1 memiliki spesialisasi berbeda:

  • T2V-14B: Cocok untuk pembuatan video berkualitas tinggi dengan dinamika gerakan yang lebih kompleks.
  • T2V-1.3B: Menawarkan keseimbangan antara kualitas visual dan efisiensi daya komputasi, ideal bagi pengembang dan akademisi.
  • I2V-14B-720P & I2V-14B-480P: Mendukung fitur image-to-video, memungkinkan pengguna mengubah gambar statis menjadi video yang dinamis hanya dengan menambahkan deskripsi teks singkat.

Sebagai contoh, model T2V-1.3B dapat digunakan untuk membuat video berdurasi 5 detik dengan resolusi 480p hanya dalam waktu sekitar 4 menit menggunakan perangkat laptop standar.

Komitmen Alibaba Cloud terhadap Open-Source AI

Alibaba Cloud telah lama berperan aktif dalam pengembangan AI open-source. Pada Agustus 2023, perusahaan ini merilis model AI open-source pertamanya, Qwen-7B, yang hingga kini terus menduduki peringkat teratas dalam Hugging Face Open LLM Leaderboards. Model Qwen telah dikembangkan lebih dari 100.000 kali di platform tersebut, menjadikannya salah satu ekosistem AI terbesar di dunia.

Dengan langkah terbaru ini, Alibaba Cloud semakin memperkuat posisinya sebagai salah satu perusahaan teknologi global yang mendorong inovasi AI terbuka, memungkinkan lebih banyak pihak untuk mengembangkan dan memanfaatkan AI generatif secara luas.


Pertanyaan Umum FAQ (Frequently Asked Questions)


1. Apa itu Wan2.1?
Wan2.1 adalah seri model AI open-source dari Alibaba Cloud yang dapat menghasilkan video berkualitas tinggi dari teks atau gambar.

2. Apa saja model yang tersedia dalam seri Wan2.1?
Terdapat empat model: T2V-14B, T2V-1.3B, I2V-14B-720P, dan I2V-14B-480P.

3. Di mana saya bisa mengakses model ini?
Model dapat diunduh melalui Model Scope Alibaba Cloud dan platform Hugging Face.

4. Apakah model ini gratis?
Ya, model ini tersedia secara open-source untuk akademisi, peneliti, dan bisnis.

5. Apa perbedaan antara model T2V dan I2V?
T2V (Text-to-Video) menghasilkan video dari teks, sementara I2V (Image-to-Video) memungkinkan konversi gambar menjadi video.

6. Apakah saya bisa menggunakan model ini di perangkat dengan spesifikasi rendah?
Ya, model T2V-1.3B dapat digunakan di laptop standar untuk membuat video resolusi 480p dalam waktu sekitar 4 menit.

7. Bagaimana performa Wan2.1 dibandingkan model lain?
Wan2.1 mencetak skor tertinggi di VBench leaderboard dan merupakan satu-satunya model open-source yang masuk dalam lima besar di Hugging Face.


IKUTI INDONESIAUPDATES.COM

GOOGLE NEWS | WHATSAPP CHANNEL