🎬 CogVideoX-5B — Character Animation

حوّل صورة شخصيتك إلى فيديو متحرك · نموذج خفيف يعمل بثبات على ZeroGPU

📥 المدخلات

5 50
1 20
✅ النموذج: CogVideoX-5B-I2V (~10GB فقط)
✅ sequential CPU offload + VAE slicing + tiling
⏱️ وقت التوليد: 2–4 دقائق على ZeroGPU A100
📐 الدقة: 720×480 ثابتة (قيد النموذج) · 49 إطار · 8fps
🔄 الفرق عن النسخة السابقة (LTX-2 IC-LoRA):
• النموذج أخف 4× (5B بدل 19B) — أسرع وأكثر استقراراً
• فيديو الحركة يُحلَّل ويُستخرج منه وصف الحركة تلقائياً
• لا يحتاج Gemma 12B للنص — يستخدم T5 مدمج أخف

📤 النتيجة

🧠 النموذج: CogVideoX-5B Image-to-Video
💾 VRAM: ~6-8GB (sequential CPU offload)
🎞️ الإخراج: 49 إطار · 8fps · ~6 ثوانٍ
ZeroGPU: A100 40GB ✅ مستقر

💡 دليل Prompts للحركات الشائعة

الحركة Prompt مقترح
رقص a person dancing gracefully, smooth flowing movement, expressive gestures, cinematic
مشي a person walking naturally with confidence, realistic gait, steady movement
حديث a person speaking expressively, natural facial expressions, head movement, lifelike
رياضة an athlete performing dynamic movements, powerful and fluid motion, high energy
تأمل a person meditating peacefully, slow breathing, calm serene movement

📊 مقارنة مع النموذج السابق

المعيار LTX-2 19B IC-LoRA (السابق) CogVideoX-5B (الحالي)
حجم النموذج 38GB BF16 / 27GB FP8 ~10GB
VRAM المطلوب 20-30GB+ ~8GB
وقت التوليد 5-8 دقائق 2-4 دقائق
الاستقرار على ZeroGPU صعب ✅ ممتاز
نقل الشخصية IC-LoRA دقيق صورة مرجعية
الإطارات مرن (9-97) 49 ثابتة