🎬 CogVideoX-5B — Character Animation
حوّل صورة شخصيتك إلى فيديو متحرك · نموذج خفيف يعمل بثبات على ZeroGPU
📥 المدخلات
5 50
1 20
✅ النموذج: CogVideoX-5B-I2V (~10GB فقط)
✅ sequential CPU offload + VAE slicing + tiling
⏱️ وقت التوليد: 2–4 دقائق على ZeroGPU A100
📐 الدقة: 720×480 ثابتة (قيد النموذج) · 49 إطار · 8fps
✅ sequential CPU offload + VAE slicing + tiling
⏱️ وقت التوليد: 2–4 دقائق على ZeroGPU A100
📐 الدقة: 720×480 ثابتة (قيد النموذج) · 49 إطار · 8fps
🔄 الفرق عن النسخة السابقة (LTX-2 IC-LoRA):
• النموذج أخف 4× (5B بدل 19B) — أسرع وأكثر استقراراً
• فيديو الحركة يُحلَّل ويُستخرج منه وصف الحركة تلقائياً
• لا يحتاج Gemma 12B للنص — يستخدم T5 مدمج أخف
• النموذج أخف 4× (5B بدل 19B) — أسرع وأكثر استقراراً
• فيديو الحركة يُحلَّل ويُستخرج منه وصف الحركة تلقائياً
• لا يحتاج Gemma 12B للنص — يستخدم T5 مدمج أخف
📤 النتيجة
🧠 النموذج: CogVideoX-5B Image-to-Video
💾 VRAM: ~6-8GB (sequential CPU offload)
🎞️ الإخراج: 49 إطار · 8fps · ~6 ثوانٍ
⚡ ZeroGPU: A100 40GB ✅ مستقر
💾 VRAM: ~6-8GB (sequential CPU offload)
🎞️ الإخراج: 49 إطار · 8fps · ~6 ثوانٍ
⚡ ZeroGPU: A100 40GB ✅ مستقر
💡 دليل Prompts للحركات الشائعة
| الحركة | Prompt مقترح |
|---|---|
| رقص | a person dancing gracefully, smooth flowing movement, expressive gestures, cinematic |
| مشي | a person walking naturally with confidence, realistic gait, steady movement |
| حديث | a person speaking expressively, natural facial expressions, head movement, lifelike |
| رياضة | an athlete performing dynamic movements, powerful and fluid motion, high energy |
| تأمل | a person meditating peacefully, slow breathing, calm serene movement |
📊 مقارنة مع النموذج السابق
| المعيار | LTX-2 19B IC-LoRA (السابق) | CogVideoX-5B (الحالي) |
|---|---|---|
| حجم النموذج | 38GB BF16 / 27GB FP8 | ~10GB |
| VRAM المطلوب | 20-30GB+ | ~8GB |
| وقت التوليد | 5-8 دقائق | 2-4 دقائق |
| الاستقرار على ZeroGPU | صعب | ✅ ممتاز |
| نقل الشخصية | IC-LoRA دقيق | صورة مرجعية |
| الإطارات | مرن (9-97) | 49 ثابتة |