تکنولوژی

هوش مصنوعی تولید ویدیو تنسنت منتشر شد؛ رقیب متن‌باز Sora

هوش مصنوعی تبدیل متن به ویدیوی تنسنت

تنسنت در اعلامیه رسمی خود می‌گوید: «ما Hunyuan Video را ارائه می‌کنیم، یک مدل متن‌باز جدید که عملکرد آن در تولید ویدیو اگر بهتر از مدل‌های متن‌‌بسته پیشرو نباشد، با آنها قابل مقایسه است.» در جدول پایین بنچمارک‌های مدل جدید تنسنت را در مقایسه با دیگر مدل‌ها می‌بینید:

این شرکت چینی ادعا می‌کند که مدل جدیدش براساس نتایج ارزیابی کارشناسان، از مدل‌های پیشرفته‌ای مانند Runway Gen-3 یا Luma 1.6 بهتر است. تنسنت همچنین می‌گوید این هوش مصنوعی دارای 96.4 درصد امتیاز کیفیت بصری است.

Hunyuan Video به‌صورت متن‌باز در گیت‌هاب منتشر شده است؛ اما اگر بخواهید در سایت اصلی از این مدل استفاده کنید، باید اعتبار بخرید تا بتوانید ویدیو تولید کنید؛ برای هر ویدیو نیز به 15 اعتبار نیاز دارید.

شرکت تنسنت (Tencent) از هوش مصنوعی تبدیل متن به ویدیوی Hunyuan Video رونمایی کرد که به‌صورت متن‌باز منتشر شده است؛ نکته جالب این است که این هوش مصنوعی درست زمانی منتشر می‌شود که در طول کمپین 12 روزه OpenAI هستیم؛ احتمال دارد در این کمپین این شرکت، هوش مصنوعی ویدیوساز Sora را پس از ماه‌ها انتظار برای عموم منتشر کند.

براساس اعلام وب‌سایت Hunyuan Video ، هوش مصنوعی جدید تنسنت یک مدل جدید و پیشرفته است که ویدیوهای با کیفیت بالا را از طریق پرامپت‌های متنی ایجاد می کند. به ادعای این شرکت، مدل 13 میلیارد پارامتری Hunyuan Video قدرتمندترین مدل تولید ویدیوی متن‌باز موجود است.

هوش مصنوعی تبدیل متن به ویدیوی تنسنت

تنسنت در اعلامیه رسمی خود می‌گوید: «ما Hunyuan Video را ارائه می‌کنیم، یک مدل متن‌باز جدید که عملکرد آن در تولید ویدیو اگر بهتر از مدل‌های متن‌‌بسته پیشرو نباشد، با آنها قابل مقایسه است.» در جدول پایین بنچمارک‌های مدل جدید تنسنت را در مقایسه با دیگر مدل‌ها می‌بینید:

این شرکت چینی ادعا می‌کند که مدل جدیدش براساس نتایج ارزیابی کارشناسان، از مدل‌های پیشرفته‌ای مانند Runway Gen-3 یا Luma 1.6 بهتر است. البته بااین مدل جدید شما می‌توانید فقط ویدیوهای 5 ثانیه‌ای تولید کنید. همچنین تولید هر ویدیو حدوداً 15 دقیقه طول می‌کشد.

مدل جدید تنسنت از یک انکودر متنی مبتنی بر مدل زبانی چندوجهی (MLLM) استفاده می‌کند و با نرخ هم‌ترازی متن تا 68.5 درصد بهتر از مدل‌های پیشرفته قبلی عمل می‌کند. نرخ هم‌ترازی متن میزان وفاداری مدل هوش مصنوعی به پرامپت شما و میزان مطابقت خروجی با آنچه نوشته بودید را اندازه‌گیری می‌کند. تنسنت همچنین می‌گوید این هوش مصنوعی دارای 96.4 درصد امتیاز کیفیت بصری است.

Hunyuan Video به‌صورت متن‌باز در گیت‌هاب منتشر شده است؛ اما اگر بخواهید در سایت اصلی از این مدل استفاده کنید، باید اعتبار بخرید تا بتوانید ویدیو تولید کنید؛ برای هر ویدیو نیز به 15 اعتبار نیاز دارید. هر یک بسته 150 اعتباری 9.99 دلار هزینه دارد. البته در FAL.ai می‌توانید این هوش مصنوعی را نیز به‌صورت رایگان امتحان کنید.

نمونه عملکرد هوش مصنوعی تولید ویدیو تنسنت
توسط
دیجیاتو
منبع
دیجیاتو
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا