تکنولوژی

ویگل شخصیت‌های هوش مصنوعی قابل کنترل برای میم‌ها و تجسم ایده‌ها ایجاد می‌کند

استارتاپ کانادایی ویگل با استفاده از مدل ویدیوی سه بعدی JST-1، شخصیت‌های هوش مصنوعی قابل کنترل برای میم‌ها و تجسم ایده‌ها ایجاد می‌کند. این شرکت با استفاده از داده‌های عمومی و مدل فیزیکی مبتنی بر شبکه‌های عصبی، امکان ایجاد حرکات واقعی و قابل کنترلی را فراهم می‌کند. ویگل همچنین با جمع‌آوری ۱۹ میلیون دلار در سری A به توسعه محصول و گسترش تیم خود می‌پردازد.

شاید ویگل AI را نشناسید، اما احتمالاً میم‌های ویروسی‌ای که ایجاد کرده را دیده‌اید. این استارتاپ کانادایی مسئول ده‌ها ویدیوی میکس شده از رپر Lil Yachty در یک جشنواره موسیقی تابستانی است. در یک ویدیو، Lil Yachty به جای شخصیت جوکر Joaquins Phoenix قرار داده شده. در دیگری، به نظر می‌رسد که عیسی جمعیت را به وجد آورده باشد. کاربران نسخه‌های بی‌شماری از این ویدیو ایجاد کردند، اما یک استارتاپ هوش مصنوعی این میم‌ها را تأمین می‌کرد. و مدیرعامل ویگل می‌گوید ویدیوهای یوتیوب مدل‌های هوش مصنوعی آن را تغذیه می‌کنند.

ویگل یک مدل بنیادین ویدئوی سه بعدی به نام JST-1 را آموزش داد تا “درک واقعی از فیزیک” داشته باشد، به گفته شرکت در بیانیه مطبوعاتی‌اش. مدیرعامل ویگل، هنگ چو می‌گوید تفاوت کلیدی بین ویگل و دیگر مدل‌های ویدیو هوش مصنوعی در این است که ویگل به کاربران اجازه می‌دهد حرکات شخصیت‌ها را مشخص کنند. دیگر مدل‌های ویدیو هوش مصنوعی اغلب حرکات غیر واقعی‌ای ایجاد می‌کنند که قوانین فیزیک را رعایت نمی‌کنند، اما چو می‌گوید مدل‌های ویگل متفاوت است.

“ما اساساً در حال ساخت یک نوع جدید از موتور گرافیک هستیم، اما صرفاً با شبکه‌های عصبی”، چو در یک مصاحبه گفت. “خود مدل با ژنراتورهای ویدئوی موجود که عمدتاً مبتنی بر پیکسل هستند و ساختار و ویژگی‌های فیزیک را درک نمی‌کنند، بسیار متفاوت است. مدل ما طراحی شده تا چنین درکی داشته باشد، و به همین دلیل در کنترل‌پذیری و کارایی تولید به طور قابل توجهی بهتر بوده است.”

برای ایجاد ویدیوی جوکر به عنوان Lil Yachty، برای مثال، فقط ویدیوی اصلی (Lil Yachty در حال رقصیدن روی صحنه) و تصویری از شخصیت (جوکر) که قرار است آن حرکت را بگیرد، بارگذاری کنید. به طور جایگزین، کاربران می‌توانند تصاویر شخصیت‌ها و همچنین پرسشنامه‌های متنی با دستورالعمل‌های نحوه انیمیشن سازی آن‌ها را بارگذاری کنند. به عنوان سومین گزینه، ویگل به کاربران اجازه می‌دهد تا شخصیت‌های انیمیشنی را از ابتدا با پرسشنامه‌های متنی ایجاد کنند.

اما میم‌ها تنها درصد کمی از کاربران ویگل هستند؛ چو می‌گوید مدل به عنوان یک ابزار تجسم برای خلاقان به طور گسترده‌ای پذیرفته شده است. ویدیوها کاملاً بی‌نقص نیستند - آن‌ها لرزانند و صورت‌ها بی‌احساس هستند - اما چو می‌گوید برای فیلمسازان، انیماتورها و طراحان بازی‌های ویدیویی اثبات شده که موثر است تا ایده‌هایشان را به چیزی بصری تبدیل کنند. در حال حاضر، مدل‌های ویگل فقط شخصیت‌ها را ایجاد می‌کنند، اما چو امیدوار است که در آینده ویدیوهای پیچیده‌تری را قادر سازد.

ویگل در حال حاضر نسخه‌ای رایگان و محدود از مدل هوش مصنوعی خود را در دیسکورد و وب اپلیکیشن خود ارائه می‌دهد. این شرکت همچنین یک اشتراک ۹.۹۹ دلاری برای ظرفیت افزایش‌یافته ارائه می‌دهد و به برخی از خلاقان دسترسی ویژه از طریق برنامه خالق خود می‌دهد. مدیرعامل می‌گوید ویگل با استودیوهای فیلم و بازی‌های ویدیویی برای مجوز دادن به این فناوری در حال گفتگو است، اما همچنین پذیرش از سوی انیماتورهای مستقل و خالقان محتوا را مشاهده کرده است.

روز دوشنبه، ویگل اعلام کرد که ۱۹ میلیون دلار سری A به رهبری Andreessen Horowitz با مشارکت Two Small Fish جمع‌آوری کرده است. استارتاپ می‌گوید این دوره به ویگل کمک خواهد کرد تا رشد کند، توسعه محصول را تسریع ببخشد و تیم خود را گسترش دهد. ویگل به TechCrunch می‌گوید که با Google Cloud و دیگر ارائه‌دهندگان ابری برای آموزش و اجرا کردن مدل‌های هوش مصنوعی خود همکاری دارد. این همکاری‌های Google Cloud اغلب شامل دسترسی به خوشه‌های GPU و TPU است، اما معمولاً ویدیوهای یوتیوب برای آموزش مدل‌های هوش مصنوعی فراهم نمی‌کند.

داده‌های آموزشی

در طول مصاحبه TechCrunch با چو، از او پرسیدیم مدل‌های ویدیو هوش مصنوعی ویگل آموزش داده شده‌اند.

“تا کنون، ما به داده‌هایی که به صورت عمومی در دسترس است، تکیه کرده‌ایم”، چو گفت، با بیانی مشابه آنچه که Mira Murati، مدیر فناوری OpenAI درباره داده‌های آموزشی سورا گفت.

پرسیدیم که آیا مجموعه داده‌های آموزشی ویگل شامل ویدیوهای یوتیوب است، چو به سادگی پاسخ داد: “بله.”

این ممکن است مشکلی باشد. در آوریل، مدیرعامل یوتیوب، نیل موهان به بلومبرگ گفت که استفاده از ویدیوهای یوتیوب برای آموزش یک تولیدکننده ویدیو از متن به وضوح نقض قوانین خواهد بود. این نظرات در زمینه استفاده احتمالی OpenAI از ویدیوهای یوتیوب برای آموزش سورا بود.

مواحن توضیح داد که گوگل، صاحب یوتیوب، ممکن است با برخی از خالقان قراردادهایی داشته باشد تا ویدیوهای آن‌ها را در مجموعه داده‌های آموزشی برای گوگل دیپ‌مایند از جمینی استفاده کند. با این حال، به گفته موهان و شرایط خدمات یوتیوب، برداشت ویدیو از پلتفرم بدون کسب اجازه قبلی از شرکت مجاز نیست.

بعد از مصاحبه تکچرانچ با مدیرعامل ویگل، سخنگوی ویگل ایمیلی به ما ارسال کرد که در آن گفته بود چو “در مورد اینکه آیا ویگل از داده‌های یوتیوب به عنوان آموزش استفاده می‌کند، زود صحبت کرده است. در حقیقت، هنگ / ویگل قادر به اشتراک‌گذاری جزئیات داده‌های آموزشی آن‌ها نیست.”

ویگل از منابع عمومی مختلف، از جمله یوتیوب، برای تولید محتوای هوش مصنوعی استفاده می‌کند. داده‌های آموزشی ما به دقت انتخاب و تصفیه شده‌اند و اطمینان حاصل می‌کند که در تمام فرآیند شرایط خدمات را رعایت می‌کنیم. ما اولویت خود را بر حفظ روابط قوی با پلتفرم‌هایی مانند یوتیوب قرار داده‌ایم و متعهد به احترام به شرایط آن‌ها با اجتناب از دانلودهای عظیم و هر اقدام دیگری که شامل دانلودهای غیرمجاز ویدیوها باشد هستیم.

این رویکرد به نظر با نظرات موهان در آوریل در تضاد است که مجموعه ویدیوهای یوتیوب یک منبع عمومی نیست. ما با سخنگویان یوتیوب و گوگل تماس گرفتیم، اما هنوز پاسخی دریافت نکرده‌ایم.

استارتاپ به دیگران در یک منطقه خاکستری در استفاده از یوتیوب به عنوان داده آموزشی می‌پیوندد. گزارش شده که بسیاری از توسعه‌دهندگان مدل‌های هوش مصنوعی – از جمله OpenAI، Nvidia، Apple و Anthropic – همه از رونویسی‌ها یا کلیپ‌های ویدیوی یوتیوب برای آموزش استفاده می‌کنند. این راز کثیف در سیلیکون ولی است که چندان هم راز نیست: به احتمال زیاد همه این کار را می‌کنند. چیزی که واقعاً نادر است این است که آن را به صراحت بگوید.

توسط
Tech Crunch
منبع
Tech Crunch
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا