ویگل شخصیتهای هوش مصنوعی قابل کنترل برای میمها و تجسم ایدهها ایجاد میکند
شاید ویگل AI را نشناسید، اما احتمالاً میمهای ویروسیای که ایجاد کرده را دیدهاید. این استارتاپ کانادایی مسئول دهها ویدیوی میکس شده از رپر Lil Yachty در یک جشنواره موسیقی تابستانی است. در یک ویدیو، Lil Yachty به جای شخصیت جوکر Joaquins Phoenix قرار داده شده. در دیگری، به نظر میرسد که عیسی جمعیت را به وجد آورده باشد. کاربران نسخههای بیشماری از این ویدیو ایجاد کردند، اما یک استارتاپ هوش مصنوعی این میمها را تأمین میکرد. و مدیرعامل ویگل میگوید ویدیوهای یوتیوب مدلهای هوش مصنوعی آن را تغذیه میکنند.
ویگل یک مدل بنیادین ویدئوی سه بعدی به نام JST-1 را آموزش داد تا “درک واقعی از فیزیک” داشته باشد، به گفته شرکت در بیانیه مطبوعاتیاش. مدیرعامل ویگل، هنگ چو میگوید تفاوت کلیدی بین ویگل و دیگر مدلهای ویدیو هوش مصنوعی در این است که ویگل به کاربران اجازه میدهد حرکات شخصیتها را مشخص کنند. دیگر مدلهای ویدیو هوش مصنوعی اغلب حرکات غیر واقعیای ایجاد میکنند که قوانین فیزیک را رعایت نمیکنند، اما چو میگوید مدلهای ویگل متفاوت است.
“ما اساساً در حال ساخت یک نوع جدید از موتور گرافیک هستیم، اما صرفاً با شبکههای عصبی”، چو در یک مصاحبه گفت. “خود مدل با ژنراتورهای ویدئوی موجود که عمدتاً مبتنی بر پیکسل هستند و ساختار و ویژگیهای فیزیک را درک نمیکنند، بسیار متفاوت است. مدل ما طراحی شده تا چنین درکی داشته باشد، و به همین دلیل در کنترلپذیری و کارایی تولید به طور قابل توجهی بهتر بوده است.”
برای ایجاد ویدیوی جوکر به عنوان Lil Yachty، برای مثال، فقط ویدیوی اصلی (Lil Yachty در حال رقصیدن روی صحنه) و تصویری از شخصیت (جوکر) که قرار است آن حرکت را بگیرد، بارگذاری کنید. به طور جایگزین، کاربران میتوانند تصاویر شخصیتها و همچنین پرسشنامههای متنی با دستورالعملهای نحوه انیمیشن سازی آنها را بارگذاری کنند. به عنوان سومین گزینه، ویگل به کاربران اجازه میدهد تا شخصیتهای انیمیشنی را از ابتدا با پرسشنامههای متنی ایجاد کنند.
اما میمها تنها درصد کمی از کاربران ویگل هستند؛ چو میگوید مدل به عنوان یک ابزار تجسم برای خلاقان به طور گستردهای پذیرفته شده است. ویدیوها کاملاً بینقص نیستند - آنها لرزانند و صورتها بیاحساس هستند - اما چو میگوید برای فیلمسازان، انیماتورها و طراحان بازیهای ویدیویی اثبات شده که موثر است تا ایدههایشان را به چیزی بصری تبدیل کنند. در حال حاضر، مدلهای ویگل فقط شخصیتها را ایجاد میکنند، اما چو امیدوار است که در آینده ویدیوهای پیچیدهتری را قادر سازد.
ویگل در حال حاضر نسخهای رایگان و محدود از مدل هوش مصنوعی خود را در دیسکورد و وب اپلیکیشن خود ارائه میدهد. این شرکت همچنین یک اشتراک ۹.۹۹ دلاری برای ظرفیت افزایشیافته ارائه میدهد و به برخی از خلاقان دسترسی ویژه از طریق برنامه خالق خود میدهد. مدیرعامل میگوید ویگل با استودیوهای فیلم و بازیهای ویدیویی برای مجوز دادن به این فناوری در حال گفتگو است، اما همچنین پذیرش از سوی انیماتورهای مستقل و خالقان محتوا را مشاهده کرده است.
روز دوشنبه، ویگل اعلام کرد که ۱۹ میلیون دلار سری A به رهبری Andreessen Horowitz با مشارکت Two Small Fish جمعآوری کرده است. استارتاپ میگوید این دوره به ویگل کمک خواهد کرد تا رشد کند، توسعه محصول را تسریع ببخشد و تیم خود را گسترش دهد. ویگل به TechCrunch میگوید که با Google Cloud و دیگر ارائهدهندگان ابری برای آموزش و اجرا کردن مدلهای هوش مصنوعی خود همکاری دارد. این همکاریهای Google Cloud اغلب شامل دسترسی به خوشههای GPU و TPU است، اما معمولاً ویدیوهای یوتیوب برای آموزش مدلهای هوش مصنوعی فراهم نمیکند.
دادههای آموزشی
در طول مصاحبه TechCrunch با چو، از او پرسیدیم مدلهای ویدیو هوش مصنوعی ویگل آموزش داده شدهاند.
“تا کنون، ما به دادههایی که به صورت عمومی در دسترس است، تکیه کردهایم”، چو گفت، با بیانی مشابه آنچه که Mira Murati، مدیر فناوری OpenAI درباره دادههای آموزشی سورا گفت.
پرسیدیم که آیا مجموعه دادههای آموزشی ویگل شامل ویدیوهای یوتیوب است، چو به سادگی پاسخ داد: “بله.”
این ممکن است مشکلی باشد. در آوریل، مدیرعامل یوتیوب، نیل موهان به بلومبرگ گفت که استفاده از ویدیوهای یوتیوب برای آموزش یک تولیدکننده ویدیو از متن به وضوح نقض قوانین خواهد بود. این نظرات در زمینه استفاده احتمالی OpenAI از ویدیوهای یوتیوب برای آموزش سورا بود.
مواحن توضیح داد که گوگل، صاحب یوتیوب، ممکن است با برخی از خالقان قراردادهایی داشته باشد تا ویدیوهای آنها را در مجموعه دادههای آموزشی برای گوگل دیپمایند از جمینی استفاده کند. با این حال، به گفته موهان و شرایط خدمات یوتیوب، برداشت ویدیو از پلتفرم بدون کسب اجازه قبلی از شرکت مجاز نیست.
بعد از مصاحبه تکچرانچ با مدیرعامل ویگل، سخنگوی ویگل ایمیلی به ما ارسال کرد که در آن گفته بود چو “در مورد اینکه آیا ویگل از دادههای یوتیوب به عنوان آموزش استفاده میکند، زود صحبت کرده است. در حقیقت، هنگ / ویگل قادر به اشتراکگذاری جزئیات دادههای آموزشی آنها نیست.”
ویگل از منابع عمومی مختلف، از جمله یوتیوب، برای تولید محتوای هوش مصنوعی استفاده میکند. دادههای آموزشی ما به دقت انتخاب و تصفیه شدهاند و اطمینان حاصل میکند که در تمام فرآیند شرایط خدمات را رعایت میکنیم. ما اولویت خود را بر حفظ روابط قوی با پلتفرمهایی مانند یوتیوب قرار دادهایم و متعهد به احترام به شرایط آنها با اجتناب از دانلودهای عظیم و هر اقدام دیگری که شامل دانلودهای غیرمجاز ویدیوها باشد هستیم.
این رویکرد به نظر با نظرات موهان در آوریل در تضاد است که مجموعه ویدیوهای یوتیوب یک منبع عمومی نیست. ما با سخنگویان یوتیوب و گوگل تماس گرفتیم، اما هنوز پاسخی دریافت نکردهایم.
استارتاپ به دیگران در یک منطقه خاکستری در استفاده از یوتیوب به عنوان داده آموزشی میپیوندد. گزارش شده که بسیاری از توسعهدهندگان مدلهای هوش مصنوعی – از جمله OpenAI، Nvidia، Apple و Anthropic – همه از رونویسیها یا کلیپهای ویدیوی یوتیوب برای آموزش استفاده میکنند. این راز کثیف در سیلیکون ولی است که چندان هم راز نیست: به احتمال زیاد همه این کار را میکنند. چیزی که واقعاً نادر است این است که آن را به صراحت بگوید.