دادهها تقریباً همه چیز در مورد آموزش سیستمهای هوش مصنوعی است، اما دسترسی به اطلاعات کافی برای تولید محصولات کیفی که به وعدههای خود عمل کنند چالشی عمده حتی برای شرکتهایی با منابع مالی عمیق است.
این مشکل است که Advex AI قصد دارد با استفاده از هوش مصنوعی مولد و دادههای مصنوعی به آن بپردازد. به طور دقیقتر، Advex به مشتریان اجازه میدهد سیستمهای دید ماشینی خود را با استفاده از یک نمونه کوچک از تصاویر آموزش دهند و با تولید هزاران تصویر "جعلی" از آن نمونه توسط Advex.
امروز نشانهای بر معرفی رسمی Advex در TechCrunch Disrupt 2024 در مرحله Startup Battlefield است، اگرچه قبلاً توانسته چند مشتری از فاز استیلت خود جذب کند. این شامل آنچه که آن را "هفت مشتری عمده" مینامد نیز هست که میگوید نمیتوان نام آنها را فاش کرد. TechCrunch همچنین فاش میکند که استارتاپ مستقر در سانفرانسیسکو توانسته است ۳.۶ میلیون دلار سرمایهگذاری جذب کند که عمدهاش از طریق یک بخش ۳.۱ میلیون دلاری در دسامبر گذشته به دست آمده است، با حامیان برجستهای مانند Construct Capital ، Pear VC و Emerson Collective متعلق به لاورین پاول جابز.
مدیرعامل پدرو پاچوکا Advex را با همبنیانگذار CTO خود قاسم وانی کمی بیش از یک سال پیش آغاز کرد و شرکت اکنون شش نفره است. اینکه چنین یک استارتاپ کوچکی توانسته با مشتریان واقعی و باپرداخت وارد صنعت شود خود چشمگیر است، و پاچوکا حداقل بخش یا همان بخشی از این موفقیت را به خاطر سابقه خود و همچنین شبکهسازی و تماسهای سرد قدیمی میداند. در واقع، پاچوکا قبلاً محقق یادگیری ماشینی در برکلی بوده و سپس به تیم تحقیقاتی گوگل برین پیوسته قبل از اینکه آن با آن با دیپمایند ادغام شد .
پاچوکا گفت: "اگر بازگشت سرمایه مناسب باشد، مشتریان به ما اعتماد خواهند کرد." "من تحقیقات زیادی در این حوزه انجام دادهام — حضورم در گوگل برین قبل از این، به من اعتبار میدهد. اما در ابتدا، ایمیلهای سرد بود و اولین دو مشتری بزرگمان را به دست آوردیم. سپس آن به کنفرانسها رسید — به همین دلیل من به بسیاری از آنها میروم!"
پاچوکا بلافاصله پس از اتمام مصاحبه با TechCrunch به اروپا میرفت، جایی که قصد داشت در جلسات و کنفرانسهای مختلفی شرکت کند، از جمله کنفرانس دید ماشینی اروپا ( ECCV ) در میلان (ایتالیا) و Vision در اشتوتگارت (آلمان).
پاچوکا گفت: "بسیاری کنفرانسها در اروپا وجود دارد." پاچوکا افزود: "ما به ECCV خواهیم رفت تا بیاموزیم و استخدام کنیم، اساساً." و Vision بیشتر بر جنبههای صنعتی است، بنابراین ما در آنجا هستیم تا بفروشیم."
مشتریان بالقوه شامل توسعهدهندگان قدیمی سیستمهای دید ماشینی هستند، در خطوطی مانند Cognex یا Keyence که در تلاش برای تقویت محصولات خود با AI بهتر هستند. اما در سوی دیگر، Advex ممکن است مستقیماً به شرکتهای کاربر نهایی مانند تولیدکنندگان خودرو یا شرکتهای لجستیک بفروشد که ابزارهای داخلی خود را میسازند.
برای مثال، یک تولیدکننده خودرومی تواند سیستم دید ماشینی خود را برای تشخیص نقصها در مواد صندلیهای خودرو آموزش دهد. اما حتی اگر شرکت بتواند به صدها تصویر متفاوت دست یابد، واقعیت این است که هیچ دو نقصی شبیه به هم نیستند. بنابراین، تولیدکننده میتواند دهها تصویر از صندلیهای دارای پارگی را بارگذاری کند و Advex با استفاده از آن از هزاران تصویر صندلی "نقصدار" تولید کند تا یک مجموعه داده آموزش بسیار گستردهتر و متنوعتر ایجاد کند.
همین امر میتواند به هر بخش تولیدی اعمال شود، از نفت و گاز گرفته تا مبلمان چوبی — همهاش در مورد کاهش هزینه و زمان جمعآوری داده با ایجاد مصنوعی تصاویر آموزشی است.
دادههای مصنوعی ایده جدیدی نیست ، البته، اما با انقلاب هوش مصنوعی در جریان، کسب و کارها در تلاش برای پر کردن شکافهای داده هستند — این شامل حوزههایی مانند تحقیقات بازار میشود، جایی که نمونههای تحقیق ممکن است خیلی کوچک باشد و به طور مشابه با دید ماشینی همانطور که با شرکتهایی مانند Advex و دیگر استارتاپهای حمایتشده توسط سرمایهگذاری خطرپذیر مانند Synthesis AI و Parallel Domain مشاهده میشود.
به طور کلی، دو نوع مدل وجود دارد که Advex با آنها کار میکند. مدلی که در محل مشتری مستقر میشود، همان چیزی است که تصاویر مشتری را آموزش میدهد، و تنها "مواد استاندارد منبع باز" است، همانطور که پاچوکا میگوید. "این به این دلیل است که آنها باید کوچک باشند و ما همچنین باور نداریم که بهبودها از معماری مدل ناشی میشود — آنها از آموزش بر روی دادههای صحیح ناشی میشود."
اما واقعاً سس مخفی، در مدل انتشار اختصاصی شرکت است، مشابه مدل انتشار به چیزی شبیه به چیزی مانند Midjourney یا Dall-E ، که برای ایجاد دادههای مصنوعی استفاده میشود. “این یکی سفارشی است و بسیار پیچیده – در آن جایی است که تمام تلاش خود را میگذاریم،” پاچوکا اضافه کرد.
اگرچه تمرکز Advex بر روی تولید کنندگان یکی از راههایی است که آن را متمایز میکند، اما در واقع مدل انتشار جایی است که شرکت خود را به عنوان ایستادگی در نظر میگیرد.
در مقایسه با دیگر تکنیکهای شبیهسازی و مدلسازی، مانند آنهایی که با موتورهای بازی/فیزیک هماهنگ هستند (مانند Unity)، پاچوکا میگوید که استفاده از انتشار به این معناست که هیچ تنظیماتی لازم نیست و تولید فقط چند ثانیه برای هر جفت تصویر/برچسب طول میکشد — و همچنین بسیار نزدیکتر به دادههای واقعی است.
“ما فقط هر عکسی تولید نمیکنیم، ما تصاویری را که ندارید ایجاد میکنیم — به طور خاص تلاش برای درک آنچه که مفقود است و خلق آن،” پاچوکا گفت. “و این بخش ‘آنچه که مفقود است’ واقعاً سخت است و بسیار نامرئی، اما یکی از بزرگترین نوآوریهایی است که ما ایجاد کردهایم.”