SuperAnnotate به شرکتها در مدیریت مجموعههای دادههای AI کمک میکند
دادهی با کیفیت ممکن است کلید به AI با کیفیت باشد. با تحقیقات نشان میدهند که کیفیت دادهها بهجای اندازه آن تأثیر بیشتری بر عملکرد مدل AI دارد، تأکید بر مدیریت مجموعههای داده افزایش یافته است. بر اساس برخی نظرسنجیها، محققان AI امروزه بیشتر وقت خود را صرف آمادهسازی و سازماندهی دادهها میکنند.
برادران واهان و تیگران پتروسیان در حین کار بر روی الگوریتمها در دانشگاه از مدیریت حجم زیادی از دادهها دچار مشکل شدند. واهان تا جایی پیش رفت که یک ابزار مدیریت داده در طول تحقیقات دکترای خود در مورد تقسیمبندی تصویر ایجاد کرد.
چند سال بعد، واهان متوجه شد که توسعهدهندگان و حتی شرکتها خوشحال خواهند شد تا برای چنین ابزارهایی هزینه کنند. بنابراین، برادران شرکت SuperAnnotate را تأسیس کردند تا این ابزار را بسازند.
واهین در بیانیهای گفت: «در طول انفجار نوآوری در سال ۲۰۲۳ پیرامون مدلها و AI چندوجهی، نیاز به مجموعههای داده با کیفیت بالا شدت گرفت، با هر سازمانی که چندین استفاده خاص نیاز به دادههای تخصصی داشت. ما فرصتی دیدیم تا یک پلتفرم کمکد آسان برای استفاده بسازیم که مانند یک Swiss Army Knife برای دادههای آموزشی AI مدرن عمل کند.
سوپرانوتیت، که مشتریان آن شامل Databricks و Canva است، به کاربران کمک میکند تا مجموعههای بزرگ دادههای آموزشی AI را ایجاد و پیگیری کنند. این استارتاپ ابتدا بر نرمافزار برچسبگذاری تمرکز داشت، اما اکنون ابزارهایی برای تنظیم، تکرار و ارزیابی مجموعههای داده فراهم میکند.
با پلتفرم سوپرانوتیت، کاربران میتوانند دادهها را از منابع محلی و ابری متصل کنند تا پروژههای دادهای ایجاد کنند که تیمها میتوانند بر روی آنها همکاری کنند. کاربران میتوانند از طریق داشبورد عملکرد مدلها را بر اساس دادهای که برای آموزش استفاده شده مقایسه کرده و سپس آن مدلها را به محیطهای مختلف منتقل کنند وقتی که آماده شدند.
سوپرانوتیت به شرکتها دسترسی به بازاری از کارگران جمعی برای وظایف برچسبگذاری داده ارائه میدهد. برچسبها معمولاً تکههایی از متن هستند که معنی یا بخشهای دادهای را مشخص میکنند که مدلها بر روی آنها آموزش میبینند و به عنوان راهنما برای مدلها عمل میکنند، آنها را «آموزش» داده تا اشیاء، مکانها و ایدهها را تمایز دهند.
به صراحت، دربارهی رفتار SuperAnnotate با برچسبگذاران دادهای که استفاده میکند چندین بحث در Reddit وجود دارد و آنها خوشایند نیستند. برچسبگذاران از مشکلات ارتباطی، انتظارات نامشخص و دستمزد پایین شکایت دارند.
سوپرانوتیت میگوید که قیمتهای منصف بازار را پرداخت میکند و خواستههایش از برچسبگذاران خارج از عرف صنعت نیست. ما از این شرکت خواستهایم تا اطلاعات دقیقتری در مورد رویههای خود ارائه دهد و اگر پاسخی دریافت کردیم این مطلب را بروز خواهیم کرد.
در حوزه مدیریت دادههای AI، چندین رقیب وجود دارد، از جمله استارتاپهایی مانند Scale AI، Weka و Dataloop. با این حال، سوپرانوتیت مستقر در سان فرانسیسکو توانسته است مسیر خود را ادامه دهد و اخیراً ۳۶ میلیون دلار در دور سرمایهگذاری سری B به رهبری Socium Ventures با مشارکت Nvidia، Databricks Ventures، Play Time Ventures و Defy.vc جمعآوری کرده است.
سرمایه تازه که مجموع سرمایههای سوپرانوتیت را به بیش از ۵۳ میلیون دلار میرساند، برای تقویت تیم فعلی با حدود ۱۰۰ نفر، برای تحقیق و توسعه محصول و برای گسترش پایگاه مشتریان سوپرانوتیت که تقریباً شامل ۱۰۰ شرکت است، استفاده خواهد شد.
واهین گفت: «ما میخواهیم پلتفرمی بسازیم که به طور کامل با نیازهای در حال تغییر سازمانها سازگار باشد و تنظیمات گستردهای در بهبود داده ارائه کند.