پلتفرمهای برچسبگذاری و تفسیر داده ممکن است توجهی به اندازه مدلهای هوش مصنوعی مولدی جذاب جدید نداشته باشند. اما آنها ضروری هستند. دادههایی که بسیاری از مدلها با آنها آموزش میبینند باید برچسبگذاری شوند، وگرنه مدلها نمیتوانند آن دادهها را در فرآیند آموزشی تفسیر کنند.
برچسبگذاری یک کار بزرگ است که برای مجموعههای داده بزرگتر و پیچیدهتری که استفاده میشود، نیاز به هزاران تا میلیونها برچسب دارد. برای کمک به کاهش این بار، اریک لاندو و اولریک هانسن انکورد را تأسیس کردند، که آن را به عنوان یک پلتفرم “توسعه داده” برای شرکتهایی که دادههای خود را برای مدلهای هوش مصنوعی مدیریت و آماده میکنند، توصیف میکنند.
اکنون، این شرکت با تشکر از یک دوره جذب سرمایه سری C به رهبری نیکست۴۷، ۳۰ میلیون دلار دیگر در خزانه خود دارد. لاندو به تککرانچ گفت که سرمایه جدید برای دو برابر کردن اندازه تیمهای محصول، مهندسی و پژوهش هوش مصنوعی انکورد طی شش ماه آینده و گسترش دفاتر سان فرانسیسکو شرکت صرف خواهد شد.
“تا پایان سال، ما انتظار داریم که تیم خود را به ۱۰۰ نفر افزایش دهیم، از ۷۰ نفر فعلی،” او افزود. “مکان ما اکنون دو دفتر مرکزی در لندن و سان فرانسیسکو دارد و اعضای تیم در سراسر جهان.
لاندو نخستین بار هنگامی که دانشجوی کارشناسی در استنفورد بود با سیستمهای داده بزرگ کار کرد و پژوهشی در زمینه فیزیک ذرات انجام داد. هانسن در بازارهای جهانی در جیپی مورگان کار کرد، جایی که با مشتقات بازارهای نوظهور سر و کار داشت.
هانسن میگوید که ایده اولیه برای انکورد هنگامی که در حال کار بر روی پروژههای هوش مصنوعی مبتنی بر داده در دوران کارشناسی ارشد علوم کامپیوتر در کالج امپریال لندن بود، به او رسید. از زمانبر بودن فرایندهای گردآوری و برچسبگذاری دادهها ناراحت بود و با لاندو که از صحنه کارآفرینی لندن میشناخت، ملاقات کرد تا درباره روشهای حل مشکل دادهها با هم گفتگو کنند.
“با ترکیب تخصص توسعه نرمافزار هانسن با بینشهای من از پژوهشهای کمی برای خودکارسازی توسعه دادهها، اولین نسخه محصول انکورد را در طول وای کامبینیتر در بهار ۲۰۲۱ عرضه کردیم،” لاندو به تککرانچ گفت. “پلتفرم انکورد ابزارهایی را به شرکتها میدهد تا دادههای خود را برای هوش مصنوعی آماده کنند و بررسی کنند که چگونه آن دادهها از مدلهایشان پشتیبانی میکنند.
با توجه به تخمینهایی که اندازه بازار برچسبگذاری و تفسیر دادهها انتظار میرود تا سال ۲۰۲۷ به ۳.۶ میلیارد دلار برسد، انکورد یکی از بسیاری از فروشندگان در رقابت برای قراردادها است. علاوه بر غولهای بزرگ مانند اسکیل ایآی ، استارتاپهایی مانند دیتاسور که به مشتریان اجازه میدهد مدلها را به طور خودکار از مجموعههای برچسبها بسازند، هیرتکس که یک پلتفرم برچسبگذاری داده منبع باز میسازد، و تأمینکننده ابزارهای برچسبگذاری داده داتالوپ قرار دارند.
لاندو میگوید انکورد با انعطافپذیری پلتفرم خود برجستهتر است.
با استفاده از انکورد، تیمها میتوانند مجموعههای داده را بررسی و تجسم کنند — از جمله مجموعههای داده تصویری، ویدئویی و صوتی — که از ذخیرهسازی ابر عمومی و خصوصی دریافت میشوند و عملکرد مدلهای مختلف آموزشدیده بر روی همان مجموعهها را مقایسه کنند. پلتفرم تلاش میکند مشکلات دقت مدلها را شناسایی کند و دادههای آموزشی اضافی که ممکن است به رفع آنها کمک کند، پیشنهاد دهد.
“در تفاوت با راهحلهای جزئی که فقط قسمتهای خاصی از پشته دادههای شما را پوشش میدهند، انکورد به شما اجازه میدهد تمام فرآیندهای دادهای خود را در یک پلتفرم واحد متمرکز کنید،” لاندو گفت. “از طریق این تمرکز، شرکتها قابلیت ردیابی پیدا میکنند که روشنکننده جعبه سیاه غالباً مبهم هوش مصنوعی است، و کمک میکند تا بفهمیم چرا یک مدل تصمیمات خاصی میگیرد.
به نظر میرسد که استراتژی انکورد تاکنون به خوبی عمل کرده است. این شرکت ۱۲۰ مشتری دارد، از جمله فیلیپس، استارتاپ هوش مصنوعی پرطرفدار سینسیسیا ، و ارائهدهندگان خدمات بهداشتی سیترز-سینای و نورثول هلث، همچنین قراردادهایی با سازمانهای نظامی و دولتی ناشناس دارد. لاندو ادعا میکند که انکورد در سال گذشته درآمد خود را ۴ برابر افزایش داده و میتواند تا سال ۲۰۲۵ از لحاظ مالی خودکفا باشد، اگر همچنان به افزایش تعداد کارکنان نپردازد.
“ما عمیقاً احساس میکنیم که در حال حاضر با کاهشی روبرو نیستیم،” لاندو گفت. “با این حال، ما از شرایط کلی بازار آگاهیم و رویکرد محافظهکارانهای در استفاده از سرمایه اتخاذ کردهایم.
دیگر شرکتکنندگان در دوره جدید جذب سرمایه شامل وای کامبینیتر، سیآروی و کرین ونچر پارتنرز بودند.