هوش مصنوعی Reliant به وظایف دادهای علوم رسیدگی میکند
مدلهای هوش مصنوعی برای انجام بسیاری از وظایف توانایی نشان دادهاند، اما چه کارهایی را واقعاً میخواهیم که انجام دهند؟ ترجیحاً کارهای یدی و زمانبر — و در پژوهش و دانشگاهی از این نوع کارها زیاد است. Reliant امیدوار است در کارهای استخراج دادههای وقتگیر که اکنون تخصص دانشجویان خسته و کارآموزان است، تخصص پیدا کند.
«بهترین کاری که میتوانید با هوش مصنوعی انجام دهید این است که تجربه انسانی را بهبود بخشید: کاهش کارهای یدی و اجازه دهید افراد به کارهایی بپردازند که برایشان مهم است،» کفت مدیرعامل Karl Moritz. در دنیای پژوهش، جایی که او و همبنیانگذاران Marc Bellemare و Richard Schlegel سالها کار کردهاند، مرور ادبیات یکی از رایجترین مثالهای این «کارهای یدی» است.
هر مقاله به کارهای قبلی و مرتبط ارجاع میدهد، اما یافتن این منابع در انبوهی از علم آسان نیست. و برخی، مانند مرورهای سیستماتیک، هزاران ارجاع یا داده استفاده میکنند.
برای یک مطالعه ، Moritz به یاد آورد، «نویسندگان باید به ۳۵۰۰ نشریه علمی نگاه میکردند و بسیاری از آنها نهایتاً مرتبط نبودند. این زمان زیادی برای استخراج مقدار کمی از اطلاعات مفید صرف شد — این به نظر میرسید چیزی باشد که واقعاً باید توسط هوش مصنوعی خودکار شود.»
آنها میدانستند که مدلهای زبان مدرن میتوانند این کار را انجام دهند: یک آزمایش ChatGPT را بر این کار گمارد و مشاهده شد که با نرخ خطای ۱۱٪ قادر به استخراج دادهها بود. مانند بسیاری از کارهایی که LLMها میتوانند انجام دهند، این قابل توجه است اما چیزی شبیه به نیاز واقعی افراد نیست.
«آن کافی نیست،» Moritz گفت. «برای این وظایف دانش، هرچند که یدی باشند، بسیار مهم است که شما اشتباه نکنید.»
محصول اصلی Reliant، Tabular، بر اساس یک LLM (LLaMa 3.1) است اما با تکنیکهای اختصاصی دیگر تکمیل شده و بسیار موثرتر است. در استخراج هزاران مطالعه فوق، آنها گفتند که این کار را بدون هیچ خطایی انجام داده است.
بدین معنی که: شما هزاران سند را وارد میکنید، میگویید که این، آن و دادههای دیگری از آنها میخواهید، و Reliant آنها را بررسی کرده و آن اطلاعات را پیدا میکند — چه به طور کامل برچسبگذاری شده و ساختاریافته باشد یا (بیشتر احتمالاً) نه. سپس آن تمام دادهها و هر تحلیلی که خواسته بودید را به یک رابط کاربری خوب میبرد تا بتوانید به موارد فردی عمیق شوید.
«کاربران ما باید قادر باشند با تمام دادهها به یکباره کار کنند و ما در حال ساخت ویژگیهایی هستیم که اجازه دهد دادههای موجود را ویرایش کنند یا از دادهها به ادبیات برسند؛ ما نقش خود را در کمک به کاربران برای یافتن محل تمرکز توجه خود میبینیم،» Moritz گفت.
این کاربرد موثر و خاص از هوش مصنوعی — نه به اندازه یک دوست دیجیتال ولی قطعاً بسیار قابل اجرا تر — میتواند علم را در بسیاری از حوزههای فنی به شدت تسریع کند. سرمایهگذاران به این موضوع توجه کردهاند و 11.3 میلیون دلار در دور اولیه سرمایهگذاری شرکت کردهاند که توسط Tola Capital و Inovia Capital رهبری شده و فرشته سرمایهگذاری Mike Volpi نیز شرکت داشت.
مانند هر کاربرد از هوش مصنوعی، تکنولوژی Reliant بسیار مصرف محاسباتی است، به همین دلیل شرکت خود سختافزار خود را خریده است به جای اجاره آن به صورت آنلاین از ارائهدهندگان بزرگ. رفتن به استفاده داخلی با سختافزار هم ریسک دارد و هم پاداش: شما باید این دستگاههای گران را جبران کنید، اما این فرصت را دارید که با محاسبات اختصاصی مسئله را شفاف کنید.
«یکی از چیزهایی که ما یافتیم این است که پاسخ خوب دادن بسیار چالشبرانگیز است اگر زمان محدودی برای دادن آن پاسخ داشته باشید،» Moritz توضیح داد — به عنوان مثال، اگر یک دانشمند از سیستم بخواهد یک کار استخراج یا تحلیل جدید روی یک صد مقاله انجام دهد. میتواند سریعاً انجام شود، یا خوب، اما نه هر دو — مگر این که پیشبینی کنیم که کاربران چه سوالاتی ممکن است بپرسند و قبل از آن پاسخی یا چیزی شبیه به آن را بیابیم.
«واقعیت این است که بسیاری از افراد همان سوالات را دارند، بنابراین ما میتوانیم قبل از اینکه آنها بپرسند، پاسخها را پیدا کنیم، به عنوان نقطه شروع،» Bellemare گفت، مدیر علمی شروعکننده. «ما میتوانیم ۱۰۰ صفحه متن را به چیزی دیگر تبدیل کنیم، که ممکن است دقیقاً همان چیزی نباشد که شما میخواهید، اما برای ما آسانتر است که با آن کار کنیم.»
این را اینطور فکر کنید: اگر شما میخواهید معنا را از هزار رمان استخراج کنید، آیا منتظر میماندید تا کسی از شما بپرسد که نام شخصیتها چیست تا بروید و آنها را بگیرید؟ یا این کار را از قبل انجام میدادید (به همراه چیزهایی مانند مکانها، تاریخها، روابط، و غیره) بدانید که دادهها احتمالاً خواسته خواهند شد؟ قطعاً دومی — اگر محاسبات را داشته باشید.
این پیش استخراج نیز به مدلها زمان میدهد تا ابهامات و فرضیات اجتناب ناپذیر در دامنههای مختلف علمی را حل کنند. وقتی یک معیار «نشان میدهد» معیار دیگر، ممکن است در داروسازی همان معنی را نداشته باشد که در پاتولوژی یا آزمایشهای بالینی دارد. نه تنها این، مدلهای زبان تمایل دارند تا خروجیهای متفاوتی بسته به اینکه چگونه از آنها سوال میشود، بدهند. بنابراین کار Reliant تبدیل ابهام به یقین بوده است — «و این تنها چیزی است که میتوان کرد اگر شما مایل به سرمایهگذاری در یک علم یا دامنه خاص باشید،» Moritz تاکید کرد.
به عنوان یک شرکت، تمرکز اول Reliant روی اثبات اینکه فناوری میتواند خود را جبران کند، است قبل از تلاش برای هر چیز بلندپروازانهتر. «برای پیشرفت جالب، شما باید یک چشمانداز بزرگ داشته باشید اما شما نیز باید با چیزی ملموس شروع کنید،» Moritz گفت. «از دیدگاه بقای یک استارتآپ، ما روی شرکتهای سودآور تمرکز میکنیم، چون آنها به ما پول میدهند تا GPUهای ما را بپردازیم. ما این را به زیان به مشتریان نمیفروشیم.»
شاید انتظار داشته باشید که شرکت فشارهایی از سمت شرکتهایی مانند OpenAI و Anthropic که پولهای زیادی در مدیریت وظایف ساختاریافتهتر مانند مدیریت پایگاهداده و کدنویسی خرج میکنند، یا از سمت شرکای پیادهسازی مانند Cohere و Scale، احساس کند. اما Bellemare امیدوار است: «ما این را روی یک موج میسازیم — هر پیشرفتی در مجموعه فناوری ما برای ما عالی است. LLM یکی از شاید هشت مدل بزرگ یادگیری ماشینی در آنجا است — سایرین کاملاً اختصاصی برای ما هستند، از ابتدا بر روی دادههای اختصاصی برای ما ساخته شدهاند.»
تغییر صنعت بیوتکنولوژی و پژوهش به یک صنعت مبتنی بر هوش مصنوعی مطمئناً تازه شروع شده است، و ممکن است برای سالها تکهتکه باشد. اما به نظر میرسد Reliant پایگاه محکمی برای شروع پیدا کرده است.
«اگر شما راهحل ۹۵٪ را میخواهید، و فقط یک بار از زمانی به مشتریان خود عذرخواهی میکنید، عالی است،» Moritz گفت. «ما برای جایی هستیم که دقت و فراخوان واقعاً مهم است، و جایی که اشتباهات واقعاً مهم است. و صادقانه بگویم، این کافی است، ما خوشحال خواهیم بود که بقیه به دیگران واگذار شود.»