لینکآپ ابزارهای LLM را با منابع محتوای برتر (بهصورت قانونی) متصل میکند
اگر تا به حال از جستجوی ChatGPT یا Perplexity استفاده کردهاید، میدانید که توانایی جستجوی وب و دریافت منابع درونخطی بهبودی چشمگیر در این چترباتهای هوش مصنوعی ایجاد میکند. نتایج زمانی بهتر هستند که شامل اطلاعات بهروز باشند و جستجوی وب ممکن است خلق افسانههای کاذب (یعنی وقتی که هوش مصنوعی تولیدی اطلاعات نادرست تولید میکند) کاهش دهد.
به همین دلیل، استارتاپ فرانسوی Linkup در حال توسعه API است که به توسعهدهندگان اجازه میدهد تا به محتوای وب از منابع معتبر و برتر دسترسی پیدا کنند و نتایج را به مدلهای زبانی بزرگ (LLM) منتقل کنند تا پاسخهای آنها را غنیتر کنند. بسیاری از توسعهدهندگان هوش مصنوعی به این فرآیند "تولید افزوده با بازیابی" (RAG) میگویند.
بیشتر از همه، آینده رباتهای جستجوگر نامشخص است. اگر توافق مالی پیشین بین ناشران محتوا و سازمانهایی که صفحات وب را جستجو میکنند وجود نداشته باشد، این رباتها محتوا را از وب باز بدون پرداخت برداشته و بسیاری از این توافق ناراضی هستند - که این موضوع نظارت قانونی در مورد آموزش هوش مصنوعی را افزایش میدهد.
همچنین اکنون پروندههای حقوقی برجستهای در حال انجام است، مانند دعوی حقوقی بین OpenAI، سازنده ChatGPT، و نیویورک تایمز - بنابراین وضعیت پیرامون جستجوی وب ممکن است در آینده نزدیک تغییر کند. به همین دلیل، OpenAI قراردادهای بلندمدت لایسنس محتوا با ناشران بزرگی مانند AP، Axel Springer، Condé Nast، El País، Financial Times، Le Monde و دیگران امضا کرده است.
"ما شرکت را در زمانی که OpenAI با منابع خبری قراردادهایی منعقد میکرد... برای اهداف آموزش یا استنتاج، برای تقویت پاسخهای مدلهای OpenAI و محصولات آنها راهاندازی کردیم. و ما فکر کردیم: 'خوب، این عالی است چون بالاخره شرکتهای هوش مصنوعی داریم که به منابع خود پرداخت میکنند،'" فیلیپ میزرهایی، همبنیانگذار و مدیرعامل Linkup به TechCrunch گفت، و محرکهایی را توضیح داد که بنیانگذاران را واداشت تا یک کسبوکار برای ارتباط توسعهدهندگان هوش مصنوعی با ارائهدهندگان محتوا برای - امیدوارانه - منفعت مشترکشان راهاندازی کنند.
در حال حاضر، ناشران محتوا با تصمیمگیری دشواری در مواجهه با تشنگی GenAI برای دادهها مواجهاند. آنها میتوانند خزندههای وب را با استفاده از فایل متاداده robots.txt (که به صورت قانونی الزامآور نیست) بلاک کنند (که نشان میدهد آیا یک وبسایت میتواند برای آموزش یک مدل هوش مصنوعی مورد استفاده قرار گیرد یا نه). علاوه بر این، آنها میتوانند از شرکتهای هوش مصنوعی که معتقدند حق کپیرایت آنها را نقض کردهاند، شکایت کنند. یا اینکه ممکن است به خزندهها اجازه دهند محتوای آنها را به صورت آزادانه ایندکس کنند (مثلاً YOLO). یا ممکن است بتوانند به توسعهدهندگان هوش مصنوعی لایسنس محتوا بدهند تا جبران مالی برای مالکیت فکریشان دریافت کنند.
اما هزاران شرکت هوش مصنوعی (یا شرکتهای فناوری که از هوش مصنوعی استفاده میکنند) وجود دارند که مقیاس و دسترسی به اندازه OpenAI را ندارند. همزمان، آنچه در وب عالی است این است که دنبالهای طولانی از ناشران محتوا وجود دارد. اما این بدان معناست که یک ناشر محتوای کوچک به طور معمول منابع مالی کافی برای تشکیل یک دعوی قضایی ندارد. این هم به این معنی است که تغییر از مدل جستجوگری به مدل صدور مجوز برای میلیونها وبسایت دشوار خواهد بود.
به همین دلیل، لینکآپ تنها یک راهحل فنی نیست. این یک بازار است؛ یک واسطه بین ناشران محتوا و شرکتهایی که میخواهند پاسخهای LLM خود را با محتوای وب غنیسازی کنند.
لینکآپ قراردادهای لایسنس محتوا با ناشران امضا میکند و با CMS آنها یکپارچه میشود تا بتواند محتوا را بدون خزیدن از ناشران دریافت کند. سپس لینکآپ به شرکای محتوای خود بر اساس میزان دسترسی مشتریان لینکآپ به محتوایشان پرداخت میکند.
"ما واقعاً به دنبال کاربردهایی هستیم که هوش مصنوعی را در محصولات خود پیادهسازی میکنند،" میزرهایی گفت. "بنابراین، مورد استفاده معمولی این است که من یک برنامه کاربردی هوش مصنوعی با استفاده از مدلی از Mistral یا OpenAI ایجاد میکنم. من خط لوله خود را میسازم، اما نیاز به این دارم که این خط لوله را با اطلاعات خارجی غنیسازی کنم."
به عنوان یک نکته جانبی، در حالی که ChatGPT میتواند وب را مرور کند، مدلهای GPT نمیتوانند. OpenAI هر دو یک برنامه کاربردی پرطرفدار (ChatGPT) و LLMهایی است که توسعهدهندگان میتوانند با یک API استفاده کنند (GPT). اما جستجوی وب یک ویژگی از ChatGPT است.
"یک مثال هست که من دوست دارم، یکی از مشتریان ما... یک برنامه کاربردی داخلی برای فروشندگان خود ساخته است،" میزرهایی نیز به ما گفت. "از یک طرف، آنها تمام مزایای محصولات خود را فهرست کردهاند. و به لطف ما، آنها اطلاعات تازه و باکیفیتی درباره مشتریان خود دریافت میکنند و آن را به یک LLM Mistral وارد میکنند. و LLM Mistral نوعی سخنرانی فروش برای نمایندگان فروش ایجاد میکند، که وقتی با مشتریان تماس میگیرند آن را پیش روی خود دارند."
در ابتدا، لینکآپ تصمیم گرفت بر روی اطلاعات شرکتی و کسبوکاری تمرکز کند. علاوه بر وبسایتهای خبری، استارتاپ با پایگاههای داده دانشی نیز کار میکند — مانند Statista، Xerfi یا دیگر منابع مشابه.
این تنها استارتاپی نیست که روی آوردن محتوای برتر به LLMها با قراردادهای مجوز پشت صحنه کار میکند. رقیب قابل مشاهدهتر ScalePost است، یک استارتاپ که با Perplexity کار میکند تا معاملات خود را با ناشران سرعت ببخشد.
لینکآپ چندی پیش یک دوره سید مالی ۳ میلیون یورویی (۳.۲ میلیون دلار با نرخ ارز فعلی) از Axeleo Capital، Motier Ventures، Seedcamp و حدود صد فرشته سرمایهگذاران جمعآوری کرد. در حال حاضر حدود ۱۰ نفر در این استارتاپ کار میکنند و قصد دارد طی سال آینده ۱۰ کارمند دیگر را استخدام کند.