کوچک کردن مدلهای زبانی متا؛ تغییر رویه این شرکت در خدمات مبتنی بر تلفن همراه
در تحقیق خود، دانشمندان توضیح دادند که چگونه مدلهای زبان بزرگ باکیفیت را با تعداد پارامتر کمتر از یک میلیارد ایجاد کردهاند، که به نظر آنها برای استقرار در دستگاههای تلفن همراه مناسب است .
برخلاف باور رایج که بر نقش محوری دادهها و کمیت پارامتر در تعیین کیفیت مدل تاکید میکند، دانشمندان با مدل زبان کوچک خود به نتایجی دست یافتند که در برخی زمینه ها با Llama LLM متا قابل مقایسه است.
نیک دجیاکومو، مدیرعامل Bucephalus، یک پلتفرم زنجیره تأمین تجارت الکترونیک مبتنی بر هوش مصنوعی در شهر نیویورک، میگوید:« برخلاف الگوی غالبی که به بزرگ بودن مدل زبانی تاکید دارد میبینیم که نتایج تحقیقات از الگوی دیگری رونمایی کرده و نشان داده میشود که واقعا نحوه استفاده از پارامترها اهمیت دارد.»
او همچنین افزود:« این موضوع، راه را برای پذیرش گستردهتر هوش مصنوعی روی دستگاه تلفن همراه هموار میکند.»
گام اساسی
تحقیقات متا از این جهت قابل توجه است که طبق گفته داریان شیمی، مدیرعامل و بنیانگذار FutureFund، یک شرکت سرمایهگذاری خطرپذیر در سانفرانسیسکو، هنجار فعلی هوش مصنوعی وابسته به ابر را به چالش میکشد، که در آن دادهها اغلب در مراکز داده دوردست، پردازش میشوند.
شیمی در ارتباط با این موضوع گفت:« شرکت متا با انتقال پردازش هوش مصنوعی به داخل دستگاه تلفن همراه در حال ایجاد تغییرات مهمی است. دانیل کلواس، مشاور پزشک در IT Medical، یک شرکت توسعه نرمافزار پزشکی جهانی، درباره تغییر و تحولات مدلهای زبانی کوچک گفت:« این تحقیق نویدبخش این است که قابلیت هوش مصنوعی تولیدکننده را برای برنامههای کاربردی شامل دستگاههای تلفن همراه که در دنیای مراقبتهای بهداشتی امروزی برای نظارت از راه دور و ارزیابیهای بیومتریک فراگیر هستند، فراهم کند.»
او به این موضوع نیز اشاره کرد که با نشان دادن اینکه مدلهای زبانی کوچک و کارآمد میتواند تعداد پارامترهایشان کمتر از یک میلیارد باشد و در عین حال در انجام برخی وظایف، عملکردی مشابه مدلهای بزرگتر داشته باشند، در واقع محققان دریچهای به سوی استفادهی فراگیر از هوش مصنوعی در پایش روزمره سلامت و مراقبتهای شخصی بیمار گشودهاند.
کلواس توضیح داد که استفاده از SLMها همچنین میتواند تضمین کند که دادههای حساس مربوط به سلامت میتواند به صورت امن در دستگاه پردازش شود که این مورد، موجب افزایش امنیت اطلاعات و حریم خصوصی بیمار میشود.
شرکت متا با اعمال تغییرات و کوچک کردن مدلهای زبانی میخواهد آنها را برای اجرا در تلفن همراه آماده کند. متا با این اقدام، مجموعه کاملا جدیدی از برنامههای کاربردی برای هوش مصنوعی را ارائه میدهد که در عین حال روشهای جدیدی برای تعامل با این فناوری در دنیای واقعی است. انتقال هوش مصنوعی به داخل دستگاه تلفن همراه میتواند ردپای کربنی که به خاطر انتقال و پردازش دادهها در مراکز داده عظیم و پرمصرف ایجاد میشود را تا حد بسیاری کاهش دهد.
به گزارش پیوست، نامتناسب بودن اندازه مدلهای زبانی بزرگ و اجرا نشدن آنها بر تلفنهای همراه، اهمیت استفاده از پارامترها را نشان میدهد.
اهمیت پارامترها در اجرای مدلهای زبانی
مدلهای زبانی بزرگ مانند ChatGPT، Gemini و Llama میتوانند از میلیاردها و حتی تریلیونها پارامتر برای بهدست آوردن نتایج خود استفاده کنند. اندازه این مدلها مانع اصلی اجرا نشدن آنها روی دستگاههای موبایلی است. به دنبال این موضوع دانشمندان متا در تحقیقات خود خاطرنشان کردند که نیاز روزافزونی به مدلهای زبانی بزرگ و کارآمد در دستگاههای تلفن همراه وجود دارد.
در تحقیق خود، دانشمندان توضیح دادند که چگونه مدلهای زبان بزرگ باکیفیت را با تعداد پارامتر کمتر از یک میلیارد ایجاد کردهاند، که به نظر آنها برای استقرار در دستگاههای تلفن همراه مناسب است .
برخلاف باور رایج که بر نقش محوری دادهها و کمیت پارامتر در تعیین کیفیت مدل تاکید میکند، دانشمندان با مدل زبان کوچک خود به نتایجی دست یافتند که در برخی زمینه ها با Llama LLM متا قابل مقایسه است.
نیک دجیاکومو، مدیرعامل Bucephalus، یک پلتفرم زنجیره تأمین تجارت الکترونیک مبتنی بر هوش مصنوعی در شهر نیویورک، میگوید:« برخلاف الگوی غالبی که به بزرگ بودن مدل زبانی تاکید دارد میبینیم که نتایج تحقیقات از الگوی دیگری رونمایی کرده و نشان داده میشود که واقعا نحوه استفاده از پارامترها اهمیت دارد.»
او همچنین افزود:« این موضوع، راه را برای پذیرش گستردهتر هوش مصنوعی روی دستگاه تلفن همراه هموار میکند.»
گام اساسی
تحقیقات متا از این جهت قابل توجه است که طبق گفته داریان شیمی، مدیرعامل و بنیانگذار FutureFund، یک شرکت سرمایهگذاری خطرپذیر در سانفرانسیسکو، هنجار فعلی هوش مصنوعی وابسته به ابر را به چالش میکشد، که در آن دادهها اغلب در مراکز داده دوردست، پردازش میشوند.
شیمی در ارتباط با این موضوع گفت:« شرکت متا با انتقال پردازش هوش مصنوعی به داخل دستگاه تلفن همراه در حال ایجاد تغییرات مهمی است. این اقدام میتواند ردپای کربنی که به خاطر انتقال و پردازش دادهها در مراکز داده عظیم و پرمصرف ایجاد میشود را بهطور قابل توجهی کم و هوش مصنوعی مبتنی بر دستگاه را به یک بازیگر کلیدی در دنیای فناوری تبدیل کند.»
یاشین مانراج، مدیرعامل Pvotal Technologies، توسعهدهنده نرمافزار امنیتی سرتاسر، در ایگل پوینت، اورگان گفت:« این تحقیق، اولین تلاش جامع و به اشتراک گذاشته شده عمومی در این وسعت است.»
او در ادامه افزود:« این یک گام اساسی در دستیابی به رویکرد هماهنگ اSLM-LLM است که در آن توسعهدهندگان میتوانند تعادل مناسبی بین پردازش داده ابری و روی دستگاه پیدا کنند. این تحقیق زیربنایی را ایجاد میکند که وعدههای برنامههای کاربردی مبتنی بر هوش مصنوعی بتواند به سطح پشتیبانی، خودکارسازی و کمکی برسد که در سالهای اخیر به بازار عرضه شده اما فاقد ظرفیت مهندسی برای حمایت از آن چشماندازها بوده است.»
دانشمندان متا همچنین در کاهش اندازه یک مدل زبان گام مهم دیگری برداشتهاند. نیشانت نیکرا، مدیر ارشد بازاریابی موبایلی در Skyworks Solutions، یک شرکت نیمهرسانا در ایروین، کالیفرنیا، گفت:« آنها پیشنهاد میکنند یک مدل را به ترتیبی مشخص از بزرگی، کوچک کرده و آن را برای پوشیدنیها، وسایل صوتی و تلفنهای همراه قابل دسترستر کنند.»
او در ادمه گفت:« آنها در حال ارائه مجموعه کاملا جدیدی از برنامههای کاربردی برای هوش مصنوعی هستند و در عین حال روشهای جدیدی برای تعامل هوش مصنوعی در دنیای واقعی ارائه میدهند. متا همچنین با کوچک کردن آنها در حال حل یک چالش بزرگ رشد، استقرار آنها در دستگاه لبه(edge devices) است که LLMها را آزار میدهد.»
تاثیر قابل توجه بر مراقبتهای بهداشتی
یکی از حوزههایی که مدلهای زبانی کوچک میتوانند تاثیر معناداری داشته باشد، پزشکی است. دانیل کلواس، مشاور پزشک در IT Medical، یک شرکت توسعه نرمافزار پزشکی جهانی، درباره تغییر و تحولات مدلهای زبانی کوچک گفت:« این تحقیق نویدبخش این است که قابلیت هوش مصنوعی تولیدکننده را برای برنامههای کاربردی شامل دستگاههای تلفن همراه که در دنیای مراقبتهای بهداشتی امروزی برای نظارت از راه دور و ارزیابیهای بیومتریک فراگیر هستند، فراهم کند.»
او به این موضوع نیز اشاره کرد که با نشان دادن اینکه مدلهای زبانی کوچک و کارآمد میتواند تعداد پارامترهایشان کمتر از یک میلیارد باشد و در عین حال در انجام برخی وظایف، عملکردی مشابه مدلهای بزرگتر داشته باشند، در واقع محققان دریچهای به سوی استفادهی فراگیر از هوش مصنوعی در پایش روزمره سلامت و مراقبتهای شخصی بیمار گشودهاند.
کلواس توضیح داد که استفاده از SLMها همچنین میتواند تضمین کند که دادههای حساس مربوط به سلامت میتواند به صورت امن در دستگاه پردازش شود که این مورد، موجب افزایش امنیت اطلاعات و حریم خصوصی بیمار میشود. آنها همچنین میتوانند نظارت و مداخله در زمان واقعی سلامت را تسهیل کنند، که برای بیماران مبتلا به بیماریهای مزمن یا کسانی که نیاز به مراقبت مداوم دارند بسیار مهم است.
او اضافه کرد که این مدلها همچنین میتواند موانع تکنولوژیکی و مالی برای استقرار هوش مصنوعی در محیطهای مراقبتهای بهداشتی را کاهش دهد و به طور بالقوه فناوریهای پیشرفته نظارت بر سلامت را برای جمعیتهای گستردهتر دموکراتیک کند.
انعکاس روندهای صنعت
کاریداد مونوز، استاد فناوری رسانهای جدید در کالج اجتماعی CUNY LaGuardia توضیح داد که تمرکز متا بر مدلهای کوچک هوش مصنوعی برای دستگاههای تلفن همراه نشاندهنده گرایش گستردهتر صنعت به سمت بهینهسازی هوش مصنوعی برای کارایی و دسترسی است.
او همچنین گفت:« این تغییر نه تنها به چالشهای عملی میپردازد، بلکه با نگرانیهای فزاینده درباره تأثیرات زیستمحیطی عملیاتهای هوش مصنوعی در مقیاس بزرگ همسو میشود. با حمایت از مدلهای کوچکتر و کارآمدتر، متا در حال ایجاد سابقهای برای توسعه هوش مصنوعی پایدار و فراگیر است.»
مدلهای زبان کوچک همچنین با روند محاسبات لبه (edge computing) مطابقت دارند که تمرکز آن بر نزدیکتر کردن قابلیتهای هوش مصنوعی به کاربران است.
نیک دجیاکومو درباره مزایای کوچک کردن مدلهای زبانی گفت:« مدلهای تخصصی و تنظیم شده میتواند برای کارهای خاص کارآمدتر و مقرون به صرفهتر باشد. بسیاری از برنامههای کاربردی موبایل به هوش مصنوعی پیشرفته نیاز ندارد. مثلا نیازی نیست که برای ارسال پیامک ابرکامپیوتر در اختیار داشت.»
وی در ادامه افزود:« این رویکرد به دستگاه اجازه میدهد تا روی مسیریابی بین مواردی که با استفاده از SLM پاسخ داده میشود و موارد استفاده تخصصی، مشابه رابطه بین پزشکان عمومی و متخصص تمرکز کند.»
تاثیر عمیق بر ارتباطات جهانی
شیمی اظهار داشت که پیامدهایی که SLMها میتواند بر اتصال جهانی داشته باشد بسیار عمیق است. او خاطرنشان کرد:« با افزایش توانایی هوش مصنوعی روی دستگاه، نیاز به اتصال مداوم به اینترنت کاهش مییابد که میتواند چشمانداز فناوری را در مناطقی که دسترسی به اینترنت به صورت نامنظم یا پرهزینه است، به طور چشمگیری تغییر دهد. این امر میتواند دسترسی به فناوریهای پیشرفته را دموکراتیک کند و ابزارهای هوش مصنوعی پیشرفته را در بازارهای جهانی متنوع در دسترس قرار دهد.»
او، محقق شدن یک شبه و شدید این تغییرات را دور از انتظار خواند. علت این پیشبینی این است که پرسوجوهای پیچیده و چند زبانه همچنان به LLMهای مبتنی بر ابر نیاز دارد تا ارزشی پیشرفته برای کاربران نهایی ارائه دهد. با این حال، این تغییر به سمت اجازه دادن به مدل «آخرین مایل» روی دستگاه میتواند به کاهش بار LLM برای انجام وظایف کوچکتر، کاهش حلقههای بازخورد و غنیسازی دادههای محلی کمک کند.
شیمی درباره این روند گفت:« در نهایت این تغییرات، کاربر نهایی به وضوح برنده خواهد بود، زیرا این امر به ورود نسل جدیدی از قابلیتها در دستگاهها و شکلگیری بازنگری امیدوارکنندهتر برنامههای کاربردی فرانتاند و نحوه تعامل مردم با جهان منجر میشود.»
او افزود:« در حالی که بازیگران همیشگی با قابلیت تاثیرگذار بر زندگی روزمره همه، نوآوری را در این بخش پیش میبرند، مدلهای زبانی کوچک همچنین میتوانند اسب تروا (Trojan Horse) باشند که با داشتن مدلهایی قادر به جمعآوری دادهها و فرادادهها در سطحی بیسابقه، سطح جدیدی از پیچیدگی را در نفوذ به زندگی روزمره ما ارائه میدهند. امیدواریم با تدابیر حفاظتی مناسب، بتوانیم این تلاشها را به سمت یک نتیجهی سازنده هدایت کنیم.»
منبع: technewsworld