به چشم ناآشنا، یک تصویر پزشکی مانند MRI یا اشعه ایکس ممکن است به عنوان مجموعهای از شکلهای سیاه و سفید گیجکننده به نظر برسد. تشخیص اینکه کجا یک ساختار، مانند یک تومور، به پایان میرسد و ساختار دیگر شروع میشود، میتواند چالشبرانگیز باشد. هنگامی که سیستمهای هوش مصنوعی آموزش میبینند که مرزهای ساختارهای زیستی را درک کنند، میتوانند مناطق مورد نظر را که پزشکان و کارگران زیستپزشکی میخواهند برای بیماریها و ناهنجاریهای دیگر نظارت کنند، بخشبندی کنند. به جای اتلاف وقت برای ردیابی دستی آناتومی در تصاویر متعدد، یک دستیار مصنوعی میتواند این وظیفه را بر عهده بگیرد. محققان MIT، بیمارستان عمومی ماساچوست و دانشکده پزشکی هاروارد یک ابزار تعاملی به نام ScribblePrompt ساختهاند. این ابزار میتواند به سرعت هر تصویر پزشکی را، حتی نوعی که قبلاً ندیده است، بخشبندی کند بدون نیاز به جمعآوری دادههای پرزحمت. تیم به جای علامتگذاری دستی هر تصویر، شبیهسازی کردند که چگونه کاربران بیش از ۵۰,۰۰۰ اسکن شامل MRI، اولتراسوند و عکسها را حاشیهنویسی کنند. تیم با استفاده از الگوریتمها این اسکنها را حاشیهنویسی کردند تا شیوهای که انسانها در تصاویر پزشکی مناطق مختلف را علامت میزنند، شبیهسازی کنند. علاوه بر مناطق عادی، تیم از الگوریتمهای فوقپیکسل برای شناسایی مناطق جدیدی که محققان پزشکی میتوانند به آنها علاقمند شوند، استفاده کردند و ScribblePrompt را برای بخشبندی آنها آموزش دادند. ScribblePrompt دادههای مصنوعی آماده کرده است تا درخواستهای بخشبندی واقعی از کاربران را پاسخ دهد. این دادههای مصنوعی به ScribblePrompt کمک میکند تا درخواستهای بخشبندی واقعی را پاسخ دهد. “هوش مصنوعی پتانسیل زیادی در تحلیل تصاویر و دادههای با بعد بالا دارد تا به انسانها کمک کند کارها را بهطور مؤثرتری انجام دهند.”، هالی وونگ، دانشجوی دکتری MIT و نویسنده اصلی مقالهای درباره ScribblePrompt گفت. “ما میخواهیم تلاشهای کارگران پزشکی را از طریق یک سیستم تعاملی تکمیل کنیم، نه جایگزین کنیم. ScribblePrompt یک مدل ساده با کارایی است که به پزشکان کمک میکند روی بخشهای جالبتر تحلیل خود تمرکز کنند. این مدل سریعتر و دقیقتر از روشهای تعاملی مشابه است و زمان حاشیهنویسی را ۲۸ درصد کاهش میدهد.” رابط ScribblePrompt ساده است: کاربران میتوانند در ناحیهای که میخواهند بخشبندی کنند بکشند یا کلیک کنند و ابزار ساختار یا پسزمینه کل را برجسته کند. به عنوان مثال، میتوانید روی رگهای چشمی در یک اسکن شبکیه کلیک کنید. ScribblePrompt همچنین میتواند یک ساختار را بر اساس یک چارچوببندی علامتگذاری کند. ابزار میتواند بر اساس بازخورد کاربران اصلاحاتی انجام دهد. به عنوان مثال، اگر بخواهید یک کلیه را در یک اولتراسوند برجسته کنید، میتوانید از یک چارچوببندی استفاده کنید و سپس در صورت از دست رفتن لبهها توسط ScribblePrompt، قسمتهای اضافی ساختار را بکشید. اگر بخواهید بخشبندی خود را ویرایش کنید، میتوانید از یک “کشیدن منفی” برای حذف برخی نواحی استفاده کنید. این تواناییهای خوداصلاحکننده و تعاملی، ScribblePrompt را به ابزار اصلی در میان محققان نروایمجی در بیمارستان عمومی ماساچوست در یک مطالعه کاربری تبدیل کرد. ۹۳.۸ درصد از کاربران این روش MIT را نسبت به مدل SAM متا در بهبود بخشبندی در پاسخ به اصلاحات کشیدن ترجیح دادند. برای ویرایشهای مبتنی بر کلیک، ۸۷.۵ درصد محققان پزشکی ScribblePrompt را ترجیح دادند. ScribblePrompt بر اساس کشیدنهای شبیهسازی شده و کلیکها روی ۵۴,۰۰۰ تصویر از ۵۴ مجموعه داده شامل اسکنهای چشمی، قفسه سینه، ستون فقرات، سلولها، پوست، عضلات شکمی، گردن، مغز، استخوانها، دندانها و ضایعات آموزش داده شده است. مدل با ۱۶ تصویر پزشکی شامل میکروسکوپی، سیتی اسکن، اشعه ایکس، MRI و عکسها آشنا شد. “بسیاری از روشهای موجود هنگامی که کاربران بر روی تصاویر میکشند خوب جواب نمیدهند زیرا شبیهسازی چنین تعاملاتی در آموزش دشوار است. برای ScribblePrompt، ما توانستیم مدل خود را مجبور کنیم به ورودیهای مختلف با استفاده از وظایف بخشبندی مصنوعی توجه کند.” وونگ گفت. “ما خواستیم چیزی که به طور اساسی یک مدل پایه باشد را بر روی دادههای متنوع زیادی آموزش دهیم تا به تصاوی و وظایف جدید تعمیم یابد.”