سوپرکامپیوتر Summit قدرت مطالعه ژنهای 635,000 کهنهسرباز ارتش آمریکا را برای ارتباطات بیماری فراهم میکند
سوپرکامپیوتر Summit از آزمایشگاه ملی اوک ریج، که قرار است تا پایان سال منسوخ شود، فصل دیگری را به میراث خود در خدمات پردازش بسیار بالا و تحقیقات علمی افزود.
در مطالعهای که در ماه جولای در مجله Science منتشر شد، محققان از قدرت پردازش Summit برای تحلیل دادههای ژنتیکی بیش از نیم میلیون کهنهسرباز آمریکایی استفاده کردند که یکی از گستردهترین و متنوعترین مطالعات ارتباطات ژنوم تا به امروز محسوب میشود.
این مطالعه به بررسی ساختار ژنتیکی 2,068 صفت در میان 635,969 کهنهسرباز از سنین، نژادها و پیشینههای مختلف پرداخت. برنامه میلیون کهنهسرباز (MVP)، هسته اصلی این تحقیق، یک زیربنای وسیع است که توسط اداره امور کهنهسربازان نگهداری میشود.
آنها دادههای اساسی را برای این مطالعه فراهم کردند که سعی در فهم ارتباطات بین ژنها، صفات و بیماریها در جمعیتهای متنوع دارد.
قابل توجه است که 29٪ از گروه MVP شامل افرادی است که از نظر ژنتیکی مشابه با اجداد آفریقایی، آمریکای مخلوط و آسیای شرقی هستند و به این ترتیب به شکاف مهم در تحقیقات ژنتیکی که عمدتاً بر افراد اروپاییتبار متمرکز است، پاسخ میدهند.
کاوش در تنوع ژنتیکی با برنامه میلیون کهنهسرباز
برای بررسی دادههای گسترده ارائهشده توسط برنامه میلیون کهنهسرباز، محققان به یکی از قدرتمندترین سیستمهای محاسباتی جهان در آن زمان، Summit، روی آوردند.
این کامپیوتر رهبری با سرعت شگفتانگیز 200 پتافلاپ، معادل با 200 کوادریلیون محاسبه در ثانیه، عمل میکند و به آنها اجازه میدهد مقیاس دادههای عظیم درگیر در این مطالعه سطحفرادادهای دسترسی یابند.
یکی از محققان اشاره کرد که چنین مطالعات جامعی اغلب به دلیل عدم دسترسی به منابع محاسباتی مورد نیاز، به ویژه هنگام بررسی جوامع اقلیت در ایالات متحده، با مشکلات روبرو بودند. دسترسی به دادههای دقیق از VA، همراه با قدرت محاسباتی Summit، این تحقیق را به طور منحصربهفردی برای موفقیت فراهم کرده است.
دادههای اصلی VA برای تحلیل در سیستمهای مبتنی بر CPU طراحی شده بودند و باید از طریق یک تغییر عمده برای بهینهسازی برای معماری GPU قدرتدهندهی Summit تبدیل میشدند. این فرآیند تبدیل چندین سال به طول انجامید و شامل محاسباتی بود که به دنبال ارتباطات بین نشانگرهای ژنتیکی و صفات سلامتی بدون افت دقت بود.
توانایی فنی Summit در تحلیل ژنوم
تواناییهای GPU از Summit به محققان اجازه داد تا روابط بین نزدیک به 44 میلیون واریانت ژنتیکی و بیش از 2,000 صفت را با کارآیی تجزیه کنند و بیش از 30 ترابایت داده خام را تحلیل کنند.
این تحلیل جامع به مدت بیش از 500,000 ساعت نود اجرا شد و 26,049 ارتباط معنادار در میان 1,270 صفت سلامتی شناسایی کرد. این یافتهها از طریق کتابخانه ملی پزشکی موسسه ملی بهداشت قابل دسترس هستند و به جامعه جهانی تحقیقات ژنتیکی درک دقیقتر و پیشرفتهای در پزشکی دقیق را تسهیل میکنند.
تبدیل دادههای ژنتیکی به بینشهای قابل دسترس
محقق راوی مدهوری تأکید کرد بر موقعیت منحصر به فرد دیتابیس ژنتیکی برنامه میلیون کهنهسرباز، با بیان اینکه "اکنون ما دیتابیسی داریم که اولین در نوع خود است." برخلاف سایر مخازن دادههای ژنتیکی، مانند بانک زیستی UK، دیتابیس MVP بهدلیل تنوع و مقیاس خود برجسته است.
برای مدیریت و تفسیر این حجم عظیم از دادهها، تیم ORNL یک خط لوله محاسباتی قوی توسعه دادند که قادر به انجام تمامپردازشهای بزرگمقیاس، شامل چارتها، نمودارها و گرافها است. این تلاش با پلتفرم آنلاین CIPHER پشتیبانی میشود که دسترسی جهانی به این تصویرسازیها را تسهیل میکند و به محققان در سراسر جهان امکان بررسی دادهها را میدهد.
دیوید هایزه، مهندس نرمافزار ORNL و سرپرست تیم خط لوله، هدف داشت تا دادهها "به طور سطحی به راحتی قابل دسترس باشند"، تا اطمینان حاصل شود که جامعه علمی گسترده میتواند بدون خطر نقض حریم خصوصی افراد، که تصویرسازیها تنها آمارهای خلاصه را شامل میشود، از این اطلاعات بهرهبرداری کند.
لورا دیویس، مدیر پروژه در ORNL، بر دو نفع این پروژه تاکید کرد: حمایت از سلامت کهنهسربازان از طریق تحقیقات هدفمند و در عین حال گسترش دامنه تحقیقات علمی در زمینههای گوناگون.
این ابتکار توسط VA و برنامه تحقیقاتی محاسبات علمی پیشرفته دفتر علوم DOE حمایت شده است که تعهد ORNL برای مقابله با برخی از چالشهای علمی برجسته زمان ما را تقویت میکند.
سال اضافی Summit برای پیشرفتهای علمی
ابتدا قرار بود در سال 2023 بازنشسته شود، سوپرکامپیوتر IBM Power System AC922 Summit در ORNL خدمت خود را تا پایان سال 2024 تمدید کرد و عمر عملیاتی خود را افزایش داد. بهرغم استقرار جانشین خود، کلاس اگزاسکیل Frontier، Summit در سال اضافی خود به تحقیقاتی برجسته کمک کرد.
برانسون مسر، مدیر علمی OLCF بیان کرد که "Summit یک سوپرکامپیوتر فوقالعاده موفق بوده است، و هیچ دلیلی برای محدودکردن آن به پنج سال وجود نداشت. هنوز چهارمین سوپرکامپیوتر سریع در ایالات متحده بود، ما هنوز داشنایی داشتیم که میخواست از قدرت پردازشی Summit استفاده کند، و ما هنوز تسهیلات دیتاسنتری خود را در 2024 داشتیم. بنابراین، منطقی بود Summit را تا 2024 برای یک سال دیگر در بهرهبرداری نگه داریم."
سوپرکامپیوتر Summit در طول دوره اضافی خدمتی خود به چندین پیشرفت علمی مهم کمک کرد. این کامپیوتر به درمانهای جدید برای بیماری آلزایمر از طریق تحلیل دادههای زیستی پیچیده کمک کرد، درک ما را از جهان با پیشبینی امضاهای ستارههای نوترونی و سیاهچالهها ارتقا داد، طراحی داروهای بزرگمولکول را برای ایجاد داروهایی مؤثرتر و شخصیتر ارتقا داد و مکانیک انتقال ویروسهای آئروسل را بررسی کرد و در دوران بحرانهای بهداشت جهانی بینشهای حیاتی ارائه کرد.
میراث سوپرکامپیوتر Summit فقط بر اساس تواناییهای محاسباتی آن نیست، بلکه بر اساس تاثیر آن بر تحقیقات علمی و سلامت تعریف شده است. در طی شش سال، این سوپرکامپیوتر معیاری جدید را برای استفاده از فناوری در خدمت به بشریت ایجاد کرده است.