تکنولوژی

تأیید فناوری تشخیص گفتار Intron Health که لهجه‌های آفریقایی را تشخیص می‌دهد

فناوری تشخیص گفتار Intron Health که توسط 'Tobi Olatunji' تأسیس شده است، بر روی شناسایی و تلفظ صحیح اصطلاحات پزشکی در لهجه‌های مختلف آفریقایی تمرکز دارد. این فناوری به توانمندسازی پزشکان در نوشتن دستورات پزشکی و کاهش زمان انتظارات کمک می‌کند. Intron Health در توسعه و استفاده از سیستم‌های صوتی که بتوانند در بیمارستان‌ها و کلینیک‌های آفریقا به کار گرفته شوند، نقش مهمی ایفا می‌کند. ادغام تشخیص گفتار در تقریباً همه جنبه‌های زندگی مدرن در حال وقوع است، اما هنوز یک شکاف بزرگ وجود دارد: سخنرانان زبان‌های اقلیت و کسانی که لهجه‌های غلیظ یا اختلالات گفتاری مانند لکنت دارند، معمولاً کمتر توانایی استفاده از ابزارهای تشخیص گفتار را برای کنترل برنامه‌ها، نوشتن یا خودکارسازی وظایف، و عملکردهای دیگر دارند. توبي اولاتونجي، بنیان‌گذار و مدیر عامل استارتاپ تشخیص گفتار بالینی Intron Health، می‌خواهد این شکاف را پر کند. او ادعا می‌کند که Intron بزرگترین پایگاه داده بالینی آفریقا است، با الگوریتمی که بر روی 3.5 میلیون کلیپ صوتی (16000 ساعت) از بیش از 18000 مشارکت کننده، عمدتاً پزشکان، از 29 کشور و 288 لهجه آموزش دیده است. اولاتونجي می‌گوید که استفاده بیشتر از مشارکت‌کنندگان در بخش بهداشت و درمان تضمین می‌کند که اصطلاحات پزشکی برای بازارهای هدف صحیح تلفظ و ضبط شوند. او اضافه کرد که داده‌های از غنا، اوگاندا، و آفریقای جنوبی رو به افزایش است و استارتاپ مطمئن است که مدل را در اینجا راه‌اندازی کند. علاقه اولاتونجي به فناوری‌های بهداشت از دو بخش از تجربیاتش ناشی می‌شود. اول، او به عنوان یک پزشک آموزش دیده و در نیجریه کار کرده است، جایی که از نزدیک ناکارآمدی‌های سیستم‌ها در آن بازار را دیده است، از جمله میزان بالای کارهای کاغذی که باید پر شوند و سختی دنبال کردن تمام آنها. این سوال‌ها او را به مرحله بعدی زندگی‌اش سوق داد. اولاتونجي برای تحصیل در مقطع کارشناسی ارشد در انفورماتیک پزشکی از دانشگاه سانفرانسیسکو و سپس در رشته علم کامپیوتر از دانشگاه جورجیا تک به ایالات متحده آمد. او سپس در تعدادی از شرکت‌های فناوری کار کرد. به عنوان یک دانشمند و پژوهشگر برنامه‌نویسی زبان طبیعی بالینی (NLP) در Enlitic، یک شرکت در منطقه خلیج سانفرانسیسکو، مدل‌هایی برای خودکارسازی استخراج اطلاعات از گزارش‌های متنی رادیولوژی ساخت. او همچنین به عنوان یک دانشمند ماشین یادگیری در Amazon Web Services خدمت کرد. در هر دو شرکت Enlitic و Amazon، او بر پردازش زبان طبیعی در بهداشت و درمان تمرکز کرد و سیستم‌هایی را شکل داد که به بیمارستان‌ها کمک می‌کنند بهتر کار کنند. از طریق این تجربیات، او شروع به فرموله کردن ایده‌هایی کرد که چگونه آنچه در ایالات متحده توسعه یافته و استفاده می‌شود، می‌تواند به بهبود بهداشت و درمان در نیجریه و سایر بازارهای نوظهور مشابه کمک کند. هدف اولیه Intron Health که در سال 2020 راه‌اندازی شد، دیجیتالی کردن عملیات بیمارستان‌ها در آفریقا از طریق یک سیستم پرونده‌های پزشکی الکترونیکی (EMR) بود. اما پذیرش چالش‌برانگیز بود: مشخص شد پزشکان نوشتن را به تایپ کردن ترجیح می‌دهند. این او را به بررسی چگونگی بهبود آن مشکل ابتدایی هدایت کرد: چگونه می‌توان نوشتن، ورود داده‌ها، و وظایف پایه پزشکان را بهتر کرد. در ابتدا شرکت به دنبال راه حل‌های شخص ثالث برای خودکارسازی وظایفی مانند نگارش یادداشت‌ها و تعبیه فناوری‌های موجود تبدیل گفتار به متن در برنامه EMR خود رفت. اما مسائل زیادی وجود داشت زیرا تراکنش نادرست مداوم بود. مشخص شد که لهجه‌های غلیظ آفریقایی و تلفظ اصطلاحات و نام‌های پزشکی پیچیده، اجتناب از ابزارهای تراکنش موجود خارجی را غیرعملی می‌کرد. این باعث شروع فناوری تشخیص گفتار Intron Health شد که می‌تواند لهجه‌های آفریقایی را تشخیص دهد و همچنین می‌تواند در EMRهای موجود تلفیق شود. این ابزار تاکنون در 30 بیمارستان در پنج بازار، از جمله کنیا و نیجریه، پذیرفته شده است. برخی نتایج مثبت فوری وجود داشته است. در یک مورد، اولاتونجی گفت که Intron Health به کاهش زمان انتظار برای نتایج رادیولوژی در یکی از بزرگترین بیمارستان‌های غرب آفریقا از 48 ساعت به 20 دقیقه کمک کرده است. این کارایی‌ها در ارائه خدمات بهداشتی، به ویژه در آفریقا که نسبت پزشک به بیمار از کمترین در جهان است، بسیار مهم هستند. “بیمارستان‌ها قبلاً بسیار در تجهیزات و فناوری سرمایه‌گذاری کرده‌اند... اطمینان از اینکه از این فناوری‌ها استفاده کنند مهم است. ما می‌توانیم ارزشی ارائه دهیم که به آنها کمک کند پذیرش سیستم EMR را بهبود بخشند.” اولاتونجی گفت. با نگاهی به آینده، این استارتاپ در حال بررسی جبهه‌های رشد جدید با حمایت یک دوره پیش‌بذری 1.6 میلیون دلاری است که توسط Microtraction، با مشارکت Plug and Play Ventures، Jaza Rift Ventures، Octopus Ventures، Africa Health Ventures، OpenseedVC، Pi Campus، Alumni Angel، Baker Bridge Capital و چند سرمایه‌گذار فرشته رهبری شده است. از نظر فناوری، Intron Health در حال کار بر روی بهبود لغو نویز، و همچنین اطمینان از عملکرد خوب پلتفرم در پهنای باند کم است. این علاوه بر توانمندسازی تراکنش گفتگوهای چند گوینده، و تلفیق قابلیت‌های تبدیل متن به گفتار است. برنامه، اولاتونجی می‌گوید، افزودن سیستم‌های هوشمند یا ابزارهای پشتیبانی تصمیم‌گیری برای وظایفی مانند نسخه‌نویسی یا آزمایشات آزمایشگاهی است. این ابزارها، او اضافه می‌کند، می‌توانند به کاهش خطای پزشکان کمک کنند و مکاملئت درمان بیمار را تضمین کنند علاوه بر سرعت‌دهی به کار آنها. Intron Health در میان تعداد رو به رشد استارتاپ‌های هوش مصنوعی مولد در فضای پزشکی است، از جمله DAX Express مایکروسافت، که وظایف اداری را برای پزشکان با تولید یادداشت‌ها در عرض چند ثانیه کاهش می‌دهند. ظهور و پذیرش این فناوری‌ها همراه است با این که بازار جهانی تشخیص گفتار و صدا پیش‌بینی می‌شود تا سال 2032 به مبلغ 84.97 میلیارد دلار ارزش‌گذاری شود، بعد از یک نرخ رشد سالانه مرکب (CAGR) از 23.7٪ از سال 2024، بر اساس گزارش Fortune Business Insights. علاوه بر ساخت فناوری های صوتی، Intron همچنین نقش محوری در تحقیقات گفتار در آفریقا بازی می‌کند و اخیراً با Google Research، بنیاد Bill & Melinda Gates و Digital Square در PATH همکاری کرده است تا مدل‌های زبان بزرگ (LLM) معروف مانند GPT-4o OpenAI، Gemini گوگل و Claude شرکت Anthropic را در 15 کشور ارزیابی کند، تا نقاط قوت، ضعف‌ها و خطرات تعصب یا آسیب در LLMها را شناسایی کند. این تماماً در جهت اطمینان از دسترسی مدل‌های متناسب فرهنگی برای کلینیک‌ها و بیمارستان‌های آفریقایی است.
توسط
Tech Crunch
منبع
Tech Crunch
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا