ادغام تشخیص گفتار در تقریباً همه جنبههای زندگی مدرن در حال وقوع است، اما هنوز یک شکاف بزرگ وجود دارد: سخنرانان زبانهای اقلیت و کسانی که لهجههای غلیظ یا اختلالات گفتاری مانند لکنت دارند، معمولاً کمتر توانایی استفاده از ابزارهای تشخیص گفتار را برای کنترل برنامهها، نوشتن یا خودکارسازی وظایف، و عملکردهای دیگر دارند. توبي اولاتونجي، بنیانگذار و مدیر عامل استارتاپ تشخیص گفتار بالینی Intron Health، میخواهد این شکاف را پر کند. او ادعا میکند که Intron بزرگترین پایگاه داده بالینی آفریقا است، با الگوریتمی که بر روی 3.5 میلیون کلیپ صوتی (16000 ساعت) از بیش از 18000 مشارکت کننده، عمدتاً پزشکان، از 29 کشور و 288 لهجه آموزش دیده است. اولاتونجي میگوید که استفاده بیشتر از مشارکتکنندگان در بخش بهداشت و درمان تضمین میکند که اصطلاحات پزشکی برای بازارهای هدف صحیح تلفظ و ضبط شوند. او اضافه کرد که دادههای از غنا، اوگاندا، و آفریقای جنوبی رو به افزایش است و استارتاپ مطمئن است که مدل را در اینجا راهاندازی کند. علاقه اولاتونجي به فناوریهای بهداشت از دو بخش از تجربیاتش ناشی میشود. اول، او به عنوان یک پزشک آموزش دیده و در نیجریه کار کرده است، جایی که از نزدیک ناکارآمدیهای سیستمها در آن بازار را دیده است، از جمله میزان بالای کارهای کاغذی که باید پر شوند و سختی دنبال کردن تمام آنها. این سوالها او را به مرحله بعدی زندگیاش سوق داد. اولاتونجي برای تحصیل در مقطع کارشناسی ارشد در انفورماتیک پزشکی از دانشگاه سانفرانسیسکو و سپس در رشته علم کامپیوتر از دانشگاه جورجیا تک به ایالات متحده آمد. او سپس در تعدادی از شرکتهای فناوری کار کرد. به عنوان یک دانشمند و پژوهشگر برنامهنویسی زبان طبیعی بالینی (NLP) در Enlitic، یک شرکت در منطقه خلیج سانفرانسیسکو، مدلهایی برای خودکارسازی استخراج اطلاعات از گزارشهای متنی رادیولوژی ساخت. او همچنین به عنوان یک دانشمند ماشین یادگیری در Amazon Web Services خدمت کرد. در هر دو شرکت Enlitic و Amazon، او بر پردازش زبان طبیعی در بهداشت و درمان تمرکز کرد و سیستمهایی را شکل داد که به بیمارستانها کمک میکنند بهتر کار کنند. از طریق این تجربیات، او شروع به فرموله کردن ایدههایی کرد که چگونه آنچه در ایالات متحده توسعه یافته و استفاده میشود، میتواند به بهبود بهداشت و درمان در نیجریه و سایر بازارهای نوظهور مشابه کمک کند. هدف اولیه Intron Health که در سال 2020 راهاندازی شد، دیجیتالی کردن عملیات بیمارستانها در آفریقا از طریق یک سیستم پروندههای پزشکی الکترونیکی (EMR) بود. اما پذیرش چالشبرانگیز بود: مشخص شد پزشکان نوشتن را به تایپ کردن ترجیح میدهند. این او را به بررسی چگونگی بهبود آن مشکل ابتدایی هدایت کرد: چگونه میتوان نوشتن، ورود دادهها، و وظایف پایه پزشکان را بهتر کرد. در ابتدا شرکت به دنبال راه حلهای شخص ثالث برای خودکارسازی وظایفی مانند نگارش یادداشتها و تعبیه فناوریهای موجود تبدیل گفتار به متن در برنامه EMR خود رفت. اما مسائل زیادی وجود داشت زیرا تراکنش نادرست مداوم بود. مشخص شد که لهجههای غلیظ آفریقایی و تلفظ اصطلاحات و نامهای پزشکی پیچیده، اجتناب از ابزارهای تراکنش موجود خارجی را غیرعملی میکرد. این باعث شروع فناوری تشخیص گفتار Intron Health شد که میتواند لهجههای آفریقایی را تشخیص دهد و همچنین میتواند در EMRهای موجود تلفیق شود. این ابزار تاکنون در 30 بیمارستان در پنج بازار، از جمله کنیا و نیجریه، پذیرفته شده است. برخی نتایج مثبت فوری وجود داشته است. در یک مورد، اولاتونجی گفت که Intron Health به کاهش زمان انتظار برای نتایج رادیولوژی در یکی از بزرگترین بیمارستانهای غرب آفریقا از 48 ساعت به 20 دقیقه کمک کرده است. این کاراییها در ارائه خدمات بهداشتی، به ویژه در آفریقا که نسبت پزشک به بیمار از کمترین در جهان است، بسیار مهم هستند. “بیمارستانها قبلاً بسیار در تجهیزات و فناوری سرمایهگذاری کردهاند... اطمینان از اینکه از این فناوریها استفاده کنند مهم است. ما میتوانیم ارزشی ارائه دهیم که به آنها کمک کند پذیرش سیستم EMR را بهبود بخشند.” اولاتونجی گفت. با نگاهی به آینده، این استارتاپ در حال بررسی جبهههای رشد جدید با حمایت یک دوره پیشبذری 1.6 میلیون دلاری است که توسط Microtraction، با مشارکت Plug and Play Ventures، Jaza Rift Ventures، Octopus Ventures، Africa Health Ventures، OpenseedVC، Pi Campus، Alumni Angel، Baker Bridge Capital و چند سرمایهگذار فرشته رهبری شده است. از نظر فناوری، Intron Health در حال کار بر روی بهبود لغو نویز، و همچنین اطمینان از عملکرد خوب پلتفرم در پهنای باند کم است. این علاوه بر توانمندسازی تراکنش گفتگوهای چند گوینده، و تلفیق قابلیتهای تبدیل متن به گفتار است. برنامه، اولاتونجی میگوید، افزودن سیستمهای هوشمند یا ابزارهای پشتیبانی تصمیمگیری برای وظایفی مانند نسخهنویسی یا آزمایشات آزمایشگاهی است. این ابزارها، او اضافه میکند، میتوانند به کاهش خطای پزشکان کمک کنند و مکاملئت درمان بیمار را تضمین کنند علاوه بر سرعتدهی به کار آنها. Intron Health در میان تعداد رو به رشد استارتاپهای هوش مصنوعی مولد در فضای پزشکی است، از جمله DAX Express مایکروسافت، که وظایف اداری را برای پزشکان با تولید یادداشتها در عرض چند ثانیه کاهش میدهند. ظهور و پذیرش این فناوریها همراه است با این که بازار جهانی تشخیص گفتار و صدا پیشبینی میشود تا سال 2032 به مبلغ 84.97 میلیارد دلار ارزشگذاری شود، بعد از یک نرخ رشد سالانه مرکب (CAGR) از 23.7٪ از سال 2024، بر اساس گزارش Fortune Business Insights. علاوه بر ساخت فناوری های صوتی، Intron همچنین نقش محوری در تحقیقات گفتار در آفریقا بازی میکند و اخیراً با Google Research، بنیاد Bill & Melinda Gates و Digital Square در PATH همکاری کرده است تا مدلهای زبان بزرگ (LLM) معروف مانند GPT-4o OpenAI، Gemini گوگل و Claude شرکت Anthropic را در 15 کشور ارزیابی کند، تا نقاط قوت، ضعفها و خطرات تعصب یا آسیب در LLMها را شناسایی کند. این تماماً در جهت اطمینان از دسترسی مدلهای متناسب فرهنگی برای کلینیکها و بیمارستانهای آفریقایی است.