تکنولوژی

اپلیکیشن متن به گفتار ElevenLabs به صورت جهانی در دسترس است

شرکت ElevenLabs، که در زمینه توسعه ابزارهای هوش مصنوعی برای ایجاد و ویرایش صداهای مصنوعی فعالیت دارد، اپلیکیشن متن به گفتار خود به نام Reader را با پشتیبانی از 32 زبان در سراسر جهان معرفی کرد. این اپلیکیشن که در ژوئن برای اولین بار در ایالات متحده، بریتانیا و کانادا عرضه شد، به کاربران اجازه می‌دهد تا هر محتوای متنی مانند مقاله، سند PDF و کتاب الکترونیکی را بارگذاری کرده و به آن‌ها در زبان‌ها و صداهای مختلف گوش دهند. ElevenLabs که امسال پس از جمع‌آوری 80 میلیون دلار به وضعیت یونیکورن رسید، اکنون صدها صدای جدید به کتابخانه خود اضافه کرده است و این اپلیکیشن اولین محصول مصرفی این شرکت است. شرکت همچنین اعلام کرد که قابلیت‌های جدیدی مانند پشتیبانی آفلاین و امکان به اشتراک‌گذاری تقسیم صوتی به اپلیکیشن افزوده خواهد شد.

ElevenLabs ، یک استارتاپ که ابزارهای هوش مصنوعی برای ایجاد و ویرایش صداهای مصنوعی توسعه می‌دهد، اپلیکیشن Reader خود را با پشتیبانی از 32 زبان به صورت جهانی در دسترس قرار داده است.

این اپلیکیشن که اولین بار در ماه ژوئن در ایالات متحده، بریتانیا و کانادا عرضه شد، به کاربران اجازه می‌دهد تا هر محتوای متنی، مانند مقاله، اسناد PDF یا کتاب‌های الکترونیکی را بارگذاری کرده و به آن‌ها در زبان‌ها و صداهای مختلف گوش دهند. اکنون اپلیکیشن Reader از زبان‌هایی چون پرتغالی، اسپانیایی، فرانسوی، هندی، آلمانی، ژاپنی، عربی، کره‌ای، ایتالیایی، تامیل و سوئدی پشتیبانی می‌کند.

ElevenLabs که امسال پس از جمع‌آوری 80 میلیون دلار از سرمایه‌گذاران، از جمله Andreessen Horowitz، به وضعیت یونیکورن رسید، یک API ارائه می‌دهد که شرکت‌ها می‌توانند برای موارد گوناگون مانند دوبله یا متن به گفتار از آن استفاده کنند. این شرکت تعاملات صوتی روی دستگاه Rabbit r1 را توانمند می‌سازد، همچنین ویژگی‌های متن به گفتار در موتور جستجوی هوش مصنوعی Perplexity و پلتفرم‌های صوتی Pocket FM و Kuku FM نیز توسط این شرکت پشتیبانی می‌شوند. اپلیکیشن Reader اولین محصول مصرفی این شرکت است.

این استارتاپ اعلام کرد که صدها صدای جدید از کتابخانه خود که برای زبان‌های مختلف مناسب هستند را به اپلیکیشن افزوده است. ماه گذشته، شرکت صدای بازیگرانی مانند جودی گارلند، جیمز دین، بارت رینولدز و سر لورنس اولیویه را نیز برای اپلیکیشن لایسنس کرد.

ElevenLabs اظهار داشت که پشتیبانی گسترده از زبان، توسط مدل Turbo v2.5 که ماه گذشته منتشر شد، فراهم شده است. این مدل به طور قابل توجهی تاخیر تبدیل متن به گفتار را کاهش داده و کیفیت را بهبود می‌بخشد.

رقیب اصلی اپلیکیشن Reader، برنامه Speechify است که ویژگی‌های اضافی مانند اسکن اسناد برای متن، ادغام با جیمیل و کنواس، و همچنین اجازه به کاربران برای کلون کردن صدای خودشان جهت خواندن متن را ارائه می‌دهد. Pocket تحت تملک موزیلا و اپلیکیشن صوتی نیویورک تایمز بر پایه Audm نیز به کاربران اجازه می‌دهند تا به محتوایشان گوش دهند.

ElevenLabs اعلام کرد که ویژگی‌های بیشتری به اپلیکیشن افزوده خواهد شد، از جمله پشتیبانی آفلاین و قابلیت اشتراک‌گذاری قطعات صوتی.

توسط
Tech Crunch
منبع
Tech Crunch
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا