تکنولوژی

دیپ ال انتشار DeepL Voice: ترجمه‌های متنی فوری از صدا و ویدئو

دیپ ال با افزودن حالت صوتی به پلتفرم خود، اکنون DeepL Voice را ارائه کرده است که به کاربران اجازه می‌دهد صدای یک زبان را در زمان واقعی به زبان‌های دیگر ترجمه کنند. این قابلیت برای مکالمات زنده و جلسه‌های ویدئویی استفاده می‌شود و نتایج به صورت متنی ارائه می‌شود. این ویژگی همزمان با رقابت شدید با دیگر شرکت‌های مشابه مانند گوگل و ElevenLabs ارائه شده است.

دیپ ال خود را با ترجمه‌های متنی آنلاین معروف کرده است که ادعا می‌کند نسبت به خدماتی مانند گوگل دقت و جزئیات بیشتری دارد—ادعایی که موجب ارزیابی ۲ میلیارد دلاری این استارتاپ آلمانی و جلب بیش از ۱۰۰,۰۰۰ مشتری پولی شده است.

اکنون به عنوان شدت تبلیغات برای خدمات هوش مصنوعی افزایش می‌یابد، دیپ ال حالت جدیدی به پلتفرم خود اضافه کرده است: صوت. کاربران اکنون می‌توانند با استفاده از DeepL Voice به صدای کسی که به یک زبان صحبت می‌کند گوش دهند و به طور خودکار آن را به زبانی دیگر، در زمان واقعی، ترجمه کنند.

دیپ ال قادر به شنیدن زبان‌های انگلیسی، آلمانی، ژاپنی، کره‌ای، سوئدی، هلندی، فرانسوی، ترکی، لهستانی، پرتغالی، روسی، اسپانیایی و ایتالیایی است. ترجمه‌های زیرنویس برای همه ۳۳ زبانی که اکنون توسط مترجم دیپ ال پشتیبانی می‌شوند، در دسترس هستند.

دیپ ال وویس در حال حاضر قرار نیست نتیجه را به صورت یک فایل صوتی یا ویدیویی ارائه دهد: این سرویس برای مکالمات زنده و ویدئو کنفرانس‌ها مورد هدف بوده و به صورت متن و نه صوت ارائه می‌شود.

در مورد اول، شما می‌توانید ترجمه‌های خود را به صورت “آینه‌ها” بر روی یک گوشی هوشمند تنظیم کنید—ایده این است که شما گوشی را بر روی میز جلسه قرار دهید تا هر دو طرف کلمات ترجمه شده را ببینند—یا به عنوان یک نوشته‌ای که کنار هم با شخصی به اشتراک بگذارید. سرویس ویدئو کنفرانس از این ترجمه‌ها به عنوان زیرنویس استفاده می‌کند.

این می‌تواند چیزی باشد که با گذشت زمان تغییر کند، یارک کوتلوفسکی، بنیان‌گذار و مدیرعامل شرکت (تصویر بالا)، در یکی از مصاحبه‌ها اشاره کرد. این اولین محصول دیپ ال برای صوت است، اما بعید است که آخرین باشد. “صوت جایی است که ترجمه در سال آینده اجرا خواهد شد,” او اضافه کرد.

همچنین شواهد دیگری نیز برای حمایت از این ادعا وجود دارد. گوگل—یکی از بزرگ‌ترین رقبای دیپ ال—نیز شروع به ادغام زیرنویس‌های همزمان ترجمه‌شده در سرویس ویدئو کنفرانس Meet خود کرده است. و بسیاری از استارتاپ‌های هوش مصنوعی در حال ساخت خدمات ترجمه صوت هستند، از جمله ElevenLabs و Panjaya.

دیپ ال وویس در حال حاضر یک API برای محصول صوتی ندارد. تجارت اصلی دیپ ال بر B2B متمرکز شده است و کوتلوفسکی گفت شرکت به طور مستقیم با شرکا و مشتریان خود کار می‌کند.

هنوز تنوع گسترده‌ای از ادغام‌ها وجود ندارد: تنها سرویس تماس ویدئویی که در حال حاضر زیرنویس‌های دیپ ال را پشتیبانی می‌کند Teams است، که “بیشتر مشتریان ما را پوشش می‌دهد,” کوتلوفسکی گفت. هنوز خبری در مورد زمان یا احتمال ادغام DeepL Voice با Zoom یا Google Meet وجود ندارد.

توسط
Tech Crunch
منبع
Tech Crunch
نمایش بیشتر

اخبار مرتبط

بازگشت به بالا