جمینای لایو در دسترس قرار گرفت؛ پاسخ گوگل به حالت صوتی پیشرفته ChatGPT
گوگل در کنفرانس توسعهدهندگان خود در فصل بهار از Gemini Live برای رقابت با حالت صوتی ChatGPT پرده برداشته بود. این شرکت حالا امشب ویژگی هیجانانگیز جمینای لایو را عرضه کرده است تا کاربران بتوانند مکالمات خود را به زبان طبیعی و سیال با این هوش مصنوعی انجام دهند.
سرویس جمینای لایو از امروز برای مشترکان Gemini Advanced در دسترس قرار گرفته است و عملکردی بسیار شبیه به Voice Mode در ChatGPT دارد. کاربر در این حالت نیز میتواند بدون نیاز به تپکردن روی هیچ دکمهای، صحبتهای هوش مصنوعی را قطع کند و حرف بزند.
گوگل میگوید مکالمه با جمینای لایو میتواند جریانی آزادانه داشته باشد. علاوهبر قطعکردن صحبتهای هوش مصنوعی، میتوانید یک مکالمه را متوقف کنید و بعداً به آن برگردید. این سرویس همچنین میتواند در پسزمینه یا حتی زمانی که صفحه گوشی قفل است، کار کند.
اهالی مانتین ویو همچنین 10 صدای جدید انگلیسی را برای انتخاب در جمینای در اختیار کاربران اندروید قرار میدهند. این شرکت میگوید این قابلیت در آینده در دسترس کاربران iOS قرار خواهد گرفت و زبانهای بیشتر نیز در هفتههای آینده فعال میشوند.
یکی از برتریهای احتمالی جمینای لایو نسبت به حالت صوتی ChatGPT حافظه بهتر است. معماری پشت مدل هوش مصنوعی مولد لایو که جمینای 1.5 پرو و فلش است، از پنجره زمینهای (Context Window) بهره میبرد که طولانیتر از سطح میانگین محسوب میشود، یعنی میتواند دادههای بیشتری را دریافت و پردازش کند.
بااینهمه، جمینای لایو فاقد یکی از ویژگی چندوجهی است که گوگل در I/O به آن اشاره کرده بود. این یعنی حالت صوتی جمینای نمیتواند از طریق تصویر یا ویدیو نسبت به ورودیها واکنش نشان دهد. گوگل میگوید قابلیت چندوجهی در دنباله سال جاری میلادی در دسترس قرار میگیرد، اما جزئیات دقیقی در این زمینه ارائه نشده است.
درحال بهروزرسانی...
اسپانسر این رویداد در وبسایت دیجیاتو شرکت فراسیستم دیناست؛ با فراسیستم دینا به بهترینها دسترسی دارید