حذف مرزهای زبانی؛ مترجم زنده گوگل حالا از ۷۰ زبان پشتیبانی میکند
گوگل مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را با پشتیبانی از ۷۰ زبان و ترجمهی زندهی طبیعی معرفی کرد.
به گزارش دیدبان ایران، گوگل لحظاتی پیش مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را بهعنوان تازهترین مدل خود برای ترجمهی زندهی گفتار به گفتار رونمایی کرد؛ مدلی که برای ارائهی ترجمهای روان، طبیعی و نزدیک به صدای گوینده طراحی شده است.
هوش مصنوعی جدید گوگل میتواند بیش از ۷۰ زبان را تشخیص دهد و «گفتار نرم و طبیعی» تولید کند؛ گفتاری که آهنگ صدا، سرعت بیان و زیر و بم صدای گوینده را حفظ خواهد کرد.
هوش مصنوعی جدید گوگل عملکرد چشمگیری در ترجمهی زندهی مکالمهها دارد
گوگل میگوید این رویکرد نسبت به سیستمهای ترجمهی مرحلهای که «منتظر میمانند تا گوینده صحبتش را تمام کند و بعد پاسخ میدهند»، تجربهای پیوستهتر ارائه میکند.
بیانیهی مطبوعاتی گوگل، مدل جدید این شرکت «صدای روان بدون مکثهای ناخوشایند» تولید میکند که در طول گفتوگو تنها چند ثانیه از گوینده عقب میماند.
مدل جدید گوگل از امروز در گوگل ترنسلیت روی اندروید و آیاواس در حال انتشار است. کاربر برای استفاده باید هنگام اتصال هدفون، گزینهی «ترجمهی زنده» را در گوشهی پایینِ سمت چپ لمس کند.
گوگل همزمان در اپ اندروید ترنسلیت حالت تازهای با نام «حالت شنیدن» را ارائه میکند که اجازه میدهد کاربر وقتی هدفون در دسترس ندارد، ترجمه را از طریق گوشی و اسپیکر بشنود و «فقط گوشی را مثل یک تماس معمولی کنار گوشش بگیرد.»
گوگل میگوید ترجمه در محصولات این شرکت از بیست سال پیش بهعنوان یکی از نخستین آزمایشهای یادگیری ماشین برای تبدیل علم زبان به «جادوی ارتباط انسانی» آغاز شد و حالا به مرحلهای رسیده که بیش از یک تریلیون واژه هر ماه برای میلیاردها کاربر در محصولات گوگل ترجمه میشوند. این شرکت میگوید جمنای ۳٫۵ لایو ترنسلیت گام بعدی همین مسیر است و علاوه بر گوگل ترنسلیت، قرار است به گوگل میت و ابزارهای توسعهدهندگان هم برسد.
در گوگل میت، ترجمهی گفتار پیشتر فقط از پنج زبان پشتیبانی میکرد، اما اکنون با پشتیبانی بیش از ۷۰ زبان، فراتر از ۲٬۰۰۰ ترکیب زبانی در یک جلسه ممکن میشود پیشتر ترجمهی گفتمان تنها به مقصد انگلیسی امکانپذیر بود.
گوگل میگوید در نسخهی وب، یک دکمهای تازه به ردیف کنترلها اضافه شده تا ترجمهی گفتار را فوراً آغاز کند. این بهروزرسانی از همین ماه بهصورت آزمایشی منتشر میشود.
گوگل میگوید «جمنای ۳٫۵ لایو ترنسلیت» گفتار را در حین پخششدن پردازش میکند
گوگل میگوید جمنای ۳٫۵ لایو ترنسلیت گفتار را در حین پخششدن پردازش میکند و همین موضوع، اتصال روانتری را میان زبانها ممکن میسازد. این مدل بدون نیاز به تنظیم دستی، ورودیهای چندزبانه را مدیریت میکند و در عین حال، بهدلیل مقاومت بالا در برابر نویز، میتواند در محیطهای شلوغ و غیرقابلپیشبینی هم کار کند. به گفتهی گوگل، از این قابلیت میتوان برای ترجمهی زنده در تماسهای چندزبانه، جلسات، کلاسها، پخشهای زنده و موارد مشابه استفاده کرد.
از منظر ایمنی، گوگل میگوید همهی صداهای تولیدشده توسط مدلهایش با سینتآیدی واترمارک میشوند. این واترمارک نامرئی مستقیماً در خروجی صوتی تنیده میشود تا محتوای تولیدشده با هوش مصنوعی قابل شناسایی باقی بماند و به جلوگیری از انتشار اطلاعات نادرست کمک کند.