حذف مرزهای زبانی؛ مترجم زنده گوگل حالا از ۷۰ زبان پشتیبانی می‌کند

گوگل مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را با پشتیبانی از ۷۰ زبان و ترجمه‌ی زنده‌ی طبیعی معرفی کرد.

به گزارش دیدبان ایران، گوگل لحظاتی پیش مدل زبانی «جمنای ۳٫۵ لایو ترنسلیت» را به‌عنوان تازه‌ترین مدل خود برای ترجمه‌ی زنده‌ی گفتار به گفتار رونمایی کرد؛ مدلی که برای ارائه‌ی ترجمه‌ای روان، طبیعی و نزدیک به صدای گوینده طراحی شده است.

هوش مصنوعی جدید گوگل می‌تواند بیش از ۷۰ زبان را تشخیص دهد و «گفتار نرم و طبیعی» تولید کند؛ گفتاری که آهنگ صدا، سرعت بیان و زیر و بم صدای گوینده را حفظ خواهد کرد.

هوش مصنوعی جدید گوگل عملکرد چشمگیری در ترجمه‌ی زنده‌ی مکالمه‌ها دارد

گوگل می‌گوید این رویکرد نسبت به سیستم‌های ترجمه‌ی مرحله‌ای که «منتظر می‌مانند تا گوینده صحبتش را تمام کند و بعد پاسخ می‌دهند»، تجربه‌ای پیوسته‌تر ارائه می‌کند.

بیانیه‌ی مطبوعاتی گوگل، مدل جدید این شرکت «صدای روان بدون مکث‌های ناخوشایند» تولید می‌کند که در طول گفت‌و‌گو تنها چند ثانیه از گوینده عقب می‌ماند.

مدل جدید گوگل از امروز در گوگل ترنسلیت روی اندروید و آی‌اواس در حال انتشار است. کاربر برای استفاده باید هنگام اتصال هدفون، گزینه‌ی «ترجمه‌ی زنده» را در گوشه‌ی پایینِ سمت چپ لمس کند.

گوگل هم‌زمان در اپ اندروید ترنسلیت حالت تازه‌ای با نام «حالت شنیدن» را ارائه می‌کند که اجازه می‌دهد کاربر وقتی هدفون در دسترس ندارد، ترجمه را از طریق گوشی و اسپیکر بشنود و «فقط گوشی را مثل یک تماس معمولی کنار گوشش بگیرد.»

گوگل می‌گوید ترجمه در محصولات این شرکت از بیست سال پیش به‌عنوان یکی از نخستین آزمایش‌های یادگیری ماشین برای تبدیل علم زبان به «جادوی ارتباط انسانی» آغاز شد و حالا به مرحله‌ای رسیده که بیش از یک تریلیون واژه هر ماه برای میلیاردها کاربر در محصولات گوگل ترجمه می‌شوند. این شرکت می‌گوید جمنای ۳٫۵ لایو ترنسلیت گام بعدی همین مسیر است و علاوه بر گوگل ترنسلیت، قرار است به گوگل میت و ابزارهای توسعه‌دهندگان هم برسد.

در گوگل میت، ترجمه‌ی گفتار پیش‌تر فقط از پنج زبان پشتیبانی می‌کرد، اما اکنون با پشتیبانی بیش از ۷۰ زبان، فراتر از ۲٬۰۰۰ ترکیب زبانی در یک جلسه ممکن می‌شود پیش‌تر ترجمه‌ی گفتمان تنها به مقصد انگلیسی امکان‌پذیر بود.

گوگل می‌گوید در نسخه‌ی وب، یک دکمه‌‌ای تازه به ردیف کنترل‌ها اضافه شده تا ترجمه‌ی گفتار را فوراً آغاز کند. این به‌روزرسانی از همین ماه به‌صورت آزمایشی منتشر می‌شود.

گوگل می‌گوید «جمنای ۳٫۵ لایو ترنسلیت» گفتار را در حین پخش‌شدن پردازش می‌کند

گوگل می‌گوید جمنای ۳٫۵ لایو ترنسلیت گفتار را در حین پخش‌شدن پردازش می‌کند و همین موضوع، اتصال روان‌تری را میان زبان‌ها ممکن می‌سازد. این مدل بدون نیاز به تنظیم دستی، ورودی‌های چندزبانه را مدیریت می‌کند و در عین حال، به‌دلیل مقاومت بالا در برابر نویز، می‌تواند در محیط‌های شلوغ و غیرقابل‌پیش‌بینی هم کار کند. به گفته‌ی گوگل، از این قابلیت می‌توان برای ترجمه‌ی زنده در تماس‌های چندزبانه، جلسات، کلاس‌ها، پخش‌های زنده و موارد مشابه استفاده کرد.

از منظر ایمنی، گوگل می‌گوید همه‌ی صداهای تولیدشده توسط مدل‌هایش با سینت‌آی‌دی واترمارک می‌شوند. این واترمارک نامرئی مستقیماً در خروجی صوتی تنیده می‌شود تا محتوای تولیدشده با هوش مصنوعی قابل شناسایی باقی بماند و به جلوگیری از انتشار اطلاعات نادرست کمک کند.