بزرگترین مدل هوش مصنوعی چین معرفی شد؛ بدون نیاز به تراشه انویدیا
شرکت خدمات آنلاین «میتوان» از مدل زبانی LongCat-2.0 که بهطور کامل بر پایهی سختافزارهای بومی چین آموزش دیده، رونمایی کرد.
به گزارش سایت دیدبان ایران، شرکت Meituan مدل زبانی بزرگ جدید خود را با نام LongCat-2.0 بهصورت متنباز منتشر کرد. این مدل دارای ۱٫۶ تریلیون پارامتر است و از پنجرهی متنی یک میلیون توکنی پشتیبانی میکند.
هوش مصنوعی لانگکت ۲ از نظر مقیاس با مدل DeepSeek-V4-pro برابری میکند. ویژگی متمایز این مدل، استفاده از پردازندههای بومی چین برای هر دو مرحلهی آموزش و استنتاج است.
شرکت میتوان میگوید لانگکت ۲ نخستین مدل در صنعت بهشمار میرود که فرآیند کامل آموزش و استنتاج را روی یک کلاستر پردازشی متشکل از ۵۰ هزار کارت گرافیک چینی انجام داده است. برخلاف مدلهای پیشین که تنها در مرحلهی استنتاج از تراشههای داخلی استفاده میکردند، لانگکت ۲ تمام مراحل محاسباتی سنگین را با پردازندههای چینی پیش برده است.
میتوان در بیانیهی خود تأکید کرد که مدل مذکور با استفاده از کلاسترهای بزرگ متشکل از دهها هزار ASIC یا همان مدارهای مجتمع با کاربرد خاص ساخته شده؛ دستاوردی که نشاندهندهی توانایی انجام آموزشهای مقیاس بزرگ روی پلتفرمهای سختافزاری جایگزین در چین است.
شرکت سازنده نام پردازندهها را اعلام نکرده و مشخص نیست که لانگکت ۲ دقیقا با چه نوع پردازندههایی آموزش دیده است؛ اما میتوان هواوی را بهعنوان یکی از گزینههای احتمالی در نظر داشت.
مدل جدید لانگکت ۲ هنوز در بنچمارکهای پیشرو مانند Artificial Analysis و Arena یا تستهای پیشرفتهای مانند Agents’ Last Exam و CyberGym ارزیابی نشده است.