PANews 30 ژوئن، به گزارش Jin10، امروز، میتوانید به طور رسمی مدل بزرگ با تریلیون پارامتر نسل بعدی LongCat-2.0 را منتشر کرد و آن را به صورت منبع باز در اختیار عموم قرار خواهد داد. مقیاس دادههای پیشآموزش LongCat-2.0 بیش از 30 تریلیون توکن است که شامل انواع دادههای چینی، انگلیسی، چندزبانه، کد و غیره میشود. در مواجهه با خرابیهای سختافزاری، ناهنجاریهای ارتباطی، فشار حافظه و نوسانات عددی در آموزش روی دهها هزار کارت، تیم LongCat چالشهای آموزش با توان محاسباتی داخلی را از سه جنبه پایداری، صحت و کارایی حل کرد. از نظر پایداری، از طریق مدیریت استثناهای HCCL، مقیاسپذیری الاستیک کارت و بازیابی خودکار خطا، میانگین نرخ خرابی روزانه در ماه بیش از 70 درصد کاهش یافت. از نظر صحت، با توسعه عملگرهای قطعی خودکار، تأیید سازگاری بیتی و تشخیص پارامتر، قابلیت اطمینان نتایج آموزش تضمین میشود، در حالی که دقت محاسباتی ماژولهای کلیدی نیز بهبود یافته و منطق Reduce بر اساس عمل بهینهسازی شده است.
میتوانید مدل بزرگ با تریلیون پارامتر نسل بعدی LongCat-2.0 را منتشر کرد
اگر بازخورد یا سؤالی درباره این محتوا دارید، لطفاً با ما از طریق crypto.news@kcex.com ارتباط بگیرید.
توضیحات قانونی: مقالات بازنشر شده در این وبسایت از پلتفرمهای عمومی گرفته شده و صرفاً جنبه مرجع دارند. این مقالات نمایانگر دیدگاه یا نظرات KCEX نیستند. تمامی حقوق کپیرایت متعلق به نویسندگان اصلی است. اگر معتقدید که هر مقالهای حقوق شخص ثالث را نقض میکند، لطفاً با آدرس crypto.news@kcex.com تماس بگیرید تا حذف شود. KCEX هیچ نمایندگی یا تضمینی درباره زمانبندی، دقت یا کامل بودن مقالات بازنشر شده نمیدهد و هیچ مسئولیتی در قبال هیچ اقدام یا تصمیمی که بر اساس این محتوا گرفته شود، نمیپذیرد. محتوای بازنشر شده صرفاً برای اطلاعرسانی است و هیچگونه مشاوره، تأیید یا مبنایی برای تصمیمات تجاری، مالی، حقوقی و/یا مالیاتی محسوب نمیشود.
