NVIDIA اکنون دسترسی رایگان API با شتاب‌دهنده GPU به Kimi K2.5، یک مدل هوش مصنوعی چندوجهی با 1T پارامتر با 384 متخصص و طول زمینه 262K را برای توسعه‌دهندگان ارائه می‌دهد. (بیشتر بخوانیدNVIDIA اکنون دسترسی رایگان API با شتاب‌دهنده GPU به Kimi K2.5، یک مدل هوش مصنوعی چندوجهی با 1T پارامتر با 384 متخصص و طول زمینه 262K را برای توسعه‌دهندگان ارائه می‌دهد. (بیشتر بخوانید

NVIDIA نقاط پایانی تسریع‌شده با GPU را برای مدل Kimi K2.5 هوش مصنوعی Moonshot راه‌اندازی می‌کند

مدت مطالعه: 3 دقیقه

NVIDIA نقاط پایانی تسریع شده GPU را برای مدل Kimi K2.5 هوش مصنوعی Moonshot راه‌اندازی می‌کند

Jessie A Ellis 1404/11/16 20:11

NVIDIA اکنون دسترسی رایگان API تسریع شده GPU به Kimi K2.5، یک مدل هوش مصنوعی چندوجهی با 1 تریلیون پارامتر با 384 متخصص و طول زمینه 262 هزار توکن برای توسعه‌دهنده‌ها ارائه می‌دهد.

NVIDIA نقاط پایانی تسریع شده GPU را برای مدل Kimi K2.5 هوش مصنوعی Moonshot راه‌اندازی می‌کند

NVIDIA نقاط پایانی تسریع شده GPU را برای Kimi K2.5 هوش مصنوعی Moonshot عرضه کرده است و به توسعه‌دهنده‌ها دسترسی رایگان API به یکی از توانمندترین مدل‌های چندوجهی منبع باز موجود در حال حاضر می‌دهد. این یکپارچه‌سازی که در 1404/11/16 اعلام شد، مدل 1 تریلیون پارامتری را برای پذیرش سریع سازمانی از طریق پلتفرم build.nvidia.com شرکت NVIDIA قرار می‌دهد.

Kimi K2.5 مشخصات فنی جدی دارد که برای استقرارهای تولید اهمیت دارند. این مدل از معماری ترکیبی متخصصان با 384 متخصص استفاده می‌کند و تنها 32.86 میلیارد پارامتر به ازای هر توکن را فعال می‌کند - نرخ فعال‌سازی 3.2 درصد که هزینه‌های استنتاج را علی‌رغم تعداد عظیم پارامترها قابل مدیریت نگه می‌دارد. طول زمینه به 262,000 توکن می‌رسد و تجزیه و تحلیل اسناد قابل توجه و مکالمات طولانی را مدیریت می‌کند.

قابلیت‌های بینایی شایسته توجه هستند. Moonshot یک برج بینایی سفارشی MoonViT3d ساخته است که تصاویر و فریم‌های ویدیویی را به embeddings پردازش می‌کند، که توسط یک واژگان 164,000 توکنی حاوی توکن‌های خاص بینایی پشتیبانی می‌شود. این چندوجهی متصل شده نیست - بومی معماری است.

آنچه توسعه‌دهنده‌ها دریافت می‌کنند

دسترسی رایگان نمونه‌سازی از طریق برنامه توسعه‌دهنده NVIDIA به این معنی است که تیم‌ها می‌توانند قبل از تعهد زیرساخت در برابر بارهای کاری تولید آزمایش کنند. این API از الگوهای سازگار با OpenAI پیروی می‌کند، از جمله پشتیبانی از فراخوانی ابزار برای گردش‌های کاری عامل. میکروسرویس‌های NVIDIA NIM برای استنتاج تولید کانتینری در راه هستند، اگرچه هیچ جدول زمانی مشخصی ارائه نشد.

برای استقرارهای خود میزبانی، یکپارچه‌سازی vLLM اکنون آماده است. NVIDIA همچنین پشتیبانی از تنظیم دقیق را از طریق چارچوب منبع باز NeMo تأیید کرد، با استفاده از NeMo AutoModel برای سفارشی‌سازی مدل مستقیماً از نقاط بازرسی Hugging Face بدون مراحل تبدیل.

زمینه بازار

Moonshot AI مدل Kimi K2.5 را در 1404/11/08 منتشر کرد و آن را بر روی تقریباً 15 تریلیون توکن بصری و متنی مختلط که بر روی پایه K2 قبلی ساخته شده بود، آموزش داد. این مدل مقایسه‌های مستقیمی با Gemini 3 Pro گوگل داشته است و معیارهای رقابتی از جمله امتیاز 78.5 درصد در آزمون‌های درک بصری MMMU-Pro و 76.8 درصد در SWE-Bench Verified برای وظایف کدنویسی را ثبت کرده است.

یک ویژگی متمایز: مکانیسم "ازدحام عامل" که تا 100 عامل فرعی موازی را هماهنگ می‌کند و به گفته گزارش‌ها زمان اجرا را 4.5 برابر در مقایسه با رویکردهای تک عامل کاهش می‌دهد. برای سازمان‌هایی که سیستم‌های خودمختار پیچیده می‌سازند، این یک شکاف قابلیت معنادار است.

پشتیبانی معماری Blackwell شرکت NVIDIA نشان می‌دهد که این شرکت Kimi K2.5 را به عنوان یک رقیب جدی در استقرارهای هوش مصنوعی سازمانی می‌بیند. توسعه‌دهنده‌ها می‌توانند بلافاصله از طریق build.nvidia.com یا از طریق پلتفرم API Kimi مستقیماً از Moonshot به مدل دسترسی داشته باشند.

منبع تصویر: Shutterstock
  • nvidia
  • kimi k2.5
  • moonshot ai
  • هوش مصنوعی چندوجهی
  • محاسبات gpu
فرصت‌ های بازار
لوگو NodeAI
NodeAI قیمت لحظه ای(GPU)
$0.03052
$0.03052$0.03052
-11.51%
USD
نمودار قیمت لحظه ای NodeAI (GPU)
سلب مسئولیت: مطالب بازنشرشده در این وب‌ سایت از منابع عمومی گردآوری شده‌ اند و صرفاً به‌ منظور اطلاع‌ رسانی ارائه می‌ شوند. این مطالب لزوماً بازتاب‌ دهنده دیدگاه‌ ها یا مواضع MEXC نیستند. کلیه حقوق مادی و معنوی آثار متعلق به نویسندگان اصلی است. در صورت مشاهده هرگونه محتوای ناقض حقوق اشخاص ثالث، لطفاً از طریق آدرس ایمیل [email protected] با ما تماس بگیرید تا مورد بررسی و حذف قرار گیرد.MEXC هیچ‌ گونه تضمینی نسبت به دقت، جامعیت یا به‌ روزبودن اطلاعات ارائه‌ شده ندارد و مسئولیتی در قبال هرگونه اقدام یا تصمیم‌ گیری مبتنی بر این اطلاعات نمی‌ پذیرد. همچنین، محتوای منتشرشده نباید به‌عنوان توصیه مالی، حقوقی یا حرفه‌ ای تلقی شود و به منزله پیشنهاد یا تأیید رسمی از سوی MEXC نیست.