logo
خانه موارد

WEKA با NVIDIA STX برای رفع گلوگاه‌های حافظه استنتاج هوش مصنوعی ادغام می‌شود

گواهی
چین Beijing Qianxing Jietong Technology Co., Ltd. گواهینامه ها
چین Beijing Qianxing Jietong Technology Co., Ltd. گواهینامه ها
نظرات مشتریان
کارکنان فروش Beijing Qianxing Jietong Technology Co.,Ltd بسیار حرفه ای و صبور هستند. آنها می توانند به سرعت نقل قول ارائه کنند. کیفیت و بسته بندی محصولات نیز بسیار خوب است. همکاری ما بسیار روان است.

—— 《Festfing DV》LLC

وقتی فوراً دنبال CPU اینتل و SSD توشیبا می‌گشتم، Sandy از Beijing Qianxing Jietong Technology Co., Ltd کمک زیادی به من کرد و محصولات مورد نیاز را به سرعت به من داد. من واقعا از او قدردانی می کنم.

—— کیتی ین

Sandy of Beijing Qianxing Jietong Technology Co.,Ltd فروشنده بسیار دقیقی است که هنگام خرید سرور می تواند اشتباهات پیکربندی را به موقع به من یادآوری کند. مهندسان نیز بسیار حرفه ای هستند و می توانند به سرعت فرآیند آزمایش را تکمیل کنند.

—— استرلکین میخائیل ولادیمیرویچ

ما از تجربه همکاری با شرکت پکن چیان‌شینگ جیه‌تونگ بسیار خوشحالیم. کیفیت محصول عالی است و تحویل همیشه به موقع انجام می‌شود. تیم فروش آنها حرفه‌ای، صبور و در پاسخگویی به تمام سوالات ما بسیار مفید است. ما واقعاً از پشتیبانی آنها قدردانی می‌کنیم و مشتاقانه منتظر یک مشارکت بلندمدت هستیم. اکیداً توصیه می‌شود!

—— احمد نوید

کیفیت: تجربه عالی با تامین کننده من. MikroTik RB3011 قبلا استفاده شده بود، اما در وضعیت بسیار خوبی بود و همه چیز به خوبی کار می کند. ارتباطات سریع و بدون مشکل بود،و تمام نگرانی هایم به سرعت حل شد. عرضه کننده ي خيلي قابل اطمينان

—— گران کولسیو

چت IM آنلاین در حال حاضر

WEKA با NVIDIA STX برای رفع گلوگاه‌های حافظه استنتاج هوش مصنوعی ادغام می‌شود

April 10, 2026
WEKA ادغام پلت فرم NeuralMesh خود را با معماری مرجع NVIDIA STX اعلام کرده است،ایجاد شبکه حافظه افزوده به عنوان یک بلوک کلیدی برای زیرساخت های نسل بعدی هوش مصنوعیاین راه حل ترکیبی یکی از مهم ترین تنگنایی ها را در محیط های نتیجه گیری در مقیاس بزرگ حل می کند: محدودیت های حافظه که به طور مستقیم بر عملکرد، کل هزینه مالکیت،و رشد مقیاس پذیر.

شبکه حافظه افزوده WEKA که از طریق NeuralMesh کار می کند، حافظه GPU را با خارج کردن و حفظ کیش های کلید ارزش گسترش می دهد.این معماری ذخیره سازی حافظه زمینه ای با سرعت بالا را برای بارهای کاری هوش مصنوعی عامل ارائه می دهد، پشتیبانی از استدلال زمینه ای طولانی در جلسات، ابزارها و جریان های کاری از انتهای به انتهای.و اسپکتروم-X اترنت می تواند سرعت انتقال توکن حافظه زمینه ای را 4 تا 10 برابر افزایش دهدهمچنین پیش بینی می شود که این پلتفرم حداقل 320 GB / s خواندن و 150 GB / s نوشتن را ارائه دهد، بیش از دو برابر عملکرد معماری های ذخیره سازی سنتی هوش مصنوعی.

آخرین مورد شرکت WEKA با NVIDIA STX برای رفع گلوگاه‌های حافظه استنتاج هوش مصنوعی ادغام می‌شود  0

زیرساخت های حافظه به تنگنای نتیجه گیری تبدیل می شوند


WEKA این ادغام را بر روی چالش رو به رشد دیوار حافظه در پیاده سازی های هوش مصنوعی مدرن متمرکز می کند. در خط لوله نتیجه گیری امروز، حافظه GPU پهنای باند بالا محدود، اخراج مکرر KV cache،منجر به محاسبه مجدد مکرر و کاهش بهره وری عملیاتیبا افزایش همزمان سیستم، این ناکارآمدی ها چند برابر می شوند، هزینه های زیرساخت را افزایش می دهند و پیش بینی عملکرد را کاهش می دهند.

این شرکت زیرساخت های ذخیره سازی KV مشترک را به عنوان راه حل ترویج می کند.ذخیره سازی به اشتراک گذاشته شده پردازش اضافی را از بین می برد و سرعت انتقال توکن را ثبات می دهد. NVIDIA STX معماری مرجع تایید شده را برای این مدل ارائه می دهد ، در حالی که WEKA لایه ذخیره سازی و گسترش حافظه را ارائه می دهد.

NeuralMesh و معماری شبکه حافظه افزوده


NeuralMesh به عنوان پلت فرم ذخیره سازی توزیع شده WEKA عمل می کند، ساخته شده برای ادغام یکپارچه در سراسر مجموعه کامل NVIDIA STX. این خدمات داده با عملکرد بالا را برای بار های کاری هوش مصنوعی بهینه می کند،در حالی که شبکه حافظه افزوده به عنوان یک لایه توسعه حافظه اختصاص داده شده است که کش KV را خارج از حافظه GPU تقویت می کند.

این طراحی به محیط های استنتاج اجازه می دهد تا جلسات طولانی مدت را بدون بارگذاری بیش از حد منابع GPU حفظ کنند. با حفظ حالت حافظه کش و امکان استفاده مجدد در تمام بارهای کاری،این پلتفرم بهره برداری بالا و عملکرد ثابت را در مقیاس استقرار حفظ می کند..

WEKA خاطرنشان می کند که شبکه حافظه افزوده، که برای اولین بار در GTC 2025 معرفی شد و اکنون به طور کلی در دسترس است، در سیستم عامل های پردازنده NVIDIA Grace با DPU های BlueField تایید شده است.معماری به دستاوردهای قابل اندازه گیری در بهره وری نتیجه گیری می پردازد، از جمله زمان سریع تر تا اولین توکن، سرعت بیشتری در هر توکن GPU و عملکرد پایدار تحت افزایش همزمان.تخلیه مسیر داده به BlueField-4 همچنین هزینه های CPU را کاهش می دهد و تنگنایی های I / O را کاهش می دهد.

افزایش عملکرد و کارایی


در محیط های مشابه تولید، این پلتفرم برای افزایش پاسخگویی و بهره وری زیرساخت طراحی شده است.WEKA می گوید که شبکه حافظه افزوده می تواند زمان تا اولین توکن را 4 تا 20 برابر کاهش دهد، در حالی که تولید توکن در هر GPU را تا 6.5 برابر افزایش می دهد. این پیشرفت ها ناشی از نرخ موفقیت کیش KV بالاتر و چرخه های محاسبه مجدد کمتر است.اجازه دادن به سیستم ها برای حفظ عملکرد به عنوان ابعاد زمینه و تعداد کاربران افزایش می یابد.

شرکت فرموس، یک ارائه دهنده زیرساخت های هوش مصنوعی به عنوان یک کاربر اولیه با استفاده از NeuralMesh با زیرساخت های مبتنی بر NVIDIA برجسته شده است. شرکت گزارش می دهد که سرعت انتقال توکن بهبود یافته و تاخیر در مقیاس کمتر است.,با دستاوردهای ناشی از استفاده کارآمدتر از GPU های موجود به جای استفاده از سخت افزار اضافی.

پیامدهای طراحی زیرساخت های هوش مصنوعی


این ادغام یک تغییر در طراحی سیستم هوش مصنوعی را برجسته می کند، جایی که استراتژی های حافظه و ذخیره سازی به طور فزاینده ای عملکرد کلی و بهره وری هزینه را تعریف می کنند.با گسترش حجم کار هوش مصنوعی و گسترش پنجره های زمینه ای، رویکردهای تنها DRAM به دلیل افزایش هزینه های محاسبه مجدد و GPU های کم استفاده، پایدار نمی شوند.

WEKA موقعیت های KV کش پایدار و مشترک را به عنوان یک قابلیت پایه ای برای کارخانه های هوش مصنوعی قرار می دهد. سازمان هایی که این مدل را اتخاذ می کنند می توانند بهره برداری از GPU را افزایش دهند.مصرف انرژی کمتر در هر کار نتیجه گیریدر مقابل، محیط هایی که به طور انحصاری به حافظه محلی GPU متکی هستند، احتمالا با افزایش حجم کار، با افزایش هزینه های عملیاتی و کاهش بازده مواجه خواهند شد.

شرکت فناوری چینجینگ جیوتونگ پکن، لمیتد
سندي يانگ، مدير استراتژي جهاني
واتساپ / وی چت: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز کسب و کار:
توزیع محصولات ICT / ادغام سیستم و خدمات / راه حل های زیرساخت
با 20+ سال تجربه توزیع فناوری اطلاعات، ما با مارک های پیشرو جهانی همکاری می کنیم تا محصولات قابل اعتماد و خدمات حرفه ای را ارائه دهیم.
استفاده از تکنولوژی برای ساختن یک جهان هوشمند، ارائه دهنده خدمات قابل اعتماد محصولات ICT شما
اطلاعات تماس
Beijing Qianxing Jietong Technology Co., Ltd.

تماس با شخص: Ms. Sandy Yang

تلفن: 13426366826

ارسال درخواست خود را به طور مستقیم به ما (0 / 3000)