در طول GTC 2026، VDURA بهروزرسانیهای کلیدی پلتفرم دادهاش را به نمایش گذاشت که برای افزایش بهرهوری GPU و کارایی ذخیرهسازی در محیطهای هوش مصنوعی طراحی شده بود. این اعلامیه دارای سه نکته مهم است: دسترسی عمومی به حافظه مستقیم از راه دور (RDMA)، پیش نمایشی از فناوری نوآورانه Context-Aware Tiering، و پیکربندی های زیرساخت معتبر ساخته شده بر روی پردازنده های AMD EPYC Turin و اجزای شبکه NVIDIA ConnectX-7.
این بهروزرسانیها برای از بین بردن تنگناهای حرکت دادهها بین خوشههای GPU و سیستمهای ذخیرهسازی طراحی شدهاند، در حالی که بهینهسازی قرار دادن دادهها در لایههای ذخیرهسازی برای پشتیبانی بهتر از آموزش هوش مصنوعی در مقیاس بزرگ و بارهای کاری استنتاج - پرداختن به نقاط دردناک بحرانی در زیرساخت هوش مصنوعی مدرن.
RDMA مسیرهای داده مستقیم GPU را فعال می کند
VDURA پشتیبانی RDMA را در کل پلتفرم داده خود یکپارچه کرده است، و سرورهای GPU را قادر می سازد تا بدون دخالت CPU مستقیماً از طریق شبکه به فضای ذخیره سازی دسترسی داشته باشند. این پیشرفت به انتقال دادههای GPU به ذخیرهسازی اجازه میدهد تا مسیرهای سنتی هسته و CPU را دور بزند، به طور قابلتوجهی تأخیر را کاهش میدهد و توان عملیاتی را افزایش میدهد - مسیر داده با تأخیر کم و بازده بالا را که بارهای کاری آموزش هوش مصنوعی و استنتاج در مقیاس میخواهد ارائه میکند.
فضای نام جهانی VDURA
پیاده سازی RDMA به شدت با VDURA DirectFlow، لایه انتقال داده اختصاصی این شرکت، ادغام شده است و اطمینان می دهد که تمام ترافیک سرور GPU از RDMA استفاده می کند. با حذف سربار CPU در مسیر داده، منابع محاسباتی به طور کامل به آموزش مدل اصلی و وظایف استنتاج اختصاص داده می شود. این رویکرد نرخ بهرهبرداری بالاتر از GPU را حفظ میکند و در عین حال تاخیر خط لوله را در خوشههای هوش مصنوعی توزیعشده به حداقل میرساند، که یک اولویت کلیدی برای استقرار هوش مصنوعی در مقیاس بزرگ است.
Context-Aware Tiering راندمان قرار دادن داده ها را هدف قرار می دهد
VDURA همچنین مرحله اول قابلیت Context-Aware Tiering خود را که برای انتشار عمومی در اواخر سال 2026 برنامهریزی شده است، شرح داد. این فناوری قرار دادن دادههای هوشمند و خودکار را در سطوح ذخیرهسازی بر اساس رفتار بار کاری بلادرنگ و الگوهای دسترسی معرفی میکند - فراتر از سیاستهای ثابت حرکت میکند تا اطمینان حاصل شود که دادهها دقیقاً در جایی که بیشتر مورد نیاز است قرار میگیرند.
فاز اولیه بافر DirectFlow را به SSD های محلی NVMe گسترش می دهد و به داده های "داغ" که اغلب به آنها دسترسی دارند اجازه می دهد تا نزدیک به منابع محاسباتی قرار گیرند. این امر اتکا به فضای ذخیرهسازی مشترک یا متصل به شبکه را برای دادههای فعال کاهش میدهد، زمان پاسخگویی را برای بارهای کاری حیاتی بهبود میبخشد و عملکرد را بیشتر بهینه میکند.
علاوه بر این، این پلتفرم کنترلهای بازگشتی KVCache را معرفی میکند که بهطور انتخابی تنها دادههای استنتاج حیاتی پایدار را برای ذخیرهسازی بادوام حفظ میکنند. این فعالیت غیرضروری I/O را به حداقل میرساند در حالی که تضمینهای پایداری مورد نیاز خطوط لوله استنتاج هوش مصنوعی تولید را حفظ میکند و تعادلی بین کارایی و قابلیت اطمینان ایجاد میکند.
VDURA همچنین در حال ارائه یک چارچوب یکپارچه Context Cache Tiering است که DRAM و SSD محلی را در بر می گیرد. این چارچوب دسترسی خواندن و نوشتن پرسرعت قابل مقایسه با عملکرد کلاس LMCache را امکانپذیر میکند و آن را برای موارد استفاده مانند استنتاج LLM با زمینه طولانی و تولید تقویتشده بازیابی (RAG) مناسب میسازد.
VDURA خاطرنشان کرد که مراحل آینده Context-Aware Tiering به قرار دادن دادههای آگاه از برنامه، افزایش انسجام حافظه پنهان در سراسر گرهها و پشتیبانی از اجزای زیرساختی نوظهور مانند NVIDIA BlueField-4 DPU گسترش مییابد – که با تکامل بار کاری هوش مصنوعی، قابلیتهای پلتفرم را بیشتر گسترش میدهد.
مکمل این پیشرفتهای نرمافزاری، این شرکت پیکربندیهای پلتفرم بهینهسازی شدهای را معرفی کرد که پردازندههای AMD EPYC Turin را با آداپتورهای شبکه NVIDIA ConnectX-7 جفت میکنند. این پیکربندیها بهمنظور تکمیل مسیرهای دادهای با قابلیت RDMA ساخته شدهاند، و از ارتباطات پرتوان و کم تأخیر بین خوشههای GPU و سیستمهای ذخیرهسازی پشتیبانی میکنند و معیار جدیدی را برای زیرساختهای هوش مصنوعی بومی GPU تعیین میکنند.
فوکوس خط لوله داده تمام پشته هوش مصنوعی
کن کلافی، مدیرعامل VDURA بر تمرکز این شرکت بر ارائه یک پلتفرم ذخیرهسازی هوش مصنوعی که کل سلسله مراتب دادهها از حافظه تا ذخیرهسازی بلندمدت را در بر میگیرد، بدون هیچ گونه مصالحهای در عملکرد، تأکید کرد. او تاکید کرد که این پلتفرم از RDMA برای دسترسی مستقیم و بدون CPU به داده ها و طبقه بندی Context-Aware برای قرار دادن هوشمندانه داده ها در سطوح ذخیره سازی استفاده می کند - نوآوری هایی که به سازمان ها کمک می کند از مدل های هوش مصنوعی بزرگتر پشتیبانی کنند، درخواست های استنتاج بیشتری را انجام دهند و زیرساخت های هوش مصنوعی را مقیاس کنند در حالی که الزامات قابلیت اطمینان در سطح تولید را برآورده می کنند.
این رویکرد ترکیبی به طور خاص برای پشتیبانی از اندازههای مدل بزرگتر، افزایش توان استنتاج و بهبود کارایی کلی زیرساخت طراحی شده است - همه اینها در حالی که استانداردهای قابلیت اطمینان و انطباق ضروری برای استقرار هوش مصنوعی تولید را حفظ میکنند.
در دسترس بودن
پشتیبانی RDMA اکنون به طور کلی در پلتفرم های VDURA V5000 و V7000 در دسترس است و آماده استقرار فوری است. مرحله 1 Context-Aware Tiering قرار است در اواخر سال 2026 در دسترس عموم قرار گیرد، با برنامه های دسترسی زودهنگام در حال حاضر برای مشتریان منتخب برای آزمایش و بهینه سازی فناوری قبل از انتشار کامل آن.
پکن Qianxing Jietong Technology Co., Ltd.
سندی یانگ / مدیر استراتژی جهانی
WhatsApp / WeChat: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز تجاری:
توزیع محصول ICT/یکپارچه سازی سیستم و خدمات/راه حل های زیرساخت
با بیش از 20 سال تجربه توزیع فناوری اطلاعات، ما با برندهای پیشرو جهانی برای ارائه محصولات قابل اعتماد و خدمات حرفه ای همکاری می کنیم.
«استفاده از فناوری برای ساختن جهانی هوشمند» ارائهدهنده خدمات محصول ICT مورد اعتماد شما!
سندی یانگ / مدیر استراتژی جهانی
WhatsApp / WeChat: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز تجاری:
توزیع محصول ICT/یکپارچه سازی سیستم و خدمات/راه حل های زیرساخت
با بیش از 20 سال تجربه توزیع فناوری اطلاعات، ما با برندهای پیشرو جهانی برای ارائه محصولات قابل اعتماد و خدمات حرفه ای همکاری می کنیم.
«استفاده از فناوری برای ساختن جهانی هوشمند» ارائهدهنده خدمات محصول ICT مورد اعتماد شما!



