خانه موارد

بررسی NVIDIA DGX Spark Cluster: نتیجه گیری توزیع شده در Dell، GIGABYTE و HP

همه محصولات

سرور ذخیره سازی رک
(165)

سرور فیوژن هواوی
(31)

سرور Poweredge Dell
(59)

سرور H3C
(31)

سوئیچ های دیتاکام
(96)

دستگاه WLAN
(21)

روتر بی سیم هوشمند
(10)

هارد دیسک HDD
(78)

هارد داخلی SSD
(16)

کارت گرافیک Geforce
(27)

پردازنده CPU اینتل
(20)

رم حافظه سرور
(6)

سرور ذخیره سازی بازسازی شده
(6)

ماژول فرستنده گیرنده SFP
(4)

سوئیچ کانال فیبر
(42)

گواهی

نظرات مشتریان

کارکنان فروش Beijing Qianxing Jietong Technology Co.,Ltd بسیار حرفه ای و صبور هستند. آنها می توانند به سرعت نقل قول ارائه کنند. کیفیت و بسته بندی محصولات نیز بسیار خوب است. همکاری ما بسیار روان است.

—— 《Festfing DV》LLC

وقتی فوراً دنبال CPU اینتل و SSD توشیبا می‌گشتم، Sandy از Beijing Qianxing Jietong Technology Co., Ltd کمک زیادی به من کرد و محصولات مورد نیاز را به سرعت به من داد. من واقعا از او قدردانی می کنم.

—— کیتی ین

Sandy of Beijing Qianxing Jietong Technology Co.,Ltd فروشنده بسیار دقیقی است که هنگام خرید سرور می تواند اشتباهات پیکربندی را به موقع به من یادآوری کند. مهندسان نیز بسیار حرفه ای هستند و می توانند به سرعت فرآیند آزمایش را تکمیل کنند.

—— استرلکین میخائیل ولادیمیرویچ

ما از تجربه همکاری با شرکت پکن چیان‌شینگ جیه‌تونگ بسیار خوشحالیم. کیفیت محصول عالی است و تحویل همیشه به موقع انجام می‌شود. تیم فروش آنها حرفه‌ای، صبور و در پاسخگویی به تمام سوالات ما بسیار مفید است. ما واقعاً از پشتیبانی آنها قدردانی می‌کنیم و مشتاقانه منتظر یک مشارکت بلندمدت هستیم. اکیداً توصیه می‌شود!

—— احمد نوید

کیفیت: تجربه عالی با تامین کننده من. MikroTik RB3011 قبلا استفاده شده بود، اما در وضعیت بسیار خوبی بود و همه چیز به خوبی کار می کند. ارتباطات سریع و بدون مشکل بود،و تمام نگرانی هایم به سرعت حل شد. عرضه کننده ي خيلي قابل اطمينان

—— گران کولسیو

چت IM آنلاین در حال حاضر

بررسی NVIDIA DGX Spark Cluster: نتیجه گیری توزیع شده در Dell، GIGABYTE و HP

May 15, 2026

دو ویژگی مشخص برای NVIDIA DGX Spark برجسته است: حافظه ی یکپارچه 128 گیگابایتی در یک واحد دسکتاپ 4000 دلاری و یک شبکه ی داخلی درجه 200 گیگابایتی برای مرکز داده ها.پارچه با سرعت بالا آن را از ایستگاه های کاری معمولی متمایز می کنداین بررسی معیارهای استنباط توزیع شده در Dell، GIGABYTE،و انواع HP Spark در خوشه های دو گره 200GbE در مدل ها و بارهای مختلف کاراین همچنین موازی خط لوله (PP) را تجزیه و تحلیل می کند ، یک روش تقسیم جایگزین که از موازی تنسور پیش فرض NVIDIA (TP) بهتر است.

بافت شبکه 200 گيگابايت

هر Spark دو قفس QSFP56 را مجهز به یک SmartNIC ConnectX-7 یکپارچه می کند. محدود به پهنای باند PCIe Gen5 x4 ، حداکثر سرعت شبکه قابل استفاده در 200 گیگابایت ،با یک پورت کافی برای پهنای باند کامل؛ پورت دوم انعطاف پذیری توپولوژی را ارائه می دهد. سه پیکربندی رایج در دسترس است: پیوندهای مستقیم Spark-to-Spark 200Gb، توپولوژی حلقه بدون سوئیچ از طریق پورت های دوگانه 100Gb،و خوشه بندی ترکیبی با دسترسی به ذخیره سازی NVMe-oF با سرعت بالا. NVIDIA یک واحد دسکتاپ می فروشد، خوشه های دو گره معتبر، و تازه منتشر شده چهار گره تنظیمات.پیکربندی دو جرقه ای عملی ترین برای نتیجه گیری سبک تولید و تمرکز این آزمایش است.

دلایل جمع آوری جرقه

مزیت اصلی گسترش ظرفیت مدل است: دو Spark متصل می توانند مدل های پارامتر 120B را اجرا کنند که از محدودیت های حافظه واحد فراتر می روند.این پلتفرم به عنوان یک ابزار آموزشی مقرون به صرفه استNVIDIA Spark را برای مبتدیان طراحی می کند تا جریان های کاری هوش مصنوعی را یاد بگیرند، با راهنماهای رسمی که گسترش مدل، تنظیم دقیق و توسعه PyTorch / JAX را پوشش می دهد.خوشه های دو گره به علاوه تعادل چند گره و تجزیه و تحلیل تنگه های شبکه را بدون سخت افزار گران قیمت مرکز داده آموزش می دهند.به طور خاص، Spark برای نتیجه گیری تولید بهینه نشده است. محدود به پهنای باند حافظه و تاخیر بین گره، لینک 200GbE آن کندتر از اتصالات داخلی PCIe است.خوشه های بزرگتر دچار کاهش شدید عملکرد می شوند، با حجم کم توکن، آنها را به استفاده آموزشی به جای استفاده تجاری محدود می کند.

آزمایش عملکرد: PP در مقابل TP

انتخاب استراتژی موازی

NVIDIA به طور پیش فرض به TP، که هر لایه ترانسفورم را در دو GPU با مبادلات داده های مکرر کاهش می دهد، تقسیم می کند. در مقابل، PP مدل ها را به صورت لایه تقسیم می کند.انتقال فعال سازی فقط یک بار بین گره هادر پیوندهای 200GbE، PP ارتباطات بین گره ها را به حداقل می رساند. برای مدل های بزرگ در اندازه های دسته های بالا، PP به شدت از TP برتر است؛ TP فقط در سناریوهای چت کم تاخیر با یک درخواست برجسته است.

آزمایشات بر روی GPT-OSS-120B این شکاف را تأیید می کند. در اندازه دسته 128 ، PP 554.69 tok / s (2.20 × سریعتر از TP) را در بارهای کار متعادل ، 310.63 tok / s در مقابل 164.99 tok / s در وظایف سنگین پیش از پر کردن می یابد.لوله های TP فقط در اندازه دسته 1برای مدل های کوچک مانند Llama-3.1-8B ، TP به دلیل محاسبه لایه سبک ، بر اکثر اندازه های دسته ای تسلط دارد ، PP فقط در همزمان بودن بالا از TP پیشی می گیرد.

نتایج معیار چند مدل (PP=2)

سری GPT-OSS

برای GPT-OSS-120B، HP در بارهای کاری متعادل (504.88 توک / ثانیه) و پیش از پر کردن (441.63 توک / ثانیه) حداکثر سرعت را به دست آورد. برای GPT-OSS-20B،دِل تسلط داشت متعادل (976.77 tok / s) و سناریوهای پر کردن پیش (852.39 tok / s) ، در حالی که GIGABYTE وظایف رمزگشایی را (945.55 tok / s) رهبری می کند.

لاما ۳.۱ 8B

در دقت BF16، دِل بار های کاری متعادل (689.53 توک/ ثانیه) و کد شکنی (581.43 توک/ ثانیه) را هدایت کرد؛ گیگابایت آزمون های سنگین پیش پر کردن (539.27 توک/ ثانیه) را برنده شد. بهینه سازی FP4 سرعت تولید را به شدت افزایش داد:گیگابایت LED متعادل (1458.86 توکن در ثانیه) و وظایف پیش پر کردن (954.23 توکن در ثانیه). برای FP8 ، دل در سناریوهای متعادل (1105.42 توکن در ثانیه) و رمزگشایی (862.33 توکن در ثانیه) منجر به باریک شد.

مدل های میسترال و کوون

Mistral Small 3.1 24B حداقل شکاف را مشاهده کرد: GIGABYTE در 255.09 tok / s در بار کار متعادل به اوج خود رسید. برای Qwen3 Coder 30B (A3B Base) ، GIGABYTE وظایف سنگین پیش از پر کردن (1862.40 tok / s) را رهبری کرد.ديل در سيناريوهاي رمزگشايي برتري داشتتحت کوانتیزاسیون FB8، GIGABYTE از پیش پر کردن سنگین (3088.62 توک / ثانیه) ، در حالی که دل منجر به وظایف رمزگشایی (705.77 توک / ثانیه) شد.

خلاصه اوج تولید سیستم های دو طرفه

مدل	سناریو (BS ¢ 64)	Dell Peak Output (خروجی اوج)	گگابایت حداکثر خروجی	حداکثر خروجی HP
GPT-OSS-120B	ISL/OSL مساوی	463.97 توک/ ثانیه	497.26 توک/ ثانیه	504.88 توک/ ثانیه
GPT-OSS-120B	پیش پر کردن سنگین	419.56 توک/ ثانیه	417.34 توک/ ثانیه	441.63 توک/ ثانیه
GPT-OSS-120B	رمزگشایی سنگین	451.18 توک/ ثانیه	494.37 توک/ ثانیه	474.85 توک/ ثانیه
GPT-OSS-20B	ISL/OSL مساوی	976.77 توک/ ثانیه	952.31 توک/ ثانیه	915.72 توک/ ثانیه
GPT-OSS-20B	پیش پر کردن سنگین	852.39 توک/ ثانیه	802.37 توک/ ثانیه	757.05 توک/ ثانیه
GPT-OSS-20B	رمزگشایی سنگین	938.65 توک/ ثانیه	945.55 توک/ ثانیه	865.78 توک/ ثانیه
لاما-۳-۱-۸-بی-اسنتر	ISL/OSL مساوی	689.53 توک/ ثانیه	687.48 توک در ثانیه	618.87 توک/ ثانیه
لاما-۳-۱-۸-بی-اسنتر	پیش پر کردن سنگین	515.45 توک/ ثانیه	539.27 توک/ ثانیه	463.39 توک/ ثانیه
لاما-۳-۱-۸-بی-اسنتر	رمزگشایی سنگین	581.43 توک/ ثانیه	576.91 توک/ ثانیه	531.07 توک/ ثانیه
Llama-3.1-8B-FP4	ISL/OSL مساوی	1427.39 توک/ ثانیه	1458.86 توک/ ثانیه	1413.51 توک/ ثانیه
Llama-3.1-8B-FP4	پیش پر کردن سنگین	884.22 توک/ ثانیه	954.23 توک/ ثانیه	843.57 توک/ ثانیه
Llama-3.1-8B-FP4	رمزگشایی سنگین	1008.98 توک/ ثانیه	1007.23 توک/ ثانیه	943.73 توک/ ثانیه
Llama-3.1-8B-FP8	ISL/OSL مساوی	1105.42 توک/ ثانیه	1089.85 توک/ ثانیه	1076.68 توک/ ثانیه
Llama-3.1-8B-FP8	پیش پر کردن سنگین	759.50 توک/ ثانیه	827.40 توک/ ثانیه	725.51 توک/ ثانیه
Llama-3.1-8B-FP8	رمزگشایی سنگین	862.33 توک/ ثانیه	855.81 توک/ ثانیه	800.78 توک/ ثانیه
"مسترال-سمال"	ISL/OSL مساوی	249.77 توک/ ثانیه	255.09 توک/ ثانیه	239.09 توک/ ثانیه
"مسترال-سمال"	پیش پر کردن سنگین	216.01 توک/ ثانیه	214.38 توک/ ثانیه	197.92 توک/ ثانیه
"مسترال-سمال"	رمزگشایی سنگین	238.44 توک در ثانیه	237.97 توک/ ثانیه	221.41 توک/ ثانیه

نتیجه گیری

دستگاه های Dell، GIGABYTE و HP Spark با تفاوت های عملکردی ناچیز، با منجر شدن به دسته های خاص کوچک، ارائه می دهند. تصمیمات خرید باید طراحی شاسی، عملکرد حرارتی، گارانتی،و پشتیبانی پس از فروش نسبت به تفاوت های ناچیز در شاخص های مرجعاستراتژی موازی بسیار تاثیر بیشتری نسبت به تغییرات OEM دارد: PP از TP برای نتیجه گیری دسته بندی شده بهتر است، در حالی که TP برای تعامل یک جریان کم تاخیر مناسب است.توصیه NVIDIA به TP با موقعیت Spark به عنوان یک دستگاه یادگیری تعاملی به جای زیرساخت های تولید مطابقت داردیک خوشه دو گره ای اسپارک به عنوان یک پلت فرم آموزشی مقرون به صرفه برای هوش مصنوعی توزیع شده عمل می کند. آزمایشات آینده خوشه های بزرگتر و آموزش مدل کوچک از انتهای به انتهای را پوشش می دهد.در حال انتظار لابراتوار 800Gb جابجا کردن سوئیچ.

شرکت فناوری چینجینگ جیوتونگ پکن، لمیتد
سندي يانگ، مدير استراتژي جهاني
واتساپ / وی چت: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز کسب و کار:
توزیع محصولات ICT / ادغام سیستم و خدمات / راه حل های زیرساخت
با 20+ سال تجربه توزیع فناوری اطلاعات، ما با مارک های پیشرو جهانی همکاری می کنیم تا محصولات قابل اعتماد و خدمات حرفه ای را ارائه دهیم.
استفاده از تکنولوژی برای ساختن یک جهان هوشمند، ارائه دهنده خدمات قابل اعتماد محصولات ICT شما

PREV: بررسی ORICO X50: Thunderbolt 5 Speed در یک محفظه SSD قابل حمل

NEXT: بررسی Seagate IronWolf Pro 32TB: ظرفیت بالای پشته برای Multi-Bay NAS

اطلاعات تماس

Beijing Qianxing Jietong Technology Co., Ltd.

تماس با شخص: Ms. Sandy Yang

تلفن: 13426366826

بررسی NVIDIA DGX Spark Cluster: نتیجه گیری توزیع شده در Dell، GIGABYTE و HP

سرور ذخیره سازی رک

سرور فیوژن هواوی

سرور Poweredge Dell

سرور H3C

سوئیچ های دیتاکام

دستگاه WLAN

روتر بی سیم هوشمند

هارد دیسک HDD

هارد داخلی SSD

کارت گرافیک Geforce

پردازنده CPU اینتل

رم حافظه سرور

سرور ذخیره سازی بازسازی شده

ماژول فرستنده گیرنده SFP

سوئیچ کانال فیبر

بررسی NVIDIA DGX Spark Cluster: نتیجه گیری توزیع شده در Dell، GIGABYTE و HP

بافت شبکه 200 گيگابايت

دلایل جمع آوری جرقه

آزمایش عملکرد: PP در مقابل TP

انتخاب استراتژی موازی

نتایج معیار چند مدل (PP=2)

سری GPT-OSS

لاما ۳.۱ 8B

مدل های میسترال و کوون

خلاصه اوج تولید سیستم های دو طرفه

نتیجه گیری

سرور ذخیره سازی رک

12 Bays 1U Rackmount سرور Lenovo ThinkSystem SR630 Rack Server

ThinkSystem SR250 V2 4SFF Rack Storage Server پردازنده Intel Xeon E-2378G

سرور Intel C621A Rack Storage Server Inspur NF5180M6 1U Rack Mount Server

سرور فیوژن هواوی

FusionServer 5288 V6 4U Rack Server 32 DDR4 DIMM 44 Hard Disk 3.5 اینچی

سرور فوق العاده با چگالی هواوی فیوژن سرور 1U شبکه ذخیره سازی سرور 1288H V5

نسل جدید OceanStor 5310 Huawei Rack Server Hybrid Flash Storage