مشخصات DapuStor J5060
| J5060 | |
|---|---|
| ظرفیت (TB) | 61.44 |
| فاکتور فرم | U.2 15mm |
| رابط | PCIe 4.0 x4، NVMe 1.4a، پشتیبانی از دو پورت |
| پهنای باند خواندن / نوشتن (128K) MB / s | 7400 / 3000 |
| خواندن / نوشتن تصادفی (4KB) K IOPS | 1500 / 30 (16KB) |
| 4K Random Latency (Typ.) R/W μs | 105 (4KB) / 33 (16KB) |
| تاخیر توالی 4K (معمول) R/W μs | 7 (4KB) / 12 (16KB) |
| قدرت معمولی (W) | 23 |
| قدرت در حالت بیکار (W) | 5 |
| نوع فلش | 3D Enterprise QLC NAND فلاش |
| استقامت | 0.5 DWPD |
| MTBF | 2 میلیون ساعت |
| UBER | 1 بخش در هر 10 ^ 17 بیت خوانده شده |
| تضمین | 5 سال |
DapuStor J5060 عملکرد
چک پوینت
برای ارزیابی عملکرد دنیای واقعی SSD Dapustor J5060 در محیط های آموزش هوش مصنوعی، ما از ابزار معیار داده و ورودی / خروجی یادگیری (DLIO) استفاده کردیم.,DLIO به طور خاص برای آزمایش الگوهای I / O در بارهای کاری یادگیری عمیق طراحی شده است. این بینش را در مورد چگونگی مدیریت چالش های سیستم های ذخیره سازی مانند چک پوینت، مصرف داده،و آموزش مدلنمودار زیر نشان می دهد که چگونه هر دو درایو فرآیند را در 99 نقطه چک مدیریت می کنند. هنگام آموزش مدل های یادگیری ماشین، نقاط چک برای ذخیره حالت مدل به طور دوره ای ضروری هستند.جلوگیری از از دست دادن پیشرفت در هنگام وقفه یا قطع برقاین تقاضا برای ذخیره سازی نیاز به عملکرد قوی دارد، به ویژه تحت بار کاری مداوم یا فشرده.
پلتفرم انتخاب شده برای این کار Dell PowerEdge R760 ما بود که Ubuntu 22 را اجرا می کرد.04.02 LTS. ما از نسخه 2.0 معیار DLIO از نسخه 13 اوت 2024 استفاده کردیم. پیکربندی سیستم ما در زیر بیان شده است:
- 2 x Intel Xeon Gold 6430 (32-Core، 2.1GHz)
- 16 x 64GB DDR5-4400
- ۴۸۰ گیگابایت دی اس دی دِل باس
- کابل های سریال Gen5 JBOF
- 61.44TB Dapustor J5060
- 61.44 ترابايت سوليدگيم D5-P5336
برای اطمینان از این که سنجش مقایسه ای ما سناریوهای دنیای واقعی را منعکس می کند، ما آزمایشات خود را بر اساس معماری مدل LLAMA 3.1 405B انجام دادیم. ما از چک پوینت با استفاده از torch.save ((() برای گرفتن پارامترهای مدل استفاده کردیم،حالت بهینه سازیسیستم ما یک سیستم 8GPU را شبیه سازی کرد، استراتژی موازی ترکیبی را با موازی تنسور 4 طرفه و پردازش موازی لوله 2 طرفه توزیع شده در 8 GPU اجرا می کند..این پیکربندی منجر به اندازه نقاط بازرسی 1636 گیگابایت شد، که نماینده نیازهای آموزش مدل زبان بزرگ مدرن است.
به طور کلی، Dapustor J5060 در طول مرحله اولیه آزمایش ثابت ثابت بود، با زمان در حدود 575.66 ثانیه برای 33 نقطه بررسی اول.5060J قادر به حفظ عملکرد بالاتر قبل از اینکه درایو برای اولین بار پر شداز سوی دیگر، Solidigm P5336، در حالی که در ابتدا آهسته تر از J5060 بود، عملکرد ثابت را نشان داد.
چه موقعبا توجه به میانگین کل، Dapustor J5060 زمان769.44 ثانیه، در حالی که Solidigm P5336 به پایان رسید 640.17 ثانیه. اين باعث ميشه که سوليديگم P5336 از نظر سريع تر کردن بازرسي نقاط جلوتر باشه
به طور کلی، Dapustor J5060 عملیات کوتاه مدت را به خوبی انجام می دهد اما با نوشتن طولانی مدت بیش از 30 دقیقه مبارزه می کند.Solidigm P5336 بهترین درایو برای عملکرد ثابت در طول کارهای طولانی استاین عملکرد ضعیف نوشتن از Dapustor J5060 هنگامی که سرعت چکپوائنتیشن آن در ادامه آزمایش بدتر می شود، آشکار است.
حافظه ی مستقیم گپ
GPU Direct Storage یک فناوری است که امکان انتقال مستقیم داده بین دستگاه های ذخیره سازی و GPU ها را فراهم می کند، بدون نیاز به CPU و حافظه سیستم. در انتقال داده های سنتی،داده ها از ذخیره سازی به حافظه CPU خوانده می شوند و سپس به حافظه GPU کپی می شونداین فرآیند شامل کپی های متعدد داده است که منجر به افزایش تاخیر و کاهش عملکرد می شود. CPU به عنوان یک گلوی فشرده عمل می کند، زیرا باید انتقال داده بین ذخیره سازی و GPU را مدیریت کند.GDS این تنگنایی را از بین می برد و به طور مستقیم به دستگاه های ذخیره سازی اجازه می دهد تا داده ها را از و به حافظه GPU منتقل کنند..
ما به طور سیستماتیک هر ترکیبی از پارامترهای زیر را در هر دو بار کار خواندن و نوشتن آزمایش کردیم:
- اندازه بلوک: 1M، 128K، 16K
- عمق: 128, 64, 32, 16, 8, 4, 1
در حالی که ما نتایج GDSIO را بررسی می کنیم، عملکرد خواندن و نوشتن ۶۱٫۴۴TB Dapustor J5060 و Solidigm P5336 را بررسی می کنیم.
عملکرد خواندن توالی GDSIO
Dapustor J5060 حداکثر خروجی خواندن 4.2 GiB / s را در یک بلوک 1M با عمق IO 64 و 128 به دست می آورد. در کوچکترین بلوک (16K) ، عملکرد از 0.1 GiB / s تا 0.8 GiB/s با افزایش عمق IOاین نشان می دهد که ترجیح واضح برای بلوک های بزرگتر با عمق IO بالا برای خروجی بهینه است. حداکثر عملکرد در بلوک های بزرگ به دست می آید،نشان دهنده بهره وری درایو در پردازش انتقال داده های انبوه.
در مقایسه، Solidigm P5336 به حداکثر خروجی مشابه 4 رسید.3 GiB/s در همان اندازه بلوک (1M) اما این عملکرد را در عمق IO 32 به دست آورد و آن را به طور مداوم در عمق IO بالاتر حفظ کرداین نشان می دهد که کمی کارایی بهتر در رسیدگی به اندازه بلوک های بزرگ در طیف گسترده ای از عمق های IO برای Solidigm P5336 است.
برای ارائه یک نمای مقایسه ای بهتر، ما یک نمودار تمایزی داریم که هر دو درایو را مقایسه می کند. یک بلوک سایه سبز نشان می دهد یک مزیت از SSD Dapustor،در حالی که یک بلوک که به سمت سمت قرمز حرکت می کند نشان دهنده ضعف استدر اینجا، J5060 از P5336 در اندازه بلوک 128K به جز عمق های 4 تا 8 IO برتر است. با این حال، کاهش سرعت در عمق های IO بالاتر با اندازه بلوک 16K و 1M مشاهده می شود.نشان دهنده بهره وری کمتر در این سناریوها.
در مقایسه تاخیر خواندن متوالی ، Solidigm P5336 به طور مداوم تاخیر کمتری نسبت به Dapustor J5060 در تقریباً همه اندازه های بلوک و عمق IO حفظ می کند. در اندازه بلوک 16K ،شکاف با افزایش عمق صف بیشتر می شود: J5060 در عمق 2329 μs در عمق 128 ، در حالی که P5336 در عمق 1365 μs پایین تر است. در 128K ، Solidigm دوباره در اکثر عمق ها ، به استثنای بار های بالا (4,080 μs در J5060 در مقابل 5539 μs در P5336) در عمق 128در اندازه بلوک 1M، هر دو درایو افزایش تاخیر را تجربه می کنند، اما P5336 کمی بهتر کنترل می شود، با 29.138 μs در مقابل 29.512 μs در بالاترین عمق صف.
عملکرد نوشتن دنباله ای GDSIO
Dapustor J5060 یک سرعت نوشتن ثابت 2.7 تا 2.8 GiB / s را برای 128K و 1M اندازه بلوک در سراسر تمام عمق IO نشان می دهد (به جز 128K ، اندازه عمق IO 1 ، که 2.2GiB / s را ثبت کرد. برای اندازه بلوک 16K ،محدوده عملکرد از 0.5 GiB/s تا 1.4 GiB/s، بسته به عمق IO، اوج در 1.4 GiB/s در عمق IO بالاتر.
در مقایسه، Solidigm P5336 در اندازه بلوک 128K و 1M عملکرد بهتری دارد و حداکثر 3.2GiB / s است. برای اندازه بلوک های کوچکتر (16K) ، Solidigm P5336 همچنین عملکرد بالاتر را نشان می دهد.به اوج 1 می رسد..4 GiB / s در عمق IO 16 تا 64 این نشان می دهد که Solidigm P5336 با اندازه بلوک های کوچکتر در طول عملیات نوشتن کمی کارآمدتر است.
در حال حرکت به یک دیدگاه تفاوتی، ما یک شکاف بزرگتر بین Dapustor J5060 و عملکرد نوشتن Solidigm P5336 می بینیم.مقايسه توليدات ما نشان ميده که J5060 در بيشتر مناطق از P5336 عقب مي ماند، به ویژه با اندازه بلوک های بزرگ (1M) در تمام عمق های IO. کاهش سرعت در عمق های 4 IO به -0.5 GiB / s می رسد. در حالی که در عمق های IO بالاتر با اندازه بلوک های 128K عملکرد افزایش می یابد،آنها به اندازه کافی قابل توجه نیستند تا عملکرد پایین تر را جبران کنند..
وقتی تاخیر نوشتن متوالی بین Dapustor J5060 و Solidigm P5336 را مقایسه می کنیم، هر دو درایو رفتار مشابهی در بلوک های کوچکتر مانند 16K نشان می دهند،با Solidigm نگه داشتن یک لبه کمی در عمق پایین IO، در حالی که Dapustor شکاف را در عمق های بالاتر (64 و 128) کاهش می دهد. در اندازه بلوک 128K، Solidigm دوباره در عمق صف کم منجر می شود،اما داپستور به طور مداوم تاخیر کمتری را با افزایش عمق IO ارائه می دهدبا این حال، با اندازه بلوک 1M، Solidigm یک مزیت تاخیر واضح را در تمام عمق های IO حفظ می کند.نشان دهنده زمان پاسخ به طور قابل توجهی سریع تر تحت بار سنگین نوشتن دنباله ایبه طور کلی، Solidigm به طور مداوم عملکرد بیشتری دارد، در حالی که قدرت Dapustor در بلوک های متوسط و صف های عمیق تر بیشتر دیده می شود.
خلاصه بار کار FIO
تست کننده I/O انعطاف پذیر (FIO) یک ابزار سنجش استاندارد صنعت است که برای اندازه گیری عملکرد دستگاه های ذخیره سازی تحت طیف گسترده ای از سناریوهای بار کار استفاده می شود.به خاطر انعطاف پذیری و قابلیت اطمینان قابل اعتماد است، FIO شرایط دنیای واقعی را شبیه سازی می کند و بینش هایی را در مورد قابلیت ها و محدودیت های عملکرد SSD ارائه می دهد.,و IOPS در سراسر الگوهای حجم کار، اندازه بلوک، و عمق صف.
بار کاری اعمال شده:
- 128K خواندن و نوشتن دنباله ای
- 64K خواندن و نوشتن تصادفی
- 16K به صورت تصادفی می خواند و می نویسد
- خواندن و نوشتن تصادفی 4K
این حجم کار طیف گسترده ای از موارد استفاده از شرکت را نشان می دهد، از جمله انتقال دنباله دار بزرگ، I / O تصادفی فشرده معمول پایگاه داده ها،و دسترسی های تصادفی بلوک کوچک که معمولا در محیط های مجازی دیده می شود.
این بخش عملکرد عملکرد Dapustor J5060 را در باره بار های کاری کلیدی مصنوعی، از جمله عملیات خواندن / نوشتن دنباله دار و تصادفی در اندازه های مختلف بلوک و عمق صف خلاصه می کند.متریک ها به طور مستقیم از خروجی فیلو تجزیه شده استخراج می شوند و شامل پهنای باند (MB / s) هستند، IOPS، و درصد تاخیر تا 99.9999٪، ارائه بینش در هر دو throughput و رفتار دم تحت بار.
128K عملکرد خواندن و نوشتن متوالی
| درایو | عمق رشته/IO | BW (MB/s) | IOPS | 99. ٪ | 99.9 درصد | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 خوانده شده | 1T/64Q | 7,482 | 57,081 | 1.66 ms | 2.02 ms | 2.83ms |
| Solidigm P5336 خواندن | 1T/64Q | 7,479 | 57,057 | 1.51 ms | 1.66 ms | 1.81 ms |
| Dapustor J5060 بنویسید | 1T/16Q | 3,023 | 23,063 | 0.69 ms | 0.69 ms | 0.70 ms |
| Solidigm P5336 نوشتن | 1T/16Q | 3,364 | 25,669 | 2.67 میلیمتر | 3.48ms | 4.42ms |
Dapustor J5060 عملکرد خواندن دنباله ای چشمگیر را در 128K ارائه می دهد و حتی در درصد های بالاتر، با کنترل تأخیر دقیق، به 7.48GB / s می رسد.J5060 ′s از طریق اساسا همان است (7.48GB / s در مقابل 7.47GB / s). با این حال، Solidigm یک لبه کوچک در ثبات تاخیر را حفظ می کند و تاخیر دم کمی پایین تر را نشان می دهد.
در 128 کیلو متری نوشتن متوالی (QD16) ، J5060 با تاخیر بسیار کم به عملکرد قوی 3,023MB / s دست می یابد. با این حال Solidigm P5336 این را با حاشیه متوسط، به 3,364MB / s می رسد.اگرچه با تاخیر قابل توجهی بیشتراین نشان می دهد که J5060 کاندیدای قوی تری برای سناریوهای نوشتن دنباله ای حساس به تاخیر است.
64K عملکرد خواندن و نوشتن تصادفی
| درایو | عمق | BW (MB/s) | IOPS | 99. ٪ | 99.9 درصد | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 خوانده شده | 8T/32Q | 7,475 | 114,058 | 20.05 ms | 21.89 ms | 25.82ms |
| Solidigm P5336 خواندن | 8T/32Q | 7,472 | 114,014 | 21.36 ms | 21.89 ms | 22.68 میلیمتر |
| Dapustor J5060 بنویسید | 8T/32Q | 534 | 8,151 | 574.6 ms | 708.8 ms | 742.39 میلیمتر |
| Solidigm P5336 نوشتن | 8T/32Q | 857 | 13,070 | 196.1 ms | 208.6 ms | 221.24ms |
در خواندن تصادفی 64K (QD256) ، Dapustor J5060 با سرعت نزدیک به 7.4GB / s و تاخیر به خوبی کنترل شده برجسته است.با کمی بهتر حداکثر درصد تاخیر. هر دو درایو عملکرد استثنایی در اینجا، با حداقل تفاوت های عملی.
عملکرد نوشتن در 64K تصادفی جایی است که J5060 به طور قابل توجهی مبارزه می کند، با کاهش سرعت به شدت به 534MB / s و افزایش تاخیر به طور قابل توجهی (742.39ms در 99.99٪). در مقایسه،Solidigm P5336 به طور قابل توجهی از J5060 بهتر است، ارائه 857MB / s و تاخیر به شدت پایین تر (221.24ms در همان درصد) ، باعث می شود که آن را بسیار مناسب تر برای برنامه های کاربردی حساس به تاخیر و سرعت نوشتن پایدار است.
16K عملکرد خواندن و نوشتن تصادفی
| درایو | عمق | BW (MB/s) | IOPS | 99. ٪ | 99.9 درصد | 99.99% |
|---|---|---|---|---|---|---|
| Dapustor J5060 خوانده شده | 8T/32Q | 7,430 | 453,461 | 5.28 ms | 6.39 میلیمتر | 8.16 ms |
| Solidigm P5336 خواندن | 8T/32Q | 7,431 | 453,527 | 5.01ms | 5.21ms | 5.47 میلیمتر |
| Dapustor J5060 بنویسید | 8T/32Q | 531 | 32,404 | 143.65 ms | 149.94 ms | 181.40 ms |
| Solidigm P5336 نوشتن | 8T/32Q | 847 | 51,724 | 57.9 ms | 65.8 ms | 71.8 ms |
در 16K بار کار خواندن تصادفی (QD256) ، Dapustor با 453K IOPS و تأخیر کنترل شده نتایج بسیار خوبی را به دست می آورد.کمی از Dapustor در طول طول طول می کشد (5.47ms در مقابل 8.16ms در 99.99٪ ، نشان می دهد که ثبات تاخیر کمی بهتر برای Solidigm در سناریوهای خواندن تصادفی سنگین است.
عملکرد نوشتن تصادفی 16K Dapustor SSD به طور قابل توجهی به 32K IOPS کاهش می یابد و تاخیر به 181.4ms (99.99٪) افزایش می یابد.تحویل 51.7K IOPS و مشخصات تاخیر به طور چشمگیری بهبود یافته (71.8ms در 99.99٪) ، که بر مزیت Solidigm برای بار های کاری نوشتن تصادفی حساس به تاخیر تاکید می کند.
شرکت فناوری چینجینگ جیوتونگ پکن، لمیتد
سندي يانگ، مدير استراتژي جهاني
واتساپ / وی چت: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز کسب و کار:
توزیع محصولات ICT / ادغام سیستم و خدمات / راه حل های زیرساخت
با 20+ سال تجربه توزیع فناوری اطلاعات، ما با مارک های پیشرو جهانی همکاری می کنیم تا محصولات قابل اعتماد و خدمات حرفه ای را ارائه دهیم.
استفاده از تکنولوژی برای ساختن یک جهان هوشمند، ارائه دهنده خدمات قابل اعتماد محصولات ICT شما



