StorageReview با محاسبه عدد پی به ۳۱۴ تریلیون رقم شگفتانگیز، تاج محاسباتی معتبر را دوباره به دست آورد و رکورد جهانی قبلی را در هم شکست. مسابقه مدرن برای دقت عدد پی از آزمایشهای اولیه ابری به نمایشگاهی تمام عیار از توانایی زیرساخت و نبوغ مهندسی تکامل یافته است.
در سال ۲۰۲۲، گوگل کلود با محاسبه عدد پی به ۱۰۰ تریلیون رقم، خبرساز شد. این پروژه با استفاده از ناوگان عظیمی از نمونههای ابری برای اجرای برنامه y-cruncher، دهها پتابایت داده ورودی/خروجی مصرف کرد. در آن زمان، این نقطه عطف به عنوان معیار قطعی برای حداکثر تواناییهای زیرساخت سنتی محسوب میشد.
سپس تمرکز به محیطهای آزمایشگاهی داخلی منتقل شد. در اوایل سال ۲۰۲۴، سیستم خود را ارتقا دادیم تا با پشتیبانی نزدیک به ۱ پتابایت درایو SSD QLC Solidigm، رکورد جدید ۱۰۵ تریلیون رقم را ثبت کنیم. این دستاورد یک معیار مقیاس جدید را ایجاد کرد و ثابت کرد که یک ماشین داخلی واحد میتواند کارایی استثنایی ارائه دهد. تنها چند ماه بعد، مرزها را بیشتر به سمت ۲۰۰ تریلیون رقم گسترش دادیم. این پیشرفت تأیید کرد که ذخیرهسازی فلش با چگالی بالا، همراه با تنظیم دقیق سیستم، میتواند برای این بار کاری خاص و بسیار پرتقاضا، از زیرساخت ابری هایپرسکیل بهتر عمل کند.
طبیعتاً هر رکورد، چالشی را دعوت میکند. Linus Media Group و KIOXIA متعاقباً با محاسبه عدد پی به ۳۰۰ تریلیون رقم، این عنوان را به دست آوردند. راهاندازی آنها به یک خوشه ذخیرهسازی مشترک Weka مجهز به ۲ پتابایت فضای ذخیرهسازی فلش متکی بود. در حالی که این امر پتانسیل زیرساخت سنتی سنگین ذخیرهسازی را نشان داد، اما با مصالحههای قابل توجهی همراه بود: یک رک کامل سختافزار، مصرف برق قابل توجه و نیازهای خنککننده پیچیده. ما مصمم بودیم که این رکورد را بدون چالش نگذاریم.
امروز، StorageReview مفتخر است که پیروزی جدید خود را اعلام کند: محاسبه عدد پی به ۳۱۴ تریلیون رقم. این شاهکار با استفاده از یک سرور ۲U واحد Dell PowerEdge R7725، مجهز به پردازندههای دوگانه AMD EPYC با ۱۹۲ هسته و چهل درایو SSD Micron 6550 Ion با ظرفیت ۶۱.۴۴ ترابایت انجام شد. ما ساخت و تنظیم سیستم را در ماه جولای تکمیل کردیم و اجرای محاسبه را در ۳۱ جولای ۲۰۲۵ آغاز کردیم. به طور اتفاقی، این اجرا در روز دوم SC25 به پایان رسید و این رکورد جدید محاسبات با کارایی بالا (HPC) را هرچه بهموقعتر کرد.
مقیاسبندی y-cruncher به ۳۱۴ تریلیون رقم
هنگامی که مقیاس محاسبه از صدها تریلیون رقم فراتر میرود، y-cruncher از یک معیار سنتی به یک تست استرس زیرساخت طولانی و طاقتفرسا تبدیل میشود. منطق اصلی برنامه ساده باقی میماند، اما تعامل آن با سختافزار در این مقیاس عامل تعیینکننده میشود. کل عملیات به توانایی سیستم برای اجرای روان هزاران عملیات با دقت بالا بستگی دارد - بدون اینکه پردازندهها را متوقف کند یا لایه ذخیرهسازی را تحت فشار قرار دهد. در واقع، این رکورد جدید واقعاً در لایه ذخیرهسازی به دست آمد.
ما ۴۰ درایو SSD NVMe Micron 6550 Ion Gen5 را مستقر کردیم که ۳۴ مورد از آنها به طور انحصاری برای اجرای y-cruncher اختصاص داده شده بود. این استخر SSD تقریباً ۲.۱ پتابایت فضای قابل استفاده را فراهم میکند و به y-cruncher فضای ذخیرهسازی کافی را برای محاسبه و پردازش ۳۱۴ تریلیون رقم عدد پی میدهد. ۶ درایو SSD باقیمانده در یک حجم نرمافزاری RAID10 پیکربندی شدهاند که به طور خاص برای ذخیره نتایج نهایی ۳۱۴ تریلیون رقمی استفاده میشوند.
بهبودهای طراحی بین نسل شانزدهم و هفدهم سرورهای Dell PowerEdge نیز نقش کلیدی در افزایش عملکرد این اجرای رکورد ۳۱۴ تریلیون رقمی ایفا کردند. تلاش قبلی ما برای ۲۰۰ تریلیون رقم از Dell PowerEdge R760 با ۲۴ جایگاه استفاده کرد که دارای سوئیچ PCIe در صفحه پشتی درایو بود - تراکم درایو را برای عملکرد بهبود یافته مبادله میکرد. در مقابل، سرورهای PowerEdge نسل هفدهم، مانند R770 مبتنی بر اینتل و R7725 مبتنی بر AMD، دارای صفحات پشتی با طراحی فقط اتصال مستقیم هستند که ۲ یا ۴ خط PCIe در هر جایگاه ارائه میدهند.
PowerEdge R7725، مجهز به صفحه پشتی ۴۰ جایگاهی Gen5 E3.S، ۲ خط PCIe در هر اسلات SSD ارائه میدهد. در حالی که این ممکن است در ظاهر یک مبادله عملکرد بالقوه به نظر برسد، این پلتفرم همچنان میتواند سرعتهای چشمگیری را ارائه دهد: تا ۲۸۰ گیگابایت بر ثانیه عملکرد خواندن و نوشتن همزمان در صورت استفاده کامل از ۴۰ جایگاه.
با استفاده از بنچمارک داخلی ذخیرهسازی y-cruncher، عملکرد ذخیرهسازی هر پلتفرم را در پیکربندی مربوطه اندازهگیری کردیم. در تمام بارهای کاری، ما بهبود عملکرد ذخیرهسازی را از ۷۲٪ تا ۳۸۳٪ مشاهده کردیم، با معیارهای خواندن و نوشتن متعادل - که برتری سرور PowerEdge نسل هفدهم را برای محاسبات فشرده ذخیرهسازی در مقیاس بالا تثبیت میکند.
| معیار | سیستم ۲۰۲ تریلیون (رکورد قبلی) | سیستم ۳۱۴ تریلیون (رکورد جدید) | تفاوت درصدی (۳۱۴ تریلیون در مقابل ۲۰۲ تریلیون) |
|---|---|---|---|
| نوشتن ترتیبی | ۴۷.۰ گیگابایت بر ثانیه | ۱۰۷ گیگابایت بر ثانیه | +۱۲۷.۷٪ |
| خواندن ترتیبی | ۵۶.۷ گیگابایت بر ثانیه | ۱۲۷ گیگابایت بر ثانیه | +۱۲۴.۰٪ |
| نوشتن آستانه با گام | ۶۲.۲ گیگابایت بر ثانیه | ۱۰۷ گیگابایت بر ثانیه | +۷۲.۰٪ |
| خواندن آستانه با گام | ۲۰.۹ گیگابایت بر ثانیه | ۱۰۱ گیگابایت بر ثانیه | +۳۸۳.۳٪ |
Dell PowerEdge R7725 بسیار بیشتر از یک نیروگاه ذخیرهسازی است؛ این دستگاه به عنوان یک پلتفرم دو سوکته AMD Turin با پتانسیل محاسباتی استثنایی میدرخشد. ما سیستم خود را با پردازندههای AMD EPYC 9965 با ۱۹۲ هسته مجهز کردیم که در مجموع ۳۸۴ هسته را ارائه میدهد. برای باز کردن این عملکرد، ما راهحل خنککننده هوای استاندارد را به صفحات سرد CoolIT SP5 با خنککننده مایع ارتقا دادیم که توسط یک واحد توزیع خنککننده مایع به هوا (CDU) CoolIT AHx10 خنک میشود.
این ارتقاء خنککننده استراتژیک سه مزیت کلیدی را به همراه داشت: این امکان را به پردازندهها داد تا سرعتهای کلاک بالا و پایدار را حفظ کنند، فنهای شاسی سرور را با PWM (مدولاسیون عرض پالس) قابل توجهی پایین نگه داشت و اطمینان حاصل کرد که مصرف برق متوسط سیستم در حدود ۱۶۰۰ وات ثابت باقی میماند.بهینهسازی نرمافزار و سیستمبرای لایه نرمافزار، ما از شیوههای گذشته فاصله گرفتیم و Ubuntu 24.04.2 LTS Server را به جای Windows Server انتخاب کردیم. این تصمیم در به حداکثر رساندن پایداری سیستم و دستیابی به افزایش قابل توجه در عملکرد بار کاری، ابزار بود.قبل از شروع اجرای رکورد، ما تکرارهای آزمایشی دقیقی را انجام دادیم و پیکربندی را تنظیم کردیم. یک مرحله حیاتی، رزرو ۴ هسته از ۳۸۴ هسته موجود برای عملیاتهای پسزمینه حیاتی سیستم بود، که اطمینان حاصل میکرد رشتههای محاسباتی اصلی بدون مانع باقی بمانند. نتیجه؟ ما فقط رکورد قبلی عدد پی را شکستیم - ما آن را در هر معیار قابل اندازهگیری در هم کوبیدیم. اجرای ما از نظر عملکرد، بهرهوری انرژی و مهمتر از همه، قابلیت اطمینان بینقص، بینظیر است. ما به طور منحصر به فرد مفتخریم که تنها تلاش در مقیاس بزرگ برای رکورد جهانی عدد پی را با صفر زمان از کار تکمیل کردهایم؛ محاسبه بدون وقفه از ابتدا تا انتها اجرا شد بدون اینکه نیازی به از سرگیری داشته باشد.بهرهوری انرژی رکوردشکنیک اصل اساسی در پشت هر تلاش برای ثبت رکورد عدد پی توسط StorageReview، به حداقل رساندن پیچیدگی سیستم و بهینهسازی برای بهرهوری انرژی بوده است. رکورد قبلی ۳۰۰ تریلیون رقم به یک خوشه ذخیرهسازی توزیع شده با شبکه پرسرعت متکی بود که ذاتاً بودجههای بزرگتر برق و خنککننده را طلب میکرد.
در طول محاسبه کامل ۳۱۴ تریلیون رقمی، Dell PowerEdge R7725 ما در مجموع ۴۳۰۴.۶۶۲ کیلووات ساعت مصرف کرد. این معادل ۱۳.۷۰ کیلووات ساعت فوقالعاده در هر تریلیون رقم است - که راهحل ما را در میان کارآمدترین محاسبات عدد پی در مقیاس بزرگ قرار میدهد. تضاد آشکار بین رویکرد کارآمد و تک سرور ما و روش خوشه توزیع شده پرمصرف بلافاصله مشخص است، همانطور که در جدول مقایسه زیر نشان داده شده است.
اجراکل کیلووات ساعتهزینه در $۰.۱۲/کیلووات ساعت
هزینه در $۰.۲۰/کیلووات ساعتاجرای خوشه Weka ۳۰۰ تریلیون۳۳,۶۰۰ کیلووات ساعت (تخمینی)$۴,۰۳۲$۶,۷۲۰اجرای تک سرور ۳۱۴ تریلیون۴,۳۰۴.۶۶۲ کیلووات ساعت
$۵۱۷
$۸۶۱
این نکته مهم است که در طول محاسبه ۳۱۴ تریلیون رقمی خود، ما از درایوهای SSD در پیکربندی JBOD (فقط مجموعهای از دیسکها) استفاده کردیم که شامل مقاومت در برابر خطای داده داخلی نمیشود. این تصمیم توسط دو اولویت اصلی هدایت شد: بهینهسازی مصرف برق و به حداکثر رساندن عملکرد کلی سیستم. با این حال، این امر همچنین گفتگوی مهمی را در مورد تطبیق راهحلهای ذخیرهسازی با نیازهای خاص بار کاری در دست راهاندازی برانگیخت. هر بار کاری منحصر به فرد است - برخی را میتوان با حداقل تأثیر بر عملیات راهاندازی مجدد کرد و بنابراین به همان سطح بالای تحمل خطا مانند وظایف حیاتی نیاز ندارند. در مورد ما، ما بر حفاظت از خروجی نهایی داده از طریق یک راهاندازی RAID نرمافزاری سنتی تمرکز کردیم و از یکپارچگی ارقام عدد پی رکوردشکن اطمینان حاصل کردیم بدون اینکه کارایی سیستم را به خطر بیندازیم.۱۱۰ روز زمان اجرای بدون وقفهعلیرغم محاسبه ارقام بیشتر از هر تلاش قبلی برای ثبت رکورد عدد پی، زمان اجرای ساعت دیواری ما به طور قابل توجهی کوتاهتر از معیار قبلی بود. رکورد قبلی ۳۰۰ تریلیون رقم تقریباً ۲۲۵ روز کل برای تکمیل نیاز داشت - معادل ۱۷۵ روز محاسباتی واقعی با حذف زمان از کار. در مقابل، اجرای ۳۱۴ تریلیون رقمی ما ۱۱۰ روز عملیات بدون وقفه را به دست آورد. این پایداری استثنایی را میتوان به چهار عامل کلیدی نسبت داد: یک سیستم عامل قوی و پایدار، حداقل بار کاری پسزمینه برای جلوگیری از رقابت منابع، یک توپولوژی NUMA (دسترسی به حافظه غیر یکنواخت) متعادل برای ارتباط بهینه پردازنده-حافظه، و یک آرایه موقت که به طور خاص برای مدیریت الگوهای دسترسی داده منحصر به فرد تولید شده توسط y-cruncher در این مقیاس بیسابقه مهندسی شده است.
نکات فنی: ۱۴۸,۳۵۶,۶۳۵,۶۰۶,۲۶۳,۵۰۴ (۱۳۲ پیبی): ۳۱۴,۰۰۰,۰۰۰,۰۰۰,۰۰۰سختافزار مورد استفاده: Dell PowerEdge R7725 با ۲ پردازنده AMD EPYC 9965، ۱.۵ ترابایت DRAM DDR5، ۴۰ عدد Micron 61.44TB 6550 Ion
| نرمافزار و الگوریتمها | : y-cruncher v0.8.6.9545، Chudnovsky | فرسودگی SSD بر اساس SMART | : ۷.۳PB نوشته شده در هر درایو یا ۲۴۹.۱۱PB در ۳۴ درایو SSD مورد استفاده برای مبادله |
|---|---|---|---|
| بزرگترین نقطه بازرسی منطقی | : ۸۵۰,۵۳۸,۳۸۵,۰۶۴,۹۹۲ (۷۷۴ تیبی) | حداکثر استفاده منطقی از دیسک | : ۱,۶۰۵,۹۶۰,۵۲۰,۶۳۶,۴۴۰ (۱.۴۳ پیبی) |
| بایتهای خوانده شده منطقی دیسک | : ۱۴۸,۳۵۶,۶۳۵,۶۰۶,۲۶۳,۵۰۴ (۱۳۲ پیبی) | بایتهای نوشته شده منطقی دیسک | : ۱۲۶,۶۵۸,۸۰۵,۱۹۵,۷۷۶,۶۰۰ (۱۱۲ پیبی) |
تاریخ شروع
: پنجشنبه ۳۱ جولای ۱۷:۱۶:۴۱ ۲۰۲۵
تاریخ پایان
: سهشنبه ۱۸ نوامبر ۰۵:۵۷:۰۸ ۲۰۲۵
- عدد پی: ۸۷۹۳۲۲۳.۱۴۴ ثانیه، ۱۰۱.۷۷۳ روز
- کل زمان محاسبه: ۹۲۷۴۸۷۸.۵۸۰ ثانیه
- زمان از ابتدا تا انتها: ۹۴۶۳۲۲۶.۴۵۴ ثانیه
- افکار پایانیبرای دههها، محاسبات شدید عدد پی به عنوان نمایشی از تواناییهای محاسباتی عمل کرده است و "آهن بزرگ" هر دوره در مرکز توجه قرار گرفته است. رکوردهای اولیه به دسکتاپهای با کارایی بالا و آرایههای ذخیرهسازی خارجی متکی بودند؛ سپس تمرکز به تجهیزات سازمانی داخلی منتقل شد. اخیراً، مسابقه به ابر مهاجرت کرد، جایی که ابتکاراتی مانند اجرای ۱۰۰ تریلیون رقمی گوگل نشان داد که نیروی خام - مجهز به هزاران نمونه و توان عملیاتی عظیم ورودی/خروجی - میتواند یک رکورد را تضمین کند. سپس شاهد ظهور خوشههای ذخیرهسازی مشترک بزرگ بودیم که موازیسازی خام را بر سادگی اولویت میدادند، اما با هزینه مصرف برق قابل توجه و نیازهای خنککننده پیچیده.
- سفر ما مسیر مخالف را طی کرده است. در طول اجراهای متوالی ثبت رکورد، ما بار کاری y-cruncher را به عنوان یک وظیفه حیاتی و طولانی مدت HPC در نظر گرفتهایم - نه یک نمایش یکباره. کمپینهای ۱۰۵ تریلیون و ۲۰۰ تریلیون رقم در شناسایی گلوگاههای اصلی نقش اساسی داشتند: بهینهسازی ظرفیت ذخیرهسازی موقت، اطمینان از بار کاری پایدار پردازنده بدون تحت فشار قرار دادن لایه ورودی/خروجی، و سختسازی سیستم برای ارائه عملکرد قابل اعتماد در طول ماهها. اجرای ۳۱۴ تریلیون رقم اوج آن تخصص به سختی به دست آمده است. این صرفاً یک عدد بزرگتر نیست؛ بلکه نشاندهنده یک طراحی بالغتر و درجه تولید است.دادهها خودشان صحبت میکنند. ما مانع ۳۰۰ تریلیون رقمی را بر روی یک سرور ۲U واحد Dell PowerEdge R7725، مجهز به ۴۰ درایو SSD Micron 6550 Ion و پردازندههای دوگانه AMD EPYC با ۱۹۲ هسته، در هم شکستیم. سیستم به مدت ۱۱۰ روز متوالی بدون نقص کار کرد و محاسبه را بدون یک وقفه یا راهاندازی مجدد تکمیل کرد. توان عملیاتی ذخیرهسازی بیش از دو برابر پلتفرم ۲۰۰ تریلیون رقمی ما بود، با این حال سرور میانگین مصرف برق متوسط ۱۶۰۰ وات را حفظ کرد، با مصرف کل انرژی فقط ۴۳۰۵ کیلووات ساعت. این معادل ۱۳.۷۰ کیلووات ساعت بسیار کارآمد در هر تریلیون رقم است - کسری از برق تخمینی استفاده شده توسط خوشه قبلی ۳۰۰ تریلیون رقم. به طور خلاصه، ما با گرههای کمتر، پیچیدگی کمتر و هزینههای انرژی کمتر، کار بیشتری انجام دادیم.
- اهمیت این رکورد فراتر از حق لاف زدن است. اگر یک سرور تجاری ۲U واحد بتواند بار کاری این بزرگی را با چنین قابلیت اطمینان و کارایی حفظ کند، اصول معماری مشابه مستقیماً به محاسبات علمی دنیای واقعی ترجمه میشود. مدلهای آب و هوایی طولانی مدت، شبیهسازیهای فیزیک با دقت بالا، خطوط لوله ژنومیک و مشاغل آموزش هوش مصنوعی در مقیاس بزرگ همه به عناصر اساسی یکسان متکی هستند: عملکرد متعادل ورودی/خروجی، مدیریت حرارتی قابل پیشبینی، سفتافزار پایدار و معماری ساخته شده برای کار مداوم برای ماهها. پلتفرم ما اکنون ثابت کرده است که میتواند این اصول اساسی را تحت چالشبرانگیزترین شرایط ارائه دهد.شرکت فناوری پکن Qianxing Jietong
- سندی یانگ/مدیر استراتژی جهانی واتساپ / ویچت: +۸۶ ۱۳۴۲۶۳۶۶۸۲۶
- ایمیل: yangyd@qianxingdata.com وبسایت: www.qianxingdata.com/www.storagesserver.com
- تمرکز تجاری: توزیع محصولات ICT/یکپارچهسازی سیستم و خدمات/راهحلهای زیرساخت
- با بیش از ۲۰ سال تجربه توزیع IT، ما با برندهای پیشرو جهانی همکاری میکنیم تا محصولات قابل اعتماد و خدمات حرفهای ارائه دهیم. "استفاده از فناوری برای ساختن دنیایی هوشمند" ارائهدهنده خدمات محصولات ICT مورد اعتماد شما!
اطلاعات تماس
Beijing Qianxing Jietong Technology Co., Ltd.
تماس با شخص: Ms. Sandy Yang
تلفن: 13426366826



