برای بسیاری از شرکت ها، انبار داده از یک دارایی استراتژیک به یک بار عملیاتی تبدیل شده است. پلتفرمهای اختصاصی قدیمی مانند Teradata، همراه با سرویسهای انحصاری ابری مانند Snowflake، مقیاسپذیری و عملکرد را ارائه دادهاند – اما به قیمت قفل شدن فروشنده، قیمتهای پیشبینینشده، و سازگاری معماری محدود.
با تشدید بررسی نظارتی و تبدیل شدن تجزیه و تحلیل مبتنی بر هوش مصنوعی به مزیت رقابتی، سازمانها در حال ارزیابی مجدد هستند که آیا پلتفرمهای انبار فعلی آنها واقعاً با اهداف بلندمدت تجاری همسو هستند یا خیر.
EDB Postgres® AI (EDB PG AI) با WarehousePG، یک انبار داده منبع باز و در مقیاس پتابایت که برای بازیابی کنترل، پیش بینی پذیری و حاکمیت داده ها ساخته شده است، به طور مستقیم با این چالش ها مقابله می کند - همه بدون به خطر انداختن عملکرد. WarehousePG که بر روی Postgres ساخته شده و برای تجزیه و تحلیل های موازی عظیم طراحی شده است، روشی مدرن برای رهایی از سیستم های محدودکننده ارائه می دهد و در عین حال هزینه کل مالکیت (TCO) را تا 58 درصد کاهش می دهد.
منبع باز، تجزیه و تحلیل مقیاس پتابایت با Postgres در هسته آن
انبارهای داده سازمانی اکنون فراتر از محدودیت های طراحی اولیه خود کشیده شده اند. مجموعه دادههای اندازه پتابایت، نیازهای استقرار ترکیبی، الزامات حاکمیت داده، و تجزیه و تحلیل مبتنی بر هوش مصنوعی، همگی در محیطهای تولیدی وجود دارند که هم عملکرد استثنایی و هم انعطافپذیری معماری را میطلبد.
پلتفرمهای اختصاصی سنتی و انبارهای صرفاً ابری برای برآورده کردن این خواستهها بهطور همزمان تلاش میکنند، و سازمانها را مجبور میکنند تا بین هزینه، کنترل و عملکرد، معاوضه ایجاد کنند.
EDB Postgres AI برای WarehousePG این شکاف را با ارائه یک انبار داده کاملاً منبع باز و در مقیاس پتابایت ساخته شده بر روی Postgres پر می کند. برای تجزیه و تحلیل با کارایی بالا، هوش مصنوعی در پایگاه داده و استقرار انعطاف پذیر در محیط های داخلی، ابری و ترکیبی طراحی شده است، محدودیت های سیستم های قدیمی و انحصاری ابر را برطرف می کند.
معماری: MPP مبتنی بر Postgres در مقیاس
معماری پردازش موازی انبوه WarehousePG (MPP) به آن اجازه می دهد تا در صدها گره بزرگ شود. به جای تکیه بر یک مدل مقیاس پذیر تک سرور، هم داده ها و هم اجرای پرس و جو را در گره های چند بخش توزیع می کند که توسط یک گره هماهنگ کننده مرکزی نظارت می شود.
هماهنگ کننده تجزیه پرس و جو، بهینه سازی و برنامه ریزی اجرا را مدیریت می کند. هنگامی که یک طرح پرس و جو نهایی شد، وظایف به بخش ها توزیع می شود که به طور موازی بر روی پارتیشن های داده محلی خود عمل می کنند. این رویکرد WarehousePG را قادر میسازد تا به طور موثر پرس و جوهای تحلیلی پیچیده را اجرا کند - از جمله اتصالات بزرگ، تجمعها، توابع پنجره و تبدیلها - در مجموعه دادههای مقیاس پتابایت.
این معماری تنگناهای ذاتی پایگاههای داده یکپارچه را از بین میبرد و در عین حال سازگاری کامل SQL با Postgres را حفظ میکند و منحنی یادگیری را برای تیمهای داده موجود بسیار کاهش میدهد.
عملکرد قابل پیش بینی بدون محدودیت اختصاصی
برخلاف انبارهای بومی ابری که بر قیمت گذاری مبتنی بر مصرف و مدیریت منابع غیرشفاف متکی هستند، WarehousePG رفتار بار کاری قطعی و عملکرد ثابت را ارائه می دهد. تخصیص منابع و اجرای پرس و جو به طور کامل در داخل خوشه کنترل می شود و زمان پاسخگویی ثابت را حتی تحت بارهای کاری تحلیلی مختلط تضمین می کند.
WarehousePG به عنوان یک راه حل دارای مجوز Apache 2.0 که بر روی Postgres منبع باز ساخته شده است، شرکت ها را از قالب های ذخیره سازی اختصاصی و موتورهای اجرایی کنترل شده توسط فروشنده آزاد می کند. دادهها در هر جایی که سازمان به آن نیاز داشته باشد، کاملاً قابل دسترسی، قابل حمل و استقرار باقی میماند - در محل برای انطباق با مقررات، در ابر عمومی برای انعطافپذیری، یا در تنظیمات ترکیبی برای بهینهسازی هزینه.
این استقلال معماری، همراه با قیمتگذاری مبتنی بر هسته EDB، کاهش 58 درصدی TCO را امکانپذیر میکند – بهویژه برای سازمانهایی که از پلتفرمهای اختصاصی پرهزینه یا انبارهای ابری غیرقابل پیشبینی مهاجرت میکنند.
ذخیره سازی ترکیبی و دسترسی SQL به دریاچه های داده
محیط های تحلیلی مدرن به طور فزاینده ای در سطوح مختلف ذخیره سازی پخش می شوند. WarehousePG از طریق چارچوب افزونه پلتفرم خود (PXF) به این موضوع می پردازد، که دسترسی مستقیم SQL به داده های خارجی ذخیره شده در فروشگاه های شی و سیستم های فایل توزیع شده، مانند Amazon S3 و سیستم فایل توزیع شده Hadoop (HDFS) را امکان پذیر می کند.
با PXF، مهندسان داده می توانند فرمت هایی مانند Parquet، AVRO، JSON و CSV را بدون کپی کردن داده ها در انبار جستجو کنند. این به طور قابل توجهی پیچیدگی ETL و افزونگی ذخیره سازی را کاهش می دهد در حالی که یک استراتژی ترکیبی "داده های گرم و سرد" را فعال می کند: مجموعه داده هایی که اغلب به آنها دسترسی دارند در حافظه با کارایی بالا WarehousePG باقی می مانند، در حالی که داده هایی که به ندرت استفاده می شوند در ذخیره سازی اشیاء کم هزینه قرار می گیرند.
از نقطه نظر فنی، این رویکرد معنایی SQL را در لایههای ذخیرهسازی متنوع حفظ میکند و به تیمهای تحلیلی اجازه میدهد با یک مدل داده منطقی واحد کار کنند.
دریافت بلادرنگ با FlowServer
خطوط لوله فقط دسته ای دیگر برای بسیاری از موارد استفاده تحلیلی کافی نیستند. WarehousePG شامل یک جزء اختصاصی FlowServer برای هضم داده ها در زمان واقعی و تقریباً واقعی است.
FlowServer از پخش رویدادهای با توان بالا از پلتفرم هایی مانند Apache Kafka و RabbitMQ پشتیبانی می کند و موارد استفاده مانند تجزیه و تحلیل عملیاتی، تشخیص تقلب و نظارت در زمان واقعی را امکان پذیر می کند. سازمانها با وارد کردن مستقیم دادههای جریانی به انبار، تأخیر بین سیستمهای عملیاتی و بینشهای تحلیلی را حذف میکنند.
این معماری به حجم کاری جریانی و دستهای اجازه میدهد در یک پلتفرم تحلیلی یکسان وجود داشته باشند، زیرساختها را ساده کرده و حرکت دادهها را کاهش میدهد.
هوش مصنوعی، ML، و پردازش برداری در پایگاه داده
یکی از ویژگی های کلیدی EDB Postgres AI برای WarehousePG پشتیبانی آن از تجزیه و تحلیل درون پایگاه داده و هوش مصنوعی است که نیاز به انتقال مجموعه داده های بزرگ به پلتفرم های یادگیری ماشین خارجی (ML) را از بین می برد.
WarehousePG MADlib را برای یادگیری ماشینی مبتنی بر SQL ادغام می کند و به کاربران اجازه می دهد مدل ها را مستقیماً در پایگاه داده با استفاده از ساختارهای رابطه ای آشنا آموزش داده و امتیاز دهند. برای موارد استفاده پیشرفتهتر، این پلتفرم از چارچوبهای پایتون ML درون پایگاه داده پشتیبانی میکند و دانشمندان داده را قادر میسازد تا در مقیاس بدون صادرات داده کار کنند.
پشتیبانی بردار بومی از طریق پسوند pgvector جستجوی شباهت، جستجوی معنایی و بارهای کاری تولید افزوده شده با بازیابی (RAG) را مستقیماً در انبار فعال می کند. این قابلیت برای برنامههای مبتنی بر هوش مصنوعی که دادههای سازمانی ساختیافته را با محتوای بدون ساختار مانند اسناد و گزارشها ترکیب میکنند، به طور فزایندهای حیاتی میشود.
WarehousePG با متمرکز کردن داده ها، تجزیه و تحلیل و هوش مصنوعی پیچیدگی خط لوله را کاهش می دهد و زمان بینش را سرعت می بخشد.
در دسترس بودن بالا و آمادگی سازمانی
WarehousePG برای قابلیت اطمینان در سطح تولید طراحی شده است. در دسترس بودن بالا از طریق هماهنگ کننده آماده به کار به دست می آید و در صورت خرابی هماهنگ کننده اولیه، عملکرد بدون وقفه را تضمین می کند. تحمل خطا در سطح بخش به بارهای کاری اجازه می دهد حتی زمانی که گره های جداگانه در دسترس نیستند به اجرا ادامه دهند.
ویژگیهای سازمانی شامل مدیریت حجم کار، زمانبندی پرس و جو قابل پیشبینی، و مشاهدهپذیری جامع، تضمین عملکرد پایدار تحت تقاضای تحلیلی سنگین است.
مهمتر از همه، سازمان ها به پشتیبانی 24 ساعته از کارشناسان Postgres EDB دسترسی پیدا می کنند و شکاف بین انعطاف پذیری منبع باز و نیازهای عملیاتی سازمان را پر می کنند.
مهاجرت بدون اختلال
برای سازمانهایی که از پلتفرمهای تحلیلی قدیمی مدرنسازی میشوند، WarehousePG مسیری کمخطر به پیش ارائه میدهد. بارهای کاری موجود Greenplum را می توان از طریق یک مبادله باینری انتقال داد، که امکان نوسازی سریع را بدون بازنویسی پرس و جو یا بازآموزی تیم ها فراهم می کند. برابری بالا SQL همچنین مهاجرت از دیگر انبارهای داده اختصاصی مبتنی بر SQL را ساده می کند.
این رویکرد به شرکتها اجازه میدهد تا به صورت تدریجی مدرن شوند و تداوم کسبوکار را حفظ کنند و در عین حال کنترل روی پشته تحلیلی خود را دوباره به دست آورند.
بازسازی انبار برای تجزیه و تحلیل مدرن
EDB PG AI برای WarehousePG ثابت می کند که تجزیه و تحلیل در مقیاس پتابایت، آمادگی هوش مصنوعی و حاکمیت داده ها نیازی به پلت فرم های اختصاصی یا قفل ابری ندارند. WarehousePG با ترکیب سازگاری Postgres، مقیاسپذیری MPP، ذخیرهسازی ترکیبی، قابلیتهای بلادرنگ و قابلیتهای هوش مصنوعی و ML درون پایگاه داده، پایهای از لحاظ فنی قوی برای تجزیه و تحلیلهای سازمانی مدرن ارائه میدهد.
برای سازمان هایی که به دنبال انبار داده ای هستند که کنترل معماری، عملکرد قابل پیش بینی و اقتصاد منبع باز را در اولویت قرار دهد، WarehousePG یک جایگزین قانع کننده و مطمئن برای آینده ارائه می دهد.
پکن Qianxing Jietong Technology Co., Ltd.
سندی یانگ / مدیر استراتژی جهانی
WhatsApp / WeChat: +86 13426366826
ایمیل: yangyd@qianxingdata.com
وب سایت: www.qianxingdata.com/www.storagesserver.com
تمرکز تجاری:
توزیع محصول ICT/یکپارچه سازی سیستم و خدمات/راه حل های زیرساخت
با بیش از 20 سال تجربه توزیع فناوری اطلاعات، ما با برندهای پیشرو جهانی برای ارائه محصولات قابل اعتماد و خدمات حرفه ای همکاری می کنیم.
«استفاده از فناوری برای ساختن جهانی هوشمند» ارائهدهنده خدمات مورد اعتماد شما در زمینه فناوری اطلاعات و ارتباطات!