کلان داده در میکروسافت با ورود بیگ دیتا در پایگاه داده MS-SQLServer
جایگاه کلان داده در میکروسافت
استفاده از Big Data Cluster در SQL Server 2019 باعث هوشمندسازی تمام دادههای کاربر شده و با تلفیق دادههای ساختاریافته و ساختارنیافته در سراسر منطقه داده، به از میان بردن Siloهای داده کمک میکند. این کلاستر، Microsoft SQL Server را با بهترین راهکارهای منبعباز Big Data ادغام میکند و با استفاده از Apache Spark، Containerهای HDFS با Kubernetes و SQL Server بر کلاسترهای مقیاسپذیر اجرا میگردد. همچنین این کلاستر راهکار ایدهآل Big Data برای هوش مصنوعی، ML،M/R ، Streaming، BI، T-SQL و Spark است. با این اتفاق ورود کلان داده در میکروسافت محقق شده است.
شرکتهای مایکروسافت و اینتل در اکتبر 2019 با استفاده از بارهای کاری ناشی از طرح TPC-DS با مجموعههای بزرگ داده، تست عملکرد و مقیاسپذیری را اجرا نمودند. این مجموعههای داده، دادههای خام ساختاریافته و نیمه ساختاریافته به ارزش 1، 10، 30 و 100 ترابایت تولید میکنند که در Big Data Cluster در Microsoft SQL Server 2019 اجرا میشوند.
TPC-DC نخستین معیار استاندارد صنعت در جهان است که برای سنجش عملکرد سیستم پشتیبانی تصمیمگیری (DSS) شامل Queryها و نگهداری از داده طراحی شده است. این معیار متشکل از 99 عدد Query است. با استفاده از Spark SQL، حجم بزرگی از داده را به دقت بررسی کرده و به سوالات کسبوکار موجود در دنیای واقعی پاسخ میدهد. همچنین پیکربندیهای کلاستر را میآزماید تا CPU، حافظه و I/O را همراه با سیستم عامل و راهکار Big Data به بیشترین بازدهی برساند.
برای اجرای تست عملکرد از 2nd Gen Intel Xeon Scalable processors استفاده شده است. Intel® Xeon® Scalable platform برای مدرنسازی مرکز داده طراحی شده تا بازده عملیاتی را که منجر به بهبود هزینه کل مالکیت (TCO) و بهرهوری بالاتر برای کاربران میشود، بالا ببرد.
نتایج استفاده از Big Data Clusters
معیارهای Big Data Cluster که از TC-DC نشات گرفتهاند، مقیاسپذیری و عملکرد رفرنس Big Data Cluster در Microsoft SQL Server را نشان میدهند. تست انجام شده نشان میدهد که عملکرد، مقیاسی خطی از 1 ترابایت تا 100 ترابایت مجموعه داده را به صورت یکدست در بر میگیرد. به این ترتیب منابع متنوع سیستم به گونهای موثر مورد استفاده قرار میگیرند. استفاده از Big Data Cluster درMicrosoft SQL Server 2019، باعث عملکرد بالای پردازنده (Processor)های Intel® Xeon® و Intel® SSDها شده تا بهترین عملکرد را برای Queryهای پیچیده ارائه دهند. به علاوه، نتایج معیار، قابلیت بالای الاستیکی و عملکرد قوی کل پلتفورم را نشان میدهد.
ترکیب Big Data Cluster در Microsoft SQL Server 2019 و Intel’s Xeon Scalable platform میتواند بسیاری از چالشهای Big Data درکسبوکار را مورد توجه و بررسی قرار دهد. میتوان دادهها را از در مقیاس مختلف از منابع متفاوت، در فرمتهای متنوع داده، با محاسبه Scale-Out برای پردازش داده و یادگیری ماشینی، به همراه تجربه پیشتاز SQL Server در صنعت، تجزیه و تحلیل نمود.
مدیریت سرور پشتیبانی و مشاوره – ثبت دامنه