درباره Big Data بیشتر بدانید

BigData

بیگ دیتا (Big Data) یک اصطلاح رایج است که در فارسی به آن “کلان داده” هم می گویند. که در دسترس بودن آن باعث رشد ساختارمند یک سازمان می شود. در واقع بیگ دیتا به مجموعه داده های عظیمی گفته می شود که تحلیل آن توسط یک فرد یا یک نرم افزار ساده امکان پذیر نیست در صورتی که تحلیل دقیق و منطقی این داده ها باعث تصمیم گیری های بهتر و هدفمند کردن فعالیت های یک کسب و کار از جمله فروش محصول، تبلیغات، کمپین ها و رویدادهای مختلف و همچنین باعث کاهش هزینه و ریسک تا حد بسیار زیادی می شود. در صورتی که بیگ دیتا همواره متغییر است و به طور روز افزون رشد می کند، تکنیک ها و استراتژی تحلیل آن نیز با همان روند در حال به روز شدن است. تحلیل بیگ دیتا امروزه به اندازه دسترسی و استفاده از اینترنت اهمیت دارد. به زبان ساده به اطلاعات با سرعت بالا، انواع زیاد و در حجم عظیم که باعث کاهش هزینه و ریسک می شود و از طرفی نیازمند روش و استراتژی خاص برای استخراج داده های مورد نیاز و هدفمند است اطلاق می شود.

ویژگی های بیگ دیتا به اصطلاح “V” گفته می شود که آن را به عنوان 3V یا 5V یاد می کنند. که پنج ویژگی آن را به اختصار توضیح می دهیم.

1- مقدار (Volume) : به مقدار و اندازه داده های تولید شده، گردآوری شده و ذخیره شده که در حجم زیاد تلقی شود  که باعث کاهش هزینه شود.

2- گوناگونی (Variety) : گوناگونی داده ها به شکل عددی، اطلاعات سنتی، صدا و ایمیلی و … است  که می تواند در دسته بندی مالی، اقتصادی و مدریتی و … نیز قرار گیرد. این تنوع داده ها به تحلیلگران کمک لازم را می کند که با استفاده مناسب نتیجه هدفمندی داشته باشند.

3- سرعت (Velocity) : در مورد این ویژگی باید گفت، سرعت تولید و پردازش داده ها در راستای برآورده کردن خواسته ها و چالش های پیش رو که در مسیر توسعه و رشد قرار دارند. سرعت داده های تولید شده در سال 2010 به میزان تمامی اطلاعاتی بود که تا سال 2003 تولید شده بود و مواجه شدن با چنین حجم اطلاعاتی که روزافزون به طور سرسام آور تولید و ذخیره می شود برای تمام سازمان ها و تحلیلگران به چالشی بزرگ تبدیل شده است.

4- تغییر پذیری (Variability) : یکی از مشکلاتی که در مواجه با بیگ دیتا مورد اهمیت است، تغییرات در داده های ورودیست، بدین معنی که هرگونه تغییر داده باعث عدم تطابق و ناپایداری داده می شود و هرچه این ناپایداری داده ها بیشتر باشد کنترل و مدیریت آن دشوارتر می شود.

5- اطمینان (Veracity) : کیفیت داده های ذخیره شده می تواند به قدری متفاوت باشد که تاثیر شدیدی بر تحلیل دقیق بگزارد.

نوشته های مشابه