به گزارش سراج24؛ ظهور ابزارهای دیجیتال و استفاده روزانه آنها موجب شده است تا حجم زیادی از دادهها بوجود آید. دردنیای امروز به صورت روزانه حجم بسیار بزرگی از دادهها کلان دادهها تولید میشود که علاوه بر نیاز به ذخیره سازی، نیازمند پردازش و مدیریت نیز هستند. کلان دادهها امروزه به عنصری جدایی ناپذیر در حوزه فناوری اطلاعات و ارتباطات تبدیل شده اند علی الخصوص با توسعه روزافزون شبکههای اجتماعی. قابلیتها و تواناییهای ما برای اندازه گرفتن پدیدههای طبیعی و اجتماعی از طریق دادهها در مقیاسی بی سابقه به سرعت در حال افزایش است.
به عنوان مثال در دهه انسانها گذشته قریب به پنج اگزابایت داده تولید کردهاند، اما امروزه این مقدار داده در کمتر از دو روز تولید میشود و هر دوسال نیز حجم تولید آن دوبرابر میشود. طبیعی است که این میزان رشد در تولید دادهها چالشی برای صنایع، علوم، سیاست، اقتصاد و دیگر حوزههای انسانی از لحاظ محاسبه پذیری و هم ذخیره سازی آنها بوجود می آورد؛ که علاوه بر نیاز به ذخیره سازی، نیازمند پردازش و مدیریت نیز هستند؛ و فناوریهای کلاسیک معمولا در مواجهه با حجم بسیار بزرگ دادهها بسیار کند عمل میکنند.
عبارت (Big Data) «بیگ دیتا» مدتها است که برای اشاره به حجمهای عظیمی از دادهها که توسط سازمانهای بزرگی مانند گوگل یا ناسا ذخیره و تحلیل میشوند مورد استفاده قرار میگیرد. اما به تازگی، این عبارت بیشتر برای اشاره به مجموعههای دادهای بزرگی استفاده میشود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاههای داده سنتی و معمولی قابل مدیریت نیستند. مشکلات اصلی در کار با این نوع دادهها مربوط به برداشت و جمع آوری، ذخیره سازی، جستجو، اشتراک گذاری، تحلیل و نمایش آنها است.
کلان دادهها در ایران در سالهای اخیر رو به رشد بوده و توجه بسیاری از سازمانها و شرکتها را به خود جلب کرده است و باعث رشد فناوری اطلاعات شده زیرا با پیشرفت تکنولوژیهای اطلاعاتی و ارتباطی، زیرساختهای لازم برای جمعآوری، ذخیرهسازی و تحلیل کلان دادهها در حال توسعه است. همچنین صنایع مختلفی از جمله بانکداری، بیمه، تولید، آموزش و بهداشت به دنبال بهرهبرداری از کلان دادهها برای بهبود عملکرد و تصمیمگیریهای استراتژیک هستند. همچنین برخی از دانشگاهها و مراکز تحقیقاتی در ایران به تحقیقات در زمینه کلان دادهها و کاربردهای آن در زمینههای مختلف مشغول هستند و شامل تحلیل دادهها، یادگیری ماشین و هوش مصنوعی نیز میشود. اما با همه این موارد به رغم پیشرفتها، زیرساختهای دادهای وسیع و کارآمد هنوز به طور کامل توسعه نیافته است و بسیاری از سازمانها به دنبال راهکارهایی برای بهبود مدیریت دادهها و تحلیل آنها هستند.از طرفی با مشکلاتی اعم از کمبود نیروی متخصص، عدم دسترسی به دادههای با کیفیت، و نگرانیهای مربوط به حریم خصوصی و امنیت دادهها وجود دارد.
مسئله دیگر این است که با توسعه هوش مصنوعی در جهان این کلان دادهها به صورت دسته بندی شده وجود دارد که میتواند باعث کاربردی سازی هرچه بهتر فناوری هوش مصنوعی شود اما در کشور ما به دلیل ضعف در بخش طبقه بندی دادهها این اقدام در حال حاضر میسر نیست زیرا ما اکنون تنها با حجم عظیمی از کلان دادهها طبقه بندی نشده مواجه است که عملا نمیتواند خروجی خوب و کاربردی برای نهادها و سازمانها و داشته باشد. در حالی که با هوشمندشدن زندگی روزمره و برای ارتقا کیفیت زندگی و در راستای ارتقا رفاه اجتماعی لازم است این کلان دادهها دسته بندی شوند. از آنجا که دادهها جز سرمایه ملی یک کشور محسوب می شود لازم است با انجام سرمایه گذاری های دولتی و خصوصی در جهت سامان دهی هرچه بهتر آنها حرکت کنیم. زیرا با رشد و توسعه هوش مصنوعی در جهان اگر این طبقه بندی و دسته بندیهای صورت نگیرد ما از قافله پرشتاب این فناوری عقب میمانیم.