چالش هاي حوزه کلان داده در دنيا و در كشور ايران
پرش به ناوبری
پرش به جستجو
چالش های فنی و زیرساختی
- پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند
- کند بودن دسترسی به داده ها
- سربارهای پایگاه داده های رابطه ای
- جمع آوری داده های عظیم
- پردازش داده های عظیم
- به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است:
- الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست
- نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی
- نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN)
- بهینه سازی ترافیک داده
- کاستی ابزاری در داده های عظیم:
- ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند
- ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
- برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
- حفظ محرمانگی
- تشخیص و جلوگیری از نفوذ
- کنترل دسترسی
- پراکندهسازی در توزیع دادههای بزرگ
- ایجاد گمنامی در پایگاه دادهها
- وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
- وجود چالش در سخت افزار پردازش و ذخيره سازي
- توزيع جغرافيايي
- همزمان سازي داده ها
- موارد دیگری در اینجا هم بررسی شده است
چالش های تحقیقاتی، مدیریتی و حقوقی
- تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
- مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم
- برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم
- نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه
- استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت
- سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه
- در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند
- تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند
- کاربردهای داده های عظیم هنوز به درستی شناخته و استفاده نشده است
- داده ها در حال افزایش اند و به صورت داده های کلان تبدیل شده اند . استفاده از این داده ها می تواند مزایای فراوانی را در بر داشته باشد، اما:
- کمبود امکانات زیرساختی وجود دارد و ذخیره این داده ها به خودی خود یک مسئله قابل توج است
- هزینه بالای تحقبقات و تأمین زیرساخت های لازم برای داده های عظیم
- ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
- الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
- عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
- امكان عدم بازگشت سرمايه
- تأمین هزینه:
- هزینه بالای نیروی انسانی متخصص و تجهیزات
- مشکل جذب سرمایه گذار
- حفظ حریم شخصی افراد
- نبود و یا نقص قوانین
- قوانین مالکیت معنوی و حقوق مالکیت فکری
- قوانین مربوط به تجارت الکترونیک
- قوانین جرائم و تخلفات سایبری
- در حوزه مصادیق
- در حوزه برخورد
- لایسنس کردن محصولات توسعه یافته در کشور
- توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها
چالش های مشترک
- عدم وجود تجربه موفق در حوزه بومي سازي در كشور
- عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
- عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
- ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
- وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
- مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
- عدم راه اندازي و احتمال شكست پروژه
- در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.