چالش هاي حوزه کلان داده در دنيا و در كشور ايران

از OCCC Wiki
پرش به ناوبری پرش به جستجو

چالش های فنی و زیرساختی

  • پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند
    • کند بودن دسترسی به داده ها
    • سربارهای پایگاه داده های رابطه ای
  • جمع آوری داده های عظیم
  • پردازش داده های عظیم
  • به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است:
    • الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست
    • نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی
    • نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN)
    • بهینه سازی ترافیک داده
  • کاستی ابزاری در داده های عظیم:
    • ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند
    • ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
  • برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
    • حفظ محرمانگی
    • تشخیص و جلوگیری از نفوذ
    • کنترل دسترسی
    • پراکنده‌سازی در توزیع داده‌های بزرگ
    • ایجاد گمنامی در پایگاه داده‌ها
  • وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
  • وجود چالش در سخت افزار پردازش و ذخيره سازي
  • توزيع جغرافيايي
  • همزمان سازي داده ها
  • موارد دیگری در اینجا هم بررسی شده است

چالش های تحقیقاتی، مدیریتی و حقوقی

  • تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
  • مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم
  • برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم
  • نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه
  • استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت
  • سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه
  • در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند
  • تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند
  • کاربردهای داده های عظیم هنوز به درستی شناخته و استفاده نشده است
  • داده ها در حال افزایش اند و به صورت داده های کلان تبدیل شده اند . استفاده از این داده ها می تواند مزایای فراوانی را در بر داشته باشد، اما:
    • کمبود امکانات زیرساختی وجود دارد و ذخیره این داده ها به خودی خود یک مسئله قابل توج است
    • هزینه بالای تحقبقات و تأمین زیرساخت های لازم برای داده های عظیم
    • ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
  • الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
  • عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
  • امكان عدم بازگشت سرمايه
  • تأمین هزینه:
    • هزینه بالای نیروی انسانی متخصص و تجهیزات
    • مشکل جذب سرمایه گذار
  • حفظ حریم شخصی افراد
  • نبود و یا نقص قوانین
    • قوانین مالکیت معنوی و حقوق مالکیت فکری
    • قوانین مربوط به تجارت الکترونیک
    • قوانین جرائم و تخلفات سایبری
      • در حوزه مصادیق
      • در حوزه برخورد
  • لایسنس کردن محصولات توسعه یافته در کشور
    • توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها

چالش های مشترک

  • عدم وجود تجربه موفق در حوزه بومي سازي در كشور
  • عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
  • عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
  • ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
  • وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
  • مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
  • عدم راه اندازي و احتمال شكست پروژه
  • در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.

لینکهای مرتبط