چالش هاي حوزه کلان داده در دنيا و در كشور ايران: تفاوت میان نسخه‌ها

از OCCC Wiki
پرش به ناوبری پرش به جستجو
(اضافه کردن به قسمت امنیت)
 
(۵ نسخهٔ میانی ویرایش شده توسط یک کاربر دیگر نشان داده نشد)
خط ۲۱: خط ۲۱:
* وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
* وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
* وجود چالش در سخت افزار پردازش و ذخيره سازي
* وجود چالش در سخت افزار پردازش و ذخيره سازي
* توزيع جغرافيايي
* همزمان سازي داده ها
* موارد دیگری در [[چالش واقعی سازمانها در رابطه با کلان داده ها و بررسی دقیقتر مدلهای کلان داده| اینجا]] هم بررسی شده است


= چالش های تحقیقاتی، مدیریتی و حقوقی=
= چالش های تحقیقاتی، مدیریتی و حقوقی=
خط ۳۷: خط ۴۰:
**ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
**ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
* الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
* الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
* عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
* امكان عدم بازگشت سرمايه
* تأمین هزینه:
* تأمین هزینه:
** هزینه بالای نیروی انسانی متخصص و تجهیزات
** هزینه بالای نیروی انسانی متخصص و تجهیزات
خط ۵۵: خط ۶۰:
* عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
* عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
* ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
* ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
* وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
* مقياس بزرگ كار و پيچيدگي  بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
* عدم راه اندازي و احتمال شكست پروژه
* '''در دسترس نبودن داده (NoData Problem)''' دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه  هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.


= لینکهای مرتبط =
= لینکهای مرتبط =
*[[سند خروجي همايش داده هاي عظيم]]
*[[سند خروجي همايش داده هاي عظيم]]

نسخهٔ کنونی تا ‏۱۲ فوریهٔ ۲۰۱۵، ساعت ۰۲:۴۵

چالش های فنی و زیرساختی

  • پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند
    • کند بودن دسترسی به داده ها
    • سربارهای پایگاه داده های رابطه ای
  • جمع آوری داده های عظیم
  • پردازش داده های عظیم
  • به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است:
    • الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست
    • نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی
    • نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN)
    • بهینه سازی ترافیک داده
  • کاستی ابزاری در داده های عظیم:
    • ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند
    • ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
  • برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
    • حفظ محرمانگی
    • تشخیص و جلوگیری از نفوذ
    • کنترل دسترسی
    • پراکنده‌سازی در توزیع داده‌های بزرگ
    • ایجاد گمنامی در پایگاه داده‌ها
  • وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
  • وجود چالش در سخت افزار پردازش و ذخيره سازي
  • توزيع جغرافيايي
  • همزمان سازي داده ها
  • موارد دیگری در اینجا هم بررسی شده است

چالش های تحقیقاتی، مدیریتی و حقوقی

  • تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
  • مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم
  • برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم
  • نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه
  • استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت
  • سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه
  • در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند
  • تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند
  • کاربردهای داده های عظیم هنوز به درستی شناخته و استفاده نشده است
  • داده ها در حال افزایش اند و به صورت داده های کلان تبدیل شده اند . استفاده از این داده ها می تواند مزایای فراوانی را در بر داشته باشد، اما:
    • کمبود امکانات زیرساختی وجود دارد و ذخیره این داده ها به خودی خود یک مسئله قابل توج است
    • هزینه بالای تحقبقات و تأمین زیرساخت های لازم برای داده های عظیم
    • ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
  • الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
  • عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
  • امكان عدم بازگشت سرمايه
  • تأمین هزینه:
    • هزینه بالای نیروی انسانی متخصص و تجهیزات
    • مشکل جذب سرمایه گذار
  • حفظ حریم شخصی افراد
  • نبود و یا نقص قوانین
    • قوانین مالکیت معنوی و حقوق مالکیت فکری
    • قوانین مربوط به تجارت الکترونیک
    • قوانین جرائم و تخلفات سایبری
      • در حوزه مصادیق
      • در حوزه برخورد
  • لایسنس کردن محصولات توسعه یافته در کشور
    • توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها

چالش های مشترک

  • عدم وجود تجربه موفق در حوزه بومي سازي در كشور
  • عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
  • عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
  • ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
  • وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
  • مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
  • عدم راه اندازي و احتمال شكست پروژه
  • در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.

لینکهای مرتبط