چالش هاي حوزه کلان داده در دنيا و در كشور ايران: تفاوت میان نسخه‌ها

از OCCC Wiki
پرش به ناوبری پرش به جستجو
 
(۱۴ نسخهٔ میانی ویرایش شده توسط ۲ کاربر نشان داده نشد)
خط ۱۴: خط ۱۴:
** ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
** ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
* برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
* برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
** حفظ محرمانگی
** تشخیص و جلوگیری از نفوذ
** کنترل دسترسی
** پراکنده‌سازی در توزیع داده‌های بزرگ
** ایجاد گمنامی در پایگاه داده‌ها
* وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
* وجود چالش در سخت افزار پردازش و ذخيره سازي
* توزيع جغرافيايي
* همزمان سازي داده ها
* موارد دیگری در [[چالش واقعی سازمانها در رابطه با کلان داده ها و بررسی دقیقتر مدلهای کلان داده| اینجا]] هم بررسی شده است


= چالش های تحقیقاتی و مدیریتی =
= چالش های تحقیقاتی، مدیریتی و حقوقی=
* تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
* تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
* مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم  
* مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم  
خط ۳۰: خط ۴۰:
**ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
**ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
* الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
* الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
* عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
* امكان عدم بازگشت سرمايه
* تأمین هزینه:
* تأمین هزینه:
** هزینه بالای نیروی انسانی متخصص و تجهیزات
** هزینه بالای نیروی انسانی متخصص و تجهیزات
** مشکل جذب سرمایه گذار
** مشکل جذب سرمایه گذار
*حفظ حریم شخصی افراد
* نبود و یا نقص قوانین
** قوانین مالکیت معنوی و حقوق مالکیت فکری
** قوانین مربوط به تجارت الکترونیک
** قوانین جرائم و تخلفات سایبری
*** در حوزه مصادیق
*** در حوزه برخورد
* لایسنس کردن محصولات توسعه یافته در کشور
** توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها
=چالش های مشترک=
* عدم وجود تجربه موفق در حوزه بومي سازي در كشور
* عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
* عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
* ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
* وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
* مقياس بزرگ كار و پيچيدگي  بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
* عدم راه اندازي و احتمال شكست پروژه
* '''در دسترس نبودن داده (NoData Problem)''' دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه  هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.
= لینکهای مرتبط =
*[[سند خروجي همايش داده هاي عظيم]]

نسخهٔ کنونی تا ‏۱۲ فوریهٔ ۲۰۱۵، ساعت ۰۲:۴۵

چالش های فنی و زیرساختی

  • پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند
    • کند بودن دسترسی به داده ها
    • سربارهای پایگاه داده های رابطه ای
  • جمع آوری داده های عظیم
  • پردازش داده های عظیم
  • به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است:
    • الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست
    • نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی
    • نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN)
    • بهینه سازی ترافیک داده
  • کاستی ابزاری در داده های عظیم:
    • ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند
    • ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
  • برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
    • حفظ محرمانگی
    • تشخیص و جلوگیری از نفوذ
    • کنترل دسترسی
    • پراکنده‌سازی در توزیع داده‌های بزرگ
    • ایجاد گمنامی در پایگاه داده‌ها
  • وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
  • وجود چالش در سخت افزار پردازش و ذخيره سازي
  • توزيع جغرافيايي
  • همزمان سازي داده ها
  • موارد دیگری در اینجا هم بررسی شده است

چالش های تحقیقاتی، مدیریتی و حقوقی

  • تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
  • مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم
  • برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم
  • نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه
  • استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت
  • سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه
  • در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند
  • تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند
  • کاربردهای داده های عظیم هنوز به درستی شناخته و استفاده نشده است
  • داده ها در حال افزایش اند و به صورت داده های کلان تبدیل شده اند . استفاده از این داده ها می تواند مزایای فراوانی را در بر داشته باشد، اما:
    • کمبود امکانات زیرساختی وجود دارد و ذخیره این داده ها به خودی خود یک مسئله قابل توج است
    • هزینه بالای تحقبقات و تأمین زیرساخت های لازم برای داده های عظیم
    • ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
  • الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
  • عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
  • امكان عدم بازگشت سرمايه
  • تأمین هزینه:
    • هزینه بالای نیروی انسانی متخصص و تجهیزات
    • مشکل جذب سرمایه گذار
  • حفظ حریم شخصی افراد
  • نبود و یا نقص قوانین
    • قوانین مالکیت معنوی و حقوق مالکیت فکری
    • قوانین مربوط به تجارت الکترونیک
    • قوانین جرائم و تخلفات سایبری
      • در حوزه مصادیق
      • در حوزه برخورد
  • لایسنس کردن محصولات توسعه یافته در کشور
    • توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها

چالش های مشترک

  • عدم وجود تجربه موفق در حوزه بومي سازي در كشور
  • عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
  • عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
  • ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
  • وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
  • مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
  • عدم راه اندازي و احتمال شكست پروژه
  • در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.

لینکهای مرتبط