چالش هاي حوزه کلان داده در دنيا و در كشور ايران: تفاوت میان نسخهها
پرش به ناوبری
پرش به جستجو
بدون خلاصۀ ویرایش |
جز (Javan صفحهٔ چالش هاي حوزه داده هاي عظيم در دنيا و در كشور ايران را به چالش هاي حوزه کلان داده در دنيا و در كشور ايران منتقل کرد: اصلاح نام) |
||
(۲۰ نسخهٔ میانی ویرایش شده توسط ۲ کاربر نشان داده نشد) | |||
خط ۱: | خط ۱: | ||
* آمادگی کشور در مواجهه با پدیده داده های عظیم | = چالش های فنی و زیرساختی = | ||
* پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند | |||
**کند بودن دسترسی به داده ها | |||
**سربارهای پایگاه داده های رابطه ای | |||
* جمع آوری داده های عظیم | |||
* پردازش داده های عظیم | |||
* به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است: | |||
**الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست | |||
** نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی | |||
** نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN) | |||
** بهینه سازی ترافیک داده | |||
* کاستی ابزاری در داده های عظیم: | |||
**ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند | |||
** ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند | |||
* برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها | |||
** حفظ محرمانگی | |||
** تشخیص و جلوگیری از نفوذ | |||
** کنترل دسترسی | |||
** پراکندهسازی در توزیع دادههای بزرگ | |||
** ایجاد گمنامی در پایگاه دادهها | |||
* وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات | |||
* وجود چالش در سخت افزار پردازش و ذخيره سازي | |||
* توزيع جغرافيايي | |||
* همزمان سازي داده ها | |||
* موارد دیگری در [[چالش واقعی سازمانها در رابطه با کلان داده ها و بررسی دقیقتر مدلهای کلان داده| اینجا]] هم بررسی شده است | |||
= چالش های تحقیقاتی، مدیریتی و حقوقی= | |||
* تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط | |||
* مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم | |||
* برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم | * برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم | ||
* نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه | * نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه | ||
* استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت | * استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت | ||
* سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه | * سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه | ||
* در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند | * در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند | ||
* تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند | * تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند | ||
خط ۱۶: | خط ۴۰: | ||
**ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد | **ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد | ||
* الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد | * الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد | ||
* | * عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود | ||
* امكان عدم بازگشت سرمايه | |||
* | |||
* تأمین هزینه: | * تأمین هزینه: | ||
** هزینه بالای نیروی انسانی متخصص و تجهیزات | ** هزینه بالای نیروی انسانی متخصص و تجهیزات | ||
** مشکل جذب سرمایه گذار | ** مشکل جذب سرمایه گذار | ||
*حفظ حریم شخصی افراد | |||
* نبود و یا نقص قوانین | |||
** قوانین مالکیت معنوی و حقوق مالکیت فکری | |||
** قوانین مربوط به تجارت الکترونیک | |||
** قوانین جرائم و تخلفات سایبری | |||
*** در حوزه مصادیق | |||
*** در حوزه برخورد | |||
* لایسنس کردن محصولات توسعه یافته در کشور | |||
** توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها | |||
=چالش های مشترک= | |||
* عدم وجود تجربه موفق در حوزه بومي سازي در كشور | |||
* عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است) | |||
* عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم. | |||
* ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم. | |||
* وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد) | |||
* مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد. | |||
* عدم راه اندازي و احتمال شكست پروژه | |||
* '''در دسترس نبودن داده (NoData Problem)''' دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند. | |||
= لینکهای مرتبط = | |||
*[[سند خروجي همايش داده هاي عظيم]] |
نسخهٔ کنونی تا ۱۲ فوریهٔ ۲۰۱۵، ساعت ۰۲:۴۵
چالش های فنی و زیرساختی
- پایگاه داده های قدیمی و رابطه ای پاسخگوی نیازهای داده های عظیم نیستند
- کند بودن دسترسی به داده ها
- سربارهای پایگاه داده های رابطه ای
- جمع آوری داده های عظیم
- پردازش داده های عظیم
- به واسطه ظهور داده های عظیم الگوی ترافیک شبکه ها در حال تغییر است:
- الگوهایی مانند ترافیک های انفجاری در حال افزایش ااست
- نیاز به تجهیزات مقتضی برای زیرساخت ارتباطی
- نیاز به مدیریت پویا تر شبکه (مانند ساختار های SDN)
- بهینه سازی ترافیک داده
- کاستی ابزاری در داده های عظیم:
- ابزارهای موجود مانند هادوپ، در عین اینکه استفاده زیادی دارند، دارای مشکلات فراوانی نیز هستند، برای مثال دربرخی موارد مانند سرعت پردازش کارآمدی لازم را ندارند
- ابزارهای موجود برای کارایی لازم را برای تمامی امور ندارند
- برقراری امنیت با توجه به حجم زیاد داده ها و تراکنش ها
- حفظ محرمانگی
- تشخیص و جلوگیری از نفوذ
- کنترل دسترسی
- پراکندهسازی در توزیع دادههای بزرگ
- ایجاد گمنامی در پایگاه دادهها
- وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات
- وجود چالش در سخت افزار پردازش و ذخيره سازي
- توزيع جغرافيايي
- همزمان سازي داده ها
- موارد دیگری در اینجا هم بررسی شده است
چالش های تحقیقاتی، مدیریتی و حقوقی
- تحقیقات و توسعه در این حوزه با توجه به چند وجهی بودن و پیچیدگی دانش مرتبط
- مشخص نبودن میزان نسبی آمادگی کشور در مواجهه با پدیده داده های عظیم
- برنامه ریزی و اجرای آن برای مواجهه با داده ای عظیم
- نحوه پیاده سازی صحیح و هدفمند داده های عظیم در کمترین زمان ممکن در کشورهای در حال توسعه
- استفاده از شبکه های اجتماعی و داده های عظیم تولید شده در آن برای تجارت
- سرمایه گذاری کلان در بخش داده های عظیم و جذب سرمایه
- در فضایی که داده های عظیم مطرح می شود، شرکت ها چگونه باید با آن برخورد کنند
- تولید حجم زیاد داده در کشورها در حالی که بسیاری هنوز آمادگی و دانش مدیریت آن را ندارند
- کاربردهای داده های عظیم هنوز به درستی شناخته و استفاده نشده است
- داده ها در حال افزایش اند و به صورت داده های کلان تبدیل شده اند . استفاده از این داده ها می تواند مزایای فراوانی را در بر داشته باشد، اما:
- کمبود امکانات زیرساختی وجود دارد و ذخیره این داده ها به خودی خود یک مسئله قابل توج است
- هزینه بالای تحقبقات و تأمین زیرساخت های لازم برای داده های عظیم
- ارزش واقعی داده های عظیم درک نشده و لذا برنامه ای برای بهره برداری و استفاده از آن وجود ندارد
- الگوی مشخصی از تولید و استفاده کلان داده وجود ندارد
- عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
- امكان عدم بازگشت سرمايه
- تأمین هزینه:
- هزینه بالای نیروی انسانی متخصص و تجهیزات
- مشکل جذب سرمایه گذار
- حفظ حریم شخصی افراد
- نبود و یا نقص قوانین
- قوانین مالکیت معنوی و حقوق مالکیت فکری
- قوانین مربوط به تجارت الکترونیک
- قوانین جرائم و تخلفات سایبری
- در حوزه مصادیق
- در حوزه برخورد
- لایسنس کردن محصولات توسعه یافته در کشور
- توسعه محصولات داخلی بر پایه محصولاتی با لایسنس متن باز (مانند GPL، BSDF و انواع مشابه) بدون داشتن دانش و شناخت کافی از این لایسنس ها
چالش های مشترک
- عدم وجود تجربه موفق در حوزه بومي سازي در كشور
- عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
- عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
- ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.
- وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
- مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
- عدم راه اندازي و احتمال شكست پروژه
- در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.