برنامه ریزی در حوزه کلان داده

از OCCC Wiki
پرش به ناوبری پرش به جستجو
  • از جمله مسائل مهمی که در حال حاضر در حوزه کلان داده مطرح است، این است که چگونه میتوان برای فعالیت در این حوزه در کشور برنامه ریزی راهبردی انجام داد و اصولا نوع نگاه به مسائل کلان داده باید چگونه باشد؟ آیا با موضوع جدیدی مواجه هستیم که نیازمند برنامه ریزی متفاوتی است یا اینکه این مساله در ادامه سیر تکاملی فناوری های مدیریت داده نمایان شده است؟


اقدامات پیشنهادی

بر اساس هم اندیشی انجام شده با حدود 30 نفر از اساتید و متخصصیص فعال در حوزه کلان داده در طی 3 جلسه، رویکردهایی برای برنامه ریزی در این حوزه پیشنهاد شده است که در ادامه ارایه شده است. هر پیشنهاد در جای خود جای بحث و بررسی دارد، ضمن اینکه شما نیز میتوانید موارد پیشنهادی خود را به این لیست اضافه نمایید:

پیشنهادات راهبردی

این موارد شامل اقدامات و پیشنهاداتی است که جهت دهی های کلی در حوزه کلان داده را در دراز مدت مشخص می کنند:

  • ایجاد اکوسیستم بومی کلان داده (استانداردسازي شامل ايجاد فهم مشترك، شناخت نيازمنديها و ايجاد مدل مرجع و تكسونومي کلان داده و ايجاد نقشه راه فناوري در كشور در حوزه کلان داده)
    • رويكرد اثرگذاري به جاي اثرپذيري با شروع از ايجاد اكوسيستم
    • ایجاد ارتباط بين عوامل مؤثر در چرخه (صنعت، دانشگاه و كاربران پاياني و...) بر اساس مدل دانش آزاد
    • شناخت نیازهای واقعی، ایجاد زمینه های پژوهشی و برنامه ریزی برای تولید محصولات مورد نیاز
    • حمايت از پروژه ها و پايان نامه هاي اين حوزه
  • استفاده از زيرساختهاي موجود:
    • مثال اجرایی: همگرایی با برنامه قطب فناوری های مرتبط با رایانش ابری در مرکز تحقیقات مخابرات جهت حمایت از توسعه راهکارهای بومی
    • ارتقا و تأمين زيرساختهاي مورد نياز (بسترهاي ارتباطي، ذخيره سازي و پردازشي و ...)
    • تجهيز آزمايشگاهها و فراهم كردن بستر سخت افزاري مناسب در اين زمينه
  • آينده پژوهي
  • آسیب شناسی توسعه فناوری در کشور از طریق شناخت تجربیات و الگوهای موفق، شناخت تجربیات و الگوهای ناموفق به منظور بهره برداری در حوزه کلان داده
  • ایجاد سازوکاری جهت اندازه گیری میزان ارزش استخراج شده از داده های موجود در کشور با روش های سنتی فعلی و روش های مدرن پیشنهادی
  • بررسی ارتباط موضوع با حوزه شرکت های دانش بنیان و چگونگی ورود به این حوزه
  • بررسی ارتباط موضوع با نهادهای مختلف نظیر شورای عتف و نحوه اثرگذاری
  • لزوم مشاوره در عرصه مديريت فناوري يا MOT
  • لزوم بررسی مسایل مرتبط با امنیت (هم از بعد چالشی خود کلان داده نظیر حریم خصوصی و هم از بعد کاربرد کلان داده نظیر کشف تقلب و کشف جرم و ...)
  • برنامه ريزي به سمت دانش آزاد: ايجاد فرآيندهاي مورد نياز براي تعامل صنعت و دانشگاه براي ايجاد كارگروهاي مختلف داده هاي عظيم بر اساس مدلهاي open data و جامعه آزاد (براي جلوگيري از انحصار). مثال: http://data.gov (پلتفرم دسترسی به مجموعه داده های صنایع مختلف)

پیشنهادات عملیاتی

این موارد شامل پیشنهادات و اقداماتی است که می بایست در راستای موارد راهبردی مشخص شده در حوزه کلان داده اجرا شوند:

  • ایجاد کارگروه هایی تخصصی تر جهت برگزاری جلسات منظم و انجام ارایه های تخصصی توسط عوامل درگیر جهت تبادل نظر و رسیدن به یک زبان مشترک : ارایه های تخصصی برای اینکه اثربخش باشند نباید محدود به یک همایش باشد و بجای آن باید بصورت مستمر در جلسات هم اندیشی وجود داشته باشد. در جلسات هم اندیشی هم نباید صرفا مباحثات پراکنده انجام شود و باید فرآیندی جهت ثبت و پردازش مباحثات بصورت مستمر وجود داشته باشد. مثال: http://bigdatawg.nist.gov/home.php
  • شناخت مدل راهبری فناوری های حوزه کلان داده و ارتباط آن با دیگر فناوری ها در کشورهای دیگر (در سطوح آکادمیک / صنعتی و حاکمیتی)
  • شناسایی شرکت های فعال در حوزه کلان داده و شناخت مسائل و نیازمندی ها
  • اولویت دهی محورها بر اساس کاربردهای مطرح در کشور
  • لزوم توجيه مسئولین و مديران ارشد و میانی شركت هاي بزرگ و سازمانها
  • در دسترس قرار گرفتن محتوای مربوط به این حوزه برای محققین و دانشجویان
  • لزوم برگزاری جلسات هدف مند و مستندسازی نتایج
  • لزوم بررسی موضوعات زیر:
    • حقوق معنوي طلايه داران رشته
    • پيش بيني وضعيت مالكيت حاصل از فعاليت هاي آتي اين حوزه در كشور
    • تعيين بخش هاي لازم براي بازنويسي جهت تعيين چيدمان موفق فناوري كشور.
    • تاريخچه داده هاي عظيم و آينده آن
    • حجم بازار اين حوزه و راهكارهاي ورود به آن
    • کلان داده از دیدگاه دانشگاهی
    • کلان داده از دیدگاه صنعتی

دسته بندی نشده

موارد زیر پیشنهاداتی هستند که بصورت کلی مطرح شده است و بصورت برنامه عملیاتی و یا راهبردی ارایه نشده اند:

  • لزوم توجه بیشتر به بحث تحلیل داده ها در حوزه کلان داده
  • لزوم توجه به بحث فرهنگ سازي، سرمايه گذاري و تبيين راهبردها
  • لزوم بررسی موارد باز: كشف انطباق روندها در ميان داده هاي انبوه، آمايش تحليلي آن و پويا (آماتاپ-OLAP) به صورت بلادرنگ RTOLAP، روش هاي طراحي ابر مكعب هاي آماتاپي

محورهای پیشنهادی در حوزه کلان داده

محورهای زیر جهت ایجاد فهم مشترک و انجام هرگونه فعالیت در حوزه کلان داده پیشنهاد شده است. اگر فکر میکنید اصلاحی باید روی آنها انجام شود میتوانید مستقیما اقدام نمایید و یا محورها و زیرمحورهای مورد نظر را پیشنهاد دهید:

  • زیرساخت ها و بسترهای داده های عظیم
    • زیرساخت های سخت افزاری و نرم افزاری داده­ های عظیم
    • زیرساخت های انتقال داده های عظیم
  • امنیت، مسائل حقوقی و استانداردهای داده های عظیم
    • امنیت، شخصی سازی و قابلیت اعتماد در حوزه داده های عظیم
    • مسائل حقوقی و استانداردهای مطرح در حوزه های مختلف داده های عظیم
  • کاربردها، مدل ها، الگوریتم ها و راهکارهای ذخیره، دسترسی، جستجو، تحلیل، پالایش، پردازش، کاوش و مدیریت داده های عظیم
    • سرویس ها و کاربردهای توسعه یافته مبتنی بر داده های عظیم
    • روش ها و الگوریتم های دسترسی، جستجو، کاوش و پالایش داده های عظیم
    • راهکارها و الگوریتم های تحلیل و پردازش داده های عظیم
    • چارچوب ها، مدل ها و ابزارهای مدیریت داده های عظیم
    • الگوریتم ها، محصولات و راهکارهای ذخیره­ سازی داده ­های عظیم
    • راهکارهای پردازش سریع فرآیندهای مختلف در داده های عظیم به صورت بلادرنگ
    • الگوها و فرآیندهای تولید داده های عظیم و انواع کاربردهای ایجادکننده آن
    • كاوش و تحليل شبكه هاي اجتماعي
  • سرمایه گذاری، راهبرد و الگوهای مهاجرت به داده های عظیم
    • مدل ها و الگوهای مهاجرت از مدل های سنتی به داده ­های عظیم
    • ابعاد تجاری و مالی مطرح در حوزه داده های عظیم
    • راهبردها و سیاست های استفاده از داده های عظیم


  • سایر موضوعات پیشنهادی (دسته بندی نشده):
    • اینترنت اشیاء
    • بررسي تاريخچه فناوري و سير تحول داده هاي عظيم از آغاز تا كنون
    • كلان داده و رايانش ابري
    • مديريت مركز داده و كلاستر
    • اندازه بازار، كاربردها و پيش بيني راهبردي بازار اين رشته در كشور / بازار و نحوه سرمايه گذاري در حوزه داده هاي عظيم

بحث روی واژه

معادل های پیشنهادی برای Big Data:

  • داده های انبوه: انبوه بیشتر اشاره به واژه هایی نظیر dense و mass دارد و بعنوان معادل برای big مناسب بنظر نمیرسد
  • داده های حجیم: این عنوان بنظر مناسب نیست، زیرا بیشتر به بعد Volume یا حجم که یکی از چالش های حوزه Big data است اشاره میکند.
  • داده های عظیم: این عنوان بدلیل اینکه ریشه عربی دارد پیشنهاد نمیشود. ضمن اینکه بیشتر معادل کلماتی نظیر great، huge و enormous می باشد.
  • بزرگ داده: این واژه در حال حاضر بیشتر برای معادل کلمه Large استفاده میشود (نظیر Large Scale : مقیاس بزرگ) و بنابراین پیشنهاد نمیشود.
  • وزرگ داده: این عنوان همان بزرگ است که در فارسی قدیم برای اشاره به عظمت مقام و یا وسعت قلمرو (معادل great و vast) استفاده شده است.
  • کلان داده: این عنوان به نظر میرسد که برای Big Data مناسبتر باشد. زیرا ترکیبات مشابه دیگری نیز دارد که ترجمه کلان برای آنها نیز استفاده میشود (نظیر Big Approach : رویکرد کلان)

بنابراین طبق این تحلیل کلان داده پیشنهاد میشود که مورد استفاده قرار بگیرد. لطفا اگر نظری روی این تحلیل دارید در بخش نظرات اعلام بفرمایید.

سوالات پیش رو

  • چه مسائلی برای صنایع کشور وجود دارد که با آن مواجه هستند؟ (لزوم دعوت از شرکت ها)
  • چه حوزه های کاربردی بطور دقیق وجود دارد؟ (لزوم دعوت از اساتید و صنایع برای بررسی حوزه های کاربردی موجود و مستند سازی آن)
  • چقدر از داده های موجود در کشور با روش های سنتی ارزش استخراج شده است و چه موانعی در استخراج ارزش بیشتر مشاهده شده است؟ (لزوم دعوت از اساتید و شرکت ها)
  • مشکلات فعلی آیا قابل اندازه گیری است؟ یا اینکه بصورت شهودی احساس میشود که مشکل کلان داده داریم؟ یا اینکه بصورت کالای لوکس تمایل داریم روی مساپل با این عنوان کار کنیم؟

چالش هاي سرمايه گذاري در حوزه داده هاي عظيم

  • در دسترس نبودن داده (NoData Problem) دسترسي به داده ها كه معمولا در اختيار نهادهايي است كه دغدغه هاي امنيتي دارند و دسترسي به آنها را فراهم نمي كنند.
  • عدم بلوغ مدلهاي داده هاي عظيم متناسب با مدلهاي كسب و كار موجود
  • هزينه زياد سخت افزار پردازش و ذخيره سازي داده ها
  • مقياس بزرگ كار و پيچيدگي بسيار زياد مسئله سبب خواهد شد تا هر گونه فعاليت اعم از علمي و پژوهشي تا صنعتي مقياس بزرگ داشته باشد و نيازمند سرمايه گذاري هاي كلان، مديريت راهبردي دقيق و منظم و با ريسك بالا باشد.
  • وابستگي به فناوري هاي وارداتي و عدم بلوغ آنها (تحميل هزينه و پيچيدگي زياد)
  • امكان عدم بازگشت سرمايه
  • عدم راه اندازي و احتمال شكست پروژه
  • برخي موارد فني رايج
    • توزيع جغرافيايي
    • همزمان سازي داده ها
    • موارد دیگری در اینجا هم بررسی شده است

چالش هاي صنايع فعال در حوزه داده هاي عظيم

  • هزينه سخت افزاري
  • هزينه نيروي انساني
  • عدم وجود نيروي انساني كارآمد/ كمبود نيروي متخصص و مهاجرت نخبگان
  • انحصار نهادها و سازمانهاي خاص بر داده ها و پروژه هاي اين حوزه
  • ریسک بالای سرمايه گذاري
  • عدم وجود اعتماد به تيم اجرايي
  • عدم امكان تأمين هزينه هاي پروژه
  • عدم وجود توانايي فني و نيروي متخصص
  • عدم وجود تجربه موفق در حوزه بومي سازي در كشور
  • عدم بلوغ كافي در اين حوزه در اكوسيستم جهاني (اكوسيستم در حال شكل گيري است)
  • وجود چالش ها در زمينه الگوريتم هاي پردازش و تحليل اطلاعات.
  • وجود چالش در سخت افزار پردازش و ذخيره سازي.
  • عدم وجود انگيزه و آگاهي لازم در شركت ها و سازمانها براي استفاده از داده هاي عظيم.
  • ضعيف بودن رزومه كاري فعالان در حوزه داده هاي عظيم.

بررسي حوزه هاي كاربردي مطرح داده هاي عظيم در ايران

  • اطلاعات وب فارسي/ وبلاگهاي فارسي/ شبكه هاي اجتماعي فارسي زبان
  • اطلاعات بورس/ بانك/ بيمه
  • اطلاعات تماس هاي تلفني/ موبايل/ پيامك
  • كاربردهاي مالي و اعتباري (نظير بانكداري)
  • كابردهاي بايو و پزشكي (نظير ژنتيك)
  • كاربردهاي شبكه هاي اجتماعي
  • كاربردهاي رهگيري
  • كاربردهاي هواشناسي
  • كاربردهاي جستجو و بازيابي اطلاعات
  • سازمانهاي بزرگ (اپراتورهاي مخابراتي، صنايع بزرگ نظير فولاد)
  • مخابرات و اپراتورها
  • بانكها
  • GIS و تحليل جغرافيايي

لینک های مرتبط