وضعيت موجود دنيا و كشور ايران در حوزه کلان داده

از OCCC Wiki
نسخهٔ تاریخ ‏۸ فوریهٔ ۲۰۱۵، ساعت ۰۰:۲۳ توسط Javan (بحث | مشارکت‌ها) (صفحه‌ای جدید حاوی «از جمله مهمترین فعالیت هایی که در حال حاضر در بحث کلان داده در دنیا در حال انج...» ایجاد کرد)
(تفاوت) → نسخهٔ قدیمی‌تر | نمایش نسخهٔ فعلی (تفاوت) | نسخهٔ جدیدتر ← (تفاوت)
پرش به ناوبری پرش به جستجو

از جمله مهمترین فعالیت هایی که در حال حاضر در بحث کلان داده در دنیا در حال انجام است، برنامه ریزی برای استانداردسازی و ایجاد یک فهم مشترک بین موجودیت های درگیر است که بر اساس آن بتوانند نسبت به تدوین نقشه راه کلان داده به عنوان یک فناوری اقدام کنند. تا کنون چندين برنامه براي استانداردسازي حوزه کلان داده اجرا شده است که مهمترین آنها در ادامه توضیح داده شده است.

در سال 2012 در مجموعه CSA کارگروهي با هدف شناسايي تکنيک هاي مقياس پذير براي مشکلاتي امنيتي و حريم خصوصي داده-محور ايجاد شد که تاکنون گزارش هاي متعددي از اين کارگروه منتشر شده است. انتظار مي رود که خروجي هاي اين کارگروه بتواند در شفاف کردن تجارب موفق براي امنيت و حريم خصوصي در کلان داده موثر باشد، همچنين صنعت و دولت ايالات متحده را در پذيرش آن تجارب موفق راهنمايي کند. فعاليت هاي مرکز استاندارد آمريکا (NIST) نيز از اواسط 2012 با يک برنامه کارگاهی شروع شد و يک سال بعد کارگروهي را بصورت عمومي ايجاد کرد. هدف اين کارگروه ايجاد يک توافق عمومي و مشترک در تعاريف، ارتباط بين موجوديت ها، معماري مرجع و نقشه راه فناوري براي تکنيک هاي تحليلي و زيرساخت هاي فناوري مي باشد تا بصورت امن و موثر بتواند از پذيرش کلان-داده پشتيباني کند. کميته مديريت داده در ISO/IEC JTC1 نيز مطالعاتي بر روي نسل بعدي تکنيک هاي تحليلي شروع کرد که طي گزارشي در [12] آن را منتشر کرده است. موسسه W3C هم چندين کارگروه روي موضوعات مختلف کلان داده تشکيل داده است، ولي هنوز گزارشي از طرف آنها منتشر نشده است. در ادامه به بررسي دقيق تر فعاليت مرکز NIST به عنوان يک نهاد حاکميتي و اثرگذار در سطح کلان مي پردازيم.

فعاليت های انجام شده در NIST

اين مجموعه راهبري تدوين نقشه راه فناوري کلان داده را در سطح جهانی بر عهده گرفته است. در اين نقشه راه اولويت هاي کلان در حوزه هاي مختلف تعامل پذيري، قابليت حمل، قابليت استفاده مجدد و قابليت گسترش براي تکنيک هاي تحليلي و نيز فناوري هاي زيرساختي کلان داده مشخص خواهد شد. به اين منظور، کارگروهي براي تدوين استانداردهاي حوزه کلان داده مشتمل بر موارد زير ايجاد شده است:

  • تدوين تعاريف مشترک و واحد از کلان داده
  • تهيه يک دسته بندی از کلان داده به منظور شناخت مسايل مختلف مطرح در کلان داده و ارتباط بين آنها
  • تهيه نيازمندي هاي فني و غيرفني مرتبط با کلان داده
  • تهيه نيازمندي هاي امنيتي و نيازمندي هاي مرتبط با حريم خصوصي
  • تهيه يک معماري مرجع از کلان داده
  • تهيه نقشه راه فناوري کلان داده

تهيه نقشه راه يک فناوري مي تواند نقش موثري در جهت دهي فعاليت ها و برنامه ريزي ها داشته باشد تا بتوان براي مراحل مختلف بلوغ فناوري برنامه ريزي کرد. براي انجام اين کار نياز به ايجاد يک فهم مشترک مي باشد. تدوين تعاريف واحد و استاندارد سبب ايجاد يک فهم مشترک بين همه طرفين درگير مي شود و مي تواند از بروز بسياري از ابهامات جلوگيري کند. پس از ايجاد اين فهم مشترک است که مي توان نسبت به توصيف موجوديت هاي مختلف و دسته بندي آنها اقدام کرد. اين اقدام ديد خوبي براي شناخت مسايل مختلف مطرح در کلان داده و ارتباط بين آنها ايجاد ميکند و به شناخت نيازمندي هاي فني، غيرفني و امنيتي منجر می شود. با مشخص کردن ارتباط بين اجزا و نيازمندي ها و ارتباط بين آنها مي توان به يک معماري مرجع دست پيدا کرد که قادر باشد همه نيازمندي ها را در بر گيرد.

بررسی چند پروژه کلان

در اين بخش چند نمونه از فعاليت¬هايي که در ارتباط با کلان-داده و مرتبط با موضوعات امنيتی يا استانداردسازی، بطور خاص در سطوح حاکميتی راهبری مي¬شوند ارائه شده است. مطالعه دقيق چنين فعاليت¬هايي مي¬تواند ديد بهتری برای برنامه¬ريزی بر روی کلان¬داده در کشور ايجاد کند.

داده باز

عنوان داده باز (داده آزاد - Open Data) به داده هايي اطلاق مي شود که به صورت رايگان و آزاد در اختيار همه قرار دارد تا بتوانند از آن استفاده کنند و در هر قالب دلخواهي بازنشر دهند. داده باز داراي محدوديت هاي مربوط به حق کپي، يا موارد محدودکننده مشابه آن نمي باشد و مفاهيم مشابهي با ديگر جنبش هاي "باز" نظير نرم افزارهای متن باز (Open Source) يا محتوای آزاد (Open Content) دارد. همانطور که در شکل زير نشان داده شده است، داده هاي باز اغلب از جنس کلان داده هستند، با اين حال مجموعه داده هاي کوچک نيز مي توانند بصورت باز منتشر شوند. به همين دليل اين دو تعريف از هم متمايز هستند.


Opendata.jpg

ارتباط بين داده باز، کلان داده و ديگر انواع داده


داده باز ضمن اينکه بعد جديدي از عمليات تحليلي را به کلان داده اضافه کرده است و سبب افزايش نوآوري در آن شده است، باعث ايجاد مفاهيم جديدي نظير دولت باز (Open Government) نيز شده است. در حقيقت داده باز يکي از اصول هشتگانه دولت باز مي باشد که در صنايع مختلف مالي، سلامت، حمل و نقل، انرژي، آموزش و ... بطور بالقوه مي تواند حدود 3000 تا 5000 ميليارد دلار ارزش اقتصادي توليد کند. بسترسازي براي داده باز اصولا بايد توسط دولت ها انجام شود تا بتوان ارزش استخراج شده توسط داده ها را بصورت واقعي مورد استفاده قرار داد. از نمونه بسترهاي ايجاد شده در اين خصوص مي توان به پرتال هاي داده باز اشاره کرد که در دولت هاي مختلف اجرا شده است و برخي از آنها در شکل 5 معرفي شده اند.

نمونه پرتال های داده باز دولت ها و سازمان های مختلف

State / Org. Website
Belgium http://data.gov.be/
Ghana http://data.gov.gh/
India http://data.gov.in/
Kenya https://www.opendata.go.ke/
Morocco http://data.gov.ma/
Russia http://opengovdata.ru/
UAE http://government.ae/web/guest/uae-data
UK http://data.gov.uk/
US http://www.data.gov/
EU http://open-data.europa.eu/
OECD http://stats.oecd.org/
UN http://data.un.org/
UNHCR http://data.unhcr.org/
World Bank http://data.worldbank.org/

بررسی مدل اجرای داده باز در دولت های مختلف نشان دهنده الگوهای مختلفی در اجرا می باشد و هر کدام دارای تجربيات خاص خود هستند که بطور جداگانه حائز اهميت است و بايد مورد بررسی قرار بگيرد. برای مثال در دولت فدرال آمريکا اين برنامه زير مجموعه برنامه دولت باز مطرح شده است که خود آن نيز در برنامه FASTER پيگيری می شود، و در مجموع سازوکار منظمی برای اجرا و بهره برداری از آن ايجاد شده است.