مجازی سازی داده

از OCCC Wiki
پرش به ناوبری پرش به جستجو
نسخهٔ قابل چاپ دیگر پشتیبانی نمی‌شود و ممکن است در زمان رندر کردن با خطا مواجه شوید. لطفاً بوکمارک‌های مرورگر خود را به‌روزرسانی کنید و در عوض از عمبکرد چاپ پیش‌فرض مرورگر خود استفاده کنید.

مجازی سازی داده رویکردی است برای مدیریت داده که از طریق آن برنامه های کاربردی میتوانند بدون نیاز به جزئیات فنی در خصوص داده (نظیر فرمت داده یا محل ذخیره سازی آنها)، با داده ها کار کنند. [۱]

برخلاف فرآیند سنتی ETL (استخراج، تبدیل، بارگزاری)، داده ها در محل خود باقی می مانند و بطور بلادرنگ از طریق سیستم مبدا خود قابل دسترسی هستند، بنابراین ریسک ناشی از وجود خطا در داده کاهش می یابد و نیاز به پردازش اضافی برای جابجایی داده ها نخواهد بود. همچنین برخلاف رویکرد متحد سازی داده نیاز نیست که یک مدل داده های واحد بر روی همه داده ها (در حالتی که ناهمگن هستند) تحمیل شود.

برای برطرف کردن تفاوت های بین فرمت های مبدا و مصرف کننده داده و معنای داده، تکنیک های مختلف ایجاد انتزاع و تبدیل استفاده میشود.

این مفهوم به همراه نرم افزارهای مربوط به آن، زیرمجموعه بحث یکپارچه سازی داده است و بطور رایج در مباحث هوش تجاری، سرویس داده با معماری سرویس گرا، رایانش ابری و جستجوی سازمانی استفاده میشود.

برای اطلاعات بیشتر میتوانید به [۲] مراجعه نمایید.

مثال

  • در مفهوم Linked Data در پایگاه های داده یک اتصال به لایه پایگاه داده مجازی ایجاد می شود که میتواند در پشت آن انواع منابع داده نظیر ODBC, JDBC, OLE DB, ADO.NET و ... وجود داشته باشد.


قابلیت ها

مجازی سازی داده یک فناوری توانمند ساز است که اغلب همه این قابلیت ها را فراهم میکند:

  • انتزاع: ایجاد انتزاع در خصوص جنبه های فنی داده های ذخیره شده، نظیر مکان، ساختار ذخیره سازی، واسط های برنامه نویسی، زبان دسترسی و فناوری ذخیره سازی
  • دسترسی داده مجازی شده: اتصال به منابع داده مختلف و در دسترس قرار دادن آنها از طریق یک نقطه واحد با منطق مشترک
  • تبدیل: تبدیل کردن، بهبود کیفیت، اصلاح فرمت و ... منابع داده متناسب با نیاز مصرف کنند
  • متحد کردن داده: ترکیب نتایج مجموعه های مختلف از چندین سیستم مبدا
  • تحویل داده: انتشار مجموعه نتایج بصورت view و یا سرویس های داده ای که در زمان نیاز توسط برنامه های کلاینت یا کاربران اجرا میشود

مزایا

  • کاهش ریسک خطا در داده
  • کاهش سربار جابجایی داده ها در سیستم
  • افزایش سرعت دسترسی به داده ها بصورت بلادرنگ
  • کاهش چشمگیر زمان توسعه و پشتیبانی
  • افزایش کنترل و کاهش ریسک از طریق استفاده از سیاست ها [۳]
  • کاهش نیازمندی به ذخیره سازی داده [۴]

معایب

  • ممکن است زمان پاسخ را در سیستم های عملیاتی کاهش دهد مخصوصا اگر به خوبی طراحی نشده باشد. [۵]
  • یک مدل داده همگن را بکارنمیگیرد. بنابراین باید خود کاربر داده ها را تفسیر کند، مگر اینکه با مدل های دیگری ترکیب شده باشد. [۶]
  • برای ثبت تصاویر لحظه ای از سوابق داده ها خوب نیست. برای این موارد پایگاه داده تحلیلی مناسب تر است. [۶]
  • مدیریت تغییرات سربار بسیار زیادی دارد. زیرا هر تغییر باید توسط تمام برنامه های کاربردی و کاربرانی که داده با آنها به اشتراک گذاشته شده است مورد پذیرش قرار گیرد. [۶]

استفاده از مجازی سازی داده در کلان داده

مجازی سازی داده مانند سایر انواع فناوری های مجازی سازی، رویکردی است که امکان دسترسی، مدیریت و بهینه سازی یک زیرساخت ناهمگن را فراهم میکند بگونه ای که بتوان یک دید منطقی واحد به آن داشت. به این ترتیب شما میتوانید یک واسط بیرونی انتزاعی داشته باشید که فارغ از پیاده سازی داخلی و عملکرد سرویس ها یا سایر منابع باشد. با استفاده از این تکنیک در فناوری های مرتبط با کلان داده، دید انتزاعی به کل داده ها ایجاد میشود که سبب سهولت کار با داده ها مستقل از مکان جغرافیایی یا نوع تکنولوژی مورد استفاده میشود. [۷]

لینک های مرتبط

مراجع