Data Warehouse

از OCCC Wiki
پرش به ناوبری پرش به جستجو
  • موضوع: Data Warehouseing
  • تهیه کننده: فرناز کرمی

چکیده

مقدمه

خلاصه ای از بررسی خود موضوع اصلی و تعاریف موجود در آن و ...

بررسی ادبیات موضوع

انباره‏ سازی‏ داده

تعریف انبارداده

انبارداده، سیستمی است که به صورت دوره ای داده ها را از سیستم های منبع در یک مخزن داده ای ابعادی یا نرمال شده، بازیابی و یکپار چه می کند. انبارداده ها، معمولا داده ها را به صورت تاریخچه ای نگه داری می کنند وبرای پاسخ به پرس و جوهای کسب و کار هوشمند و یا دیگر فعالیت های تحلیلی از آن استفاده می شود.پرس و جو ,فرایند گرفتن داده از مخزن داده برای مقاصد خا ص است .

ساخت انباره داده

با توجه به آنکه داده های اطلاعاتی در یک دوره زمانی می توانند با فواصل طولانی در مکانهای گوناگون واز طریق منابع متفاوت تولید و یا تغییر نمایند دسترسی سریع وصحیح به آنها کاری بس دشوار است .از این جهت ذخیره سازی آنها در یک منبع داده یکپارچه ضروری به نظر می رسد . برای ایجاد چنین منبع داده ای مراحل زیر رادر نظر می گیریم .

نقطه شروع طراحی و ساخت انبار داده تعیین نوعData Model می باشد . انواع Data Model:

    • شمای ستاره ای
    • شمای برف دانه ای
    • شمای کهکشانی

معماری هر یک در شکل زیر ترسیم گردیده است .


شمای ستاره ای , این نوع شما ساده ترین نوع Data Model می باشد .

Star.jpg

شمای برف دانه ای

Snow.jpg

شمای کهکشانی

Kah.jpg

سپس تکنولوژی سخت افزار و نرم افزار را انتخاب می کنیم .فاکتور هایی که در این خصوص در نظر گرفته می شود حجم داده -سرعت دسترسی به داده ها -میزان نیاز به تاریخچه داده ها در انبارداده -تعدا کاربران -هزینه راع اندازی و ... می یباشد .

انبار داده را بروی سخت افزارهای MainFrame - ClientServer می توان راه اندازی کرد .حال نوبت به جمع آوری اطلاعات می باشد که با انتخاب استراتژی انتقال داده, داده های اطلاعاتی مورد نظر راجمع آوری و براساس موضوع آنها را در Subject Area های مختلف تقسیم بندی می کنیم . شکل زیر بیانگر استراتژی های انتقال داده می باشد .انتقال داده باسیستمی به نام ETL انجام می شود .

Trans.jpg

هنگام انتقال داده این مهم را در نظر می گیریم که فقط داده ها ی مورد نیاز را انتخاب و از انتقال تمامی داده ها و حجم بالای آنان خودداری کنیم . به عنوان مثال درشکل زیراطلاعات مالی -حسابداری -بازار یابی وفروش از یک شرکت انتخاب شده است واز انتخاب سایر دادها ی سازمانی -اداری خودداری شده است .

Trans2.jpg

همانگونه که پیشتر گفته شد پس از انتخاب داده ها انها را در Subject Area های گوناگون تقسیم بندی می کنیم . هر Subject Area می تواندشامل چند جدول از بانک اطلاعاتی باشد .فیلدهای هر جدول با توجه به نیاز کاربران نهایی (KPI های تعیین شده جهت ایجاد پرس و جو)و رعایت قوانین جامعیت بانکهای رابطه ای طراحی می گردد.به هر رکورد جدول علاوه برساختار داده ای تاریخ و زمان ایجاد دیتا نیز اضافه می گردد .

Trans4.jpg


Trans5.jpg

پس از ساخت اولیه انبار داده با توجه به تغییر آنها با گذشت زمان , نیاز به انتقال تغییرات به انباره داده است .

Trans7.jpg

و در نهایت کاربران نهایی گزارشات مورد نیاز خود را به راحتی اسخراج می کنند.

Trans8.jpg

ETL

ETL سیستمی است که توانایی اتصال به سیستم های منبع، خواندن داده ها، اعمال تغییرات روی آنها و بارگذاری در سیستم اصلی را دارد.سیستمETLداده ها ارا از منابع مختلف جمع آوری یکپارچه، تبدیل و در مخزن داده بارگذاری می کند .

سیستمETL توسط سیستم کنترل ، بر اساس قوانین و منطق متاداده،مدیریت و هماهنگی می شود. متاداده، پایگاه داده ای است حاوی اطلاعاتی درباره ساختار دادها، معنی داده ها، مورد کاربرد آنها، قوانین کیفیت داده و سایر اطلاعاتی که در مورد دادها مورد اهمیت است، می باشد .ساده تری سیستم انبارداده، تنها دارای یک سیستمETL و یک مخزن داده ابعادی می باشد.

Etl.jpg


بدنه تحقیق

تحلیل هایی که توسط محقق صورت گرفته است (نظیر مقایسه و ارزیابی)

نتیجه گیری

نتیجه ای که در نهایت حاصل شده است.

مراجع

Park, Taeil, and Hyoungkwan Kim. "A data warehouse-based decision support system for sewer infrastructure management." Automation in Construction 30 (2013): 37-49.

BV, SCN Education. Data warehousing: the ultimate guide to building corporate business intelligence. Springer Science & Business Media, 2013.

Awogbamila, Y., and A. B. Adeyemo. "DESIGN OF AN INTEGRATED AGRARIAN DATA DIMENSIONAL DATA WAREHOUSE."

Yoo, Sooyoung, et al. "Electronically implemented clinical indicators based on a data warehouse in a tertiary hospital: its clinical benefit and effectiveness." International journal of medical informatics 83.7 (2014): 507-516.

Oktavia, Tanty. "Implementing Data Warehouse As A Foundation For Decision Support System (Perspective: Technical And Nontechnical Factors)." Journal of Theoretical and Applied Information Technology 60.3 (2014): 476-482.

Kimball, Ralph, and Margy Ross. The data warehouse toolkit: the complete guide to dimensional modeling. John Wiley & Sons, 2011.

Khan, Abeer, et al. "Integration between customer relationship management (CRM) and data warehousing." Procedia Technology 1 (2012): 239-249.