EC:92231529 Research plan: تفاوت میان نسخهها
(←مراجع) |
|||
خط ۱۰۶: | خط ۱۰۶: | ||
5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review. | 5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review. | ||
6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress. |
نسخهٔ ۲۲ فوریهٔ ۲۰۱۵، ساعت ۰۰:۱۳
بازگشت به صفحه اولیه
موضوع : کاربرد Big Data در تجارت الکترونیک
نام و نام خانوادگی : طیبه اسماعیلی
چکیده
داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندهاو افزایش رقابت پذیری, تصمیم گیری های اثربخش تر را به دنبال دارد. هم اکنون وبلاگها، شبکههای اجتماعی، نتایج جستجوهای اینترنتی و پایگاههای داده مربوط به رشتههای علمی مختلف از مهمترین منابع كلان دادهها به شمار میروند. یکی از مثالهای بارز در این زمینه پایگاههای داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از دادههای مربوط به تغییرات اقتصادی را تولید میکنند. در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.
مقدمه
امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.
واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار میکند)، Big Data را با ويژگيهايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety). نمونهدادههاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكههاي اجتماعي مثل Facebook .
پيشرفتهاي پژوهشي در سالهاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكههاي عصبي، روشهاي تحليل آماري)، با اين وجود هنوز جنبههاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسيهاي بيشتر دانشمندان دارد.
بررسی ادبیات موضوع
چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ به معرفي تكنولوژيهاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفتهاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكههاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند. تعريف IDC در سال 2011 از فناوريهاي داده بزرگ: توصيف نسل جديدي از فناوريها و معماريها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از دادههاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.
از جمله مسايل چالشبرانگيز که رشد روزافزون و انفجارگونه داده ها را به دنبال داشته سهولت بيشتر براي توليد داده است . جمعآوري و يكپارچهسازي انبوه داده از منابع داده بطور گسترده توزيعشده یک مسئله در حوزه بزرگ داده محسوب می شود. همچنین با رشد سريع رايانش ابري و اينترنت اشياء(IOT), ذخيرهسازي و مديريت مجموعه دادههاي ناهمگن عظيم با ملزومات مناسبي از زيرساخت سختافزاري و نرمافزاري را می طلبد که ملاحظات مقياسپذيري، بلادرنگ بودن،پيچيدگي و محرمانگي داده را نیز لحاظ نماید.
براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوريهاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوريها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطهاي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمعآوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه دادههاي بزرگ وب و شبكههاي اجتماعي، اينترنت اشياء و فعاليتهاي علمي گروههاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. در جدول 1 روند توسعه بزرگ داده(chen,et .al, 2014) به لحاظ تغییرات در بانک های اطلاعاتی نمایش داده شده است.
1970 | ماشين پايگاه داده، افزايش حجم داده |
1980 | سيستم پايگاه داده موازي با قابليت مبتني بر كلاستر |
1986 | ارايه Treadata اولين سيستم پايگاه داده موازي با ظرفيت ذخيره 1TB |
1990 | گستردگي شناخت مزاياي بكارگيري پايگاه داده موازي |
2004 | ايجاد GFS و مدل برنامهنويسي Mapreduce توسط گوگل |
2007 | پارادايم 4 – نظر جيم گري براي توليد ابزارهاي پايگاه داده جديد براي تحليل و مصورسازي دادههاي انبوه |
2011 | انتشار گزارش EMC/IDC با عنوان استخراج ارزش از آشفتگي |
2012 | انتشار گزارش با عنوان اثر بزرگ ، معرفي داده به عنوان سرمايه |
2012 | سرمايهگذاري 200 ميليون دلاري دولت آمريكا براي طرح تحقيق و توسعه Big Data |
2012 | پروژه ملي Vigorous ICT Japan توسط وزارت كار و ارتباطات ژاپن |
بسیاری از وب سایت های تجارت الکترونیک شامل قیمت گذاری، محصول، و اطلاعات با نام تجاری هستند. با این حال، چنین داده هایی، به عنوان در صفحات وب ارائه شده است، در یک فرم ساختار شناخته شده از یک پایگاه دادهدر دسترس نیست . اگرچه برخی از داده ها ساختار دارند اما واقعا به خوبی سازمان یافته نبوده و نسبتا تجزیه آن دشوار است .عبارت NoSQL یک مفهوم برای مشخصنمودن یک موج خلاقانه است که در دنیای پایگاههاي دادهاي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستينبار در سال 1998عبارت NoSQL را برای اشاره به پایگاههاي دادهاي سبک ومتن باز رابطهاي به كار گرفت که از رابط SQL استفاده نمیکردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer) با ارائه نظریه CAP به کمبودها و محدودیتهاي مدل رابطهاي در سیستمهاي بخش بخش شده (Partitioned) اشارهکرد و توضیح داد که ثبات (Consistency) و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه دادهای موجود در یک شبکه گسترده و وسیع قابل فراهم شدن نیستند.
این نظریه، باعث شد توجه به دادههاي گسترده در سطح شبکه شده و مدلهايي با تأکید بر بخش بخشسازی (Partitioning) و دسترس پذیری بالا (High Availability) بهعنوان نیازمندی اصلی و با در نظرگرفتن ثبات بهعنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویتها نیز وجود دارد، معرفی شوند. به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاههاي دادهاي بهکار ميرود که به شدت با پایگاههاي دادهاي رابطهاي سنتی متفاوت هستند. این پایگاههاي دادهاي اغلب با مفاهیم سنتی نظیر جدولها، سطر و ستونهاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آنها بیمعنی بوده و بهصورت افقی مقیاسپذیرهستند.
مشابه با رایانش ابری معماری بزرگ داده را می توان به صورت لایه های خدمات مورد بررسی قرار داد(kataria,et al.,2014). در تصویر زیر معماری لایه ای بزرگ داده نشان داده شده است.
در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.
بدنه تحقیق
امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).
بزرگ داده از منابع مختلف روبرو رشد کلیکهای اینترنتی، تراکنشهای موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکههای حسگر، تراکنشهای مالی تولید میشود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزودهاند. گاهی بزرگ داده را با حجم نامحدود دادهها یا انباشتگی داده بیشمار نشان میدهند. این انباشتگی داده میتواند برای قالبهای مختلف داده نشان داد که اغلب جریانهای داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است.
در ادامه برخي چالشهاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:
•نمايش داده: بيشتر مجموعههاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانهبندي و دسترسپذيري دارند. نمايش داده كمك ميكند تا داده مفيدتر براي تحليل رايانهاي و تفسير انساني ايجاد شود.
•كاهش افزونگي و فشرده سازي داده : بطور معمول سطح بالايي از افزونگي در مجموعههاي داده وجود دارد.
•مديريت چرخه حيات داده:
•مكانيزم تجزيه و تحليل: سيستم تحليلي بزرگ داده بايستي تودههاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياسپذيري و بسطپذيري ميباشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاههاي داده غيررابطهاي با ويژگيهاي منحصربفرد خود در پردازش دادههاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند.
•محرمانگي داده: بيشتر فراهمكنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديتهاي ظرفيتي و تحليلي نميتوانند بطور موثري اين مجموعههاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند.
•مديريت انرژي: با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف ميشود.
•بسط پذيري و مقياس پذيري: الگوريتم تحليلي بزرگ داده بايستي بگونهاي باشد كه به راحتي با رشد مجموعههاي داده و پيچيدگي آنها قابل بسطپذيري باشد.
•همكاري مشترك: تحليل بزرگ داده ها يك تحقيق بين رشتههاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينههاي مختلف با هم همكاري داشته باشند.
نتیجه گیری
تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.
مراجع
1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).
2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.
3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.
4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.
5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review.
6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress.