EC:92231529 Research plan: تفاوت میان نسخه‌ها

از OCCC Wiki
پرش به ناوبری پرش به جستجو
 
(۵۶ نسخهٔ میانی ویرایش شده توسط ۴ کاربر نشان داده نشد)
خط ۹: خط ۹:


== چکیده ==
== چکیده ==
امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویرجریان های داده کلیک کنید، سیاهههای مربوط، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.
داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندهاو افزایش رقابت پذیری, تصمیم گیری های اثربخش تر را به دنبال دارد.
هم اکنون وبلاگ‌ها، شبکه‌های اجتماعی، نتایج جستجوهای اینترنتی و پایگاه‌های داده مربوط به رشته‌های علمی مختلف از مهمترین منابع كلان داده‌ها به شمار می‌روند. یکی از مثال‌های بارز در این زمینه پایگاه‌های داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از داده‌های مربوط به تغییرات اقتصادی را  تولید می‌کنند.
در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.


== مقدمه ==
امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.


* [http://ceit.aut.ac.ir/~hshahriari/how-to-write-abstract.htm چگونه یک چکیده خوب بنویسیم؟]
واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف  و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار می‌کند)، Big Data را با ويژگي‌هايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety).
نمونه‌داده‌هاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكه‌هاي اجتماعي مثل Facebook . پيشرفت‌هاي پژوهشي در سال‌هاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكه‌هاي عصبي، روش‌هاي تحليل آماري)، با اين وجود هنوز جنبه‌هاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسي‌هاي بيشتر دانشمندان دارد.


== مقدمه ==
 
تجارت الكترونيك عبارت است از تعامل سيستم‌هاي ارتباطي، سيستم‌هاي مديريت داده‌ها و امنيت كه به‌واسطه آنها امكان مبادله اطلاعات تجاري در رابطه با فروش محصولات و يا خدمات ميسر مي‌شود. البته در اين تعاملات، حمايت و حفظ اسرار مصرف‌كنندگان و همچنين محافظت از داده‌ها و اطلاعات شخصى در تجارت الكترونيك، ايجاد قوانين روشن تجارى به‌منظور ايجاد يك بازار الكترونيك معتبر و در نهايت تدوين قوانين بسيار با اهميت است.


== بررسی ادبیات موضوع ==
== بررسی ادبیات موضوع ==
چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ به معرفي تكنولوژي‌هاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفت‌هاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكه‌هاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند.
تعريف IDC در سال 2011 از فناوري‌هاي داده بزرگ: توصيف نسل جديدي از فناوري‌ها و معماري‌ها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از داده‌هاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.
از جمله مسايل چالش‌برانگيز که رشد روزافزون و انفجارگونه داده ها را به دنبال داشته سهولت بيشتر براي توليد داده است . جمع‌آوري و يكپارچه‌سازي انبوه داده از منابع داده بطور گسترده توزيع‌شده یک مسئله در حوزه بزرگ داده محسوب می شود.
همچنین با رشد سريع رايانش ابري و اينترنت اشياء(IOT), ذخيره‌سازي و مديريت مجموعه داده‌هاي ناهمگن عظيم با ملزومات مناسبي از زيرساخت سخت‌افزاري و نرم‌افزاري را می طلبد که ملاحظات مقياس‌پذيري، بلادرنگ بودن،پيچيدگي و محرمانگي داده را نیز لحاظ نماید.
براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوري‌هاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوري‌ها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطه‌اي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمع‌آوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه داده‌هاي بزرگ وب و شبكه‌هاي اجتماعي، اينترنت اشياء و فعاليت‌هاي علمي گروه‌هاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. در جدول 1 روند توسعه بزرگ داده(chen,et .al, 2014) به لحاظ تغییرات در بانک های اطلاعاتی نمایش داده شده است.
{| class="wikitable"
|-
| 1970
|| ماشين پايگاه داده، افزايش حجم داده
|-
| 1980
|| سيستم پايگاه داده موازي با قابليت مبتني بر كلاستر
|-
| 1986 || ارايه Treadata اولين سيستم پايگاه داده موازي با ظرفيت ذخيره 1TB
|-
| 1990 || گستردگي شناخت مزاياي بكارگيري پايگاه داده موازي
|-
| 2004|| ايجاد GFS و مدل برنامه‌نويسي Mapreduce توسط گوگل
|-
| 2007 || پارادايم 4 – نظر جيم گري براي توليد ابزارهاي پايگاه داده جديد براي تحليل و مصورسازي داده‌هاي انبوه
|-
| 2011 || انتشار گزارش EMC/IDC با عنوان استخراج ارزش از آشفتگي
|-
| 2012 ||انتشار گزارش با عنوان اثر بزرگ ، معرفي داده به عنوان سرمايه 
|-
| 2012 ||سرمايه‌گذاري 200 ميليون دلاري دولت آمريكا براي طرح تحقيق و توسعه Big Data
|-
| 2012 ||پروژه ملي Vigorous ICT Japan توسط وزارت كار و ارتباطات ژاپن
|}
در ادامه برخي چالش‌هاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:
•'''نمايش داده''': بيشتر مجموعه‌هاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانه‌بندي و دسترس‌پذيري دارند. نمايش داده كمك مي‌كند تا داده مفيدتر براي تحليل رايانه‌اي و تفسير انساني ايجاد شود.
•'''كاهش افزونگي و فشرده سازي داده''' : بطور معمول سطح بالايي از افزونگي در مجموعه‌هاي داده وجود دارد.
•'''مديريت چرخه حيات داده''': 
•'''مكانيزم تجزيه و تحليل''':  سيستم تحليلي بزرگ داده بايستي توده‌هاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياس‌پذيري و بسط‌پذيري مي‌باشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاه‌هاي داده غيررابطه‌اي با ويژگي‌هاي منحصربفرد خود در پردازش داده‌هاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند. 
•'''محرمانگي داده''': بيشتر فراهم‌كنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديت‌هاي ظرفيتي و تحليلي نمي‌توانند بطور موثري اين مجموعه‌هاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند. 
•'''مديريت انرژي''': با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف مي‌شود. 
•'''بسط پذيري و مقياس پذيري''': الگوريتم تحليلي بزرگ داده بايستي بگونه‌اي باشد كه به راحتي  با رشد مجموعه‌هاي داده و پيچيدگي آنها قابل بسط‌پذيري باشد.
•'''همكاري مشترك''': تحليل بزرگ داده ها يك تحقيق بين رشته‌هاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينه‌هاي مختلف با هم همكاري داشته باشند.
بسیاری از وب سایت های تجارت الکترونیک شامل قیمت گذاری، محصول، و اطلاعات با نام تجاری هستند. با این حال، چنین داده هایی، به عنوان در صفحات وب ارائه شده است، در یک فرم ساختار شناخته شده از یک پایگاه داده در دسترس نیست . اگرچه برخی از داده ها ساختار دارند اما واقعا به خوبی سازمان یافته نبوده و نسبتا تجزیه آن دشوار است (Feinleib,2014) .عبارت  NoSQL یک مفهوم برای مشخص‌نمودن یک موج خلاقانه است که در دنیای پایگاه‌هاي داده‌اي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستين‌بار در سال 1998عبارت NoSQL را برای اشاره به پایگاه‌هاي داده‌اي سبک ومتن باز رابطه‌اي به كار گرفت که از رابط SQL استفاده نمی‌کردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer)  با ارائه نظریه CAP به کمبودها و محدودیت‌هاي مدل رابطه‌اي در سیستم‌هاي بخش بخش شده (Partitioned) اشاره‌کرد و توضیح داد که ثبات (Consistency)  و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه داده‌ای موجود در یک شبکه گسترده و وسیع قابل فراهم‌ شدن نیستند.
این نظریه، باعث شد توجه به داده‌هاي گسترده در سطح شبکه شده و مدل‌هايي با تأکید بر بخش بخش‌سازی (Partitioning) و دسترس پذیری بالا (High Availability)  به‌عنوان نیازمندی اصلی و با در نظر‌گرفتن ثبات به‌عنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویت‌ها نیز وجود دارد، معرفی شوند.  به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاه‌هاي داده‌اي به‌کار مي‌رود که به شدت با پایگاه‌هاي داده‌اي رابطه‌اي سنتی متفاوت هستند. این پایگاه‌هاي داده‌اي اغلب با مفاهیم سنتی نظیر جدول‌ها، سطر و ستون‌هاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آن‌ها بی‌معنی بوده و به‌صورت افقی مقیاس‌پذیر‌هستند.
مشابه با رایانش ابری معماری بزرگ داده را می توان به صورت لایه های خدمات مورد بررسی قرار داد(kataria,et al.,2014).  در تصویر زیر معماری لایه ای بزرگ داده نشان داده شده است.


[[پرونده:BigDataArchitecture.PNG|قاب|لایه های معماری بزرگ داده]]


== بدنه تحقیق ==
== بدنه تحقیق ==
امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی  تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).


بزرگ داده از منابع مختلف روبرو رشد کلیک‌های اینترنتی، تراکنش‌های موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکه‌های حسگر، تراکنش‌های مالی تولید می‌شود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزوده‌اند. گاهی بزرگ داده را با حجم نامحدود داده‌ها یا انباشتگی داده بی‌شمار نشان می‌دهند. این انباشتگی داده می‌تواند برای قالب‌های مختلف داده نشان داد که اغلب جریان‌های داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است.
در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.آنها ضمن مرور مدل هاي مختلف كسب و كار، چارچوب مدل مبتني بر داده را به صورت زير خلاصه نمودند.
[[پرونده:DDBM.png|بندانگشتی|چارچوب مدل كسب و كار داده محور]]


== نتیجه گیری ==
== نتیجه گیری ==
تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.
== مراجع ==
1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).
2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.
3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.


4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.


== مراجع ==
5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review.
1-
 
Trends in Big Data Analytics<br />
6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress.
Journal Of Parallel and Distributed Computing - 2014<br />
Karthik Kambatla1, Giorgos Kollias2, Vipin Kumar3, Ananth Grama1
1Dept. of Computer Science, Purdue University
2IBM T. J. Watson Research Center
3Dept. of Computer Science, University of Minnesota<br />
2-
Big Data: A Survey<br />
Springer Science+Business Media New York 2014<br />
M. Chen
School of Computer Science and Technology, Huazhong University of Science and Technology, 1037 Luoyu Road, Wuhan, 430074, China
e-mail: minchen2012@hust.edu.cn; minchen@ieee.org
S. Mao
Department of Electrical & Computer Engineering, Auburn University, 200 Broun Hall, Auburn, AL 36849-5201, USA e-mail: smao@ieee.org
Y. L iu
TNLIST, School of Software, Tsinghua University, Beijing, China
e-mail: yunhao@greenorbs.com

نسخهٔ کنونی تا ‏۲۵ فوریهٔ ۲۰۱۵، ساعت ۱۳:۰۳

بازگشت به صفحه اولیه

موضوع : کاربرد Big Data در تجارت الکترونیک

نام و نام خانوادگی : طیبه اسماعیلی


چکیده

داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندهاو افزایش رقابت پذیری, تصمیم گیری های اثربخش تر را به دنبال دارد. هم اکنون وبلاگ‌ها، شبکه‌های اجتماعی، نتایج جستجوهای اینترنتی و پایگاه‌های داده مربوط به رشته‌های علمی مختلف از مهمترین منابع كلان داده‌ها به شمار می‌روند. یکی از مثال‌های بارز در این زمینه پایگاه‌های داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از داده‌های مربوط به تغییرات اقتصادی را تولید می‌کنند. در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.

مقدمه

امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.

واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار می‌کند)، Big Data را با ويژگي‌هايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety). نمونه‌داده‌هاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكه‌هاي اجتماعي مثل Facebook . پيشرفت‌هاي پژوهشي در سال‌هاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكه‌هاي عصبي، روش‌هاي تحليل آماري)، با اين وجود هنوز جنبه‌هاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسي‌هاي بيشتر دانشمندان دارد.


تجارت الكترونيك عبارت است از تعامل سيستم‌هاي ارتباطي، سيستم‌هاي مديريت داده‌ها و امنيت كه به‌واسطه آنها امكان مبادله اطلاعات تجاري در رابطه با فروش محصولات و يا خدمات ميسر مي‌شود. البته در اين تعاملات، حمايت و حفظ اسرار مصرف‌كنندگان و همچنين محافظت از داده‌ها و اطلاعات شخصى در تجارت الكترونيك، ايجاد قوانين روشن تجارى به‌منظور ايجاد يك بازار الكترونيك معتبر و در نهايت تدوين قوانين بسيار با اهميت است.

بررسی ادبیات موضوع

چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ به معرفي تكنولوژي‌هاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفت‌هاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكه‌هاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند. تعريف IDC در سال 2011 از فناوري‌هاي داده بزرگ: توصيف نسل جديدي از فناوري‌ها و معماري‌ها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از داده‌هاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.

از جمله مسايل چالش‌برانگيز که رشد روزافزون و انفجارگونه داده ها را به دنبال داشته سهولت بيشتر براي توليد داده است . جمع‌آوري و يكپارچه‌سازي انبوه داده از منابع داده بطور گسترده توزيع‌شده یک مسئله در حوزه بزرگ داده محسوب می شود. همچنین با رشد سريع رايانش ابري و اينترنت اشياء(IOT), ذخيره‌سازي و مديريت مجموعه داده‌هاي ناهمگن عظيم با ملزومات مناسبي از زيرساخت سخت‌افزاري و نرم‌افزاري را می طلبد که ملاحظات مقياس‌پذيري، بلادرنگ بودن،پيچيدگي و محرمانگي داده را نیز لحاظ نماید.

براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوري‌هاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوري‌ها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطه‌اي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمع‌آوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه داده‌هاي بزرگ وب و شبكه‌هاي اجتماعي، اينترنت اشياء و فعاليت‌هاي علمي گروه‌هاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. در جدول 1 روند توسعه بزرگ داده(chen,et .al, 2014) به لحاظ تغییرات در بانک های اطلاعاتی نمایش داده شده است.

1970 ماشين پايگاه داده، افزايش حجم داده
1980 سيستم پايگاه داده موازي با قابليت مبتني بر كلاستر
1986 ارايه Treadata اولين سيستم پايگاه داده موازي با ظرفيت ذخيره 1TB
1990 گستردگي شناخت مزاياي بكارگيري پايگاه داده موازي
2004 ايجاد GFS و مدل برنامه‌نويسي Mapreduce توسط گوگل
2007 پارادايم 4 – نظر جيم گري براي توليد ابزارهاي پايگاه داده جديد براي تحليل و مصورسازي داده‌هاي انبوه
2011 انتشار گزارش EMC/IDC با عنوان استخراج ارزش از آشفتگي
2012 انتشار گزارش با عنوان اثر بزرگ ، معرفي داده به عنوان سرمايه
2012 سرمايه‌گذاري 200 ميليون دلاري دولت آمريكا براي طرح تحقيق و توسعه Big Data
2012 پروژه ملي Vigorous ICT Japan توسط وزارت كار و ارتباطات ژاپن


در ادامه برخي چالش‌هاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:

نمايش داده: بيشتر مجموعه‌هاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانه‌بندي و دسترس‌پذيري دارند. نمايش داده كمك مي‌كند تا داده مفيدتر براي تحليل رايانه‌اي و تفسير انساني ايجاد شود.

كاهش افزونگي و فشرده سازي داده : بطور معمول سطح بالايي از افزونگي در مجموعه‌هاي داده وجود دارد.

مديريت چرخه حيات داده:

مكانيزم تجزيه و تحليل: سيستم تحليلي بزرگ داده بايستي توده‌هاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياس‌پذيري و بسط‌پذيري مي‌باشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاه‌هاي داده غيررابطه‌اي با ويژگي‌هاي منحصربفرد خود در پردازش داده‌هاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند.

محرمانگي داده: بيشتر فراهم‌كنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديت‌هاي ظرفيتي و تحليلي نمي‌توانند بطور موثري اين مجموعه‌هاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند.

مديريت انرژي: با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف مي‌شود.

بسط پذيري و مقياس پذيري: الگوريتم تحليلي بزرگ داده بايستي بگونه‌اي باشد كه به راحتي با رشد مجموعه‌هاي داده و پيچيدگي آنها قابل بسط‌پذيري باشد.

همكاري مشترك: تحليل بزرگ داده ها يك تحقيق بين رشته‌هاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينه‌هاي مختلف با هم همكاري داشته باشند.

بسیاری از وب سایت های تجارت الکترونیک شامل قیمت گذاری، محصول، و اطلاعات با نام تجاری هستند. با این حال، چنین داده هایی، به عنوان در صفحات وب ارائه شده است، در یک فرم ساختار شناخته شده از یک پایگاه داده در دسترس نیست . اگرچه برخی از داده ها ساختار دارند اما واقعا به خوبی سازمان یافته نبوده و نسبتا تجزیه آن دشوار است (Feinleib,2014) .عبارت NoSQL یک مفهوم برای مشخص‌نمودن یک موج خلاقانه است که در دنیای پایگاه‌هاي داده‌اي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستين‌بار در سال 1998عبارت NoSQL را برای اشاره به پایگاه‌هاي داده‌اي سبک ومتن باز رابطه‌اي به كار گرفت که از رابط SQL استفاده نمی‌کردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer) با ارائه نظریه CAP به کمبودها و محدودیت‌هاي مدل رابطه‌اي در سیستم‌هاي بخش بخش شده (Partitioned) اشاره‌کرد و توضیح داد که ثبات (Consistency) و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه داده‌ای موجود در یک شبکه گسترده و وسیع قابل فراهم‌ شدن نیستند.

این نظریه، باعث شد توجه به داده‌هاي گسترده در سطح شبکه شده و مدل‌هايي با تأکید بر بخش بخش‌سازی (Partitioning) و دسترس پذیری بالا (High Availability) به‌عنوان نیازمندی اصلی و با در نظر‌گرفتن ثبات به‌عنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویت‌ها نیز وجود دارد، معرفی شوند. به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاه‌هاي داده‌اي به‌کار مي‌رود که به شدت با پایگاه‌هاي داده‌اي رابطه‌اي سنتی متفاوت هستند. این پایگاه‌هاي داده‌اي اغلب با مفاهیم سنتی نظیر جدول‌ها، سطر و ستون‌هاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آن‌ها بی‌معنی بوده و به‌صورت افقی مقیاس‌پذیر‌هستند.

مشابه با رایانش ابری معماری بزرگ داده را می توان به صورت لایه های خدمات مورد بررسی قرار داد(kataria,et al.,2014). در تصویر زیر معماری لایه ای بزرگ داده نشان داده شده است.


لایه های معماری بزرگ داده

بدنه تحقیق

امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).

بزرگ داده از منابع مختلف روبرو رشد کلیک‌های اینترنتی، تراکنش‌های موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکه‌های حسگر، تراکنش‌های مالی تولید می‌شود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزوده‌اند. گاهی بزرگ داده را با حجم نامحدود داده‌ها یا انباشتگی داده بی‌شمار نشان می‌دهند. این انباشتگی داده می‌تواند برای قالب‌های مختلف داده نشان داد که اغلب جریان‌های داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است. در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.آنها ضمن مرور مدل هاي مختلف كسب و كار، چارچوب مدل مبتني بر داده را به صورت زير خلاصه نمودند.

چارچوب مدل كسب و كار داده محور

نتیجه گیری

تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.

مراجع

1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).

2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.

3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.

4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.

5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review.

6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress.