EC:92231529 Research plan: تفاوت میان نسخه‌ها

از OCCC Wiki
پرش به ناوبری پرش به جستجو
 
(۵۹ نسخهٔ میانی ویرایش شده توسط ۴ کاربر نشان داده نشد)
خط ۹: خط ۹:


== چکیده ==
== چکیده ==
* [http://ceit.aut.ac.ir/~hshahriari/how-to-write-abstract.htm چگونه یک چکیده خوب بنویسیم؟]
داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندهاو افزایش رقابت پذیری, تصمیم گیری های اثربخش تر را به دنبال دارد.
هم اکنون وبلاگ‌ها، شبکه‌های اجتماعی، نتایج جستجوهای اینترنتی و پایگاه‌های داده مربوط به رشته‌های علمی مختلف از مهمترین منابع كلان داده‌ها به شمار می‌روند. یکی از مثال‌های بارز در این زمینه پایگاه‌های داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از داده‌های مربوط به تغییرات اقتصادی را  تولید می‌کنند.
در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.


== مقدمه ==
== مقدمه ==
عبارت Big Data مدت‌ها است که برای اشاره به حجم‌هاي عظیمی از داده‌‌ها که توسط سازمان‌های بزرگی مانند گوگل یا ناسا ذخیره و تحلیل مي‌شوند مورد استفاده قرار مي‌گیرد. اما به تازگي، این عبارت بیشتر برای اشاره به مجموعه‌­های داده‌اي بزرگی استفاده مي‌شود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاه‌هاي داده سنتي و معمولي قابل مدیریت نیستند. مشکلات اصلي در کار با این نوع داده‌‌ها مربوط به برداشت و جمع‌آوری، ذخیره‌سازی، جست‌وجو، اشتراک‌گذاری، تحلیل و نمایش آن‌ها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا مي‌کند که با استفاده از تحلیل حجم‌هاي بیشتری از داده‌ها، مي‌توان تحلیل‌هاي بهتر و پيشرفته‌تري را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی‌ و امنیتی، انجام داد و نتایج مناسب‌تری را دریافت‌کرد. بيشتر تحلیل‌های مورد نیاز در پردازش داده‌هاي عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، کانکتومیک (علوم مرتبط با نگاشت سیستم‌عصبی)، شبیه‌سازی‌هاي پیچیده فیزیک، تحقیقات زیست‌شناسی و محیطی، جست‌وجوی اینترنت، تحلیل‌هاي اقتصادی و مالی و تجاری مورد استفاده قرار مي‌گیرد. حجم داده‌هاي ذخیره‌شده در مجموعه‌هاي داده‌اي Big Data، عموماً به‌خاطر تولید و جمع‌آوری داده‌‌ها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشی‌هاي موبایل، حسگرهای محیطی، لاگ نرم‌افزارهای مختلف، دوربین‌ها، میکروفون‌ها، دستگاه‌هاي تشخیص RFID، شبکه‌هاي حسگر بی‌سیم وغيره با سرعت خیره‌کننده‌اي در حال افزایش است، به طوری که در هر روز، 2,5 کوادریلیارد بایت (هر کوادریلیارد برابر 1027 است) داده در حال تولید است. یکی از مهم‌ترین مسائل مرتبط با داده‌هاي عظیم، مشکل بودن کار با آن‌ها به وسیله پایگاه‌هاي داده‌اي رابطه‌اي و بسته‌هاي نرم‌افزاری تصویرنگاری داده‌‌ها و نرم‌افزارهای آماری رومیزی است. چراکه این داده‌ها، برای پردازش‌شدن در یک زمان معقول به نرم‌افزارهای به شدت موازی شده با قابلیت اجرا روی ده‌ها، صدها یا هزاران سرور نیاز دارند. البته مفهوم Big Data برای شرکت‌ها و سازمان‌های مختلف تعابیر متفاوتی دارد و هر کدام، بسته به کاربرد و نیازمندی‌هایی که دارند، در حجمی خاص و با شرایطی خاص به روش‌هاي جدیدی برای آسان‌کردن کار با این نوع داده‌‌ها روی مي‌آورند. از این‌رو است که Big Data برای بعضی سازمان‌ها، تنها صدها‌گیگابایت حجم دارد در حالی که برای برخی، ده‌ها و صدها ترابایت یا حتی مضاربي از اگزابایت و زتابایت از انواع داده‌‌هاي عظيم محسوب مي‌شوند. یکی از بهترین تعابیری که در زمینه توصیف و تبیین Big Data و چالش‌هاي پیش روی آن به‌کار رفته است، ایده دوگ‌ليني (Doug Laney) در گزارش سال 2001 مؤسسه META group (اکنون گارتنر) بود که در آن عنوان شده است داده‌‌ها در سه بُعد مختلف در حال رشد هستند. این سه بعد عبارتند از حجم، سرعت و تنوع داده‌‌ها که روز به روز، نرخ رشد آن‌ها با سرعتی باور نکردنی افزایش مي‌یابد. به همین دلیل، توصیف Big Data تنها با حجم‌هاي عظیم و نحوه مدیریت آن‌ها کار درستی نیست و باید دیگر جنبه‌هاي این مفهوم مهم و کلیدی را نیز در نظر گرفت. بر این اساس، با توجه به افزایش روز افزون استفاده از تجهیزات تولید یا جمع‌آوری داده‌‌ها و همچنین روی آوردن تعداد بیشتری از شرکت‌ها و افراد به شکل‌های جدیدی از زندگی دیجیتالی، اهمیت مفهوم Big Data و نحوه برنامه‌ریزی و تعیین راهبردهاي مناسب برای بهره‌برداری صحیح از آن، دو چندان شده و نیاز به توسعه ابزارها و امکانات مناسب برای مدیریت بهتر آن‌ها بیش از پیش مشخص مي‌شود.
امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.
 
واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف  و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار می‌کند)، Big Data را با ويژگي‌هايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety).
نمونه‌داده‌هاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكه‌هاي اجتماعي مثل Facebook . پيشرفت‌هاي پژوهشي در سال‌هاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكه‌هاي عصبي، روش‌هاي تحليل آماري)، با اين وجود هنوز جنبه‌هاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسي‌هاي بيشتر دانشمندان دارد.
 
 
تجارت الكترونيك عبارت است از تعامل سيستم‌هاي ارتباطي، سيستم‌هاي مديريت داده‌ها و امنيت كه به‌واسطه آنها امكان مبادله اطلاعات تجاري در رابطه با فروش محصولات و يا خدمات ميسر مي‌شود. البته در اين تعاملات، حمايت و حفظ اسرار مصرف‌كنندگان و همچنين محافظت از داده‌ها و اطلاعات شخصى در تجارت الكترونيك، ايجاد قوانين روشن تجارى به‌منظور ايجاد يك بازار الكترونيك معتبر و در نهايت تدوين قوانين بسيار با اهميت است.


== بررسی ادبیات موضوع ==
== بررسی ادبیات موضوع ==
چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ به معرفي تكنولوژي‌هاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفت‌هاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكه‌هاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند.
تعريف IDC در سال 2011 از فناوري‌هاي داده بزرگ: توصيف نسل جديدي از فناوري‌ها و معماري‌ها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از داده‌هاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.
از جمله مسايل چالش‌برانگيز که رشد روزافزون و انفجارگونه داده ها را به دنبال داشته سهولت بيشتر براي توليد داده است . جمع‌آوري و يكپارچه‌سازي انبوه داده از منابع داده بطور گسترده توزيع‌شده یک مسئله در حوزه بزرگ داده محسوب می شود.
همچنین با رشد سريع رايانش ابري و اينترنت اشياء(IOT), ذخيره‌سازي و مديريت مجموعه داده‌هاي ناهمگن عظيم با ملزومات مناسبي از زيرساخت سخت‌افزاري و نرم‌افزاري را می طلبد که ملاحظات مقياس‌پذيري، بلادرنگ بودن،پيچيدگي و محرمانگي داده را نیز لحاظ نماید.
براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوري‌هاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوري‌ها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطه‌اي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمع‌آوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه داده‌هاي بزرگ وب و شبكه‌هاي اجتماعي، اينترنت اشياء و فعاليت‌هاي علمي گروه‌هاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. در جدول 1 روند توسعه بزرگ داده(chen,et .al, 2014) به لحاظ تغییرات در بانک های اطلاعاتی نمایش داده شده است.
{| class="wikitable"
|-
| 1970
|| ماشين پايگاه داده، افزايش حجم داده
|-
| 1980
|| سيستم پايگاه داده موازي با قابليت مبتني بر كلاستر
|-
| 1986 || ارايه Treadata اولين سيستم پايگاه داده موازي با ظرفيت ذخيره 1TB
|-
| 1990 || گستردگي شناخت مزاياي بكارگيري پايگاه داده موازي
|-
| 2004|| ايجاد GFS و مدل برنامه‌نويسي Mapreduce توسط گوگل
|-
| 2007 || پارادايم 4 – نظر جيم گري براي توليد ابزارهاي پايگاه داده جديد براي تحليل و مصورسازي داده‌هاي انبوه
|-
| 2011 || انتشار گزارش EMC/IDC با عنوان استخراج ارزش از آشفتگي
|-
| 2012 ||انتشار گزارش با عنوان اثر بزرگ ، معرفي داده به عنوان سرمايه 
|-
| 2012 ||سرمايه‌گذاري 200 ميليون دلاري دولت آمريكا براي طرح تحقيق و توسعه Big Data
|-
| 2012 ||پروژه ملي Vigorous ICT Japan توسط وزارت كار و ارتباطات ژاپن
|}
در ادامه برخي چالش‌هاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:
•'''نمايش داده''': بيشتر مجموعه‌هاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانه‌بندي و دسترس‌پذيري دارند. نمايش داده كمك مي‌كند تا داده مفيدتر براي تحليل رايانه‌اي و تفسير انساني ايجاد شود.
•'''كاهش افزونگي و فشرده سازي داده''' : بطور معمول سطح بالايي از افزونگي در مجموعه‌هاي داده وجود دارد.
•'''مديريت چرخه حيات داده''': 
•'''مكانيزم تجزيه و تحليل''':  سيستم تحليلي بزرگ داده بايستي توده‌هاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياس‌پذيري و بسط‌پذيري مي‌باشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاه‌هاي داده غيررابطه‌اي با ويژگي‌هاي منحصربفرد خود در پردازش داده‌هاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند. 
•'''محرمانگي داده''': بيشتر فراهم‌كنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديت‌هاي ظرفيتي و تحليلي نمي‌توانند بطور موثري اين مجموعه‌هاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند. 
•'''مديريت انرژي''': با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف مي‌شود. 
•'''بسط پذيري و مقياس پذيري''': الگوريتم تحليلي بزرگ داده بايستي بگونه‌اي باشد كه به راحتي  با رشد مجموعه‌هاي داده و پيچيدگي آنها قابل بسط‌پذيري باشد.
•'''همكاري مشترك''': تحليل بزرگ داده ها يك تحقيق بين رشته‌هاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينه‌هاي مختلف با هم همكاري داشته باشند.
بسیاری از وب سایت های تجارت الکترونیک شامل قیمت گذاری، محصول، و اطلاعات با نام تجاری هستند. با این حال، چنین داده هایی، به عنوان در صفحات وب ارائه شده است، در یک فرم ساختار شناخته شده از یک پایگاه داده در دسترس نیست . اگرچه برخی از داده ها ساختار دارند اما واقعا به خوبی سازمان یافته نبوده و نسبتا تجزیه آن دشوار است (Feinleib,2014) .عبارت  NoSQL یک مفهوم برای مشخص‌نمودن یک موج خلاقانه است که در دنیای پایگاه‌هاي داده‌اي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستين‌بار در سال 1998عبارت NoSQL را برای اشاره به پایگاه‌هاي داده‌اي سبک ومتن باز رابطه‌اي به كار گرفت که از رابط SQL استفاده نمی‌کردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer)  با ارائه نظریه CAP به کمبودها و محدودیت‌هاي مدل رابطه‌اي در سیستم‌هاي بخش بخش شده (Partitioned) اشاره‌کرد و توضیح داد که ثبات (Consistency)  و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه داده‌ای موجود در یک شبکه گسترده و وسیع قابل فراهم‌ شدن نیستند.
این نظریه، باعث شد توجه به داده‌هاي گسترده در سطح شبکه شده و مدل‌هايي با تأکید بر بخش بخش‌سازی (Partitioning) و دسترس پذیری بالا (High Availability)  به‌عنوان نیازمندی اصلی و با در نظر‌گرفتن ثبات به‌عنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویت‌ها نیز وجود دارد، معرفی شوند.  به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاه‌هاي داده‌اي به‌کار مي‌رود که به شدت با پایگاه‌هاي داده‌اي رابطه‌اي سنتی متفاوت هستند. این پایگاه‌هاي داده‌اي اغلب با مفاهیم سنتی نظیر جدول‌ها، سطر و ستون‌هاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آن‌ها بی‌معنی بوده و به‌صورت افقی مقیاس‌پذیر‌هستند.
مشابه با رایانش ابری معماری بزرگ داده را می توان به صورت لایه های خدمات مورد بررسی قرار داد(kataria,et al.,2014).  در تصویر زیر معماری لایه ای بزرگ داده نشان داده شده است.


[[پرونده:BigDataArchitecture.PNG|قاب|لایه های معماری بزرگ داده]]


== بدنه تحقیق ==
== بدنه تحقیق ==
امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی  تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).


بزرگ داده از منابع مختلف روبرو رشد کلیک‌های اینترنتی، تراکنش‌های موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکه‌های حسگر، تراکنش‌های مالی تولید می‌شود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزوده‌اند. گاهی بزرگ داده را با حجم نامحدود داده‌ها یا انباشتگی داده بی‌شمار نشان می‌دهند. این انباشتگی داده می‌تواند برای قالب‌های مختلف داده نشان داد که اغلب جریان‌های داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است.
در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.آنها ضمن مرور مدل هاي مختلف كسب و كار، چارچوب مدل مبتني بر داده را به صورت زير خلاصه نمودند.
[[پرونده:DDBM.png|بندانگشتی|چارچوب مدل كسب و كار داده محور]]


== نتیجه گیری ==
== نتیجه گیری ==
تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.
== مراجع ==
1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).
2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.
3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.


4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.


== مراجع ==
5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review.
 
6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress.

نسخهٔ کنونی تا ‏۲۵ فوریهٔ ۲۰۱۵، ساعت ۱۳:۰۳

بازگشت به صفحه اولیه

موضوع : کاربرد Big Data در تجارت الکترونیک

نام و نام خانوادگی : طیبه اسماعیلی


چکیده

داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندهاو افزایش رقابت پذیری, تصمیم گیری های اثربخش تر را به دنبال دارد. هم اکنون وبلاگ‌ها، شبکه‌های اجتماعی، نتایج جستجوهای اینترنتی و پایگاه‌های داده مربوط به رشته‌های علمی مختلف از مهمترین منابع كلان داده‌ها به شمار می‌روند. یکی از مثال‌های بارز در این زمینه پایگاه‌های داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از داده‌های مربوط به تغییرات اقتصادی را تولید می‌کنند. در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.

مقدمه

امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.

واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار می‌کند)، Big Data را با ويژگي‌هايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety). نمونه‌داده‌هاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكه‌هاي اجتماعي مثل Facebook . پيشرفت‌هاي پژوهشي در سال‌هاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكه‌هاي عصبي، روش‌هاي تحليل آماري)، با اين وجود هنوز جنبه‌هاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسي‌هاي بيشتر دانشمندان دارد.


تجارت الكترونيك عبارت است از تعامل سيستم‌هاي ارتباطي، سيستم‌هاي مديريت داده‌ها و امنيت كه به‌واسطه آنها امكان مبادله اطلاعات تجاري در رابطه با فروش محصولات و يا خدمات ميسر مي‌شود. البته در اين تعاملات، حمايت و حفظ اسرار مصرف‌كنندگان و همچنين محافظت از داده‌ها و اطلاعات شخصى در تجارت الكترونيك، ايجاد قوانين روشن تجارى به‌منظور ايجاد يك بازار الكترونيك معتبر و در نهايت تدوين قوانين بسيار با اهميت است.

بررسی ادبیات موضوع

چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ به معرفي تكنولوژي‌هاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفت‌هاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكه‌هاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند. تعريف IDC در سال 2011 از فناوري‌هاي داده بزرگ: توصيف نسل جديدي از فناوري‌ها و معماري‌ها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از داده‌هاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.

از جمله مسايل چالش‌برانگيز که رشد روزافزون و انفجارگونه داده ها را به دنبال داشته سهولت بيشتر براي توليد داده است . جمع‌آوري و يكپارچه‌سازي انبوه داده از منابع داده بطور گسترده توزيع‌شده یک مسئله در حوزه بزرگ داده محسوب می شود. همچنین با رشد سريع رايانش ابري و اينترنت اشياء(IOT), ذخيره‌سازي و مديريت مجموعه داده‌هاي ناهمگن عظيم با ملزومات مناسبي از زيرساخت سخت‌افزاري و نرم‌افزاري را می طلبد که ملاحظات مقياس‌پذيري، بلادرنگ بودن،پيچيدگي و محرمانگي داده را نیز لحاظ نماید.

براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوري‌هاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوري‌ها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطه‌اي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمع‌آوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه داده‌هاي بزرگ وب و شبكه‌هاي اجتماعي، اينترنت اشياء و فعاليت‌هاي علمي گروه‌هاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. در جدول 1 روند توسعه بزرگ داده(chen,et .al, 2014) به لحاظ تغییرات در بانک های اطلاعاتی نمایش داده شده است.

1970 ماشين پايگاه داده، افزايش حجم داده
1980 سيستم پايگاه داده موازي با قابليت مبتني بر كلاستر
1986 ارايه Treadata اولين سيستم پايگاه داده موازي با ظرفيت ذخيره 1TB
1990 گستردگي شناخت مزاياي بكارگيري پايگاه داده موازي
2004 ايجاد GFS و مدل برنامه‌نويسي Mapreduce توسط گوگل
2007 پارادايم 4 – نظر جيم گري براي توليد ابزارهاي پايگاه داده جديد براي تحليل و مصورسازي داده‌هاي انبوه
2011 انتشار گزارش EMC/IDC با عنوان استخراج ارزش از آشفتگي
2012 انتشار گزارش با عنوان اثر بزرگ ، معرفي داده به عنوان سرمايه
2012 سرمايه‌گذاري 200 ميليون دلاري دولت آمريكا براي طرح تحقيق و توسعه Big Data
2012 پروژه ملي Vigorous ICT Japan توسط وزارت كار و ارتباطات ژاپن


در ادامه برخي چالش‌هاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:

نمايش داده: بيشتر مجموعه‌هاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانه‌بندي و دسترس‌پذيري دارند. نمايش داده كمك مي‌كند تا داده مفيدتر براي تحليل رايانه‌اي و تفسير انساني ايجاد شود.

كاهش افزونگي و فشرده سازي داده : بطور معمول سطح بالايي از افزونگي در مجموعه‌هاي داده وجود دارد.

مديريت چرخه حيات داده:

مكانيزم تجزيه و تحليل: سيستم تحليلي بزرگ داده بايستي توده‌هاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياس‌پذيري و بسط‌پذيري مي‌باشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاه‌هاي داده غيررابطه‌اي با ويژگي‌هاي منحصربفرد خود در پردازش داده‌هاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند.

محرمانگي داده: بيشتر فراهم‌كنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديت‌هاي ظرفيتي و تحليلي نمي‌توانند بطور موثري اين مجموعه‌هاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند.

مديريت انرژي: با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف مي‌شود.

بسط پذيري و مقياس پذيري: الگوريتم تحليلي بزرگ داده بايستي بگونه‌اي باشد كه به راحتي با رشد مجموعه‌هاي داده و پيچيدگي آنها قابل بسط‌پذيري باشد.

همكاري مشترك: تحليل بزرگ داده ها يك تحقيق بين رشته‌هاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينه‌هاي مختلف با هم همكاري داشته باشند.

بسیاری از وب سایت های تجارت الکترونیک شامل قیمت گذاری، محصول، و اطلاعات با نام تجاری هستند. با این حال، چنین داده هایی، به عنوان در صفحات وب ارائه شده است، در یک فرم ساختار شناخته شده از یک پایگاه داده در دسترس نیست . اگرچه برخی از داده ها ساختار دارند اما واقعا به خوبی سازمان یافته نبوده و نسبتا تجزیه آن دشوار است (Feinleib,2014) .عبارت NoSQL یک مفهوم برای مشخص‌نمودن یک موج خلاقانه است که در دنیای پایگاه‌هاي داده‌اي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستين‌بار در سال 1998عبارت NoSQL را برای اشاره به پایگاه‌هاي داده‌اي سبک ومتن باز رابطه‌اي به كار گرفت که از رابط SQL استفاده نمی‌کردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer) با ارائه نظریه CAP به کمبودها و محدودیت‌هاي مدل رابطه‌اي در سیستم‌هاي بخش بخش شده (Partitioned) اشاره‌کرد و توضیح داد که ثبات (Consistency) و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه داده‌ای موجود در یک شبکه گسترده و وسیع قابل فراهم‌ شدن نیستند.

این نظریه، باعث شد توجه به داده‌هاي گسترده در سطح شبکه شده و مدل‌هايي با تأکید بر بخش بخش‌سازی (Partitioning) و دسترس پذیری بالا (High Availability) به‌عنوان نیازمندی اصلی و با در نظر‌گرفتن ثبات به‌عنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویت‌ها نیز وجود دارد، معرفی شوند. به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاه‌هاي داده‌اي به‌کار مي‌رود که به شدت با پایگاه‌هاي داده‌اي رابطه‌اي سنتی متفاوت هستند. این پایگاه‌هاي داده‌اي اغلب با مفاهیم سنتی نظیر جدول‌ها، سطر و ستون‌هاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آن‌ها بی‌معنی بوده و به‌صورت افقی مقیاس‌پذیر‌هستند.

مشابه با رایانش ابری معماری بزرگ داده را می توان به صورت لایه های خدمات مورد بررسی قرار داد(kataria,et al.,2014). در تصویر زیر معماری لایه ای بزرگ داده نشان داده شده است.


لایه های معماری بزرگ داده

بدنه تحقیق

امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).

بزرگ داده از منابع مختلف روبرو رشد کلیک‌های اینترنتی، تراکنش‌های موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکه‌های حسگر، تراکنش‌های مالی تولید می‌شود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزوده‌اند. گاهی بزرگ داده را با حجم نامحدود داده‌ها یا انباشتگی داده بی‌شمار نشان می‌دهند. این انباشتگی داده می‌تواند برای قالب‌های مختلف داده نشان داد که اغلب جریان‌های داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است. در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.آنها ضمن مرور مدل هاي مختلف كسب و كار، چارچوب مدل مبتني بر داده را به صورت زير خلاصه نمودند.

چارچوب مدل كسب و كار داده محور

نتیجه گیری

تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.

مراجع

1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).

2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.

3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.

4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.

5- Kataria, M., & Mittal, M. P. (2014). BIG DATA: A Review.

6- Feinleib, D. (2014). Big Data Bootcamp: What Managers Need to Know to Profit from the Big Data Revolution. Apress.