EC:92231529 Research plan: تفاوت میان نسخهها
خط ۲۶: | خط ۲۶: | ||
تعريف IDC در سال 2011 از فناوريهاي داده بزرگ: توصيف نسل جديدي از فناوريها و معماريها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از دادههاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل. | تعريف IDC در سال 2011 از فناوريهاي داده بزرگ: توصيف نسل جديدي از فناوريها و معماريها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از دادههاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل. | ||
براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوريهاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوريها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطهاي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمعآوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه دادههاي بزرگ وب و شبكههاي اجتماعي، اينترنت اشياء و فعاليتهاي علمي گروههاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است | براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوريهاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوريها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطهاي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمعآوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه دادههاي بزرگ وب و شبكههاي اجتماعي، اينترنت اشياء و فعاليتهاي علمي گروههاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است. | ||
عبارت NoSQL یک مفهوم برای مشخصنمودن یک موج خلاقانه است که در دنیای پایگاههاي دادهاي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستينبار در سال 1998عبارت NoSQL را برای اشاره به پایگاههاي دادهاي سبک ومتن باز رابطهاي به كار گرفت که از رابط SQL استفاده نمیکردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer) با ارائه نظریه CAP به کمبودها و محدودیتهاي مدل رابطهاي در سیستمهاي بخش بخش شده (Partitioned) اشارهکرد و توضیح داد که ثبات (Consistency) و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه دادهای موجود در یک شبکه گسترده و وسیع قابل فراهم شدن نیستند. | |||
این نظریه، باعث شد توجه به دادههاي گسترده در سطح شبکه شده و مدلهايي با تأکید بر بخش بخشسازی (Partitioning) و دسترس پذیری بالا (High Availability) بهعنوان نیازمندی اصلی و با در نظرگرفتن ثبات بهعنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویتها نیز وجود دارد، معرفی شوند. به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاههاي دادهاي بهکار ميرود که به شدت با پایگاههاي دادهاي رابطهاي سنتی متفاوت هستند. این پایگاههاي دادهاي اغلب با مفاهیم سنتی نظیر جدولها، سطر و ستونهاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آنها بیمعنی بوده و بهصورت افقی مقیاسپذیرهستند. | |||
در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است. | در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است. |
نسخهٔ ۶ فوریهٔ ۲۰۱۵، ساعت ۲۲:۲۳
بازگشت به صفحه اولیه
موضوع : کاربرد Big Data در تجارت الکترونیک
نام و نام خانوادگی : طیبه اسماعیلی
چکیده
داده های بزرگ و اهمیت تحلیل آنها به یکی از موضوعات مهم در اقتصاد مزیت رقابتی تبدیل شده است. تحلیل و بکارگیری بزرگ داده در حوزه های مختلف تجارت الکترونیک علاوه بر شناسایی روندها,افزایش رقابت پذیری و تصمیم گیری های اثربخش تر را به دنبال دارد. هم اکنون وبلاگها، شبکههای اجتماعی، نتایج جستجوهای اینترنتی و پایگاههای داده مربوط به رشتههای علمی مختلف از مهمترین منابع كلان دادهها به شمار میروند. یکی از مثالهای بارز در این زمینه پایگاههای داده ها و اطلاعات بورس و سهام است كه روزانه حجم بسیار وسیعی از دادههای مربوط به تغییرات اقتصادی را تولید میکنند. در این تحقیق سعی شده است به کاربرد این مجموعه داده های عظیم به عنوان عامل موثر در شتاب بخشی فرایند کسب و کار الکترونیک بپردازیم.
مقدمه
امروزه بزرگ داده و تجزیه و تحلیل آن در مرکز علم مدرن و کسب و کار هستند. این داده ها از تراکنش های آنلاین، ایمیل ها، فیلم ها، فایلهای دیداری، تصاویر, جریان های داده، سیاهه های مربوط به کلیک کاربران، ارسال ها، پرس و جوهای جستجو، سوابق پزشکی، تعاملات شبکه های اجتماعی ، اطلاعات علمی، حسگرها و گوشی های تلفن همراه و برنامه های کاربردی آنها(2013وSeref SAGIROGLU and Duygu SINANC)تولید میشوند.
واژه "Big Data" در سال های اخیر محبوبیت زیادی به دست آورده است. با این حال، تعریف ضعیف و ابهام بزرگ در مورد معنای دقیق آن وجود دارد. اغلب دادههای بزرگ توسط حجم داده تعریف شده است. در سال 2001، تحلیلگر صنعت، داگ لنی (که اکنون با گارتنر کار میکند)، Big Data را با ويژگيهايي به صورت سه V تعریف کرد: حجم (Volume)، سرعت (Velocity) و تنوع (Variety). نمونهدادههاي بزرگ عملياتي در اينترنت اشيا(IoT)، فروشگاه walmart ، خدمات twitter، شبكههاي اجتماعي مثل Facebook .
پيشرفتهاي پژوهشي در سالهاي اخير براي تحليل اين داده بسيار زياد بوده(پردازش زبان طبيعي، تحليل شبكههاي عصبي، روشهاي تحليل آماري)، با اين وجود هنوز جنبههاي تحقيقاتي بسياري ناشناخته بوده كه نياز به بررسيهاي بيشتر دانشمندان دارد.
بررسی ادبیات موضوع
چن و همکاران در (chen,et .al, 2014) ضمن مروري بر سابقه داده بزرگ. معرفي تكنولوژيهاي مرتبط مثل رايانش ابري، IoT ، مراكز داده و هادوپ پرداختند. آنها همچنین با تمركز روي چهار فاز زنجيره ارزش داده بزرگ: توليد داده، استخراج، ذخيره و تحليل داده به بحث و بررسي درباره چالشهاي فني و پيشرفتهاي انجام شده اشاره نموده و برخي كاربردهاي عمده مانند مديريت سازمان، شبكههاي اجتماعي برخط، IoT و كاربردهاي مياني، هوش اجتماعي و smart grid نام بردند. تعريف IDC در سال 2011 از فناوريهاي داده بزرگ: توصيف نسل جديدي از فناوريها و معماريها طراحي شده براي استخراج ارزش اقتصادي از حجم وسيعي از دادههاي متنوع بوسيله امكان دريافت مقادير بالا، كشف و يا تحليل.
براي رسيدن به درك عميق از بزرگ داده و شناخت بيشتر آن بايستي برخي فناوريهاي مرتبط با آن را بهتر بشناسيم. برخي از مهمترين اين فناوريها شامل رايانش ابري، اينترنت اشياء(IOT)، مدل Hadoop و پايگاه داده غيررابطهاي NOSQL هستند. رايانش ابري در فازهاي مختلف توليد، اكتساب، جمعآوري، تحليل و بكارگيري بزرگ داده نقش موثري دارد. مجموعه دادههاي بزرگ وب و شبكههاي اجتماعي، اينترنت اشياء و فعاليتهاي علمي گروههاي توزيع شده در بستر محاسبات ابري مويد اين مطلب است.
عبارت NoSQL یک مفهوم برای مشخصنمودن یک موج خلاقانه است که در دنیای پایگاههاي دادهاي در حال وقوع است. کارلو استروزی (Carlo Strozzi) نخستينبار در سال 1998عبارت NoSQL را برای اشاره به پایگاههاي دادهاي سبک ومتن باز رابطهاي به كار گرفت که از رابط SQL استفاده نمیکردند. در سال 2000 ميلادي، اریک بریور (Eric Brewer) با ارائه نظریه CAP به کمبودها و محدودیتهاي مدل رابطهاي در سیستمهاي بخش بخش شده (Partitioned) اشارهکرد و توضیح داد که ثبات (Consistency) و دسترس پذیری بالا (High Availability)، هر دو در یک پایگاه دادهای موجود در یک شبکه گسترده و وسیع قابل فراهم شدن نیستند.
این نظریه، باعث شد توجه به دادههاي گسترده در سطح شبکه شده و مدلهايي با تأکید بر بخش بخشسازی (Partitioning) و دسترس پذیری بالا (High Availability) بهعنوان نیازمندی اصلی و با در نظرگرفتن ثبات بهعنوان اولویت بعدی، که امکان به تأخیر انداختن آن در مقایسه با سایر اولویتها نیز وجود دارد، معرفی شوند. به همین دلیل، عبارت NoSQL مفهومی است که برای مشخص کردن پایگاههاي دادهاي بهکار ميرود که به شدت با پایگاههاي دادهاي رابطهاي سنتی متفاوت هستند. این پایگاههاي دادهاي اغلب با مفاهیم سنتی نظیر جدولها، سطر و ستونهاي ثابت بیگانه هستند و در بيشتر موارد، عملیات Join در آنها بیمعنی بوده و بهصورت افقی مقیاسپذیرهستند.
در تحقیق اخیر (Hartmann,et al.,2014)دانشگاه کمبریج با عنوان "Big Data for Big Business?" از دیدگاه taxonomy رویکردهای مختلف کسب و کار مبتنی بر بزرگ داده ارزیابی شده است.
در ادامه برخي چالشهاي كليدي در توسعه و بكارگيري بزرگ داده (chen,et .al, 2014) ذکر شده است:
•نمايش داده: بيشتر مجموعههاي داده سطوح مشخصي از ناهمگني در نوع، ساختار، معاني، سازماندهي، دانهبندي و دسترسپذيري دارند. نمايش داده كمك ميكند تا داده مفيدتر براي تحليل رايانهاي و تفسير انساني ايجاد شود.
•كاهش افزونگي و فشرده سازي داده : بطور معمول سطح بالايي از افزونگي در مجموعههاي داده وجود دارد.
•مديريت چرخه حيات داده:
•مكانيزم تجزيه و تحليل: سيستم تحليلي بزرگ داده بايستي تودههاي ناهمگن داده را در يك زمان محدود پردازش كند. در حالي كه ساختار RDMBS سنتي بطور سخت طراحي شده فاقد مقياسپذيري و بسطپذيري ميباشد كه نتوانسته با ملزومات كارايي روبرو شود. پايگاههاي داده غيررابطهاي با ويژگيهاي منحصربفرد خود در پردازش دادههاي ساختارنيافته، شروع يك جريان اصلي در تحليل بزرگ داده هستند.
•محرمانگي داده: بيشتر فراهمكنندگان سرويس بزرگ داده يا مالكان آنها به دليل محدوديتهاي ظرفيتي و تحليلي نميتوانند بطور موثري اين مجموعههاي داده عظيم را اداره و تحليل كنند. لذا بايستي به متخصصان يا ابزارهايي براي تحليل اعتماد كنند.
•مديريت انرژي: با افزايش حجم داده و تقاضاهاي تحليلي براي پردازش، ذخيره و انتقال بزرگ داده، بطور حتم انرژي الكتريكي بيشتر و بيشتري در مراكز داده مصرف ميشود.
•بسط پذيري و مقياس پذيري: الگوريتم تحليلي بزرگ داده بايستي بگونهاي باشد كه به راحتي با رشد مجموعههاي داده و پيچيدگي آنها قابل بسطپذيري باشد.
•همكاري مشترك: تحليل بزرگ داده ها يك تحقيق بين رشتههاي مختلف علمي است. بدين معنا كه براي برداشت توان بالقوه بزرگ داده، بايستي متخصصاني در زمينههاي مختلف با هم همكاري داشته باشند.
بدنه تحقیق
امروزه ادبیات موجود در سراسر مدل های کسب و کار به طور قابل توجهی تکامل یافته و مفاهیم جدید در حال حاضر در زمینه کسب و کار الکترونیکی، استراتژی، و نوآوری استفاده می شود(Zott et al., 2011).
بزرگ داده از منابع مختلف روبرو رشد کلیکهای اینترنتی، تراکنشهای موبایل، محتوای تولید شده توسط کاربران، رسانه اجتماعی، شبکههای حسگر، تراکنشهای مالی تولید میشود. علاوه بر آن حوزه سلامت و بهداشت، امور مهندسی و عملیات، صنعت اینترنت و امور مالی همگی به فراگیر شدن بزرگ داده افزودهاند. گاهی بزرگ داده را با حجم نامحدود دادهها یا انباشتگی داده بیشمار نشان میدهند. این انباشتگی داده میتواند برای قالبهای مختلف داده نشان داد که اغلب جریانهای داده غیرساخت یافته هستند. صرفنظر از نوع و حجم داده، سهولت دسترسی به آن و توانمندی روشهای پردازشی برای تجزیه و تحلیل، زمینه کاربردی داده یک پرسش مهم است.
نتیجه گیری
تجارت الکترونیک با بهره گیری از ظرفیت بزرگ داده می تواند رونق و رشد چشمگیری داشته باشد. در این تحقیق ضمن بررسی اجمالی مفهوم بزرگ داده به کاربرد و اثربخشی تحلیل انبوه داده های عظیم در زمینه تجارت الکترونیک پرداخته شد.
مراجع
1- Hartmann, Philipp Max, Mohamed Zaki, Niels Feldmann, and Andy Neely. "Big Data for Big Business? A Taxonomy of Data-driven Business Models used by Start-up Firms." A Taxonomy of Data-Driven Business Models Used by Start-Up Firms (March 27, 2014) (2014).
2- Chen, Min, Shiwen Mao, and Yunhao Liu. "Big data: A survey." Mobile Networks and Applications 19, no. 2 (2014): 171-209.
3- Sagiroglu, Seref, and Duygu Sinanc. "Big data: A review." In Collaboration Technologies and Systems (CTS), 2013 International Conference on, pp. 42-47. IEEE, 2013.
4- Zott, C., Amit, R. and Massa, L. (2011), “The Business Model: Recent Developments and Future Research”, Journal of Management, Vol. 37, No. 4, pp. 1019–1042.