EC:92231529 Research plan
بازگشت به صفحه اولیه
موضوع : کاربرد Big Data در تجارت الکترونیک
نام و نام خانوادگی : طیبه اسماعیلی
چکیده
مقدمه
عبارت Big Data مدتها است که برای اشاره به حجمهاي عظیمی از دادهها که توسط سازمانهای بزرگی مانند گوگل یا ناسا ذخیره و تحلیل ميشوند مورد استفاده قرار ميگیرد. اما به تازگي، این عبارت بیشتر برای اشاره به مجموعههای دادهاي بزرگی استفاده ميشود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاههاي داده سنتي و معمولي قابل مدیریت نیستند. مشکلات اصلي در کار با این نوع دادهها مربوط به برداشت و جمعآوری، ذخیرهسازی، جستوجو، اشتراکگذاری، تحلیل و نمایش آنها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا ميکند که با استفاده از تحلیل حجمهاي بیشتری از دادهها، ميتوان تحلیلهاي بهتر و پيشرفتهتري را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی و امنیتی، انجام داد و نتایج مناسبتری را دریافتکرد. بيشتر تحلیلهای مورد نیاز در پردازش دادههاي عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، کانکتومیک (علوم مرتبط با نگاشت سیستمعصبی)، شبیهسازیهاي پیچیده فیزیک، تحقیقات زیستشناسی و محیطی، جستوجوی اینترنت، تحلیلهاي اقتصادی و مالی و تجاری مورد استفاده قرار ميگیرد. حجم دادههاي ذخیرهشده در مجموعههاي دادهاي Big Data، عموماً بهخاطر تولید و جمعآوری دادهها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشیهاي موبایل، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، دستگاههاي تشخیص RFID، شبکههاي حسگر بیسیم وغيره با سرعت خیرهکنندهاي در حال افزایش است، به طوری که در هر روز، 2,5 کوادریلیارد بایت (هر کوادریلیارد برابر 1027 است) داده در حال تولید است. یکی از مهمترین مسائل مرتبط با دادههاي عظیم، مشکل بودن کار با آنها به وسیله پایگاههاي دادهاي رابطهاي و بستههاي نرمافزاری تصویرنگاری دادهها و نرمافزارهای آماری رومیزی است. چراکه این دادهها، برای پردازششدن در یک زمان معقول به نرمافزارهای به شدت موازی شده با قابلیت اجرا روی دهها، صدها یا هزاران سرور نیاز دارند. البته مفهوم Big Data برای شرکتها و سازمانهای مختلف تعابیر متفاوتی دارد و هر کدام، بسته به کاربرد و نیازمندیهایی که دارند، در حجمی خاص و با شرایطی خاص به روشهاي جدیدی برای آسانکردن کار با این نوع دادهها روی ميآورند. از اینرو است که Big Data برای بعضی سازمانها، تنها صدهاگیگابایت حجم دارد در حالی که برای برخی، دهها و صدها ترابایت یا حتی مضاربي از اگزابایت و زتابایت از انواع دادههاي عظيم محسوب ميشوند. یکی از بهترین تعابیری که در زمینه توصیف و تبیین Big Data و چالشهاي پیش روی آن بهکار رفته است، ایده دوگليني (Doug Laney) در گزارش سال 2001 مؤسسه META group (اکنون گارتنر) بود که در آن عنوان شده است دادهها در سه بُعد مختلف در حال رشد هستند. این سه بعد عبارتند از حجم، سرعت و تنوع دادهها که روز به روز، نرخ رشد آنها با سرعتی باور نکردنی افزایش ميیابد. به همین دلیل، توصیف Big Data تنها با حجمهاي عظیم و نحوه مدیریت آنها کار درستی نیست و باید دیگر جنبههاي این مفهوم مهم و کلیدی را نیز در نظر گرفت. بر این اساس، با توجه به افزایش روز افزون استفاده از تجهیزات تولید یا جمعآوری دادهها و همچنین روی آوردن تعداد بیشتری از شرکتها و افراد به شکلهای جدیدی از زندگی دیجیتالی، اهمیت مفهوم Big Data و نحوه برنامهریزی و تعیین راهبردهاي مناسب برای بهرهبرداری صحیح از آن، دو چندان شده و نیاز به توسعه ابزارها و امکانات مناسب برای مدیریت بهتر آنها بیش از پیش مشخص ميشود.
بررسی ادبیات موضوع
بدنه تحقیق
نتیجه گیری
مراجع
1-
Trends in Big Data Analytics
Journal Of Parallel and Distributed Computing - 2014
Karthik Kambatla1, Giorgos Kollias2, Vipin Kumar3, Ananth Grama1
1Dept. of Computer Science, Purdue University
2IBM T. J. Watson Research Center
3Dept. of Computer Science, University of Minnesota
2-
Big Data: A Survey
Springer Science+Business Media New York 2014
M. Chen
School of Computer Science and Technology, Huazhong University of Science and Technology, 1037 Luoyu Road, Wuhan, 430074, China
e-mail: minchen2012@hust.edu.cn; minchen@ieee.org
S. Mao
Department of Electrical & Computer Engineering, Auburn University, 200 Broun Hall, Auburn, AL 36849-5201, USA e-mail: smao@ieee.org
Y. L iu
TNLIST, School of Software, Tsinghua University, Beijing, China
e-mail: yunhao@greenorbs.com