EC:92231529 Research plan: تفاوت میان نسخه‌ها

از OCCC Wiki
پرش به ناوبری پرش به جستجو
خط ۲۴: خط ۲۴:


== مراجع ==
== مراجع ==
1-
Trends in Big Data Analytics<br />
Journal Of Parallel and Distributed Computing - 2014<br />
Karthik Kambatla1, Giorgos Kollias2, Vipin Kumar3, Ananth Grama1
1Dept. of Computer Science, Purdue University
2IBM T. J. Watson Research Center
3Dept. of Computer Science, University of Minnesota<br />
2-
Big Data: A Survey<br />
Springer Science+Business Media New York 2014<br />
M. Chen
School of Computer Science and Technology, Huazhong University of Science and Technology, 1037 Luoyu Road, Wuhan, 430074, China
e-mail: minchen2012@hust.edu.cn; minchen@ieee.org
S. Mao
Department of Electrical & Computer Engineering, Auburn University, 200 Broun Hall, Auburn, AL 36849-5201, USA e-mail: smao@ieee.org
Y. L iu
TNLIST, School of Software, Tsinghua University, Beijing, China
e-mail: yunhao@greenorbs.com

نسخهٔ ‏۲۷ دسامبر ۲۰۱۴، ساعت ۰۰:۴۶

بازگشت به صفحه اولیه

موضوع : کاربرد Big Data در تجارت الکترونیک

نام و نام خانوادگی : طیبه اسماعیلی


چکیده

مقدمه

عبارت Big Data مدت‌ها است که برای اشاره به حجم‌هاي عظیمی از داده‌‌ها که توسط سازمان‌های بزرگی مانند گوگل یا ناسا ذخیره و تحلیل مي‌شوند مورد استفاده قرار مي‌گیرد. اما به تازگي، این عبارت بیشتر برای اشاره به مجموعه‌­های داده‌اي بزرگی استفاده مي‌شود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاه‌هاي داده سنتي و معمولي قابل مدیریت نیستند. مشکلات اصلي در کار با این نوع داده‌‌ها مربوط به برداشت و جمع‌آوری، ذخیره‌سازی، جست‌وجو، اشتراک‌گذاری، تحلیل و نمایش آن‌ها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا مي‌کند که با استفاده از تحلیل حجم‌هاي بیشتری از داده‌ها، مي‌توان تحلیل‌هاي بهتر و پيشرفته‌تري را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی‌ و امنیتی، انجام داد و نتایج مناسب‌تری را دریافت‌کرد. بيشتر تحلیل‌های مورد نیاز در پردازش داده‌هاي عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، کانکتومیک (علوم مرتبط با نگاشت سیستم‌عصبی)، شبیه‌سازی‌هاي پیچیده فیزیک، تحقیقات زیست‌شناسی و محیطی، جست‌وجوی اینترنت، تحلیل‌هاي اقتصادی و مالی و تجاری مورد استفاده قرار مي‌گیرد. حجم داده‌هاي ذخیره‌شده در مجموعه‌هاي داده‌اي Big Data، عموماً به‌خاطر تولید و جمع‌آوری داده‌‌ها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشی‌هاي موبایل، حسگرهای محیطی، لاگ نرم‌افزارهای مختلف، دوربین‌ها، میکروفون‌ها، دستگاه‌هاي تشخیص RFID، شبکه‌هاي حسگر بی‌سیم وغيره با سرعت خیره‌کننده‌اي در حال افزایش است، به طوری که در هر روز، 2,5 کوادریلیارد بایت (هر کوادریلیارد برابر 1027 است) داده در حال تولید است. یکی از مهم‌ترین مسائل مرتبط با داده‌هاي عظیم، مشکل بودن کار با آن‌ها به وسیله پایگاه‌هاي داده‌اي رابطه‌اي و بسته‌هاي نرم‌افزاری تصویرنگاری داده‌‌ها و نرم‌افزارهای آماری رومیزی است. چراکه این داده‌ها، برای پردازش‌شدن در یک زمان معقول به نرم‌افزارهای به شدت موازی شده با قابلیت اجرا روی ده‌ها، صدها یا هزاران سرور نیاز دارند. البته مفهوم Big Data برای شرکت‌ها و سازمان‌های مختلف تعابیر متفاوتی دارد و هر کدام، بسته به کاربرد و نیازمندی‌هایی که دارند، در حجمی خاص و با شرایطی خاص به روش‌هاي جدیدی برای آسان‌کردن کار با این نوع داده‌‌ها روی مي‌آورند. از این‌رو است که Big Data برای بعضی سازمان‌ها، تنها صدها‌گیگابایت حجم دارد در حالی که برای برخی، ده‌ها و صدها ترابایت یا حتی مضاربي از اگزابایت و زتابایت از انواع داده‌‌هاي عظيم محسوب مي‌شوند. یکی از بهترین تعابیری که در زمینه توصیف و تبیین Big Data و چالش‌هاي پیش روی آن به‌کار رفته است، ایده دوگ‌ليني (Doug Laney) در گزارش سال 2001 مؤسسه META group (اکنون گارتنر) بود که در آن عنوان شده است داده‌‌ها در سه بُعد مختلف در حال رشد هستند. این سه بعد عبارتند از حجم، سرعت و تنوع داده‌‌ها که روز به روز، نرخ رشد آن‌ها با سرعتی باور نکردنی افزایش مي‌یابد. به همین دلیل، توصیف Big Data تنها با حجم‌هاي عظیم و نحوه مدیریت آن‌ها کار درستی نیست و باید دیگر جنبه‌هاي این مفهوم مهم و کلیدی را نیز در نظر گرفت. بر این اساس، با توجه به افزایش روز افزون استفاده از تجهیزات تولید یا جمع‌آوری داده‌‌ها و همچنین روی آوردن تعداد بیشتری از شرکت‌ها و افراد به شکل‌های جدیدی از زندگی دیجیتالی، اهمیت مفهوم Big Data و نحوه برنامه‌ریزی و تعیین راهبردهاي مناسب برای بهره‌برداری صحیح از آن، دو چندان شده و نیاز به توسعه ابزارها و امکانات مناسب برای مدیریت بهتر آن‌ها بیش از پیش مشخص مي‌شود.

بررسی ادبیات موضوع

بدنه تحقیق

نتیجه گیری

مراجع

1- Trends in Big Data Analytics
Journal Of Parallel and Distributed Computing - 2014
Karthik Kambatla1, Giorgos Kollias2, Vipin Kumar3, Ananth Grama1 1Dept. of Computer Science, Purdue University 2IBM T. J. Watson Research Center 3Dept. of Computer Science, University of Minnesota
2- Big Data: A Survey
Springer Science+Business Media New York 2014
M. Chen School of Computer Science and Technology, Huazhong University of Science and Technology, 1037 Luoyu Road, Wuhan, 430074, China e-mail: minchen2012@hust.edu.cn; minchen@ieee.org S. Mao Department of Electrical & Computer Engineering, Auburn University, 200 Broun Hall, Auburn, AL 36849-5201, USA e-mail: smao@ieee.org Y. L iu TNLIST, School of Software, Tsinghua University, Beijing, China

e-mail: yunhao@greenorbs.com