EC:92231529 Research plan: تفاوت میان نسخهها
بدون خلاصۀ ویرایش |
(←مقدمه) |
||
خط ۱۲: | خط ۱۲: | ||
== مقدمه == | == مقدمه == | ||
عبارت Big Data مدتها است که برای اشاره به حجمهاي عظیمی از دادهها که توسط سازمانهای بزرگی مانند گوگل یا ناسا ذخیره و تحلیل ميشوند مورد استفاده قرار ميگیرد. اما به تازگي، این عبارت بیشتر برای اشاره به مجموعههای دادهاي بزرگی استفاده ميشود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاههاي داده سنتي و معمولي قابل مدیریت نیستند. مشکلات اصلي در کار با این نوع دادهها مربوط به برداشت و جمعآوری، ذخیرهسازی، جستوجو، اشتراکگذاری، تحلیل و نمایش آنها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا ميکند که با استفاده از تحلیل حجمهاي بیشتری از دادهها، ميتوان تحلیلهاي بهتر و پيشرفتهتري را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی و امنیتی، انجام داد و نتایج مناسبتری را دریافتکرد. بيشتر تحلیلهای مورد نیاز در پردازش دادههاي عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، کانکتومیک (علوم مرتبط با نگاشت سیستمعصبی)، شبیهسازیهاي پیچیده فیزیک، تحقیقات زیستشناسی و محیطی، جستوجوی اینترنت، تحلیلهاي اقتصادی و مالی و تجاری مورد استفاده قرار ميگیرد. حجم دادههاي ذخیرهشده در مجموعههاي دادهاي Big Data، عموماً بهخاطر تولید و جمعآوری دادهها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشیهاي موبایل، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، دستگاههاي تشخیص RFID، شبکههاي حسگر بیسیم وغيره با سرعت خیرهکنندهاي در حال افزایش است، به طوری که در هر روز، 2,5 کوادریلیارد بایت (هر کوادریلیارد برابر 1027 است) داده در حال تولید است. یکی از مهمترین مسائل مرتبط با دادههاي عظیم، مشکل بودن کار با آنها به وسیله پایگاههاي دادهاي رابطهاي و بستههاي نرمافزاری تصویرنگاری دادهها و نرمافزارهای آماری رومیزی است. چراکه این دادهها، برای پردازششدن در یک زمان معقول به نرمافزارهای به شدت موازی شده با قابلیت اجرا روی دهها، صدها یا هزاران سرور نیاز دارند. البته مفهوم Big Data برای شرکتها و سازمانهای مختلف تعابیر متفاوتی دارد و هر کدام، بسته به کاربرد و نیازمندیهایی که دارند، در حجمی خاص و با شرایطی خاص به روشهاي جدیدی برای آسانکردن کار با این نوع دادهها روی ميآورند. از اینرو است که Big Data برای بعضی سازمانها، تنها صدهاگیگابایت حجم دارد در حالی که برای برخی، دهها و صدها ترابایت یا حتی مضاربي از اگزابایت و زتابایت از انواع دادههاي عظيم محسوب ميشوند. یکی از بهترین تعابیری که در زمینه توصیف و تبیین Big Data و چالشهاي پیش روی آن بهکار رفته است، ایده دوگليني (Doug Laney) در گزارش سال 2001 مؤسسه META group (اکنون گارتنر) بود که در آن عنوان شده است دادهها در سه بُعد مختلف در حال رشد هستند. این سه بعد عبارتند از حجم، سرعت و تنوع دادهها که روز به روز، نرخ رشد آنها با سرعتی باور نکردنی افزایش ميیابد. به همین دلیل، توصیف Big Data تنها با حجمهاي عظیم و نحوه مدیریت آنها کار درستی نیست و باید دیگر جنبههاي این مفهوم مهم و کلیدی را نیز در نظر گرفت. بر این اساس، با توجه به افزایش روز افزون استفاده از تجهیزات تولید یا جمعآوری دادهها و همچنین روی آوردن تعداد بیشتری از شرکتها و افراد به شکلهای جدیدی از زندگی دیجیتالی، اهمیت مفهوم Big Data و نحوه برنامهریزی و تعیین راهبردهاي مناسب برای بهرهبرداری صحیح از آن، دو چندان شده و نیاز به توسعه ابزارها و امکانات مناسب برای مدیریت بهتر آنها بیش از پیش مشخص ميشود. | |||
== بررسی ادبیات موضوع == | == بررسی ادبیات موضوع == |
نسخهٔ ۲۷ دسامبر ۲۰۱۴، ساعت ۰۰:۲۷
بازگشت به صفحه اولیه
موضوع : کاربرد Big Data در تجارت الکترونیک
نام و نام خانوادگی : طیبه اسماعیلی
چکیده
مقدمه
عبارت Big Data مدتها است که برای اشاره به حجمهاي عظیمی از دادهها که توسط سازمانهای بزرگی مانند گوگل یا ناسا ذخیره و تحلیل ميشوند مورد استفاده قرار ميگیرد. اما به تازگي، این عبارت بیشتر برای اشاره به مجموعههای دادهاي بزرگی استفاده ميشود که به قدری بزرگ و حجیم هستند که با ابزارهای مدیریتی و پایگاههاي داده سنتي و معمولي قابل مدیریت نیستند. مشکلات اصلي در کار با این نوع دادهها مربوط به برداشت و جمعآوری، ذخیرهسازی، جستوجو، اشتراکگذاری، تحلیل و نمایش آنها است. این مبحث، به این دلیل هر روز جذابیت و مقبولیت بیشتری پیدا ميکند که با استفاده از تحلیل حجمهاي بیشتری از دادهها، ميتوان تحلیلهاي بهتر و پيشرفتهتري را برای مقاصد مختلف، از جمله مقاصد تجاری، پزشکی و امنیتی، انجام داد و نتایج مناسبتری را دریافتکرد. بيشتر تحلیلهای مورد نیاز در پردازش دادههاي عظیم، توسط دانشمندان در علومی مانند هواشناسی، ژنتیک، کانکتومیک (علوم مرتبط با نگاشت سیستمعصبی)، شبیهسازیهاي پیچیده فیزیک، تحقیقات زیستشناسی و محیطی، جستوجوی اینترنت، تحلیلهاي اقتصادی و مالی و تجاری مورد استفاده قرار ميگیرد. حجم دادههاي ذخیرهشده در مجموعههاي دادهاي Big Data، عموماً بهخاطر تولید و جمعآوری دادهها از مجموعه بزرگی از تجهیزات و ابزارهای مختلف مانند گوشیهاي موبایل، حسگرهای محیطی، لاگ نرمافزارهای مختلف، دوربینها، میکروفونها، دستگاههاي تشخیص RFID، شبکههاي حسگر بیسیم وغيره با سرعت خیرهکنندهاي در حال افزایش است، به طوری که در هر روز، 2,5 کوادریلیارد بایت (هر کوادریلیارد برابر 1027 است) داده در حال تولید است. یکی از مهمترین مسائل مرتبط با دادههاي عظیم، مشکل بودن کار با آنها به وسیله پایگاههاي دادهاي رابطهاي و بستههاي نرمافزاری تصویرنگاری دادهها و نرمافزارهای آماری رومیزی است. چراکه این دادهها، برای پردازششدن در یک زمان معقول به نرمافزارهای به شدت موازی شده با قابلیت اجرا روی دهها، صدها یا هزاران سرور نیاز دارند. البته مفهوم Big Data برای شرکتها و سازمانهای مختلف تعابیر متفاوتی دارد و هر کدام، بسته به کاربرد و نیازمندیهایی که دارند، در حجمی خاص و با شرایطی خاص به روشهاي جدیدی برای آسانکردن کار با این نوع دادهها روی ميآورند. از اینرو است که Big Data برای بعضی سازمانها، تنها صدهاگیگابایت حجم دارد در حالی که برای برخی، دهها و صدها ترابایت یا حتی مضاربي از اگزابایت و زتابایت از انواع دادههاي عظيم محسوب ميشوند. یکی از بهترین تعابیری که در زمینه توصیف و تبیین Big Data و چالشهاي پیش روی آن بهکار رفته است، ایده دوگليني (Doug Laney) در گزارش سال 2001 مؤسسه META group (اکنون گارتنر) بود که در آن عنوان شده است دادهها در سه بُعد مختلف در حال رشد هستند. این سه بعد عبارتند از حجم، سرعت و تنوع دادهها که روز به روز، نرخ رشد آنها با سرعتی باور نکردنی افزایش ميیابد. به همین دلیل، توصیف Big Data تنها با حجمهاي عظیم و نحوه مدیریت آنها کار درستی نیست و باید دیگر جنبههاي این مفهوم مهم و کلیدی را نیز در نظر گرفت. بر این اساس، با توجه به افزایش روز افزون استفاده از تجهیزات تولید یا جمعآوری دادهها و همچنین روی آوردن تعداد بیشتری از شرکتها و افراد به شکلهای جدیدی از زندگی دیجیتالی، اهمیت مفهوم Big Data و نحوه برنامهریزی و تعیین راهبردهاي مناسب برای بهرهبرداری صحیح از آن، دو چندان شده و نیاز به توسعه ابزارها و امکانات مناسب برای مدیریت بهتر آنها بیش از پیش مشخص ميشود.