آپاچی اسپارک

از OCCC Wiki
پرش به ناوبری پرش به جستجو

آپاچی اسپارک یک چارچوب محاسبات خوشه‌ای متن‌باز است که در اصل در آزمایشگاه AMPLab دانشگاه برکلی توسعه داده شده است. Spark's in-memory در یک نرم‌افزار کاربردی معین کارایی ۱۰۰ برابر نگاشت کاهش دو مرحله‌ای هادوپ(Hadoop's two-stage disk-based MapReduce paradigm) را فراهم می‌کند.اسپارک برای الگوریتم‌های یادگیری ماشین بسیار مناسب است. اسپارک یکی از فعال‌ترین پروژه‌های متن‌باز است و در سال ۲۰۱۴ بیش از ۴۶۵ کمک‌کننده[ در توسعه] داشت که آن را فعال‌ترین پروژه‌های بنیاد آپاچی در خصوص پروژه‌های نرم‌افزاری کلان داده(Big Data)ساخته‌اند. اسپارک در ابتدا در سال ۲۰۰۹ توسط Matei Zaharia در آزمایشگاه AMPLab دانشگاه برکلی شروع شد و در سال ۲۰۱۰ تحت مجوز BSD متن‌باز شد. در ۲۰۱۳ این پروژه به بنیاد نرم‌افزاری آپاچی هدیه شد و مجوز آن به آپاچی۲.۰ تغییرکرد و یک پروژه‌های سطح بالای آپاچی شد. در نوامبر۲۰۱۴ تیم مهندسی Databricks از اسپارک استفاده کردند و رکورد جهانی جدیدی در مرتب سازی مقیاس بالا ثبت‌کرد.