آموزش استفاده از R برای داده ها بزرگ (Big Data) با خوشه های اسپارک (Spark)

  • یکشنبه ۸ اردیبهشت ۱۳۹۸
  • بازدید 4 نفر
  • 1 امتیاز2 امتیاز3 امتیاز4 امتیاز5 امتیاز (5 امتیاز از 1 رای)
    Loading...

r big data spark 22680 تصویر

آموزش استفاده از R برای داده ها بزرگ با اسپارک (Spark)

در این بخش فیلم آموزش استفاده از R برای داده ها بزرگ (Big Data) با خوشه های اسپارک (Spark) را به زبان انگلیسی آماده کرده ایم که در قالب ۶ بخش و ۱۹ قسمت در مدت ۲ ساعت و ۱۸ دقیقه تهیه شده است. مدرس این دوره مدرس این دوره آقای مانوئل آماناتگی (Manuel Amunategui) است که یک متخصص علوم داده، مشاور، معلم و نویسنده با تجربه بالا در زمینه علوم داده می باشد.

معرفی دوره

در این دوره آموزشی R ، علاقه مندان و افرادی که تحلیلگر داده هستند و با زبان R نیز آشنایی دارند، با استفاده از توان اسپارک (Spark) ، محاسبات توزیع شده و همینطور ذخیره سازی ابر را یا می گیرند. این دوره آموزشی، چگونگی بکارگیری مهارت هایی که در زبان R دارید را در یک محیط داده عظیم را نشان می دهد.

در این دوره آموزشی R شما می آموزید که چگونه خوشه های اسپارک (Spark) را در چارچوب سرویس های تحت وب آمازون (AWS) ایجاد نمائید. همچنین مدل سازی بر مبنای خوشه بندی داده ها را بوسیله مدل های خطی تعمیم یافته گاوس، مدل های خطی تعمیم پذیری دو جانبه، بیز ساده (Naive Bayes) و مدل سازی کی میانگین (K-means)، دسترسی به داده ها بوسیله دیتا فریم‌ های سرویس S3 Spark و دیگر فرمت ها همچون CSV ، Json و HDFS و انجام عملیات دستکاری با داده های مبتنی بر خوشه با استفاده از ابزار هایی نظیر Spark R و Spark SQL را می آموزید. شما با گذراندن این دوره می توانید با مجموعه داده ها بزرگ (Big Data) کار کنید که در یک کامپیوتر مجزا و شخصی امکان پذیر نیست.

فهرست سرفصل های آموزش استفاده از R برای داده ها بزرگ (Big Data)

مقدمه

  • معرفی دوره
  • درباره مدرس

ایجاد خوشه و بررسی سرویس های وب آمازون

  • نحوه ایجاد یک AWS Launching instances
  • اتصال به نمونه AWS با استفاده از SSH
  • اتصال به نمونه AWS با استفاده از PuTTY
  • شروع کار با خوشه های اسپارک – بخش اول
  • شروع کار با خوشه های اسپارک – بخش دوم
  • خاتمه دادن به خوشه ها

مبانی داده ها و مذل سازی

  • مبانی داده ها
  • مدل سازی با مدل های خطی تعمیم یافته گاوس
  • مدل سازی با مدل های خطی تعمیم پذیری دو جانبه
  • بیز ساده و مدل سازی K-Means

منابع داده ها و دستکاری داده ها

  • داده های بزرگ تر و S3
  • دسترسی به دیتا فریم های S3 Spark
  • عملیات دیتا فریم Spark R
  • ماژول Spark SQL

فرمت HDFS و چارچوب Databricks

  • بررسی اجمالی فرمت HDFS
  • بررسی اجمالی چارچوب Databricks نسخه Community

نتیجه گیری

  • جمع بندی مطالب ارائه شده

مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید

    لیســــــــت پــــــــروژه های انتشــــــــار نشده ( 22 موضوع )

    مشاهده لیست کامل
    مشاهده لیست کامل
    socket programing آموزش برنامه نویسی آموزش سی شارپ بازی تحت شبکه بازی تحت شبکه به زبان سی شارپ برنامه تحت شبکه با سی شارپ برنامه نویسی ترجمه مقاله ترجمه مقاله شبکه خرید سورس بازی تحت شبکه دانلود بازی تحت شبکه دانلود رایگان پروژه های دانشجویی دانلود سورس برنامه دانلود سورس رایگان دانلود نرم افزار دانلود پروژه دانشجویی دانلود پروژه رایگان دانلود پروژه های دانشجویی دانلود کتاب دانلود کتاب آموزشی دانلود کتاب اموزشی سورس بازی با socket programing سورس رایگان سورس کد بازی تحت شبکه سورس کد بازی تحت شبکه با C# سورس کد بازی تحت شبکه چند نفره سوکت پروگرمین نحوه نوشتن برنامه تحت شبکه نحوه نوشتن برنامه تحت شبکه به زبان سی شارپ پروژه arena پروژه matlab پروژه ns2 پروژه opnet پروژه ارنا پروژه برای درس مهندسی اینترنت پروژه سیمولینک matlab پروژه مهندسی صنایع پروژه مهندسی صنایع با ارنا پروژه های آماده با OpenGL پروژه های آماده با OpenGL در سی پلاس پلاس پروژه های آماده با ارنا پروژه های آماده برای درس گرافیک کامپیوتری پروژه هوش مصنوعی پروژه پردازش تصویر matlab پروژه پردازش سیگنال matlab