خوشه بندی و بهینه سازی انتخاب رشته دانش آموزان با R

  • سه شنبه ۲۶ بهمن ۱۴۰۰
  • بازدید 42 نفر
  • 1 امتیاز2 امتیاز3 امتیاز4 امتیاز5 امتیاز (25 امتیاز از 5 رای)
    Loading...

students field selection r 23793 تصویر

خوشه بندی و بهینه سازی انتخاب رشته دانش آموزان با نرم افزار R

در این بخش پروژه خوشه بندی و بهینه سازی انتخاب رشته دانش آموزان با نرم افزار R به همراه داکیومنت و فیلم آموزشی فارسی آماده کرده ایم که در ادامه توضیحاتی از معرفی پروژه ارائه شده و قسمتی از فیلم آموزشی قرار داده شده است.

معرفی پروژه

در این پروژه دیتاست ما نمرات دانش آموزان است که با توجه به ترازها برای هر درس در ۶ رشته موجود انتخاب رشته می شوند. به عوان مثال مجموع امتیاز برای رشته ریاضی، تراز رشته ریاضی می شود که با امتیاز مشاوره برای این رشته جمع و به عنوان تراز نهایی اعمال می گردد. خوشه های ما در این دیتاست ۶ رشته کاردانش، فنی حرفه ای، ادبیات و معارف، ریاضی و تجربی می باشند. قابل ذکر است که ۸۰ درصد دیتا به عنوان آموزشی و ۲۰ درصد نیز به عنوان تست مورد استفاده قرار می گیرد. در این پروژه برای خوشه بندی دیتا ها الگوریتم K نزدیک ترین همسایه (KNN) و برای بهینه سازی آن نیز از ادغام الگوریتم PSO و همچنین از الگوریتم درخت پوشای کمینه (MST) برای خوشه بندی دانش آموزان با توجه به ترازها استفاده می شود.

مرحله کار پیاده سازی

مرحله اول آماده سازی داده ها جهت ورود به محیط R و آنالیز می باشد. برای این منظور علوم تجربی به عنوان گروه ۱، ریاضی به عنوام گروه ۲، معارف به عنوان گروه ۳، ادبیات به عنوان گروه ۴، کاردانش گروه ۵ و فنی و حرفه ای به عنوان گروه ۶ نامگذاری شده اند. از طرف دیگر برخی داوطلبان که انتخاب رشته نکرده بودند و یا در انتظار انتخاب رشته مجدد بودند از داده حذف شدند. با اعمال این تغییرات داده حاوی ۶۷ سطر (دانش آموز) و ۱۳ ستون می باشد که ۱۲ ستون اول به عنوان متغیر های پیشگو و ستون آخر که مقادیر ۱ تا ۶ را دارد عناوین رشته های انتخابی دانش آموزان می باشد که قرار است پیشگویی آن انجام شود.

در مرحله بعد داده ها وارد برنامه می شوند. برای ورود داده ها از فایل ارسالی به نام mdat.csv که با فرمت .csv می باشد و حاوی داده اصلاح شده است استفاده می شود. پس از بارگذاری داده ها، آنها را از نظر تعادل (یعنی تعداد دانش آموزان در هر رشته باید مساوی و یا نزدیک به هم باشند) مورد ارزیابی قرار می دهیم. مرحله بعدی شامل تقسیم کردن داده ها به دو مجموعه آموزش (training) و آزمون (test) می باشد که به صورت ۸۰ به ۲۰ درصد انجام شده است. در مرحله بعدی از روش یادگیری ماشینی k nearest neighbor (knn) استفاده شد. این روش یادگیری ماشینی بر اساس گروه های موجود در داده و بر اساس متغیر های پیشگو به گونه های داده ها را دسته بندی می کند که بر اساس متغیر های پیشگو کمترین فاصله را بین نمونه ها در داخل گروه ایجاد کند و بیشترین فاصله را بین نمونه های موجود در گروه های مختلف ایجاد کند. برای این روش یادگیری از پکیج caret در نرم افزار R استفاده شده است. توضیحات بیشتر و جزئی تر در داکیومنت به همراه پروژه ارائه خواهد شد.


پروژه ها و آموزش های برنامه نویسی

پروژه ها و آموزش های برنامه نویسی

آموزش برنامه نویسی

مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید

    لیســــــــت پــــــــروژه های انتشــــــــار نشده ( 22 موضوع )

    مشاهده لیست کامل
    مشاهده لیست کامل
    مشاهده لیست کامل
    مشاهده لیست کامل
    socket programing آموزش برنامه نویسی آموزش سی شارپ اینترنت اشیا بازی تحت شبکه بازی تحت شبکه به زبان سی شارپ برنامه تحت شبکه با سی شارپ برنامه نویسی ترجمه مقاله ترجمه مقاله شبکه دانلود رایگان پروژه های دانشجویی دانلود سورس برنامه دانلود سورس رایگان دانلود نرم افزار دانلود پروژه دانشجویی دانلود پروژه رایگان دانلود پروژه های دانشجویی دانلود کتاب دانلود کتاب آموزشی دانلود کتاب اموزشی سورس رایگان سورس کد بازی تحت شبکه سورس کد بازی تحت شبکه با C# سورس کد بازی تحت شبکه چند نفره سوکت پروگرمین شبکه SDN شبیه سازی با نرم افزار R نحوه نوشتن برنامه تحت شبکه نرم افزار Rstudio پروژه arena پروژه matlab پروژه ns2 پروژه opnet پروژه ارنا پروژه سیمولینک matlab پروژه شبکه عصبی پروژه مهندسی صنایع پروژه مهندسی صنایع با ارنا پروژه های آماده با OpenGL پروژه های آماده با OpenGL در سی پلاس پلاس پروژه های آماده با ارنا پروژه های آماده برای درس گرافیک کامپیوتری پروژه هوش مصنوعی پروژه پردازش تصویر matlab پروژه پردازش سیگنال matlab