آموزش طبقه بندی داده های آیریس با درخت تصمیم C5 در R
در این بخش فیلم آموزشی طبقه بندی داده های آیریس (Iris) با الگوریتم درخت تصمیم C5 در R را به زبان انگلیسی آماده کرده ایم که در مدت ۴۵ دقیقه تهیه شده است. در ادامه به معرفی دیتاست Iris و معرفی الگوریتم C5.0 پرداخته و لینک دانلود رایگان آموزش قرار داده شده است.
مجموعه داده IRIS (دیتاست آیریس)
مجموعه داده گل زنبق (Iris flower data set) یا مجموعه داده زنبق فیشر (دیتاست IRIS) یک مجموعه داده چند متغیره می باشد که توسط رانلد فیشر در سال ۱۹۳۶ معرفی شده است. مجموعه داده IRIS در پروژه های یادگیری ماشین (Machine Learning) به خصوص در ماشین بردار پشتیبان (الگوریتم SVM) استفاده می شود.
الگوریتم درخت تصمیم C5
درخت تصمیم (Decision Tree) اغلب از چندین گره تشکیل می شود که با نام گره های ورودی و خروجی شناخته می شوند. قوانین ایجاد شده در درخت تصمیم به صورت اگر و آنگاه بیان می گردد. از بین الگوریتم های مورد استفاده در ساخت درخت تصمیم، مهمترین آنها الگوریتم C5 است. الگوریتم C5.0 یا C5.0 Decision Tree Algorithm از الگوریتم های پرکاربرد یادگیری ماشین (Machine Learning) و درخت تصمیم می باشد که یک الگوریتم برای ساخت درخت های تصمیم گیری است و توسعه یافته الگوریتم C4.5 و الگوریتم ID3 می باشد. این الگوریتم می تواند جهت بیان دسته بندی به صورت درخت تصمیم و یا مجموعه قوانین مورد استفاده قرار گیرد. در خیلی از برنامه های کاربردی، مجموعه قوانین ترجیح داده می شوند که دلیل آن نیز درک ساده آنها نسبت به درخت های تصمیم گیری می باشد.
مشاهده ویدئو در این باره