تبدیل دیتاست تشخیص نفوذ KDD99 برای استفاده الگوریتم های یادگیری ماشین در MATLAB

kdd99 dataset ids matlab 22752 1 تصویر

تبدیل دیتاست تشخیص نفوذ KDD99 در MATLAB

در این بخش سورس پیاده سازی و آماده سازی تبدیل دیتاست تشخیص نفوذ KDD99 جهت تزریق به الگوریتم های یادگیری ماشین را در نرم افزار MATLAB آماده کرده ایم که در ادامه به توضیحاتی در این باره پرداخته و لینک خرید آن قرار داده شده است.

تهیه و استفاده از دیتاست در پروژه

یکی از مشکلات و چالش های پژوهشگران در بخش دیتاست ها، نحوه جستجو و تهیه دیتاست (Dataset) می باشد. اما اصلی ترین مشکل بعد از یافتن دیتاست، نحوه بکارگیری و تزریق آن به الگوریتم ها می باشد. بیشتر دیتاست ها یا مجموعه داه ها به صورت خام بوده و جهت استفاده از آنها باید پیش پردازش شوند. احتمال دارد که داده ها در دیتاست ها، نوع های متفاوتی داشته باشند (مثل رشته یا عدد) که چگونگی تبدیل آنها به فرمت مخصوص الگوریتم ها، با در نظر گرفتن ابعاد بسیار بزرگ دیتاست ها، امری چالش برانگیز، سخت و همینطور بسیار وقت گیر است. به ویژه در مواقعی که جهت دیدن نتیجه بعد از اجرای کد، باید ساعت ها منتظر ماند.

معرفی دیتاست KDD Cup 99

دیتاست KDD99 یک داده‌ استاندار به منظور ارزیابی سیستم های تشخیص نفوذ (Intrusion Detection System – IDS) می باشد که اعتبار خود را از سومین مسابقه بین الملی کشف دانش (Knowledge Discovery) و داده کاوی (Data Mining) کسب کرده است. گروه IST از آزمایشگاه MIT Lincoln اولین داده های استاندارد به منظور بررسی و ارزیابی سیستم های تشخیص نفوذ (IDS) را جمع آوری کرده اند. اطلاعات فوق در طی چند هفته در یک قالب یک شبیه سازی جهت آزمایش سیستم تشخیص نفوذ DARPA مورد استفاده قرار گرفت. این مجموعه داده ها براساس اطلاعاتی که بین سال ۱۹۹۸ تا ۱۹۹۹ جمع آوری شده اند، بندی شده است. دیتاست KDD99 متشکل از رکورد های اتصال استانداردی است که مجموعه ای از حملات و نفوذ های شبیه سازی شده در یک شبکه نظامی را دربر دارد.

یک اتصال با پروتکل TCP و UDP و یا پروتکل ICMP می باشد که در زمان های مشخصی شروع و به پایان می رسد و بین آن زمان ها، داده ها از آدرس IP مبدا به آدرس IP مقصد و برعکس، براساس یک پروتکل تعریف شده، در جریان هستند. هر کدام از اتصال ها به عنوان نرمال (Normal) یا حمله (Attack) برچسب گذاری شود و در مواقع حمله، نوع آن به صورت دقیق مشخص می شود.

kdd99 dataset ids matlab 22752 2 تصویر

دسته بندی حملات

حملاتی که در این مجموعه داده وجود دارند، در چهار دسته اصلی شامل U2R ، R2L ، DOS و Probe هستند. دیتاست KDD99 در قالب چند فایل سازماندهی شده است. در این مجموعه از فایل ها، دو فایل به نام های ۱۰_percent و corrected قرار دارد که در اغلب پروژه ها از دیتاست ۱۰_percent به منظور آموزش و آزمایش سیستم های طراحی شده استفاده می شود.

جزئیات دیتاست KDD99

مجموعه داده KDD99 (فایل ۱۰_percent) در مخزن داده ای UCI به صورت رایگان در دسترس است که شما کاربران گرامی می توانید با کلیک در اینجا دانلود نمائید. همانطور که در توضیحات بالا نیز اشاره شد، حملاتی که در این مجموعه داده وجود دارند، در چهار دسته اصلی شامل U2R ، R2L ، DOS و Probe قرار می گیرند. ولی در خود فایل ۱۰_percent در ۲۳ دسته مختلف قرار دارد. با توجه به این موضوع، طبق مقالات و رفرنس های مختلف، ما هم این دسته بندی را به صورت زیر در ۴ گروه انجام دادیم که اعداد جلوی آنها مربوط به تعداد رکوردهای موجود می باشد:

There are total of 23 types of attack, and all of them belong to the four main attack categories (DoS, R2L, U2R, Probing) and normal.

%normal.=normal. =97278

%DoS=back. land. neptune. pod. smurf. teardrop. =391458

%R2L=warezclient. warezmaster. spy. multihop. phf. ftp_write. guess_passwd. imap.=1126

%U2R=rootkit. perl. loadmodule. buffer_overflow.= 52

%Probing=portsweep. satan. ipsweep. nmap.= 4107

ما ۵ کلاس داریم که در بین آنها، یک کلاس مربوط به حالت نرمال و ۴ کلاس دیگر نیز مربوط به حمله می باشد. تعداد کل داده های ۱۰ درصدی ۴۹۴۰۲۱ رکورد است. این دیتاست شامل ۴۱ ویژگی یا ستون می باشد و ستون ۴۲ نیز معرف نوع حمله یا نرمال بودن را نشان می دهد. تصویر زیر این دیتاست را نشان می دهد که در آن هر یک از ستون ها معرف یک خصیصه از یک اتصال می باشد که در فایل دانلودی از سایت UCI نیز قابل مشاهده می باشد.

تصویر از دیتای در قالب فایل txt و mat

kdd99 dataset ids matlab 22752 3 تصویر kdd99 dataset ids matlab 22752 4 تصویر kdd99 dataset ids matlab 22752 5 تصویر kdd99 dataset ids matlab 22752 6 تصویر kdd99 dataset ids matlab 22752 7 تصویر


انجام پروژه ها و شبیه سازی مقالات و پایان نامه ها با متلب

انجام پروژه ها و شبیه سازی مقالات و پایان نامه ها با متلب

مشاهده انجام پروژه با متلب
پروژه ها و آموزش های برنامه نویسی

پروژه ها و آموزش های برنامه نویسی

آموزش برنامه نویسی

مشاهده ویدئو در این باره

خوشحال خواهیم شد اگر نظر خودتون رو درباره این مطلب ثبت کنید

خطا!دکمه ریفریش را بزنید

    لیســــــــت پــــــــروژه های انتشــــــــار نشده ( 22 موضوع )

    مشاهده لیست کامل
    مشاهده لیست کامل
    socket programing آموزش برنامه نویسی آموزش سی شارپ بازی تحت شبکه بازی تحت شبکه به زبان سی شارپ برنامه تحت شبکه با سی شارپ برنامه نویسی ترجمه مقاله ترجمه مقاله شبکه خرید سورس بازی تحت شبکه دانلود بازی تحت شبکه دانلود رایگان پروژه های دانشجویی دانلود سورس برنامه دانلود سورس رایگان دانلود نرم افزار دانلود پروژه دانشجویی دانلود پروژه رایگان دانلود پروژه های دانشجویی دانلود کتاب دانلود کتاب آموزشی دانلود کتاب اموزشی سورس بازی با socket programing سورس رایگان سورس کد بازی تحت شبکه سورس کد بازی تحت شبکه با C# سورس کد بازی تحت شبکه چند نفره سوکت پروگرمین نحوه نوشتن برنامه تحت شبکه نحوه نوشتن برنامه تحت شبکه به زبان سی شارپ پروژه arena پروژه matlab پروژه ns2 پروژه opnet پروژه ارنا پروژه برای درس مهندسی اینترنت پروژه سیمولینک matlab پروژه مهندسی صنایع پروژه مهندسی صنایع با ارنا پروژه های آماده با OpenGL پروژه های آماده با OpenGL در سی پلاس پلاس پروژه های آماده با ارنا پروژه های آماده برای درس گرافیک کامپیوتری پروژه هوش مصنوعی پروژه پردازش تصویر matlab پروژه پردازش سیگنال matlab