آشنایی با واریانس و انحراف معیار در زبان R
در این بخش مقاله آموزشی آشنایی با واریانس و انحراف معیار در R را برای علاقه مندان به مباحث آماری و زبان R آماده کرده ایم که در ادامه توضیحاتی از واریانس و انحراف معیار ارائه شده و نحوه استفاده از توابع sd و var در محیط نرم افزار R قرار داده شده است. همچمین یک فیلم آموزشی کوتاه نیز در رابطه با موضوع آموزش قابل مشاهده است.
مفهوم واریانس
واریانس به صورت مقدار متوسط مربع اختلاف مقادیر از میانگین تعریف شده است. برای محاسبه واریانس باید مراحل زیر را دنبال شود. ابتدا میانگین ساده اعداد به دست آید، سپس برای هر عدد مقدار میانگین را از آن تفریق کرده و نتیجه را به توان دو (مربع اختلاف) رساند. در نهایت میانگین مربع اختلافات به دست آمده محاسبه می شود. با انجام این مراحل، واریانس داده های شما آماده خواهد شد.
انحراف معیار
انحراف معیار مفهومی است که میزان پراکندگی داده های یک مجموعه را تعیین می کند و از این رو یکی از مهم ترین مقیاس های آماری در زمینه آمار توصیفی به حساب می آید. در صورتی که میانگین برآوردی از نقطه ثقل توزیع داده های یک مجموعه به دست می آید و مقیاسی تک بعدی جهت برآورد یک مجموعه دادهه ها فراهم می کند، می توان گفت که انحراف معیار هم میزان پراکندگی داده ها از نقطه میانگین را نشان می دهد، در نتیحه مقیاسی دو بعدی به منظور برآورد توزیع داده ها در اختیار ما قرار می دهد.
به طور کلی واریانس و انحراف معیار ، معیار های پراکندگی هستند که درجه تغییر پذیری، گسترش یا پراکندگی یک متغیر را تعیین می کنند. در کنار معیار های گرایش مرکزی، از معیار های پراکندگی آماری برای توصیف ویژگی های توزیع استفاده می شود. در این مقاله آموزشی نحوه محاسبه واریانس و انحراف معیار در R با توابع sd و var را یاد خواهید گرفت.
واریانس در R با تابع var
واریانس، نشان داده شده با فرمول زیر:
میانگین حسابی مجذور انحرافات مقادیر متغیر نسبت به میانگین آن است.
در اینجا n تعداد مشاهدات و x میانگین متغیر می باشد. طبق مشاهدات، مخرج n-1 برای ارائه یک برآوردگر بی طرفانه از واریانس برای i.i.d استفاده می می کند. واریانس همیشه مثبت است و مقادیر بیشتر نشان دهنده پراکندگی بالاتر است. هنگام استفاده از R می توانیم از تابع var برای محاسبه واریانس یک متغیر استفاده کنیم. با در نظر گرفتن بردار نمونه زیر می توان واریانس آن را با تابع محاسبه کرد:
# Sample vector
x <- c(10, 25, 12, 18, 5, 16, 14, 20)
# Variance
var(x) # 38.57143
توجه داشته باشید که این تابع یک آرگومان به نام na.rm ارائه می دهد که می تواند برای حذف مقادیر از دست رفته روی TRUE تنظیم شود.
انحراف معیار در R با تابع sd
انحراف معیار جذر مثبت واریانس است. در آمار، انحراف معیار بیشتر از واریانس استفاده می شود، زیرا در واحد های مشابه متغیر بیان می شود، در حالی که واریانس با واحد مربع بیان می شود. همانطور که در زیر نشان داده شده، در زبان R انحراف معیار را می توان با استفاده از تابع sd محاسبه کرد.
# Sample vector
x <- c(10, 25, 12, 18, 5, 16, 14, 20)
# Standard deviation
sd(x) # 6.21059
# Equivalent to:
sqrt(var(x)) # 6.21059
به طور مشابه، ما می توانیم واریانس را به عنوان مربع انحراف استاندارد محاسبه کنیم:
# Sample vector
x <- c(10, 25, 12, 18, 5, 16, 14, 20)
# Variance
sd(x) ^ 2 # 38.57143
تابع sd همچنین آرگومان na.rm را ارائه می کند که اگر بردار ورودی حاوی هر مقدار NA باشد، میتواند روی TRUE تنظیم شود. در غیر این صورت خروجی تابع یک NA خواهد بود.













































هیچ نظری ثبت نشده است