به محفل ریاضی ایرانیان خوش آمدید! لطفا برای استفاده از تمامی امکانات عضو شوید
سایت پرسش و پاسخ ریاضی
0 امتیاز
45,372 بازدید
در دبیرستان و دانشگاه توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein

سلام. چگونه انحراف معیار برای داده‌های جدول زیر را می‌توانم بدست آورم؟

فرض کنید بیمارستانی سن و درصد چربی بدن ۱۸ فرد بالغ که به تصادف گزینش شده‌اند را اندازه گرفته‌است و داده‌ها را در جدول زیر قرار داده‌است. $$\begin{array}{|c|c|} \hline \text{age} & 23 & 23 & 27 & 27 & 39 & 41 & 47 & 49 & 50 \\ \hline \text{%fat} & 9.5 & 26.5 & 7.8 & 17.8 & 31.4 & 25.9 & 27.4 & 27.2 & 31.2 \\ \hline \end{array}$$ $$\begin{array}{|c|c|} \hline \text{age} & 52 & 54 & 54 & 56 & 57 & 58 & 58 & 60 & 61 \\ \hline \text{%fat} & 34.6 & 42.5 & 28.8 & 33.4 & 30.2 & 34.1 & 32.9 & 41.2 & 35.7 \\ \hline \end{array}$$

مرجع: کتاب Data mining- concepts and techniques نوشتهٔ Jiawei Han و Micheline Kamber و Jian Pei ویرایش سوم، تمرین 2.4 بند a صفحه ۸۰
توسط AmirHosein (19,561 امتیاز)
@fo-eng داده‌هایتان حذف شده‌اند، آنها را تایپ کنید.

3 پاسخ

+1 امتیاز
توسط erfanm (13,846 امتیاز)

انحراف ار معیار همان جذر واریانس است. کافی واریانس سن ها را بیابیم و از آن جذر بگیریم تا انحراف معیار سن بدست آید و برای درصد چربی نیز به همین منوال

برای واریانس دو فرمول داریم:

$ \sigma ^{2}= \sum_{i=1}^n \frac{ F_{i}( X_{i} - \overline{X} )^{2} }{N} $

که در آن $ F_{i} $ فراوانی مطلق و $ N$ تعداد کل داده ها است.

در این سوال فراوانی برابر 1 است.

فرمول دوم برابر است با:

$ \sigma ^{2}= \sum_{i=1}^N \frac{( X_{i} )^{2} }{N}- \overline{X}^{2} $

(این فرمولها برای دبیرستان صادق است در آمار دانشگاهی اگر تعداد داده ها 30 و یا کمتر باشد در مخرج به جای $N$ از $N-1$ استفاده می شود)

در این سوال برای سن میانگین برابر است با :

$ \frac{23+23+27+39+...+58+58+60+61}{18}= \frac{836}{18} =46.4$ $ \sigma ^{2}= \sum_{i=1}^{18} \frac{2( 23 - 46.4 )^{2} +2( 27 - 46.4 )^{2}+( 39 - 46.4 )^{2}+...+2( 58 - 46.4 )^{2}+( 60 - 46.4 )^{2}+( 61 - 46.4 )^{2}}{18} $
توسط AmirHosein (19,561 امتیاز)
@erfanm قانون منهای یک کردن در مخرج به تعداد داده‌ها وابسته نیست بلکه اگر کل داده‌های جامعهٔ آماری را به کار برده‌باشید هرگر منهای یک نمی‌کنید چه کمتر از ۳۰ تا باشند چه نباشند. اگر هم از کل داده‌های جامعه استفاده نکرده بلکه از داده‌های نمونه‌ای از جامعه استفاده کرده‌باشید آنگاه حتی بیشتر از ۳۰ تا هم باشند منهای یک را در مخرج می‌گذارید. زمانی که $n$ بزرگتر از ۳۰ هست برخی می‌گویند گذاشتن $n$ یا $n-1$ در مخرج تفاوت زیادی ایجاد نمی‌کند ولی این حرف به دو چیز وابسته است: ۱- میزان دقت قرارداد شده برای هدف، ممکن است فردی به تعداد رقم بیشتری نیاز داشته باشد پس این مقدار ناچیز برایش مهم باشد. ۲- ممکن است عددهای داده‌هایتان طوری باشند که حاصل تقسیم برای دو انتخاب یاد شده اختلافشان ناچیز نشود.
0 امتیاز
توسط

می توانید از این برنامه برای محاسبه انحراف معیار کمک بگیرید
http://s8.picofile.com/file/8332114984/Standard_Deviation.exe.html
در ابتدا تعداد رو وارد کنید بعد اعداد رو وارد کنید؛ به ترتیب میانگین، واریانس و انحراف معیار رو به شما میده.

0 امتیاز
توسط AmirHosein (19,561 امتیاز)
ویرایش شده توسط AmirHosein

احتمال می‌دهم دیدن جدول شما را گیج کرده‌است. در واقع شما دو نوع داده دارید؛ ۱- سن. ۲- درصد چربی. و بند a پرسش کتاب دو انحراف معیار جداگانه را خواسته است. یکی انحراف معیار سن‌ها و یکی انحراف معیار درصد چربی بدن. به متن بند a توجه کنید؛

(a) calculate the mean, median, and standard deviation of age and %fat.

یعنی «میانگین، میانه و انحراف معیار را برای سن و درصد چربی محاسبه کنید». یعنی این سه کمیت را یک بار برای سن و یک بار برای درصد چربی بدست آورید.

پرسش گفته‌است انحراف معیار داده‌های جدول را بیابید. پس نیازی به گذاشتن $n-1$ به جای $n$ در مخرج فرمول نیست. ولی اگر می‌گفت انحراف معیار کل جامعه‌ای که این ۱۸ نفر از آن به تصادف گزینش شده‌اند را بیابید آنگاه چون با نمونه‌ای از جامعه سر و کار دارید و تمام جامعهٔ آماری نیست، در حال برآرود کردن کمیت‌های بالا برای متغیر تصادفی‌هایتان هستید یعنی خود میانگین، میانه و انحراف معیار واقعی جامعه (متغیر تصادفی‌تان) را نمی‌یابید بلکه برآوردی برای آن به کمک دادهٔ اعضای نمونه‌ای که از جامعه برداشته‌اید می‌زنید. برآورد یا تخمین میانگین فرمول یکسانی با فرمول میانگین کل جامعه دارد ولی فرمول واریانس (که جذرش انحراف معیار است) برای نمونه در مخرج $n-1$ دارد و نه $n$ و کاری به تعداد اعضای نمونه یا جامعه ندارد. علت $n-1$ در مخرج فرمول واریانس برای نمونه bias شدن برآورد (تخمین) است.

به هر حال، در این پرسش شما مخرج را $n$ می‌گذارید. پس یک بار فقط به سطر سن‌ها نگاه کنید، میانگین را بدست آورید و سپس واریانس با فرمول $\sigma^2_X=\frac{\sum_{i=1}^n(x_i-\bar{x})^2}{n}$ که منظور از $n$ تعداد اعضای نمونه، $\sigma^2_X$ واریانس داده‌ها، $\bar{x}$ میانگین داده‌ها، و $x_i$ دادهٔ $i$اُم نمونه است. سپس جذر عدد یافت‌شده انحراف‌معیاری است که به دنبالش هستید. سپس فقط به سطر درصدچربی‌ها نگاه کنید، و دقیقا مسیر یکسان را بپیمایید. پاسخ‌های نهایی شما برای سن $12.8461\cdots$ و برای درصد چربی $8.9936\cdots$ می‌شود.

برای افرادی که ممکن است بخواهند در شغل یا کار خاصی روی داده‌های واقعی کار کنند بد نیست که انجام چنین محاسباتی به کمک ماشین‌حساب‌های پیشرفته یا نرم‌افزارها را نیز فراگیرند. اگر از Excel استفاده می‌کنید، می‌توانید داده‌هایتان را در خانه‌های یک فایل بنویسید و سپس از دستورهای زیر استفاده کنید. برای نمونه فرض کنید داده‌های سن‌ها را در خانه‌های ستون B از سطر ۴ تا ۲۱ و داده‌های درصد چربی را در خانه‌های ستون C از سطر ۴ تا ۲۱ نوشته‌ایم (مانند شکل زیر). آنگاه می‌خواهیم در خانهٔ F4 (خانهٔ ستون F سطر ۴) بگذاریم. کافیست روی این خانه کلیک کنید و تایپ کنید =AVERAGE(B4:B21) و سپس کلید Enter یا Tab را بزنید تا اجرا شود. دستور AVERAGE برای میانگین، دستور MEDIAN برای میانه و دستور STDEVP برای انحراف معیار با مخرج $n$ به کار می‌روند. ST کوتاه‌شدهٔ Standard و DEV کوتاه شدهٔ Deviation و P کوتاه‌شدهٔ Population هستند که به ترتیب یعنی استاندارد (معیار)، انحراف، جمعیت. اگر می‌خواهید انحراف معیار با مخرج $n-1$ را داشته باشید از STDEV بدون حرف P در انتها استفاده کنید. هر یک از این دستورها نیاز به ورودی دارند که ورودی را در داخل پرانتز جلویشان می‌نویسد. در اینجا وقتی می‌نویسید B4 بعد دونقطه و بعد B21 یعنی تمام خانه‌های B4 تا B21. توجه کنید که علامت مساوی در ابتدای فرمول بگذارید که یعنی مقدار داخل این خانه مساوی است با نتیجهٔ این فرمول. اکنون اگر مقدار داده‌های خانه‌های داده‌دار را تغییر دهید، به صورت خودکار خانه‌های فرمول‌دار نیز به روز می‌شوند بدون نیاز به اینکه دوباره آنها را تغییر دهید.

توضیحات تصویر

توضیحات تصویر


حمایت مالی

کانال تلگرام محفل ریاضی
امروز : تاریخ شمسی اینجا نمایش داده می‌شود
...