به محفل ریاضی ایرانیان خوش آمدید! لطفا برای استفاده از تمامی امکانات عضو شوید
سایت پرسش و پاسخ ریاضی
0 امتیاز
7,236 بازدید
در دانشگاه توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein

۸.۲- تعریف و انتخابِ معیارهایِ سنجشِ شباهت، موضوعی مهم برای تحلیل داده‌ها است. با این حال، به صورت معمول هیچ سنجه‌ای برای مسأله‌ای خاص پذیرفته نشده‌است. نتایج تحلیل ممکن است به شدت به سنجهٔ به کار برده شده وابسته باشد. با وجود این، همهٔ این سنجه‌ها را می‌توان با تغییرات به یکدیگر تبدیل نمود.

فرض کنید مجموعه‌دادهٔ دوبعدی زیر را درایم: $$\begin{array}{|c|c|c|} \hline & A_1 & A_2\\ \hline x_1 & 1.5 & 1.7\\ \hline x_1 & 2 & 1.9\\ \hline x_3 & 1.6 & 1.8\\ \hline x_4 & 1.2 & 1.5\\ \hline x_5 & 1.5 & 1.0\\ \hline \end{array}$$ الف) با توجه به دادهٔ جدیدِ $x_6=(1.1,4.6)$ و فاصلهٔ اقلیدسی، فاصلهٔ منهتن، فاصلهٔ سوپریمم و شباهت کسینوسی، داده‌های پایگاه دادهٔ مفروض را رتبه‌بندی کنید.

سلام. عذر می‌خوام، می‌شه در حل این سوال هم راهنماییم بفرمایید. منظورش از دادهٔ دوبعدی چی هست؟ در صورت سوال هم یک داده جدید داره که من متوجه نشدم منظورش رو؟ حساب کردن این مورد هم مثل قبلی‌هاست؟

مرجع: کتاب Data mining- concepts and techniques نوشتهٔ Jiawei Han و Micheline Kamber و Jian Pei ویرایش سوم، تمرین ۲.۸ بند a صفحه ۸۱
توسط fo-eng (74 امتیاز)
بله کاملا درسته. سپاسگذارم.
توسط erfanm (13,846 امتیاز)
+2
سلام متاسفانه منظور سوال رو متوجه نمیشم
اما منظور از  داده دو بعدی همان داده با دو مولفه است مثل (3و2) که داده ای دو مولفه ای است.
منبع درسیتون چیه؟
توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein
راستش خودم هم متوجه نمیشم. این رو می تونید انجام بدید؟ فاصله اقلیدسی - منهتن - مینکوفسکی - سوپریمم اش رو بدست بیارید. درس داده کاوی هست. حل المسائلش رو بگذارم؟
توسط erfanm (13,846 امتیاز)
+1
اره حل المسایل رو بذارید شاید از روی اون متوجه بشم
توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein
–1
بفرمایید:
http://s3.picofile.com/file/8208298276/Data_Mining_Concepts_and_Techniques.pdf.html
صفحه 25 تمرین 2.17. البته من بیشتر مد نظرم اینه که بشه از این سوال این موارد رو بدست بیاریم:
فاصله اقلیدسی - منهتن - مینکوفسکی - سوپریمم. ممنون

1 پاسخ

+2 امتیاز
توسط erfanm (13,846 امتیاز)
ویرایش شده توسط erfanm

سوال یک کم بد ترجمه شده منظور سوال اینه که هر بار فاصله اقلیدسی داده دو بعدی $x=(1.1,4.6) $ را با داده های دوبعدی دیگر بدست آوریم مثلا برای داده دو بعدی $ x_{1}=(1.5,1.7) $ داریم فاصله برابر است با:

$$ \sqrt{(1.5-1.1)^{2} +(1.7-4.6)^{2}}= \sqrt{0.16+8.41} = \sqrt{8.57} $$

اما در کتاب داریم $x=(1.4,1.6)$ پس داریم فاصله اقلیدسی برابر است با:

$$ \sqrt{(1.5-1.4)^{2} +(1.7-1.6)^{2}}= \sqrt{0.01+0.01} = \sqrt{0.02} =0.14 $$

برای $x=(1.4,1.6)$ و $x_{2}=(2,1.9)$ فاصله اقلیدسی برابر است با :

$$ \sqrt{(2-1.4)^{2} +(1.9-1.6)^{2}}= \sqrt{0.36+0.09} = \sqrt{0.45} =0.67 $$

و فاصله اقلیدسی بقیه هم بطور مشابه بدست می آید

حال فاصله منهتن رو پیدا میکنیم:

برای داده دو بعدی $ x_{1}=(1.5,1.7) $ و $x=(1.4,1.6)$داریم فاصله منهتن برابر است با:

$$ \mid 1.5-1.4 \mid + \mid 1.7-1.6 \mid =0.1+0.1=0.2 $$

و برای داده دو بعدی $x_{2}=(2,1.9)$ و $x=(1.4,1.6)$داریم فاصله منهتن برابر است با:

$$ \mid 2-1.4 \mid + \mid 1.9-1.6 \mid =0.6+0.3=0.9 $$

و فاصله منهتن بقیه هم بطور مشابه بدست می آید

برای مینکوفسکی باید در سوال $q $ داده شده باشد با فرض $ q=3$ داریم که برای داده دو بعدی $ x_{1}=(1.5,1.7) $ و $x=(1.4,1.6)$ فاصله مینکوفسکی برابر است با:

$$ \sqrt[3]{(1.5-1.4)^{3}+(1.7-1.6)^{3}} = \sqrt[3]{(0.1)^{3}+(0.1)^{3}}= \sqrt[3]{0.001+0.001 }= \sqrt[3]{0.002} $$

و برای داده دو بعدی $x_{2}=(2,1.9)$ و $x=(1.4,1.6)$داریم فاصله مینکوفسکی برابر است با:

$$ \sqrt[3]{(2-1.4)^{3}+(1.9-1.6)^{3}} = \sqrt[3]{(0.6)^{3}+(0.3)^{3}}= \sqrt[3]{0.216+0.027 }= \sqrt[3]{0.243} $$

حال فاصله سوپریمم رو پیدا میکنیم:

برای داده دو بعدی $ x_{1}=(1.5,1.7) $ و $x=(1.4,1.6)$ فاصله سوپریمم به اینصورت بدست می آید که قدر مطلق مولفه ی اول $ x $ و $ x_{1} $ یعنی $ \mid 1.5-1.4 \mid=0.1 $ را بدست می آوریم سپس قدر مطلق مولفه ی دوم $ x $ و $ x_{1} $ یعنی $ \mid 1.7-1.6 \mid=0.1 $ را بدست می آوریم در انجا چون دو مولفه داریم همین دو تا را داریم اگر داده $ n $ بعدی باشد $ n $ عدد خواهیم داشت.

حال از بین اعداد بدست آمده بزرگترینشون همون فاصله سوپریمم است که در این حالت در هرد این مقدار $0.1$ است لذا فاصله سوپریمم برابر است با $0.1$

و برای داده دو بعدی $x_{2}=(2,1.9)$ و $x=(1.4,1.6)$ دو مقدار $\mid 2-1.4 \mid=0.6$ و $ \mid 1.9-1.6 \mid=0.3$ را داریم که بزرگترینش همان $0.6$ است پس فاصله سوپریمم برابر می شود با $0.6$

و برای داده دو بعدی $x_{3}=(1.6,1.8)$ و $x=(1.4,1.6)$ دو مقدار $\mid 1.6-1.4 \mid=0.2$ و $ \mid 1.8-1.6 \mid=0.2$ را داریم که بزرگترینش همان $0.2$ است پس فاصله سوپریمم برابر می شود با $0.2$

و برای داده دو بعدی $x_{4}=(1.2,1.5)$ و $x=(1.4,1.6)$ دو مقدار $\mid 1.2-1.4 \mid=0.2$ و $ \mid 1.5-1.6 \mid=0.1$ را داریم که بزرگترینش همان $0.2$ است پس فاصله سوپریمم برابر می شود با $0.2$


حمایت مالی

کانال تلگرام محفل ریاضی
امروز : تاریخ شمسی اینجا نمایش داده می‌شود
...