به محفل ریاضی ایرانیان خوش آمدید! لطفا برای استفاده از تمامی امکانات عضو شوید
سایت پرسش و پاسخ ریاضی

محفل ریاضی ایرانیان یک سایت پرسش و پاسخ برای تمامی کسانی است که ریاضی می خوانند. دانش آموزان، دانشجویان و اساتید ریاضی اینجا هستند. به ما ملحق شوید:

عضویت

هر سوال ریاضی که دارید می توانید بپرسید

سوال بپرسید

می توانید به سوالات پاسخ دهید

سوالات

امتیاز بگیرید و به دیگران امتیاز دهید

بدون پاسخ

Visanil
0 امتیاز
7,635 بازدید
در دانشگاه توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein

۸.۲- تعریف و انتخابِ معیارهایِ سنجشِ شباهت، موضوعی مهم برای تحلیل داده‌ها است. با این حال، به صورت معمول هیچ سنجه‌ای برای مسأله‌ای خاص پذیرفته نشده‌است. نتایج تحلیل ممکن است به شدت به سنجهٔ به کار برده شده وابسته باشد. با وجود این، همهٔ این سنجه‌ها را می‌توان با تغییرات به یکدیگر تبدیل نمود.

فرض کنید مجموعه‌دادهٔ دوبعدی زیر را درایم: \begin{array}{|c|c|c|} \hline & A_1 & A_2\\ \hline x_1 & 1.5 & 1.7\\ \hline x_1 & 2 & 1.9\\ \hline x_3 & 1.6 & 1.8\\ \hline x_4 & 1.2 & 1.5\\ \hline x_5 & 1.5 & 1.0\\ \hline \end{array}

الف) با توجه به دادهٔ جدیدِ x_6=(1.1,4.6) و فاصلهٔ اقلیدسی، فاصلهٔ منهتن، فاصلهٔ سوپریمم و شباهت کسینوسی، داده‌های پایگاه دادهٔ مفروض را رتبه‌بندی کنید.

سلام. عذر می‌خوام، می‌شه در حل این سوال هم راهنماییم بفرمایید. منظورش از دادهٔ دوبعدی چی هست؟ در صورت سوال هم یک داده جدید داره که من متوجه نشدم منظورش رو؟ حساب کردن این مورد هم مثل قبلی‌هاست؟

مرجع: کتاب Data mining- concepts and techniques نوشتهٔ Jiawei Han و Micheline Kamber و Jian Pei ویرایش سوم، تمرین ۲.۸ بند a صفحه ۸۱
توسط fo-eng (74 امتیاز)
بله کاملا درسته. سپاسگذارم.
توسط erfanm (13,871 امتیاز)
+2
سلام متاسفانه منظور سوال رو متوجه نمیشم
اما منظور از  داده دو بعدی همان داده با دو مولفه است مثل (3و2) که داده ای دو مولفه ای است.
منبع درسیتون چیه؟
توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein
راستش خودم هم متوجه نمیشم. این رو می تونید انجام بدید؟ فاصله اقلیدسی - منهتن - مینکوفسکی - سوپریمم اش رو بدست بیارید. درس داده کاوی هست. حل المسائلش رو بگذارم؟
توسط erfanm (13,871 امتیاز)
+1
اره حل المسایل رو بذارید شاید از روی اون متوجه بشم
توسط fo-eng (74 امتیاز)
ویرایش شده توسط AmirHosein
–1
بفرمایید:
http://s3.picofile.com/file/8208298276/Data_Mining_Concepts_and_Techniques.pdf.html
صفحه 25 تمرین 2.17. البته من بیشتر مد نظرم اینه که بشه از این سوال این موارد رو بدست بیاریم:
فاصله اقلیدسی - منهتن - مینکوفسکی - سوپریمم. ممنون

1 پاسخ

+2 امتیاز
توسط erfanm (13,871 امتیاز)
ویرایش شده توسط erfanm

سوال یک کم بد ترجمه شده منظور سوال اینه که هر بار فاصله اقلیدسی داده دو بعدی x=(1.1,4.6) را با داده های دوبعدی دیگر بدست آوریم مثلا برای داده دو بعدی x_{1}=(1.5,1.7) داریم فاصله برابر است با:

\sqrt{(1.5-1.1)^{2} +(1.7-4.6)^{2}}= \sqrt{0.16+8.41} = \sqrt{8.57}

اما در کتاب داریم x=(1.4,1.6) پس داریم فاصله اقلیدسی برابر است با:

\sqrt{(1.5-1.4)^{2} +(1.7-1.6)^{2}}= \sqrt{0.01+0.01} = \sqrt{0.02} =0.14

برای x=(1.4,1.6) و x_{2}=(2,1.9) فاصله اقلیدسی برابر است با :

\sqrt{(2-1.4)^{2} +(1.9-1.6)^{2}}= \sqrt{0.36+0.09} = \sqrt{0.45} =0.67

و فاصله اقلیدسی بقیه هم بطور مشابه بدست می آید

حال فاصله منهتن رو پیدا میکنیم:

برای داده دو بعدی x_{1}=(1.5,1.7) و x=(1.4,1.6)داریم فاصله منهتن برابر است با:

\mid 1.5-1.4 \mid + \mid 1.7-1.6 \mid =0.1+0.1=0.2

و برای داده دو بعدی x_{2}=(2,1.9) و x=(1.4,1.6)داریم فاصله منهتن برابر است با:

\mid 2-1.4 \mid + \mid 1.9-1.6 \mid =0.6+0.3=0.9

و فاصله منهتن بقیه هم بطور مشابه بدست می آید

برای مینکوفسکی باید در سوال q داده شده باشد با فرض q=3 داریم که برای داده دو بعدی x_{1}=(1.5,1.7) و x=(1.4,1.6) فاصله مینکوفسکی برابر است با:

\sqrt[3]{(1.5-1.4)^{3}+(1.7-1.6)^{3}} = \sqrt[3]{(0.1)^{3}+(0.1)^{3}}= \sqrt[3]{0.001+0.001 }= \sqrt[3]{0.002}

و برای داده دو بعدی x_{2}=(2,1.9) و x=(1.4,1.6)داریم فاصله مینکوفسکی برابر است با:

\sqrt[3]{(2-1.4)^{3}+(1.9-1.6)^{3}} = \sqrt[3]{(0.6)^{3}+(0.3)^{3}}= \sqrt[3]{0.216+0.027 }= \sqrt[3]{0.243}

حال فاصله سوپریمم رو پیدا میکنیم:

برای داده دو بعدی x_{1}=(1.5,1.7) و x=(1.4,1.6) فاصله سوپریمم به اینصورت بدست می آید که قدر مطلق مولفه ی اول x و x_{1} یعنی \mid 1.5-1.4 \mid=0.1 را بدست می آوریم سپس قدر مطلق مولفه ی دوم x و x_{1} یعنی \mid 1.7-1.6 \mid=0.1 را بدست می آوریم در انجا چون دو مولفه داریم همین دو تا را داریم اگر داده n بعدی باشد n عدد خواهیم داشت.

حال از بین اعداد بدست آمده بزرگترینشون همون فاصله سوپریمم است که در این حالت در هرد این مقدار 0.1 است لذا فاصله سوپریمم برابر است با 0.1

و برای داده دو بعدی x_{2}=(2,1.9) و x=(1.4,1.6) دو مقدار \mid 2-1.4 \mid=0.6 و \mid 1.9-1.6 \mid=0.3 را داریم که بزرگترینش همان 0.6 است پس فاصله سوپریمم برابر می شود با 0.6

و برای داده دو بعدی x_{3}=(1.6,1.8) و x=(1.4,1.6) دو مقدار \mid 1.6-1.4 \mid=0.2 و \mid 1.8-1.6 \mid=0.2 را داریم که بزرگترینش همان 0.2 است پس فاصله سوپریمم برابر می شود با 0.2

و برای داده دو بعدی x_{4}=(1.2,1.5) و x=(1.4,1.6) دو مقدار \mid 1.2-1.4 \mid=0.2 و \mid 1.5-1.6 \mid=0.1 را داریم که بزرگترینش همان 0.2 است پس فاصله سوپریمم برابر می شود با 0.2

...