سلام. استاد صرف نظر از اسم داده که میتونه رتبه ای یا عددی باشه، واقعا چه فرقی بین یک داده عددی و رتبه ای وجود داره؟ چون رتبه هم خودش یه عدد هست دیگه؟ از این نظر من در استفاده از روش های پیرسون و یا کندال دچار تردید هستم.
سوال دوم اینکه: شما فرمودین همبستگی برای ستونهای عددی محاسبه میشه. پس چطور طبق شکل همبستگی برای همه ستونهایی که هنوز عددی نشده اند محاسبه شده است؟
در مورد سوال اول، دادههای رتبهای معمولاً در این بازهی خاص به صورت اعداد integer صحیح (۱، ۲، ۳، ۴ ..) پشت همه با هم هستند. در یعنی در دادهای یک ستونِ رتبهای، اگر عدد ۱، ۳، ۵ موجود باشد، حتما ۲ و ۴ هم هست. در واقع تمامیِ اعداد موجود در یک بازهی خاص (مثلا از ۰ تا ۱۰) در آن ستون موجود هستند که نشان دهندهی ترتیب است.
’’
با عرض سلام و خسته نباشید
اینطور که بنده دیدم ستون های غیر عددی اصلا در محاسبات همبستگی وجود نداره. مثلا همون ستون Loss تا قبل از اینکه تبدیل به عدد نشده در محاسبات وارد نشده.