بررسی بیشتر TF -IDF

پرسیده شده
فعالیت 1163 روز پیش
دیده شده 531 بار
1

سلام دوستان وقتتون بخیر

------------------------------------------------------------------------------------------------------------------------------------------------------
من یه سری الگوریتم های گفته شده رو توی این جلسه بررسی کردم. 
این مبحث درسی مربوط به بازیابی اطلاعات هستش . 
شما میتونید برای عمیق شدن توی مطالب جلسه به کتاب introduction to information retrieval مراجعه کنید .

------------------------------------------------------------------------------------------------------------------------------------------------------

dft تعداد اسنادی است که شامل کلمه t هستند.

هر چه df یک کلمه بیشتر باشد بار اطلاعاتی آن کمتر است.

dft <= N

 بنابراین ما معکوس df را به عنوان امتیاز کلمه در نظر میگیریم.

idf=log (N/df)

ما از لگاریتم (log (N/dft بجای N/dft به منظور متعادل کردن تاثیر ( idf ) استفاده میکنیم.

N = تعداد کل اسناد موجود در مجموعه

------------------------------------------------------------------------------------------------------------------------------------------------------

همچنین برای دانلود اسلاید هایی فارسی شده این کتاب روی این لینک کلیک نمایید.


موفق باشید??

فایل پیوست

Reza Mobaraki
Reza Mobaraki

29 بهمن 99

جلسه تبدیل متن به ماتریس جبر خطی