چالش تقویم جلالی در رگرسیون

پرسیده شده
فعالیت 1159 روز پیش
دیده شده 483 بار
2

سلام آقای کاویانی
وقتتون بخیر باشه
ضمن عرض تشکر از شما بابت زحماتتون
یک سوالی داشتم
من توی شرکتی که خدمات PMS هتلداری ارائه می کنه کار می کنم. دارم روی دیتاستی کار می کنم که تایم سری هست.
و می خوام با استفاده از  catboost عمل رگرسیون رو انجام بدم.
دیتا من وابسته به مناسبت های تقویم هست به عبارت دیگه مناسبت های تقویم روی نتیجه تاثیر گذار هست.
حالا چالش اینجاست که مثلا
روز 15 شعبان امسال یک تاریخ هست و سال دیگه یک تاریخ دیگه

وقتی برای سال های مختلف ترین می کنم (مثلا 98 و 97) ، چون مناسبت ها جابه جا میشه
 . مشکل دارم. الگوریتم توی پیشبینی کردن به اشتباه میوفته

می خواستم بپرسم چطور می شه اینو هندلش کنم؟

فایل پیوست

0
حذف شده

باسلام 

شما برای اینکار متِییر های دیگه ای به وجود بیارین مثلا میلاد حضرت محمد بعد جلوی اون دیتاهایی که این واقعه رخ نداده صفر و جلوی اون دیتاهایی که مربوط به این امر هستن یک بذارین که با توجه به مثال بالا ۳۶۴دیتا صفر. و ۱ دیتا یک قرار میگیره.

در آخر هم این دیتا رو تذریق کنین به الگوریتم مشکل احتمالا حل میشه. 

فایل پیوست

مسعود ماپار

توسط

مسعود ماپار

27 بهمن 99

حذف شده
ممنون از پاسختون. من چیزی که فرمودید رو تست می کنم... ممنون.
0
حذف شده

سلام

این روشی که جناب ماپار گفتن هم خوبه

 یه روش دیگه هم هست که معمولا کشورهای عربی استفاده می‌کنند و برای خودشون هم چالش هست توی این مقاله 

می‌تونید پیدا کنید:

https://www.researchgate.net/publication/271544585_An_extension_of_X13-ARIMA-SEATS_to_forecast_islamic_holidays_effect_on_logistic_activities

همچنین یه مدل جالب برای تشخیص ترافیک در بروی داده‌های زمانی مبتنی بر تقویم هجری قمری اینجا داده شده:

https://thesai.org/Downloads/Volume10No11/Paper_66-A_Deep_Learning_Model_for_Predicting_and_Visualizing_the_Risk.pdf

 

فایل پیوست

مسعود کاویانی

توسط

مسعود کاویانی

11 اسفند 99

جلسه الگوریتم CatBoost و حل مسئله‌ی تخمین خسارت حادثه شرکت بیمه (قسمت اول)