Jak test modelu časových řad?

hlasů
2

Zajímalo by mě, co by bylo dobrý přístup k testování časové řady modelu. Předpokládejme, že mám časové řady v doméně t1, t2 čas, ... Tn. Mám vstupy, řekněme, ZT1, ZT2 ... ztN a výstup x1, x2 ... xN.

Teď, když to bylo klasický dolování dat problém, mohl jsem jet se známými postupy, jako je cross-validace, ponechte-one-out, 70-30, nebo něco jiného.

Ale jak přistupovat k problému testování můj model pomocí časových řad? Měl bych postavit model na prvních T1, T2, ... t (NK), vstupy a otestovat jej na posledních k- vstupy? Ale co když chceme maximalizovat předpověď pro p kroků dopředu a ne k (kde p <k). Mám zájem o robustní řešení, které mohu uplatnit na mém konkrétním případě.

Položena 24/01/2011 v 12:45
zdroj uživatelem
V jiných jazycích...                            


2 odpovědí

hlasů
3

S TimeSeries montáž, je nutné dávat pozor na to pomocí své out-of-vzorku dat až poté, co jste vyvinuli svůj model. Hlavním problémem modelování je to, že je to prostě jednoduché overfit.

Obvykle to, co děláme, je pro in-vzorku modelování, 30% testování / ověřování out-of-vzorku pouze 70%. A když jsme se použít model ve výrobě, data shromažďujeme day-to-day stává pravdou-out-of-vzorku dat: data, které jste nikdy neviděli nebo použity.

Nyní, pokud máte dostatek datových bodů, tak bych navrhnout snaží postupových okenní kování přístup. Pro každý časový krok ve vaší in-vzorku se ohlédnete zpět N časové kroky, aby se vešly svůj model a uvidíte, jak parametry v modelu se mění v průběhu času. Například, řekněme, že model lineární regrese s Y = B0 + B1 * X1 + B2 * X2. Uděláš regresní N - window_size čas nad vzorkem. Tímto způsobem, abyste pochopili, jak citlivá vaše Betas jsou v závislosti na čase, mimo jiné.

Odpovězeno 24/01/2011 v 20:45
zdroj uživatelem

hlasů
3

Vypadá to, že máte na výběr mezi

  1. Použitím prvních letech dat k vytvoření modelu, když viděl, jak dobře to předpovídá zbývající roky.

  2. Využitím všech těch letech dat nějakou podmnožinu vstupních podmínek, když viděl, jak dobře to předpovídá pomocí zbývající vstupní podmínky.

Odpovězeno 24/01/2011 v 18:10
zdroj uživatelem

Cookies help us deliver our services. By using our services, you agree to our use of cookies. Learn more