Home > Doc > Kernel Regression ... > la dimensionalità del Polinomio

Kernel Regression Applicazione alla Previsione del Fib 30

la dimensionalità del Polinomio

Un altro aspetto importante da considerare per applicare la kernel regression è la dimensionalità del modello, una caratteristica associata alla selezione dei candidate predictors.

La strategia proposta è di prendere ciascun candidate predictors singolarmente, sviluppare modelli unidimensionali e abbinare, nelle fasi successive, solo quei predictors che riescono a spiegare i dati originali meglio degli altri. Tale procedura viene spesso definita stepwise. Per ridurre la complessità computazionale si deve stabilire il numero massimo di best candidate predictors che potranno passare allo stadio successivo.

Questo numero è detto “numero di sopravissuti alla dimensione d” e lo si indicherà col nome num_survivors(d): solo i num_survivors(d) candidate predictors saranno combinati con gli altri per creare gli spazi a d+1 dimensioni.

In questo tipo di approccio entra in gioco un altro parametro: la dimensionalità massima da esaminare (dmax). Pur essendo questa una valutazione arbitraria la dimensione massima del modello dovrà essere abbastanza elevata da includere il modello buono, sempre se esso esista e sia compatibile con la densità di dati in possesso e le risorse tecnologiche.

In generale, una dimensione massima pari a 10 (dmax=10) può essere ritenuta più che sufficiente. In seguito, tuttavia, lo studio della metodologia sarà condotto con dmax=5, dimensione ritenuta abbastanza elevata ai fini dimostrativi. Un altro modo per ridurre la complessità computazionale è quello di vedere il num_survivors(d) come un estremo superiore e stabilire un criterio d’arresto ulteriore che agisca in base a:

− miglioramento (DELTA) riscontrato in termini di misura di performance (cap. 2.6) tra un livello (d) e il successivo (d+1); − soglia minima della misura di performance per ritenere un candidate predictors un best predictors.

Vengono presi in esame successivamente i vari approcci al problema della scelta dei best predictors dal punto di vista della complessità computazionale.

Monico Dino

Successivo: Metodo forward stepwise semplice

Sommario: Index