Reti Neuronali e Modelli

Pre-trattamento dei dati

Essendo le reti neuronali dei modelli data-intensive, gran parte dello sforzo per una loro ottimale costruzione deve essere dedicato alla costruzione del set di informazioni da utilizzare. In particolare le operazioni effettuate riguardano:

• la selezione di un opportuno sottoinsieme dei dati disponibili;

• l’opportuna ridefinizione dei dati di input ed output.

La prima operazione si è resa necessaria per i seguenti motivi:

• escludere, secondo opportuni criteri, gli esempi ritenuti non significativi e quindi, aventi scarso contenuto informativo

• ridurre il training set, per gli elevati costi computazionali per l’addestramento della rete.

I criteri utilizzati sono stati i seguenti:

1. vengono escluse le opzioni eccessivamente deep-in oppure deep-out-of-the-money. Tali opzioni risultano, generalmente, scarsamente trattate;

2. vengono escluse le opzioni con scadenza inferiore a 15 giorni. Tali opzioni risultano trattate nel mercato al loro valore intrinseco ed implicano errori rispetto ai prezzi teorici;

3. vengono escluse le opzioni trattate a prezzi troppo bassi (inferiori a 100 punti base). Infatti, da un’analisi dei dati si può notare come, soprattutto per i prezzi delle opzioni più vicini allo zero, vi sia un numero elevato di opzioni trattate allo stesso valore. La rete può avere, in questi casi, delle difficoltà nell’associare ad input anche molto diversi lo stesso output.

Essendo il numero degli esempi così ottenuti eccessivo si sono scelti casualmente 2500 esempi da utilizzare nella fase di addestramento e selezione della rete; si è ritenuto, in questo modo, di garantire che l’insieme dei dati utilizzati sia sufficientemente rappresentativo del fenomeno analizzato e permetta, allo stesso tempo, lo sviluppo di modelli sufficientemente complessi. In conclusione, possiamo individuare i seguenti insiemi di dati:

• training set: composto da 2000 esempi scelti casualmente dall’insieme delle opzioni trattate tra dal 04/01 al 31/10. Tali dati verranno utilizzati al fine di addestrare le reti neurali;

• validation set: composto da 500 esempi scelti casualmente dall’insieme delle opzioni trattate tra dal 04/01 al 31/10 una volta estratto il training set. Tali dati verranno utilizzati al fine di individuare il momento in cui bloccare la fase di apprendimento e nella fase di selezione della rete;

• test set: composto dalle opzioni trattate dal 01/11 al 24/12.

Tali dati verranno utilizzati al fine di verificare le prestazioni della rete in fase applicativa. Le variabili che influenzano il prezzo di un’opzione, avente come attività sottostante un indice azionario, secondo il modello B-S sono sei:

Il valore di un’opzione call (C) è funzione del valore dell’indice ( St ), del prezzo di esercizio (X), del tempo mancante a scadenza (T-t), della volatilità ( σ), del tasso d’interesse privo di rischio (r) e del tasso di dividendo (d).

La formula B-S può essere riscritta considerando le seguenti semplificazioni

• si utilizza come tasso d’interesse privo di rischio la differenza tra l’originario tasso d’interesse privo di rischio ed il tasso di dividendo, cioè r-d;

• si utilizza il rapporto tra il valore dell’indice ed il prezzo d’esercizio St/X , ciò al fine di determinare il rapporto tra il prezzo dell’opzione ed il prezzo d’esercizio C/X .

Gli input richiesti sono in definitiva quattro. In particolare, l’ultima semplificazione considerata, si ottiene ipotizzando che la distribuzione del rendimento dell’attività sottostante l’opzione sia indipendente dal livello del prezzo dell’attività stessa. Secondo il teorema 9 enunciato da Merton questo implica che la funzione f(.) sia omogenea di grado uno rispetto al valore dell’indice ed al prezzo d’esercizio.

Poiché la formula B-S rientra in tale categoria, utilizzando tali input per la rete ipotizziamo che anche la formula di valutazione dell’opzione lo sia. Le motivazioni alla base di tale semplificazione sono le seguenti:

1. viene utilizzato un nodo di input in meno, riducendo il numero dei parametri e quindi la complessità del problema,

2. si ritiene che questo permetta alla rete di apprendere più facilmente la struttura della volatilità implicita di mercato (il così detto effetto “smile” si evidenzia graficamente mettendo in relazione la volatilità implicita e, appunto, il rapporto St/X).

La funzione che vogliamo approssimare è, quindi:

Ciascun esempio sottoposto alla rete sarà, quindi, composto da 5 valori, di cui 4 variabili di input ed 1 relativa all’output desiderato.

M.Billio, M. Corazza, M. Gobbo

Successivo:Fase di apprendimento

Sommario: Indice