Valutazione degli investimenti
La valutazione quantitativa ex-ante dell'impatto economico atteso dagli investimenti infrastrutturali individuati, si basa sulla stima e sulla simulazione di modelli econometrici di tipo Vector Auto Regressive (VAR) Per una trattazione dettagliata dei modelli VAR si rimanda a Watson (1994) e Canova (1994).; metodologia già utilizzata dall'Unione Europea per la valutazione dell'impatto dei fondi stanziati per investimenti infrastrutturali.
Questa analisi prevede l'utilizzo di alcuni indicatori economici, tra i più importanti: il numero degli occupati, il valore aggiunto, gli investimenti privati. Tale scelta è dettata dall'esigenza di evidenziare in maniera sintetica gli aspetti più rilevanti dello sviluppo economico atteso per l'area territoriale di riferimento.
L'approccio è basato sulla stima di sistemi di equazioni, assumendo – contrariamente ai modelli econometrici tradizionali – l'endogeneità di tutte le variabili considerate dal sistema. In pratica diventa così possibile considerare le interazioni tra le diverse variabili considerate e tutti gli effetti indiretti.
Il modello economico di partenza, dato un insieme di n variabili oggetto di analisi, è il seguente:
(1)
dove Xt è un vettore n1 contenente tutte le variabili di interesse al tempo t, mentre A e B sono matrici nn e dt è un vettore n1 che descrive gli effetti di variabili deterministiche o esogene al sistema. In pratica la matrice B contiene i parametri che descrivono le interazioni tra le variabili del sistema. La matrice dei moltiplicatori e i moltiplicatori di lungo periodo sono una funzione di A e B.
Il sistema (1) può essere stimato attraverso la sua forma ridotta (dettagli in C) utilizzando dati in serie storica a livello regionale e provinciale. Ottenute le stime dei parametri, la valutazione può essere estesa a livello locale attraverso fonti a disaggregazione comunale (censimenti) e mediante i moltiplicatori.
Per approfondire l'analisi della distribuzione territoriale dell'impatto delle politiche, viene utilizzata una combinazione di metodi di analisi statistica multivariata (analisi componenti principali, cluster analysis e analisi della convergenza). L'analisi delle componenti principali parte dallo stesso vettore di variabili Xt e permette di trasformare tale insieme di indicatori rilevato in un insieme più ridotto di variabili che siano comunque in grado di spiegare una proporzione significativa della variabilità presente nei dati originali. In sostanza questo tipo di analisi consente di classificare e sintetizzare le variabili originali per determinare quali di queste siano più rilevanti nella spiegazione dei divari di sviluppo socio-economico esistenti all'interno della regione.
Analiticamente le p componenti principali Yjt (con j=1,…,p) estratte per le singole unità territoriale nel periodo t sono espresse in funzione delle variabili originali:
(2)
Dove Vjt sono gli autovettori che descrivono la relazione tra le variabili originali e le componenti principali. A partire da tali autovettori, è possibile determinare l'apporto complessivo dato dai singoli indicatori alle componenti principali selezionate attraverso una media ponderata dalle varianze delle componenti stesse:
(3)
dove vlj rappresenta l'elemento dell'autovettore Vj relativo all'l-esimo indicatore originale. Secondo tale misura si possono individuare gli indicatori più rappresentativi nella descrizione delle disparità.
A partire dalle componenti principali è poi possibile fornire una rappresentazione cartografica delle differenze territoriali, preferibilmente attraverso la cluster analysis, che permette di aggregare le unità territoriale che presentano un profilo socio-economico più simile secondo l'insieme di indicatori disponibile.
La valutazione delle politiche può essere inoltre analizzato in termini di coesione all'interno della regione. In tale prospettiva le metodologie applicabili rientrano nell'analisi della convergenza, che fornisce una misura sintetica dell'evoluzione delle differenze territoriali. L'analisi empirica della convergenza consiste nel verificare se certe caratteristiche delle unità a confronto, che nel caso delle analisi territoriali proposte in questo studio potrebbero essere i comuni della regione Lombardia, diminuiscono o piuttosto si accentuano nel tempo.
Esistono diverse metodologie per l'analisi della convergenza che sono state sviluppate di recente principalmente nell'ambito della teoria della crescita economica. Queste metodologie non possono essere applicate indifferentemente ma vengono individuate e utilizzate a seconda della tipologia di dati disponibili. Infatti, per la verifica della convergenza o divergenza degli indicatori, si possono utilizzare dei semplici test su dati cross-section quando la disponibilità dei dati è relativa a brevi periodi temporali altrimenti, nel caso in cui si ha un'ampia disponibilità temporale di dati si possono utilizzare metodologie time series. Si può infine utilizzare un'approccio congiunto di tipo panel nel caso si disponga di dati cross-section per un certo periodo temporale.
II.1 Modelli VAR
L'apparato metodologico impiegato per questa analisi si basa sulla specificazione di un modello autoregressivo vettoriale (VAR), ossia un sistema di equazioni apparentemente non collegate, nel quale viene rappresentata l'intera struttura delle correlazioni dinamiche tra le variabili economiche di interesse. In tale tipologia di modelli e diversamente dai sistemi di equazioni simultanee tutte le variabili assumono natura endogena Per una completa trattazione sui VAR si veda: Sims C.A. (1980)..
Da un punto analitico si consideri un vettore (n1) di serie yt per il quale assumiamo l'esistenza di una rappresentazione autoregressiva vettoriale (VAR) di ordine finito. Tale assunzione è pienamente legittima non solo per serie vettoriali stazionarie, ma anche per variabili integrate in presenza di relazioni di cointegrazione. Il modello VAR di ordine finito (k) è consuetamente rappresentato come:
yt = F dt + A1 yt -1 + A2 yt -2 + ... + Ak yt -k + et , et ~ VWN(0,S), (1)
dove le matrici Ai contenenti i coefficienti autoregressivi sono quadrate e di dimensione n, mentre dt è un vettore (d 1) di variabili esogene o deterministiche appropriate. L' equazione (1) descrive il comportamento di ogni singola componente del vettore yt come guidato dal passato della variabile stessa e dal passato di tutte le altre variabili del processo; non viene esplicitamente modellata alcuna forma di legame istantaneo tra le variabili endogene, e, pertanto, il VAR si configura come la forma ridotta condizionata sul passato del seguente modello strutturale:
Byt = dt + 1 yt -1 + 2 yt -2 + ... + k yt -k + ut (2)
dove Ai=B-1i e F=B-1i e t=B-1u t
Peraltro, legami simultanei tra le endogene esistono anche all'interno di un VAR e sono "nascosti" nella matrice di varianza/covarianza dei termini di errore, che è, in generale, una matrice non diagonale; un processo VAR può quindi essere visto anche come sistema di equazioni apparentemente non collegate (modello SUR; Zellner, (1962)).
Se non si impongono restrizioni sullo spazio parametrico il modello VAR (1) può facilmente essere stimato per mezzo dei minimi quadrati ordinari (OLS). Lo stimatore OLS coincide con lo stimatore di massima verosimiglianza (ipotizzando la normalità di et) quando si condizioni sulle prime k osservazioni, e con lo stimatore SUR. In presenza di variabili cointegrate, il sistema può essere stimato tramite il metodo di massima verosimiglianza imponendo o meno il vincolo di rango ridotto implicato dalla presenza di cointegrazione. Le stime risultanti sono chiaramente consistenti e il modello VAR stimato può essere utilizzato a fini previsivi e per simulazioni dinamiche.
II.2 Modelli BVAR
Accanto alle menzionate caratteristiche che fanno dei VAR uno strumento di analisi elegante e concettualmente semplice, il più grande problema che si incontra nelle applicazioni dei VAR è connesso alla loro inefficiente parametrizzazione, che sembra precludere la possibilità di analizzare sistemi di medie e grandi dimensioni. Anche in modelli con un numero limitato di variabili, l'uso delle tecniche consuete di stima dei VAR conduce spesso a stime inefficienti e a insoddisfacenti prestazioni previsive.
La ricerca di metodi di stima più efficienti e di previsioni maggiormente affidabili è la principale motivazione dei lavori di R.T. Litterman (1979) e Doan, Litterman e Sims (1986) che propongono la trattazione bayesiana dei modelli VAR (modelli Bayesian VAR, o BVAR). L' idea fondamentale sottostante a tale approccio è molto semplice: il ricercatore considera i parametri del modello come variabili casuali ed utilizza distribuzioni a priori informative sui parametri autoregressivi da combinare con la funzione di verosimiglianza per ottenere stime più efficienti basate sulla distribuzione a posteriori dei parametri stessi.
Si consideri un'opportuna riscrittura della i-esima equazione del VAR (1):
yit = xt'bi +eit, eit ~N(0, s 2i) (3)
Le informazioni a priori sui parametri possono essere tradotte in un sistema di vinoli lineari non omogenei del tipo:
R bi= d + e0, E(e0) = 0, var(e0 e0')= Q0. (4)
Questa formulazione differisce da quella usuale per i vincoli lineari non omogenei sui parametri per il fatto che l'informazione extra-campionaria su bi è soggetta ad errore, cioè si ha incertezza a priori. Per questo motivo, i vincoli sono detti stocastici.
Considerando l'informazione extra-campionaria alla stregua di p osservazioni addizionali, si ricava lo stimatore misto GLS (Theil-Goldberger, 1961), che descrive a tutti gli effetti una stima bayesiana:
i = [s -2 X'X+ R'
R]-1[s -2X'y+ R'
d],
var(
)= [s -2 X'X + R'
R]-1 . (5)
Adottando l'approccio BVAR è stato possibile in questo lavoro produrre stime efficienti e risultati relativamente affidabili anche in presenza di serie storiche piuttosto brevi (solo 16 dati annuali).
Al fine di rendere operativa la procedura di stima bayesiana, abbiamo specificato una distribuzione a priori per i parametri del modello seguendo la letteratura BVAR standard secondo la quale la maggior parte delle serie macroeconomiche è influenzata soprattutto dal proprio passato recente e solo marginalmente dal proprio passato lontano e dal passato delle altre variabili e modificando questa letteratura secondo quanto già fatto in (Amisano, Serati e Giannini, (1997)).
Questa specificazione è divenuta standard nella letteratura BVAR e la risultante distribuzione a priori viene generalmente chiamata Minnesota prior (di qui in avanti MP): le sue caratteristiche sono agilmente gestibili, perché indicizzate ad un piccolo set di "iperparametri", la cui calibrazione è effettuata in modo da ottimizzare la performance del modello.
II.3 Modelli SVAR
Una volta ottimizzato il nucleo degli iperparametri e stimato efficientemente il nostro BVAR si è trattato di utilizzarlo per la valutazione dell'impatto economico degli investimenti pubblici/privati effettuati nell'area del pavese.
A tal fine è necessario poter risalire dai coefficienti stimati della (1) a quelli della (2), ossia risolvere il cosiddetto problema dell'identificazione. Tale operazione in letteratura ha generato diversi filoni di analisi, tutti riconducibili alla letteratura sui cosiddetti modelli VAR strutturali (SVAR) Per una rassegna: Amisano e Giannini (1997).. La logica di fondo è quella di esplicitare la struttura di correlazioni istantanee tra le variabili, nascosta nella matrice di varianza/covarianza dei termini di disturbo del VAR, "organizzando" tali correlazioni secondo uno schema strutturale e imprimendo ad esse una direzione di causalità. In sostanza si cerca di "identificare" un insieme di shock indipendenti e di analizzare la reazione nel tempo di tutte le variabili del sistema rispetto a tali shock. A questo fine è necessario pre-moltiplicare il VAR della (1) per l'inversa (P-1) del fattore di Cholesky di S (esatta identificazione)
A0*yt = A1* yt -1 + A2* yt -2 + ... + Ak* yt -k + et , et ~ VWN(0,In), (6)
dove A0*=P-1, Ai*= P-1Ai e PP'=S. Chiaramente A0* è triangolare inferiore e i valori della sua diagonale principale sono tutti uguali ad 1. Ciò equivale a modellare le relazioni contemporanee tra le variabili di interesse in modo ricorsivo, ossia imporre che gli shock ortogonali et abbiano effetti di impatto sugli elementi di yt secondo lo schema triangolare descritto da P Si osservi che la scomposizione di Cholesky è unica dato l'ordinamento prescelto per le variabili di interesse all'interno del vettore y. Permutazioni in tale ordinamento possono modificare i risultati dell'analisi e pregiudicarne la robustezza. Per ovviare a tale inconveniente, alcuni lavori precedenti simili a questo (si veda lo studio relativo al completamento della superstrada Rosignano – Civitavecchia) hanno optato per la stima di un set di VAR bivariati.
In questa sede si è preferito conservare una struttura in cui n=4, perché ritenuta più ricca sul piano della struttura correlativa, e sono stati sperimentati diversi ordinamenti per le variabili. I risultati sono apparsi qualitativamente simili e si è scelto di presentare quelli relativi all'ordinamento Investimenti pubblici/privati – Investimenti privati – Occupazione – Valore Aggiunto, che riflette ragionevoli considerazioni teoriche..
Una volta resa diagonale la matrice di varianza/covarianza dei termini di errore del modello è possibile simulare il sistema e calcolare le funzioni di risposta ad impulso (IRF) che descrivono il profilo temporale delle reazioni di ciascuna variabile del sistema rispetto a shock sui termini di disturbo. In questo caso si è scelto di imporre al sistema shock unitari cosicchè le IRF descrivono la variazione percentuale nel tempo di tutte le endogene del sistema. Accanto alle risposte puntuali lungo un orizzonte di 10 anni sono state calcolate anche le risposte cumulate ossia i moltiplicatori di medio e lungo periodo associati allo shock.