Finanziare il welfare – 5. Il Pay-as-You-Go sanitario nelle Regioni italiane
Una premessa è d’obbligo. Il pay-as-you-go è uno strumento fondamentale per il funzionamento dei moderni sistemi di welfare. Ha delle proprietà positive che sono essenziali per creare solidarietà tra cittadini, territori, generazioni, per dare basi alla universalità degli istituti di welfare, per gestire in maniera efficace i rischi che individui e famiglie possono incontrare nel corso della vita. Proprietà difficilmente riproducibili o non riproducibili con altri strumenti.
Nondimeno, come tutte le leve di policy, il pay-as-you-go ha pregi e difetti, e il bilanciamento tra i due dipende in maniera cruciale dalla scala di funzionamento. Uno sproporzionato ricorso al pay-as-you-go si accompagna ad effetti distorsivi, su occupazione, produttività e crescita, derivanti dall’eccessiva estrazione di risorse che ogni anno viene operata sui redditi da lavoro. Per fornire un esempio concreto, le risorse movimentate dal pay-as-you-go (non solo quello che finanzia la sanità) anche provengono dal cuneo fiscale-contributivo sul lavoro, che da tempo l’Italia si prefigge di ridurre.
Questa caratteristica negativa non si pone affatto in contraddizione con l’importanza del welfare system per lo sviluppo economico oltre che per l’equità e la sicurezza sociale. Il limite si riferisce al pay-as-you-go in senso stretto, come meccanismo di reperimento delle risorse quando sono oltrepassate soglie critiche di utilizzo/funzionamento.
Questo capitolo propone una quantificazione del peso, sul Pil, sugli attivi, sugli occupati, etc., per finanziare la spesa sanitaria Ssn. L’orizzonte si spinge sino al 2030. L’ipotesi base è quella di costanza dell’assetto normativo e regolatorio che, in questo frangente, è quanto mai frammentato e incerto, vedendo indebolirsi (anche per sua stessa incapacità a concludersi) la spinta alla riorganizzazione federalista, senza che nel frattempo siano maturate nuove concrete alternative. Proprio in questo frangente, lo sforzo di quantificare e di allungare l’orizzonte è di grande aiuto per indirizzare il dibattito e sollecitare scelte nel contempo tempestive e avvedute.
Come si traduce, il finanziamento dei Ssr, in termini di pressione sui Pil regionali, oneri a carico degli attivi, oneri a carico degli occupati, flussi di perequazione tra Regioni e territori, flussi di perequazione tra singoli cittadini residenti in Regioni diverse?
Si spera che mappature dettagliate di questo tipo (e anche più dettagliate) servano a migliorare la programmazione, la qualità e la sostenibilità del Sistema Sanitario Nazionale. Il tentativo di fare chiarezza sui flussi di risorse non ha la finalità di stigmatizzarli o neutralizzarli tout court, ma quella di aiutare il ridisegno e la modernizzazione del sistema, e non solo di quello sanitario.
Dopo una attenta lettura della premessa, essenziale per non trarre conclusioni di policy affrettate e superficiali, si può entrare nel vivo dell’analisi.
Qual è il peso che ogni occupato deve sostenere per finanziare la sanità attraverso la ripartizione? Questo lavoro propone una quantificazione dell’onere per l’Italia e le Regioni italiane, e la sua proiezione a medio termine, sino al 2030. Tra i capitolo di spesa del welfare system, quello della la sanità è influenzato dal maggioro numero di variabili-driver e, per questo stesso motivo, nei prossimi anni farà registrare le tendenze più forti alla crescita della sua incidenza sul Pil. Analizzare separatamente il pay-as-you-go sanitario serve a focalizzare meglio le difficoltà di finanziamento presenti e future che nascono sul fronte della sanità, e a scegliere le soluzioni più adatte a superarle.
L’analisi parte dalle proiezioni di spesa sanitaria pubblica di parte corrente 2012-2030, sviluppate in prima persona dall’autore con i due modelli SaniMod e SaniMod-Reg1. Utile qui ricordare i tratti salienti delle proiezioni, così da poter leggere e interpretare bene le evidenze.
Si tratta in realtà di proiezioni di fabbisogno, che coincidono con proiezioni di spesa solo nel caso in cui (e nelle Regioni in cui) il fabbisogno trova integrale copertura e non è nascosto da razionamenti delle prestazioni, o da riduzioni degli stanziamenti di risorse che, obbligando a dilazionare i pagamenti, non lasciano traccia nella contabilità di cassa di prestazioni già erogate.
La base delle proiezioni sono i profili di spesa pro-capite delle Regioni benchmark: Emilia Romagna, Lombardia e Umbria. Sono le tre Regioni che, nel corso del quinquennio precedente alle elaborazioni, hanno dimostrato due caratteristiche positive, in senso relativo rispetto alle altre: i minori scarti tra spesa programmata ex-ante e consuntivo ex-post; e i migliori indici onnicomprensivi di qualità delle prestazioni erogate. Le tre Regioni permettono di individuare il “punto di pareggio” tra fabbisogno dei cittadini e stanziamento delle risorse. Queste ultime comprendono sia il riparto del Fondo Sanitario Nazionale che i finanziamenti aggiuntivi a carico diretto del bilancio regionale. In questa prospettiva, la spesa che si prende in esame e si proietta può essere considerata ottimizzata/standard, ossia scevra da inefficienze.
Applicando la media dei profili di spesa per fascia di età delle tre Regioni benchmark alla struttura demografica delle altre Regioni, si ottiene una misura della spesa efficiente per soddisfare il fabbisogno dei cittadini anche nelle altre Regioni. In altri termini, si estende il benchmark a tutte le Regioni. Lo scarto tra la spesa contabile a consuntivo e quella efficiente (simulata) fornisce un paramento che rappresenta di quanto dovrebbe variare la spesa nelle Regioni non benchmark affinché queste risultino utilizzare esattamente le risorse correnti necessarie e sufficienti ad emulare il benchmark. Questo scarto può essere applicato lungo tutto l’orizzonte dell’esercizio, per passare dalle proiezioni di spesa efficiente a quelle di spesa al lordo delle inefficienze (nell’ipotesi che gli scarti di efficienza restino fermi al loro valore inziale).
Due Scenari in due varianti
Le proiezioni sviluppano due scenari:
- Nel primo, la spesa pro-capite standard per fasce di età si evolve, anno per anno, al tasso di crescita del Pil pro-capite nazionale2;
- Nel secondo, la spesa pro-capite standard per fasce di età si evolve, anno per anno, ad un tasso di crescita che sovrasta quello Pil pro-capite nazionale di 1,5 p.p.. Su questo trend si innesta un’altra dinamica, secondo la cosiddetta ipotesi “healthy ageing”: di pari passo con l’aumento della speranza di vita, le migliori condizioni di salute delle età più giovani si estendono gradualmente alle età più anziane contigue3.
I profili di spesa pro-capite aggiornati nel tempo sono applicati alla struttura per età della popolazione regionale (proiezioni Istat), per ottenere il valore aggregato di fabbisogno/spesa. Le proiezioni possono esser svolte sia al netto che al lordo delle inefficienze. Per passare dalle prime alle seconde è sufficiente, come già accennato, applicare lo scarto, rilevabile al primo anno, tra spesa contabile a consuntivo e spesa standard, nell’ipotesi che i divari di efficienza tra Regioni restino irrisolti e siano attribuibili nelle stesse proporzioni a tutte le fasce di età.
Tre regole di finanziamento
Ai due più due scenari di spesa (i due iniziali più le due varianti) si fanno corrispondere tre regole di finanziamento che devono coprire sempre in pareggio la spesa:
- Nella prima regola, ogni Regione deve finanziare integralmente la propria spesa con risorse proprie. Non c’è solidarietà tra Regioni. Si calcolano le incidenze sul Pil regionale, il carico sugli attivi e sugli occupati;
- Nella seconda, il finanziamento avviene chiedendo che ogni Regioni dedichi la stessa quota di Pil, pari all’incidenza che la spesa sanitaria nazionale ha sul Pil nazionale (egual sacrificio proporzionale sul Pil). Oltre alle incidenze e al carico su attivi e occupati, qui si calcolano anche i flussi di redistribuzione tra territori (Nord, Centro e Mezzogiorno);
- Nella terza, il finanziamento avviene chiedendo che ogni occupato equivalente (cioè ponderato per la produttività del lavoro, cfr. infra per definizione) sopporti in ogni Regione il medesimo onere di finanziamento che, per dare significatività al dato, viene scalato per il Pil pro-capite nazionale. Oltre alle incidenze e al carico su attivi e occupati, anche qui si calcolano i flussi di redistribuzione tra territori (Regioni).
Le tre regole di finanziamento corrispondono a livelli crescenti di solidarietà tra Regioni. La redistribuzione è assente nel primo caso; avviene a livello aggregato nel secondo caso (chiedendo a tutte le Regioni di concorrere con la medesima quota di Pil a coprire il fabbisogno complessivo nazionale); avviene a livello micro nel terzo caso, con una esplicita considerazione delle condizioni del mercato del lavoro e della produttività, come è noto fortemente sperequate tra territori.
Con i quattro scenari lato spesa e le tre regole di finanziamento della spesa si possono costruire i termini entro cui dovranno trovare soluzione i problemi di sostenibilità, perequazione tra territori, bilanciamento tra risorse disponibili e perimetro delle prestazioni a carico della sanità pubblica.
I due scenari di spesa permettono di individuare un intervallo di proiezione. Storicamente (dal Dopoguerra ad oggi), il tasso di crescita della spesa sanitaria corrente pro-capite ha sovrastato quello del Pil di uno spread compreso tra 1 e 2 p.p. a seconda dei Paesi. Una tale dinamica si è realizzata nonostante le politiche di contenimento, in alcune stagioni, come quella dei primi anni Novanta in Italia, anche particolarmente intense. Il secondo scenario adotta l’evidenza storica, aggiungendovi il correttivo dell’”healthy ageing”. Il primo scenario, invece, ipotizza che la spesa pro-capite si evolva sempre in linea con il Pil pro-capite, sottintendendo un adeguamento (endogeno e/o realizzato con azioni di policy) del fabbisogno alle risorse disponibili. Per evitare un eccesso di “ottimismo” previsionale, il primo scenario non applica l’”healthy ageing”. L’intervallo di proiezione è sviluppato sia al netto che al lordo delle inefficienze, dando vita ai “due più due scenari” (cfr. infra l’Appendice dedicata alle tavole con i risultati delle simulazioni).
Contesto macroeconomico
Prima di entrare nel dettaglio delle quantificazioni, alcune precisazioni sul contesto macroeconomico e sul rapporto tra le proiezioni di spesa e quelle contenute nell’annuale Programma di Stabilità dell’Italia.
Svolte nel 2012 sulla spesa sanitaria a consuntivo allora disponibile con il dettaglio della mobilità interregionale, le proiezioni sono, alla data in cui si scrive, ancora l’ipotesi evolutiva migliore a medio-lungo termine. E lo rimarranno con ogni probabilità a lungo. Almeno nei prossimi 4-5 anni, infatti, le possibilità di finanziamento del sistema sanitario saranno, in Italia come in tutti gli altri Paesi, limitate se non ridotte dagli effetti della crisi economica. Il punto metodologico sollevato in apertura di questo capitolo, non confondere il fabbisogno con la spesa, diverrà particolarmente importante, per evitare che tagli dei finanziamenti vengano tout court intesi come riduzione delle risorse necessarie, come riforme dal lato della spesa. A tale scopo, è utile mantenere i profili di spesa pro-capite del 2010, anno in cui la crisi si era sì già manifestata ma non aveva ancora raggiunto gli effetti più acuti sull’equilibri sanitari (soprattutto nelle tre Regioni virtuose adottate come benchmark).
È vero che le proiezioni sottintendono il quadro macroeconomico di medio-lungo termine descritto nel Programma di Stabilità del 2012; ma è anche vero che, se lo si confronta con quello del programma di Stabilità del 2013, si evince che la dinamica del Pil non ha subito cambiamenti significativi. Dal 2030 al 2060, il tasso di crescita del Pil reale è rimasto invariato. Tra il 2010 e il 2030, ad una correzione al ribasso nel primo quinquennio fa seguito una correzione al rialzo tra il 2015 e il 2020 e tra il 2020 e il 2025, con i valori immediatamente a ridosso del 2020 rimasti invariati. I cambiamenti sono compresi tra 1 decimo e al massimo 3 decimi di punto percentuale; ordini di grandezza che, sull’orizzonte di simulazione sino al 2030, non producono variazioni di rilievo nei valori assoluti del Pil (le simulazioni lo testimoniano).
Il Programma di Stabilità dell’Italia (PdS) non contiene proiezioni regionalizzate della spesa sanitaria. Un confronto con le proiezioni qui sviluppate (da ora “le proiezioni” o “le nostre proiezioni”) è possibile solo sull’aggregato. Al 2015, il 6,9% di incidenza della spesa sanitaria sul Pil riportato nel PdS si confronta con il circa 7,2% del primo scenario. Tra il 2015 e il 2030, il Pds riporta un incremento di incidenza di 0,3 p.p., mentre il primo scenario di poco più di 0,6 p.p.. La distanza tra le due proiezioni si allarga se si considerano le sacche di inefficienza. Il PdS proietta direttamente la spesa lorda, quella che partecipa alla formazione dei conti pubblici. Le proiezioni, invece, distinguono tra spesa efficiente/standard e spesa al lordo delle inefficienze. In questo caso, al 2015, il 6,9% del PdS si confronta con il 7,5% circa delle nostre proiezioni. Tra il 2015 e il 2030, il +0,3 p.p. del PdS si confronta sempre con il poco più di 0,6 p.p. delle nostre proiezioni
Le differenze hanno due spiegazioni:
- Le proiezioni del PdS adottano le ipotesi dello scenario cosiddetto “Awg reference” coordinato a livello europeo. La spesa pro-capite per fasce di età si evolve come il Pil pro-capite4 e in più incorpora l’effetto dell’”healthy ageing”, laddove nelle nostre proiezioni il tasso è quello del Pil pro-capite ma è escluso l’”healthy ageing” (presente invece nel secondo scenario);
- Le nostre proiezioni non distinguono tra spesa acuta e spesa di assistenza ai non autosufficienti, applicando a entrambe le componenti lo stesso tasso di crescita, laddove il PdS ipotizza che la frequenza delle non autosufficienze si riduca con il progredire dell’aspettativa di vita e che contemporaneamente non si verifichi nessun ampliamento della casistica trattabile;
- Le proiezioni del PdS scontano gli effetti finanziari delle manovre di finanza pubblica adottate nel 2011 e nel 2012. In particolare, per il periodo 2013-2017 le proiezioni della spesa sanitaria coincidono con quelle del quadro di finanza pubblica contenuto nel Documento di Economia e Finanza 2013. Potrebbe essere un esempio, questo, di quella confusione tra fabbisogno e risorse erogate per coprire la spesa di cui si è detto in precedenza. Un conto dovrebbe essere proiettare le risorse disponibili per finanziare la spesa, altro conto proiettare il fabbisogno che la popolazione può esprimere a parità di normativa sui livelli essenziali di assistenza. Sulle risorse erogabili c’è pieno controllo da parte della policy, cosa che viene meno quando si passi a valutare gli effetti di diversi livelli di finanziamento sulle performance e sullo stato di salute dei cittadini5. Nel PdS 2013, l’incidenza della spesa sanitaria sul Pil è in continua diminuzione dal 7,3% del 2010, al 6,9 del 2005, al 6,8 del 2020, al 7,0 del 2025, sino al 7,2 del 2030. Solo dopo il 2030 la quota di Pil destinata alla sanità pubblica riuscirebbe a recuperare il livello del 2010.
Ancora maggiore è la distanza tra i numeri del PdS e i secondi scenari delle nostre proiezioni, al netto e al lordo delle inefficienze. Al netto delle inefficienze, l’incidenza sul Pil passa dal circa 7,2% del 2015 a oltre l’8,3% del 2030, con un aumento di oltre 1 p.p. in 15 anni. Al lordo delle inefficienze, il circa 7,5% del 2015 diviene il quasi 8,6% del 2030, +1,1 p.p. in 15 anni.
I secondi scenari delle nostre proiezioni ipotizzano, come si è detto, che la dinamica futura non si differenzi da quella mediamente osservata da Dopoguerra ad oggi. I risultati sono coerenti con gli scenari delle proiezioni sviluppate da Ecofin, Ocse e Fmi, in cui, al di là dell’invecchiamento della popolazione e della dinamica agganciata al Pil, si tenta di dar conto delle altre variabili che influenzano la spesa: l’avanzamento scientifico-tecnologico, l’ampliamento della domanda (con emersione di quella razionata o inconsapevole), la formalizzazione e istituzionalizzazione dell’assistenza ai non autosufficienti, l’insorgere di fabbisogni nuovi di pari passo che si raggiungono età mai prima sperimentate se non i casi personali rari. Tutti driver che possono essere compresenti, rafforzandosi a vicenda.
1 Dati e simulazioni sono disponibili agli interessati, contattando l’autore all’indirizzo nicola.salerno@tin.it. Nuove proiezioni, Regione per Regioni, sono in elaborazione nella collana Welfare Reforming Papers. I casi di Lazio, Emilia Romagna e Basilicata sono già disponibili su www.reforming.it (sito web di Nicola C. Salerno).
2 Il driver è il Pil nazionale e non quello regionale per rispettare il dettato costituzionale di livelli essenziali di assistenza uniformi su tutto in tutto il Paese.
3 L’algoritmo è descritto in dettaglio nei docuemnti che accompagnano i due modelli SaniMod e SaniMod-Reg. I dati di sopravvivenza sono quelli della più recente release delle proiezioni demografiche Istat.
4 Per la spesa di assistenza ai lungodegenti (la quota a carico del Ssn), il tasso di crescita è quello del Pil per occupato, per dar conto del cosiddetto “effetto Baumol”. Nei primi anni di proiezione, lo scenario “Awg reference” ipotizza la presenza di uno spread tra il tasso di crescita della spesa pro-capite e quello del Pil pro-capite, ma poi lo spread viene fatto gradualmente riassorbire nel tempo.