Il fatto non era totalmente sconosciuto nel mondo accademico, ma un’analisi così approfondita come quella effettuata da Berg et al (2019) dal titolo “Aggregate Confusion: The Divergence of ESG Ratings” rende evidente a tutti l’eterogeneità dei rating ESG assegnati dalle diverse agenzie a ciò dedicate.

Si tratta in effetti di un aspetto su cui gli operatori del settore – compresi i più accaniti sostenitori della finanza sostenibile – dovrebbero porre attenzione. Anche perché, quando si parla di rating, siamo ancora fortemente influenzati dal concetto di credit rating (i giudizi AAA, BBB, BB+ eccetera dati da Standard & Poor’s, Moody’s, Fitch), e ciò può portare ad una percezione distorta del voto espresso.

Nel caso dei credit rating, infatti, il giudizio sulla affidabilità di una società emittente di titoli di debito si basa, in termini semplici, su una analisi economico-finanziaria di tipo prospettico che, pur non garantendo in assoluto la sicurezza di restituzione del capitale (anche una società AAA può fallire), dovrebbe pervenire ad un giudizio similare sulla probabilità di default di una società indipendente da chi la effettua. Detto in altro modo, se una società è AAA per Standard & Poor’s potrebbe essere valutata AAA- o AA da Moody’s, ma difficilmente sarà BBB per un’altra società di rating.

Nel mondo dei rating ESG le cose funzionano diversamente. Da un lato, infatti, le agenzie che producono i rating ESG devono per prima cosa offrire una loro interpretazione di cosa significhi, in sostanza, la performance ESG di una società (mentre il concetto di probabilità di default è condiviso) e di come possa essere misurata. Dall’altro, mentre i rating di credito si basano su dati finanziari e di bilancio che rispettano standard ormai condivisi (i principi contabili internazionali), i rating ESG vengono elaborati su una reportistica non ancora omogenea e standardizzata.

Sta di fatto che lo studio di Berg et al (2019), mettendo in relazione i giudizi di 6 differenti provider di rating ESG[1], e ragionando su un campione comune di quasi mille rating, arriva a stimare che la correlazione media dei rating delle agenzie in esame è di 0.54, con un range che va da 0.38 a 0.71. Si tenga presente che la correlazione tra i rating di Standard & Poor’s e Moody’s arriva a 0.99.

La figura sottostante mostra la correlazione tra i rating delle diverse agenzie sia a livello complessivo (i tre pilastri ESG insieme), sia a livello di singoli pilastri (E-S-G separatamente).

Si noti come la dimensione Governance sia quella che presenta la correlazione minore tra i giudizi delle diverse agenzie, arrivando in alcuni casi ad essere negativa.

La correlazione complessiva potrebbe però nascondere interessanti differenze a livello di singole società sottoposte a giudizio. Ad esempio, una bassa correlazione media tra i rating assegnati da due agenzie potrebbe essere dovuta o a una differenza di giudizio similare per tutte le aziende analizzate, ovvero a forti differenze di giudizio ma solo per un numero ristretto di società.

Gli autori si focalizzano quindi sulle differenze agli estremi del campione, ovvero sulle 25 società per cui si registra il più alto e il più basso livello di disagreement tra le agenzie di rating[2]. Le due figure sottostanti riportano visivamente i risultati ottenuti.

Nel caso delle prime 25 aziende analizzate, quelle con un maggior accordo di giudizio tra le agenzie di rating, si nota in effetti un discreto allineamento sia per le aziende con rating più elevati, sia per quelle con voti mediani o più bassi.

Ma la situazione si ribalta per le 25 società dove il disaccordo è maggiore. E si comprende qui come la differenza di giudizio non dipenda dal livello di rating medio; in altri termini, che si stiano analizzando società buone o cattive (dal punto di vista ESG) la differenza di voto tra le agenzie è comunque significativa.

In sintesi, vi è una forte eterogeneità nel livello di disagreement tra le imprese analizzate. Le agenzie di rating sembrano quindi essere d’accordo sul giudizio dato ad alcune aziende, mentre su altre giungano a votazione totalmente differenti. E non c’è un driver preciso che spieghi questa eterogeneità, verificandosi la stessa in diversi settori e in diverse aree geografiche.

Attraverso l’applicazione di successive metodologie statistiche, gli autori giungono però ad indicare che sono prevalentemente le divergenze in termini di misurazione la ragione principale alla base delle differenze dei giudizi assegnati. In altri termini, differenti raters misurano la performance ESG della stessa società, nella stessa categoria/fattore, in maniera differente.

Ad esempio: quanto sei bravo da 1 a 10 nella categoria “Financial Inclusion”? Una agenzia dice 8 basandosi su 3 fattori, l’altra dice 4 basandosi su 5 fattori (sto inventando).

In particolare è la misurazione della performance in tema di Human Rights e Product safety quella su cui vi è più disaccordo.

Non sembra invece così importante la scope divergence, ossia il fatto che alcune agenzie considerano certe categorie di analisi che altre non considerano. Ad esempio, l’attività di lobbying di una società è considerata nel rating solo da due agenzie su sei.

Ancor meno significativa risulta essere la weights divergence, ossia la discordanza tra i pesi assegnati alle categorie/fattori utilizzati per ottenere il rating ESG. Sicuramente le agenzie assegnano pesi diversi ai fattori analizzati, ma ciò non sembra incidere significativamente sul giudizio complessivo

In aggiunta a quanto sopra, è interessante l’effetto “Rater” che gli autori mettono in luce; i giudizi riguardo diverse categorie di analisi dati dalla stessa agenzia tendono infatti ad essere tra loro molto correlati. In termini semplici: se una agenzia da un buon giudizio ad una società in una certa categoria, tenderà a dare buoni voti anche nelle altre.

Come a dire: se sei bravo in italiano sei bravo anche in educazione fisica e in matematica.

 

Per chi volesse approfondire, nel link seguente potete scaricare l’intero paper.

https://papers.ssrn.com/sol3/papers.cfm?abstract_id=3438533

[1] KLD, Sustainalytics, Vigeo-Eiris, Asset 4, RobeccoSAM, MSCI

[2] La metodologia utilizzata è quella “Mean Absolute Distance to the average rating (MAD)”