Angolo matematico: il numero di contagi è esponenziale?

Angolo matematico: il numero di contagi è esponenziale?

In questi giorni si è sentito spesso parlare di crescita esponenziale del numero di contagi e del fattore R0 associato al Coronavirus (parametro che ne descrive la contagiosità, ovvero quante persone un individuo, mediamente, può infettare). In questo articolo proviamo ad approfondire meglio l’andamento dei dati reali e a capire come la matematica, anche se piuttosto elementare, ci può aiutare a fare previsioni.

Al momento l’R0 del Coronavirus è stimato come maggiore di 2. Per seguire meglio il ragionamento che segue, supponiamo che R0 sia 2. Allora il numero di contagi seguirebbe la seguente successione a(n)=2^n: 2, 4, 8, 16, 32, 64, 128, 256, 512, 1024, 2048… (qualcuno avrà notato che questi numeri corrispondono alle memorie dei calcolatori elettronici. Ovviamente non è un caso, ma questa è un’altra storia).

Un andamento di questo tipo è detto esponenziale, e cresce molto velocemente. Qui propongo il suo grafico, per aiutarvi a capire quanto sia rapida una crescita di questo tipo.

esponenziale-base-2

Le misure di contenimento attuate in Cina, e ora in Italia, mirano dunque a far diminuire il valore di R0. Quando questo valore sarà minore di 1, allora il contagio scomparirà gradualmente. Ad esempio, ecco il grafico di 0.8^n:

 

esponenziale-decrescente

 

I dati a nostra disposizione stanno davvero seguendo un andamento esponenziale?

 

CASO CINESE

Osserviamo la crescita del numero di contagi in Cina nei primi 24 giorni dell’epidemia.

contagi-cina

 

Questa curva segue un andamento esponenziale? Per capirlo ho provato ad interpolare i dati dei primi 10 giorni con una curva esponenziale (quindi del tipo a*e^(bx)) e con una curva polinomiale, per vedere quale delle due potesse approssimare meglio i dati dei giorni successivi.

Nota1: L’interpolazione è un metodo che consiste nel trovare la curva che meglio approssima i dati che abbiamo, in gergo chiamati nodi. Esistono vari tipi di interpolazione (lineare, polinomiale, spline, ecc.) e ognuna di esse ha le sue peculiarità. Solitamente l’interpolazione viene utilizzata per trovare dati “mancanti” all’interno dell’intervallo dei dati reali, mentre utilizzarla per fare previsioni all’esterno di tale intervallo è una questione molto più delicata (problemi di malcondizionamento, errori grossolani che non tengono conto dei fattori che rendono il problema complesso, ecc). Ad ogni modo, per i giorni immediatamente successivi all’intervallo considerato, come vedremo, può darci indicazioni utili.

Nota2: Tutti i grafici e i calcoli sono stati fatti utilizzando il software MATLAB.

 

Ecco il risultato di questa prima interpolazione. Gli asterischi corrispondono ai dati reali, la curva blu è quella data dall’interpolazione esponenziale, e la curva rossa è quella data dall’interpolazione polinomiale. Risulta evidente quanto la curva esponenziale si discosti molto dai dati reali, mentre la curva polinomiale si avvicina piuttosto bene ad essi.

interpolazione-cina

Nota3: Una curva polinomiale descrive una crescita di tipo potenza. Ad esempio, per la potenza 2, a(n)=n^2: 1, 4, 9, 16, 25, 49, 64, 81,… Per la potenza 3, a(n)=n^3: 1, 8, 27, 64, 125,…

 

CASO ITALIANO

Il modello di interpolazione polinomiale che avevamo costruito qualche giorno fa aveva previsto per il 2 marzo circa 1940 contagi, quindi abbiamo leggermente sottostimato il dato reale, che è 2036.

Un modello di interpolazione esponenziale, però, avrebbe previsto per il 2 marzo circa 2800 contagi, quindi il dato reale risulterebbe di gran lunga sovrastimato!

Per prevedere il numero dei contagi dei prossimi giorni preferiamo quindi attenerci, per il momento, al modello polinomiale.

interpolazione-italia

Aggiornamento 8 marzo 2020. Dove stiamo andando?

Negli ultimi 2 giorni abbiamo riscontrato un aumento significato dei casi registrati. Le nostre previsioni, che si erano adattate bene fino al 6 marzo, ora risultano troppo prudenti.

Nel grafico che segue abbiamo messo in rosso la curva dell’interpolazione precedente, in verde la curva quadratica della nuova interpolazione e in blu la curva cubica della nuova interpolazione.

Si nota subito che la cubica, pur essendo una curva polinomiale, accelera molto più velocemente della quadratica, quindi si raggiungerà prima una situazione di crisi (la retta disegnata in viola).

grafico_confronto_curve

 

Per capirsi meglio, “ingrandiamo” il grafico aumentando il numero di giorni visibili. L’andamento di questi giorni ci suggerisce che ci stiamo avvicinando sempre più velocemente al livello di saturazione del sistema sanitario, qualsiasi esso sia. Risulta quindi urgente ritardare il raggiungimento di questo valore, tramite soprattutto le misure di contenimento che si stanno facendo sempre più stringenti. Quando si raggiungerà il picco dell’epidemia e la curva inizierà a decrescere, sarà importante trovarsi al di sotto di questo valore. Si stanno inoltre aumentando i posti letto in terapia intensiva, in modo che il valore di default incrementi e potremo guadagnare tempo.

grafico_confronto

Aggiungiamo adesso anche un fit esponenziale, in arancione, curva ancora più veloce delle precedenti. Secondo questa curva il 15 marzo dovremmo avere quasi 40000 casi.

confronto-con-exp

Ecco dunque la nuova previsione per i prossimi giorni.

CASO QUADRATICO 

GIORNOCASI
8/36346
9/37264
10/38244
11/39286
12/310390
13/311556
14/312785
15/314075
16/315427
17/316841
18/318318
19/319856
20/321457
21/323120
22/324844
24/326631
25/328480
26/330391
27/332364
28/334399
29/336496
30/338655
31/340877

 

CASO CUBICO

GIORNOCASI
8/36884
9/38161
10/39594
11/311193
12/312967
13/314926
14/317079
15/319436
16/322006
17/324799
18/327823
19/331089
20/334606
21/338383
22/342429
24/346755
25/351370
26/356282
27/361503
28/367039
29/372903
30/379102
31/385646

 

Vedremo con il tempo quale sarà il modello più giusto (o meno sbagliato!).

 

Per un modello esponenziale, più “catastrofico” di quello qui presentato: https://statisticallearningtheory.wordpress.com/2020/03/02/previsione-della-crescita-esponenziale-dei-covid19-positivi-in-italia-lombardia-veneto-ed-e-romagna/

Per maggiori dettagli sul software e sul metodo utilizzato: https://it.mathworks.com/help/curvefit/polynomial.html

Un altro interessante articolo, più approfondito, sui modelli matematici che descrivono il propagarsi delle epidemie: http://maddmaths.simai.eu/divulgazione/focus/epidemie-matematica/

 

Se ti è piaciuto questo articolo e vuoi rimanere aggiornato sulle nostre prossime pubblicazioni clicca qui per iscriverti alla nostra newsletter.

 

Samanta Zagani

Questo articolo ha 23 commenti.

  1. Massimo Maria Ferranti

    fare calcoli con i dati cinesi iniziali è fuorviante perchè potrebbero essere molto distanti dalla realtà. diverso il discorso su quelli dopo il ventesimo giorno quando oramai avevano gli occhi del mondo puntati addosso ed era scattata la quarantena per 60 milioni di abitanti.
    Cambierebbero le vs considerazioni partendo dal giorno 15 ? e se si come, più vicini alla realtà o più lontani? attendo con curiosità la vs risposta e vi auguro buon lavoro

    1. Samanta Zagani

      Buonasera, grazie del commento, il suo ragionamento è molto sensato e ho subito provato a verificare. Ho provato a interpolare i dati cinesi dal giorno 15 al giorno 20 con una curva polinomiale e devo dire che, confrontando i dati reali dei giorni successivi, l’interpolazione fatta funziona piuttosto bene. Se osserva i dati cinesi però si può notare un andamento molto particolare: subiscono una sostanziale accelerazione tra il 13 e 14 febbraio, dopodiché la crescita rallenta drasticamente (la curva cresceva molto più rapidamente nei primi giorni, probabilmente viste le misure messe in atto successivamente!). Quindi con i dati troppo “lontani” dall’inizio dell’epidemia la curva, a mio avviso, può essere tutto fuorché un’esponenziale (per fortuna!). Come detto, l’interpolazione può essere utile per prevedere l’andamento dei giorni immediatamente successivi. Vedremo nei prossimi giorni cosa succederà qui in Italia, e quale modello descriverà meglio la nostra situazione. Appena ho tempo aggiungerò queste considerazioni, con i relativi grafici, all’articolo.
      Un saluto e grazie,
      Samanta Zagani

      1. Massimo Maria Ferranti

        Grazie. Siete in gambissima. Posso darvi un consiglio ? pubblicate su Fb i vs studi. Io vi metto sulla mia bacheca e lo farò ancora 🙂

        1. Samanta Zagani

          Grazie! Abbiamo una pagina, se ha voglia di seguirci, può cercare su facebook Med4Care.
          Un saluto!

  2. Stefano Procissi

    Buonasera.
    Al momento (03-03 ore 18.40) la previsione del totale dei casi è precisa, 2425 contro i 2502 accertati ufficialmente (si veda il link sotto).
    Complimenti.
    Vediamo nei prossimi giorni.
    Cordiali saluti e buon lavoro.
    https://www.worldometers.info/coronavirus/

    1. Samanta Zagani

      Grazie! Vedremo nei prossimi giorni.
      Un saluto cordiale,
      Samanta Zagani

  3. Fabrizio Sordello

    Se posso permettermi, sarebbe meglio utilizzare i dati dei ricoverati o dei pazienti in terapia intensiva. I dati sui contagiati sono troppo affetti da errore, soprattutto ora che non vengono più testate le persone asintomatiche. Su ricoveri e terapia intensiva l’esponenziale fitta molto bene. Il che purtroppo indica che siamo all’inizio dell’epidemia e che le misure di contenimento non stanno ancora dando i loro frutti.

    Inoltre l’andamento esponenziale deriva da un modello meccanicistico, che vale finché valgono le premesse, cioè fin tanto che non si riducono i suscettibili con vaccinazioni o suscettibili e infetti misure di isolamento e quarantena. Chiaro che poi ad un certo punto il contagio rallenta grazie a queste misure e a quel punto un polinomio fitta meglio… ma si tratta di un modello fenomenologico cheprevede parametri senza nessun significato fisico.

    1. Samanta Zagani

      Buonasera, grazie per il commento. A mio parere (sottolineo che non sono un’esperta di epidemie), i dati che finora abbiamo sui pazienti critici non sono sufficienti per fare previsioni molto accurate. Ad ogni modo, dal 27 febbraio in poi i numeri di pazienti critici, se non mi sono stati forniti dati sbagliati, sono i seguenti: 56, 64, 105, 140, 166, 229, 295, 351. Ho fatto qualche prova interpolando una parte di essi con curve polinomiali e esponenziali, per poi vedere quale delle due stimasse meglio i successivi. Risultato: l’esponenziale si discostava di più dai dati reali. Ora potremmo fare così: interpoliamo tutti i dati dei pazienti critici con entrambe le curve. Le previsioni della curva polinomiale sono per 6,7,8 marzo rispettivamente 429, 513, 604. Le previsioni della curva esponenziale invece sono per 6,7,8 marzo rispettivamente 467, 601, 773. Vediamo nei prossimi giorni quali saranno i dati reali!
      So benissimo che il mio modello non tiene conto di parametri con significato fisico (infatti ho messo il link a un articolo dove vengono spiegati i “veri” modelli matematici che studiano l’andamento delle epidemie). Quello che volevo dire con questo piccolo articolo, che non ha nessuna pretesa di essere ineccepibile (ho voluto solo giocare e sperimentare un po’ con le curve e con i loro andamenti, osservando anche i casi di altri paesi) è che: se si dice che i contagi stanno seguendo un modello esponenziale, allora se interpolo i dati reali con una curva esponenziale dovrei riuscire a prevedere, all’incirca, i dati nel futuro. Facendo così però i dati che troverei si allontanerebbero molto, dopo 2 o 3 step, dalla realtà. Ho quindi pensato che potessero esserci altre curve che avrebbero descritto meglio questo andamento, perlomeno per i giorni immediatamente successivi, e ho supposto che queste curve fossero dei polinomi.
      Grazie ancora per il commento!

  4. Antonello

    Salve a tutti,

    ho fatto un’interpolazione lineare con una semplice regressione lineare utilizzando i dati nazionale sugli ultimi 6 giorni forniti dalla protezione civile.

    L’equazione è:

    n = 670 + 424*t
    R^2 = 0.988

    dove n è il numero di contagi e t è il numero dei giorni (1, 2, 3, 4…) a partire dal 29.02.

    A me sembra che questa equazione interpoli i dati in maniera più realistica sia di quella esponenziale sia di quella polinomiale.

    La previsione per i prossimi 3 giorni è:
    6 marzo 3638
    7 marzo 4062
    8 marzo 4486

    In ogni caso, gli scostamenti che osservo, tra dati osservati e dati predetti dalla precedente equazione, rientrano tutti all’interno di confidence bounds al 95%.

    Quale modello fitta meglio nellimmediato futuro?
    Cordiali saluti (e speriamo finisca al più presto)

    1. Antonello

      Più precisamente:

      4 marzo: 2790
      5 marzo: 3214
      6 marzo: 3638
      7 marzo: 4062
      8 marzo: 4486
      9 marzo: 4910
      10 marzo: 5334
      11 marzo: 5758

      1. Samanta Zagani

        Salve, grazie dell’intervento! Al momento rimango dell’idea che il modello che fitta meglio nell’immediato futuro sia quello polinomiale. Lei prevede per il 6 marzo 3638 casi quando ad oggi, 5 marzo, ci sono già 3838 casi (ma forse lei si riferisce al numero di attuali infetti, non di infettati dall’inizio dell’epidemia?). Se un modello esponenziale è troppo catastrofico, forse un modello lineare è troppo prudente, almeno per il momento. Secondo me un modello lineare potrebbe funzionare quando la velocità di crescita inizierà a calare, ma questa è solo una mia ipotesi.

        1. Antonello

          Questo può essere dovuto al fatto che io sto considerando i casi positivi così come riportato sul sito della protezione civile:

          Comunicato stampa del 5.03 ore 18:
          Coronavirus: sono 3.296 i positivi
          “Nell’ambito del monitoraggio sanitario relativo alla diffusione del Coronavirus sul territorio nazionale, al momento 3.296 persone risultano positive al virus. ”

          I dati cui faccio riferimento, quindi, sono i “positivi” così come riportato nei vari comunicati stampa. La differenza potrebbe essere dovuta anche a questo fatto.

          In realtà, dopo ulteriori analisi, penso anch’io che un modello lineare tenda a sottostimare la portata del contagio. Putroppo.

          Vedremo… Grazie per la risposta.
          Cordiali saluti.

          1. Samanta Zagani

            Perfetto. Ci auguriamo tutti che la curva inizi a seguire un andamento lineare al più presto. Vedremo.
            Grazie a lei per l’intervento.
            Un saluto cordiale.

    2. Nic

      Antonello l’interpolazione lineare va sempre bene come approssimazione di qualunque curva se l’intervallo considerato è abbastanza piccolo. Si chiama linearizzazione. Se estendi l’intervallo vedrai che una retta non si adatta bene, lo si vede anche a occhio

  5. Stefano Procissi

    Il modello è sicuramente prudenziale, a stasera ore 17, i casi totali accertati sono 3858 contro i 3642 della previsione (quindi in rialzo rispetto allo scostamento dei giorni precedenti, che era più basso). Questi sono gli unici dati che contano, il resto sono considerazioni di scuola che, nella realtà concreta, lasciano il tempo che trovano. E’ solo sul campo che si verifica la bontà (o meno) di un modello previsionale. Continuate così. Cordiali saluti.

    1. Samanta Zagani

      Sì, purtroppo questo modello sta sottostimando i dati reali, anche se al momento siamo ancora all’interno del bound. Vedremo quale sarà il trend dei prossimi giorni, augurandoci che, almeno un po’, i dati rientrino. La cosa importante è che il nostro modello, seppur prudente, ci dimostra che stiamo andando verso una situazione critica per il sistema sanitario.
      Grazie e un saluto!

  6. Stefano Procissi

    Il modello è fatto bene, con giusti criteri prudenziali. Purtroppo temo che la realtà sia peggiore del previsto (dai capoccioni in alto loco). Dall’esame dei dati parziali, maturati tra ieri sera e stamani, credo che oggi l’incremento dei nuovi casi devierà verso l’alto (rispetto alla previsione) ancora più di ieri. Aspettiamo e vediamo. Saluti.

  7. Antonello

    Buongiorno,
    potrebbe fornirci l’equazione del modello polinomiale che lei ha stimato? Questo mi aiuterebbe molto nel confronto tra le previsioni fatte dai differenti modelli: esponenziale, polinomiale e lineare. L’equazione lineare la ricalcolo facendo riferimento ai casi totali di contagio e non ai potitivi (che ho scoperto essere “depurati” dai guariti). L’equazione esponenziale ci è stata fornita dal Dott. De Nicolao.
    La serie storica a mia disposizione è limitata (dal 29.02) ma ho visto che l’aumento giornaliero dei nuovi casi (positivi) varia con un OR da 1,11 a 1,50 con una media di 1,26. Per quel che può valere, visti i dati limitati, il numero di nuovi positivi per ora sembra crescere “in media” del 26% al giorno.
    Se ci fornisce l’equazione del modello polinomiale le sarei molto grato.
    Cordiali saluti!

  8. Stefano Procissi

    La progressione dei nuovi casi dal 1 Marzo è pressoché costante, circa il 23% giornaliero di media, con oscillazioni minime. Se questo trend non viene abbattuto a breve la situazione diventerà molto molto grave, si rischia la progressione esponenziale (linea arancione) sopraindicata, potrebbero essere oltre 30.000 casi al 15 Marzo. Speriamo bene. Saluti.

    1. Stefano Procissi

      30.000 casi superati abbondantemente oggi 17/3 anziché il 15/3, due giorni di ritardo nella previsione. Di nuovo, speriamo bene. Saluti.

  9. Maurizio

    Buongiorno a tutti.
    I vostri studi mi paiono ottimi. Io ho qualche perplessità sul numero dei contagi reali. Se non sbaglio il tasso di mortalità per questo virus è dell’ordine del 3.4%.
    Ora analizzando la quantità di decessi ad oggi, il numero dei contagiati sembrerebbe essere superiore al numero ufficiale.
    Grazie

    1. Samanta Zagani

      Buongiorno Maurizio, la sua perplessità è del tutto sensata, infatti ieri abbiamo pubblicato un articolo proprio su questo, se ha voglia di leggerselo: Coronavirus: come mai tutti questi critici in Italia?
      Grazie e un saluto!

  10. Paolo

    Oggi, che è il 28/03 e che abbiamo un numero di positivi totali di 86.498, possiamo dire che la polinomiale cubica ha una corrispondenza quasi impressionante. Ovviamente le incertezze legate alla rilevazione dei casi o alla nascita/chiusura di zone rosse o, ancora, adepisodi puntuali come i rientri dal nord al sud, condizionano il fenomeno in modo pesante, ma resta il fatto che la previsione cubica è risultata estremamente azzeccata.
    Cordiali saluti e complimenti per la pagina!

Lascia un commento