SVILUPPO DI UN MODELLO DI SIMULAZIONE ABBINATO A UN ALGORITMO QUALITATIVO PER LO STUDIO DEI SISTEMI AMBIENTALI COMPLESSI di Stefano Allesina Tesi presentata per la discussione del diploma di laurea in Scienze Ambientali Facoltà di Scienze Matematiche, Fisiche e Naturali – Università di Parma AA 1999-2000 Relatore: dott. Alessandro Zaccagnini Dipartimento di Matematica Co-Relatore: dott. Antonio Bodini Dipartimento di Scienze Ambientali A b s t r a c t SVILUPPO DI UN MODELLO DI SIMULAZIONE ABBINATO A UN ALGORITMO QUALITATIVO PER LO STUDIO DEI SISTEMI AMBIENTALI COMPLESSI di Stefano Allesina Relatore: Dottor Alessandro Zaccagnini Dipartimento di Matematica Co-Relatore: Dottor Antonio Bodini Dipartimento di Scienze Ambientali La tesi si occupa dei metodi informatici e matematici della Loop Analysis, una metodologia per lo studio qualitativo dei sistemi lineari o linearizzabili di equazioni differenziali. Questi sistemi sono importanti nello studio degli ecosistemi e nella valutazione dell'impatto dell'uomo sugli ambienti naturali, in quanto i rapporti tra popolazioni, e tra gli altri fattori biotici, abiotici, culturali e sociali, si possono modellizzare in un sistema di variabili che intrattengono relazioni di indifferenza, competizione, mutualismo, ecc. La Loop Analysis si occupa proprio del segno di queste interazioni, studiando la cosiddetta matrice di comunità, ovvero la matrice Jacobiana, valutata in un punto stazionario, del sistema linearizzato. In realtà, non viene studiata direttamente la matrice, ma le proprietà del grafo orientato che si può univocamente associare alla matrice, individuando cioè i vari percorsi (paths) e cicli (loop) del grafo. Da queste proprietà è possibile valutare la stabilità del sistema, anche se formato da un cospicuo numero di variabili, e fare predizioni sul mutamento dei valori di equilibrio delle variabili in caso di input esterni. Il lavoro si è concretizzato in tre software che sono in grado di creare le matrici e i grafi, fare la Loop Analysis e infine eseguire una simulazione sui vari percorsi. L'utilizzo della simulazione ha lo scopo di individuare il segno prevalente dei cosiddetti percorsi ambigui, ossia i percorsi del grafo che partono da una variabile e arrivano a un'altra dando risultati di segno opposto. Il programma compie questa operazione assegnando, dopo averli normalizzati, valori casuali ai coefficienti della matrice (links del grafo) e calcolando poi la forza dei percorsi. Reiterando questa procedura più volte si ottengono stime approssimate della "probabilità" dei due segni, chiarendo molte delle ambiguità. Inoltre, i tre programmi permettono di analizzare sistemi con un consistente numero di variabili (30), poiché i dati in output sono memorizzati in tabelle di databases e quindi di facile accesso e molto capienti. Questa scelta si è resa necessaria perché il numero di percorsi, e quindi la complessità algoritmica, sale più che esponenzialmente con l'aumentare delle variabili. Un aspetto peculiare di questo studio consiste nella sinergia di due diverse e apparentemente inconciliabili metodologie di analisi: quella qualitativa (Loop Analysis) e quella quantitativa (simulazione). SOMMARIO Capitolo 1 – INTRODUZIONE....................................................................................1 I modelli matematici: definizioni.........................................................................................2 Modellizzare i sistemi complessi.........................................................................................4 Capitolo 2 - LA LOOP ANALYSIS...............................................................................6 1. Definizioni.................................................................................................................7 Feedback...............................................................................................................................11 Stabilità..................................................................................................................................12 Fare predizioni.....................................................................................................................14 Le tavole di predizione.......................................................................................................15 Capitolo 3 - METODI MATEMATICI DELLA LOOP ANALYSIS.................19 2. Stabilità in Tempi discreti....................................................................................20 Le equazioni viste da vicino..............................................................................................23 Matrice Jacobiana, autovalori e stabilità..........................................................................26 Self-loop................................................................................................................................30 Stabilità in più variabili.......................................................................................................32 Un esempio..........................................................................................................................38 Cambiamento nei valori di equilibrio..............................................................................40 Capitolo 4 - LE AMBIGUITA’......................................................................................44 3. Percorsi di segno opposto...................................................................................44 Ambiguità nel segno di un path o di un loop................................................................46 Il “Lumping” delle variabili ..............................................................................................47 Simulare.................................................................................................................................50 Capitolo 5 - TEORIA DEI GRAFI..............................................................................52 4. Rappresentazione e definizioni..........................................................................52 Quanti loops?.......................................................................................................................53 Rappresentazione informatica dei grafi...........................................................................57 Capitolo 6 – ALGORITMI.............................................................................................59 5. Trovare gli Open Path.........................................................................................61 Trovare i loop......................................................................................................................63 Trovare i Feedbacks............................................................................................................65 Tavole di predizione...........................................................................................................68 Simulare i percorsi ambigui...............................................................................................69 Capitolo 7 – RISULTATI................................................................................................72 6. Prestazioni..............................................................................................................74 Risolvere tutte le ambiguità?..............................................................................................75 BIBLIOGRAFIA.....................................................................................................................................79 i i C a p i t o l o 1 INTRODUZIONE “Di ciò, di cui non si può parlare, si deve tacere” L. Wittgenstein – Tractatus Logico-Philosophicus Negli ultimi decenni, si è manifestato un crescente interesse verso la complessità, interesse esplicitatosi in due modi differenti. Da una parte si sono individuate nuove interazioni tra compartimenti che erano sempre stati considerati “stagni”, cioè si sono trovate evidenze sperimentali di sistemi complessi. Dall’altra, con la possibilità di trattare enormi quantità di dati offerta dall’informatica, ci si è spinti verso modelli che comprendono più variabili e parametri: è aumentata la complessità “ideale” dei modelli. Tra i sistemi complessi, hanno acquistato una sempre crescente rilevanza e attualità i sistemi ambientali, che sono caratterizzati da una elevata complessità strutturale - basta pensare alle cosiddette proprietà emergenti - e che hanno richiesto un grande sforzo di analisi e la creazione di appositi strumenti di modellizzazione. Il desiderio di riuscire a maneggiare sistemi complessi non risponde solo a un’esigenza teorico-speculativa, ma anche a richieste sempre più pressanti della società, a fronte degli enormi danni arrecati al patrimonio ambientale anche a causa dell’insufficiente grado di comprensione dei fenomeni naturali. Sono recenti le normative comunitarie per la valutazione di impatto ambientale (85/337/CEE del 27 giugno 1985 e 97/11/CE del 3 marzo 1997), valutazione che non può prescindere da una corretta e completa analisi dei sistemi ecologici, i cui comportamenti possono essere previsti solo mediante l’utilizzo di modelli. Questo lavoro tratta di modelli qualitativi, cioè di modelli che non si basano sulla quantificazione di parametri e valori, ma sul rapporto che intercorre tra le variabili del sistema. Ci si potrebbe chiedere quale sia l’utilità di un’analisi apparentemente così approssimativa quando esistono computer, potenti ed economici, in grado di eseguire calcoli a velocità elevatissime. Si possono trovare almeno due ragioni per l’utilizzo di modelli qualitativi: 1. I metodi qualitativi riescono ad analizzare sistemi complessi senza un’eccessiva spesa di tempo e denaro; 2. I modelli qualitativi sono essenziali come elaborazione a monte di una modellizzazione quantitativa. La prima tesi è semplice da comprendere: se, con l’utilizzo di equazioni differenziali, è possibile descrivere il comportamento di sistemi in 2-3 variabili entro un certo grado di approssimazione, risolvere un sistema di 10 equazioni è impresa molto più ardua, anche sfruttando metodi di calcolo numerico approssimato. Se poi si considerano variabili biologiche, spesso legate a parametri o funzioni difficilmente stimabili, come quelli sociali, economici e legislativi, la quantificazione può diventare uno strumento paradossalmente meno potente: la difficoltà nella formalizzazione delle funzioni e nella stima dei valori dei parametri, unita ai limiti di applicabilità degli strumenti matematici, è tale da rendere i risultati decisamente lontani dalla generalità e dalla precisione a cui le equazioni ci hanno abituato. La seconda tesi non riguarda direttamente la realtà, ma la concettualizzazione che porta alla costruzione del modello. “I modelli sono strutture concettuali che studiamo per non dover studiare la realtà” (Puccia e Levins, 1985), e per comprendere effettivamente la generalità di un modello, e soprattutto la sua verosimiglianza (realismo), è utile disporre di uno strumento che valuti velocemente queste caratteristiche. Quando si costruisce un modello, è fondamentale aver chiaro come le variabili interagiscano tra loro, e come si comporti il sistema nell’eventualità dell’aggiunta o eliminazione di una variabile, o operazioni svolte sui 2 coefficienti delle equazioni. La Loop Analysis, la metodologia qualitativa di cui si occupa questa tesi, permette questa modellizzazione per raffinamenti successivi, e consente di confrontare velocemente diverse ipotesi di modello per uno stesso sistema. 1. I modelli matematici: definizioni Un modello è una rappresentazione della realtà, perciò la sua caratteristica fondamentale dovrebbe essere il realismo, la capacità di rispondere agli stimoli esattamente come il sistema reale. Inoltre, dato che la sua principale funzione è di predire il comportamento del sistema reale, deve dare risposte precise. Un'altra caratteristica auspicabile è quella di essere generale, cioè direttamente applicabile ad altri casi simili: in sostanza non deve essere una soluzione ad hoc. Purtroppo queste tre caratteristiche (generalità, precisione, realismo) non possono essere massimizzate contemporaneamente. Si dovrà quindi operare un trade-off tra le varie priorità, secondo gli obiettivi della ricerca (Levins 1966). Si prospettano tre casi: Realismo Generalità Precisione Fig. 1 Quando si massimizzano generalità e realismo a scapito della precisione (Settore 1), come nel caso della Loop Analysis e delle altre metodologie qualitative, si ottiene un risultato poco preciso, proprio perché non quantitativo. A fronte di questa perdita, si riescono a studiare modelli 3 complessi (realismo), facilmente trasferibili ad altre situazioni simili (generalità). Se si privilegiano precisione e realismo (Settore 2), come avviene in molti modelli di simulazione al computer, è necessario inserire grandi quantità di parametri, misurati di volta in volta. Inoltre questi modelli richiedono una complessa procedura di calibrazione-adattamento per poter essere applicati a situazioni anche molto simili (De Angelis e Gross, 1992). Le metodologie che ricadono nel Settore 3 sono forse quelle più diffuse, poiché a questo caso sono ascrivibili quasi tutti i modelli matematici per la biologia. A fronte di una complessità difficilmente traducibile in set di equazioni, si adottano drastiche semplificazioni, ottenendo soluzioni che, per quanto applicabili a uno stretto range di situazioni, hanno il rigore e la precisione tipiche delle scienze pure. La chiarezza ed eleganza delle equazioni permette di trasportarle direttamente in campi di applicazione anche “non contigui”: ad esempio tutti i modelli per la biologia trovano prima o poi applicazione nelle scienze economiche, e viceversa (un esempio emblematico è la figura di Malthus). Si può fare un’ulteriore distinzione fra le tecniche modellistiche, quella fra modelli deterministici e modelli probabilistici. La Loop Analysis è una metodologia deterministica: lo stesso sistema dà sempre e comunque gli stessi risultati. Una simulazione è di impronta probabilistica: ad ogni reiterazione del calcolo esiste la possibilità di ottenere un risultato diverso dal precedente. In questo lavoro di tesi la simulazione viene utilizzata per integrare la capacità predittiva della Loop Analysis, e quindi si fondono le due classi di modelli per ottenere il risultato. 4 2. Modellizzare i sistemi complessi Il problema fondamentale dell’analisi dei sistemi biologici è riuscire a tenere conto delle forti interdipendenze che si hanno tra le diverse componenti. Infatti i sistemi naturali sono composti da specie che interagiscono tra loro, ma anche da una teoria di fattori fisici, chimici, economici e sociali, i cui effetti sono difficilmente quantificabili e variabili nel tempo. Le specie non possono essere studiate in isolamento le une dalle altre, se non accettando una perdita di informazione spesso critica. Non si riesce cioè a creare quell’uniformità di comportamenti e risposte che caratterizza i sistemi più semplici, che possono essere “controllati”. Il comportamento del sistema spesso non dipende dalla forza (valore assoluto) dei legami tra le componenti, ma dalla struttura del sistema stesso. Due laghi aventi la stessa struttura trofica potranno avere un comportamento molto simile. Al contrario, si possono riscontrare risposte molto diverse a una stessa sollecitazione in laghi che abbiano identici valori per parametri come temperatura, altitudine, precipitazioni, … Inoltre, i problemi che riguardano l’ecologia implicano spesso una componente sociale, i cui effetti sono difficili da valutare. L’analisi qualitativa permette di superare questo scoglio, dato che non richiede una quantificazione, ma semplicemente la descrizione delle relazioni che intercorrono fra le variabili. L’accento viene posto sulla struttura del modello e lo stesso sistema può essere descritto da diverse strutture alternative, tutte ugualmente accettabili: è il confronto con l’osservazione sperimentale che seleziona quale, tra le metaipotesi proposte (modelli), risulta essere la più attendibile. Spesso però, per la rappresentazione dei fenomeni e la loro comunicazione al pubblico, si utilizzano metodi che apparentemente danno risultati più spendibili, ossia valori numerici, grafici, tabelle, anche se le semplificazioni necessarie per ottenerli hanno fortemente intaccato 5
Description: