FACOLT(cid:192) DI SCIENZE MATEMATICHE FISICHE E NATURALI Corso di Laurea Triennale in Matematica OMOLOGIA PERSISTENTE APPLICATA ALLO STUDIO DEL CONNETTOMA Relatore: Candidato: Ch.mo prof. Veronica Paparozzi Marco Manetti matricola 1643491 Sessione Autunnale Anno Accademico 2018-2019 Dipartimento di Matematica ‘Guido Castelnuovo’ A chi c’Ł sempre stato. La matematica Ł l’alfabeto con cui Dio ha scritto l’universo. -G. Galilei Indice Indice i Introduzione iii 1 Omologia simpliciale 1 1.1 De(cid:28)nizioni e risultati preliminari . . . . . . . . . . . . . . . . . . . . . . . . 1 1.2 Complessi simpliciali astratti . . . . . . . . . . . . . . . . . . . . . . . . . . 5 1.3 Complesso di cricche di un grafo semplice . . . . . . . . . . . . . . . . . . . 10 1.3.1 Calcolo dell’omologia . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 2 Omologia persistente 19 2.1 Costruzione dell’omologia persistente . . . . . . . . . . . . . . . . . . . . . . 19 2.2 Visualizzazione . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.1 Barcode . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22 2.2.2 Diagramma di persistenza . . . . . . . . . . . . . . . . . . . . . . . . 22 2.3 Stabilit(cid:224) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 2.4 Point cloud e costruzione del complesso (cid:28)ltrato . . . . . . . . . . . . . . . . 25 3 Applicazione al connettoma 29 3.1 Nozioni preliminari sul cervello umano . . . . . . . . . . . . . . . . . . . . . 29 3.2 Costruzione del modello . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30 3.3 Studio della struttura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.3.1 Cricche . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 3.3.2 Cavit(cid:224) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 3.4 Risoluzione delle discordanze tra i due modelli . . . . . . . . . . . . . . . . . 36 Bibliogra(cid:28)a 37 i ii INDICE Introduzione L’omologia persistente Ł uno strumento utilizzato nell’analisi topologica (Topological Data Analysis, o TDA) per rilevare le caratteristiche peculiari di una struttura di dati. Nato in origine come strumento utilizzato in teoria della misura (anni ’90), Ł stato successiva- mente riformulato per la topologia algebrica (inizio 2000), e nel corso degli anni ampliato a strutture algebriche sempre piø generali. In particolare, sar(cid:224) quest’ultimo l’ambito a cui ci restringeremo. Per avvicinarci a comprenderne il funzionamento e lo scopo, consideriamo il seguente esempio: Ci troviamo sulla super(cid:28)cie della Terra; ci poniamo il problema di contare le mon- tagne. Cominciamo dal principio: cos’Ł una montagna? Banalmente possiamo iden- ti(cid:28)care ciascuna montagna con il suo picco. Ma a questo punto sorge un problema: non tutti i picchi che vediamo corrispondono a montagne, alcuni possono essere col- line, o altipiani. Come possiamo risolvere? Dovremmo individuare i picchi che sono particolarmente alti: (cid:28)ssando un valore di soglia (ad esempio 500 metri), potremmo classi(cid:28)care come montagna (i.e., picco rilevante) tutte quelle vette che superano tale soglia. Possiamo fare un discorso analogo con quella che Ł una delle caratteristiche invarianti di un oggetto topologico: l’omologia. Senza entrare nel formalismo (momentaneamente), questo Ł equivalente a dire che deformando "senza strappi" un oggetto, questo presenter(cid:224) sempre lo stesso numero di buchi. Abbiamo visto che contare i picchi non ci permette di distinguere una montagna da una collina; allo stesso modo, contare i buchi (i.e., calcolare l’omologia) non ci permette di distinguere un buco rilevante da uno (cid:28)ttizio. In questo caso, come possiamo fare una distinzione? La risposta a questa domanda Ł data dall’omologia persistente. Negli ultimi anni, gli studi su questo campo hanno prodotto sempre piø velocemente un gran numero di risultati, ed Ł in costante crescita il numero di applicazioni di questo strumento (dallo studio della struttura del DNA a quello delle proteine, dal riconoscimento dei vari leucociti e delle cellule tumorali a quello delle lesioni causate da melanomi o da problemi di natura epatica, dallo studio delle spirali dei cicloni a quello delle galassie, dal riconoscimento della scrittura a mano a quello delle impronte digitali). Tale fatto Ł giusti(cid:28)cato sia dalla consistenza della rappresentazione (vedi Sezione 2.1 e 2.2) che dalla stabilit(cid:224) dei risultati sotto piccole perturbazioni dei dati iniziali (vedi Sezione 2.3). Lo scopo di questa tesi Ł introdurre questo strumento, focalizzandosi sulle propriet(cid:224) rilevanti per descrivere una particolare applicazione: lo studio del connettoma, ovvero della rete di connessioni nervose all’interno del cervello. In particolare, nel capitolo 1 vedremo i concetti di partenza: costruiremo la struttura utilizzata per rappresentare il connettoma (i.e., il complesso di cricche associato ad un grafo semplice) partendo dal concetto di complesso simpliciale astratto, ed entreremo nel merito dell’omologia presentando alcuni metodi di calcolo con relativa applicazione. iii iv INTRODUZIONE Il capitolo 2 costituisce il cervello della descrizione: qui costruiremo l’omologia persi- stente a partire dai concetti enunciati precedentemente, ne mostreremo i metodi di rappre- sentazione gra(cid:28)ca ed enunceremo il Teorema di stabilit(cid:224) per giusti(cid:28)carne l’attendibilit(cid:224). In(cid:28)ne, considereremo alcune strutture che serviranno per la costruzione dei modelli del terzo capitolo. Ilcapitolo3trattadell’applicazionealconnettoma: riporteremoirisultatidiunostudio [Siz17] (focalizzandoci sull’analisi di due tipi di strutture: le cricche e le cavit(cid:224)) e ne descriveremo i passaggi salienti utilizzando gli strumenti matematici enunciati nei primi due capitoli. Le (cid:28)gure non originali utilizzate in questa tesi hanno la fonte indicata nelle rispettive didascalie. Capitolo 1 Omologia simpliciale 1.1 De(cid:28)nizioni e risultati preliminari In questa sezione ci occuperemo di de(cid:28)nire i concetti di base e i risultati utili per trattare gli argomenti nel seguito. Le nozioni qui riportate sono tratte da [Spa66], [AM69], [Man14] e [Zom05]. Cominciamo col de(cid:28)nire brevemente cos’Ł una categoria. Una categoria C Ł una struttura matematica che consiste di tre dati: - una classe Ob(C) i cui elementi sono detti oggetti della categoria (indicati con le lettere A, B, C, ...); - una classe Mor(C) i cui elementi sono detti mor(cid:28)smi: data una coppia di oggetti A, B in C, l’insieme C(A,B) ⊂ Mor(C) Ł composto da tutti i mor(cid:28)smi da A in B; - data una terna di oggetti A, B, C in C, una legge di composizione: C(A,B) × C(B,C) → C(A,C) (f , g) (cid:55)−→ g◦f , con f : A → B, g : B → C e g ◦ f la loro composizione, che per semplicit(cid:224) di notazione denoteremo con gf. Una categoria, a(cid:30)nchØ risulti tale, deve rispettare tre assiomi: A1: Due insiemi C(A ,B ), C(A ,B ) si diranno disgiunti a meno che A = A , B = 1 1 2 2 1 2 1 B ; 2 A2: Dati f ∈ C(A,B), g ∈ C(B,C), h ∈ C(C,D), allora h(gf) = (hg)f A3: Per ogni A,B ∈ Ob(C) esiste un mor(cid:28)smo Id ∈ C(A,A) tale che A se f ∈ C(A,B), allora Id f = f e se g ∈ C(B,A) si ha gId = g. A A In particolare, in A3, il mor(cid:28)smo identit(cid:224) se esiste Ł unico. Possiamo considerare A2 comelacondizione di associativit(cid:224) dellacomposizione,eA3comelacondizione di esistenza (e unicit(cid:224)) dell’elemento neutro. Dunque, inunacategoria, utilizziamoimor(cid:28)smiperporreinrelazionedi(cid:27)erentioggetti della categoria considerata; allo stesso modo, possiamo stabilire una relazione tra catego- rie di(cid:27)erenti. Tale trasformazione Ł detta funtore. Un funtore covariante [o funtore controvariante] F : C → D Ł un’applicazione che associa 1 2 CAPITOLO 1. OMOLOGIA SIMPLICIALE - ad ogni oggetto X di C un oggetto F(X) di D ; - ad ogni mor(cid:28)smo f ∈ C(X,Y) un mor(cid:28)smo F(f) ∈ D(F(X),F(Y)) [o F(f) ∈ D(F(Y),F(X))] tale che F(fg) = (F(f))(F(g)) [o F(fg) = (F(g))(F(f))] , F(Id ) = Id . X F(X) In questa trattazione utilizzeremo esclusivamente funtori covarianti. In particolare, possia- mode(cid:28)nirelacategoriadeifuntori(covarianti), considerandoquestiultimicomeglioggetti della categoria e i loro mor(cid:28)smi dati dalle cosiddette trasformazioni naturali. Dati due funtori F,G: C → D, dare una trasformazione naturale φ: F → G, signi(cid:28)ca dare, per ogni oggetto X di A, un mor(cid:28)smo φ ∈ D(F(X),G(X)) tale che per X ogni mor(cid:28)smo f ∈ C(X,Y) si abbia un diagramma commutativo F(f) F(X) −−−−→ F(Y) φX(cid:121) φY(cid:121) G(f) G(X) −−−−→ G(Y) . Diremo che, la trasformazione naturale φ Ł un isomor(cid:28)smo di funtori se φ Ł un X isomor(cid:28)smo nella categoria D per ogni X ∈ C. In tal caso scriveremo F (cid:39) G. In particolare, diremo che un funtore F: C → D Ł una equivalenza di categorie se esiste un funtore G: D → C tale che le composizioni FG e GF siano isomorfe al funtore identit(cid:224), ovvero FG (cid:39) IdD e GF (cid:39) IdC . Due categorie si dicono equivalenti se esiste una equivalenza fra di loro. Consideriamo ora un anello R (cid:28)ssato, tale che esso sia un anello commutativo unitario con unit(cid:224) diversa da 0. Un modulo di(cid:27)erenziale, o complesso, C consiste di un R-modulo C e di un endo- mor(cid:28)smo d : C → C tale che dd = 0. L’endomor(cid:28)smo d Ł detto di(cid:27)erenziale, o operatore di bordo, di C. Per un modulo di(cid:27)erenziale C de(cid:28)niamo il sottomodulo dei cicli Z(C,R) = kerd e il sottomodulo dei bordi B(C,R) = Imd, dove kerd e Imd indicano rispettivamente il nucleo e l’immagine di d. Essendo dd = 0, abbiamo che B(C,R) ⊆ Z(C,R). Con queste ipotesi Ł possibile de(cid:28)nire il modulo di omologia H(C,R) come il modulo quoziente H(C,R) = Z(C,R)/B(C,R) . Gli elementi di H(C,R) sono detti classi di omologia. In particolare, se z Ł un ciclo, la sua classe di omologia in H(C,R) Ł denotata con [z]. Diremo che due cicli z e z sono nella 1 2 stessa classe di equivalenza, e scriveremo [z ] = [z ], se la loro di(cid:27)erenza Ł un bordo. 1 2 Sia τ : C → D un omomor(cid:28)smo tra moduli di(cid:27)erenziali che commuta con gli opera- tori di bordo, allora avremo che τ manda cicli di C in cicli di C(cid:48). Dunque τ induce un omomor(cid:28)smo τ : H(C,R) → H(D,R) ∗ tale che τ ([z]) = [τ(z)], per ogni z ∈ Z(C). PoichØ (τ τ ) = τ τ , esiste un funtore ∗ 1 2 ∗ 1∗ 2∗ covariante dalla categoria dei gruppi di(cid:27)erenziali alla categoria dei gruppi che assegnano al gruppo di(cid:27)erenziale C il corrispondente modulo di omologia H(C,R) e all’omomor(cid:28)smo τ l’omomor(cid:28)smo indotto τ . ∗ 1.1. DEFINIZIONI E RISULTATI PRELIMINARI 3 Un anello graduato Ł un anello R insieme a una famiglia {R } di sottogruppi del p p≥0 gruppo additivo di R, tale che R = (cid:76)∞ R e R R ⊆ R per ogni m,n ≥ 0. p=0 p m n m+n Dato un anello graduato R, un modulo graduato su R Ł un R-modulo M insieme alla famiglia {M } di sottogruppi di M tale che M = (cid:76)∞ M e R M ⊆ M . Un p p≥0 p=0 p m n m+n elemento x ∈ M Ł detto omogeneo di grado p se x ∈ M per qualche p. p Dati due R-moduli graduati M e N , un omomor(cid:28)smo graduato di grado d di R- moduli graduati Ł una collezione di omomor(cid:28)smi di R-moduli {τ } tale che τ (M ) ⊆ p p≥0 p p N per ogni intero d. p+d Unmodulo di(cid:27)erenziale graduatosuRŁunmodulograduatoaventeildi(cid:27)erenziale compatibile con la struttura graduata, ovvero diremo che d : M → M Ł il di(cid:27)erenziale p p p+r di grado r, con r intero. In particolare, un complesso di catene Ł un modulo di(cid:27)erenziale graduato con di(cid:27)e- renziale di grado r = −1. Dunque un complesso di catene C consiste in una sequenza di R-moduli {C } e omomor(cid:28)smi d : C → C , con C = 0 se p < 0, tali che p p p p−1 p C −−d−p+−→1 C −−−dp−→ C p+1 p p−1 sia l’omomor(cid:28)smo banale, ovvero d d = 0. Il rispettivo omomor(cid:28)smo graduato di p p+1 grado d = 0 per i moduli di(cid:27)erenziali graduati Ł τ : M → N , che induce l’omomor(cid:28)smo p p τ : H (M,R) → H (N,R). In particolare, diremo che τ Ł un quasi-isomor(cid:28)smo se τ Ł ∗ p p ∗ un isomor(cid:28)smo per qualunque p. Peruncomplessodicatene,alvariaredipintero,abbiamoiseguentiR-moduligraduati Z(C,R) = {Z (C,R) = ker d } , B(C,R) = {B (C,R) = Im d } p p p p+1 da cui il gruppo di omologia dato da H(C,R) = {H (C,R) = Z (C,R)/B (C,R)} . p p p Un sottocomplesso C(cid:48) di un complesso di catene C, denotato con C(cid:48) ⊂ C, Ł un complesso di catene tale che Cp(cid:48) ⊂ Cp e d(cid:48)p = dp|Cp(cid:48), per ogni p. Inoltre esiste un’inclusione naturale i : C(cid:48) (cid:44)→ C , per ogni p. p p Diremo che un complesso di catene C Ł aciclico se ... −−d−p+−→2 C −−d−p+−→1 C −−−dp−→ C −−d−p−−→1 ... p+1 p p−1 Ł una successione esatta, ovvero Imd = kerd , per ogni p. Nel gruppo di omologia, ci(cid:242) p+1 p equivale a dire che H (C,R) = 0, per ogni p. p Scegliendo R = Z nelle de(cid:28)nizioni suddette, tutti gli R-moduli diventano Z-moduli e dunque gruppi abeliani. Siano τ,τ(cid:48) : C → D omomor(cid:28)smi di grado d = 0 tra moduli di(cid:27)erenziali graduati. Un’omotopia tra τ e τ(cid:48) Ł una successione di omomor(cid:28)smi di grado d = 1, tale h = {h : p C → D } al variare di p intero, tale che p p+1 dh+hd = τ −τ(cid:48) . In tal caso, scriveremo τ ∼ τ(cid:48), dove ∼ Ł la relazione di omotopia. In particolare, diremo che τ: C → D Ł un’equivalenza omotopica se esiste σ: D → C tale che τσ ∼ Id e στ ∼ Id . In questo caso diremo che C e D sono omotopicamente D C equivalenti. In termini di omologia, questo fatto implica un isomor(cid:28)smo tra i moduli di omologia associati a C e D [HS97, segue dalla Proposizione 3.1]. Un complesso C si dice contrattile, o contraibile, se Id ∼ 0. Ovvero, se esiste per C ogni p un omomor(cid:28)smo h : C → C tale che d h +h d = Id . p p p+1 p+1 p p−1 p C 4 CAPITOLO 1. OMOLOGIA SIMPLICIALE Osservazione 1. In particolare, se C Ł un complesso contrattile, allora C Ł aciclico. Per dimostrare ci(cid:242) Ł su(cid:30)ciente far vedere che Im d ⊇ ker d , per ogni p, in quanto il vice- p+1 p versa segue dalla de(cid:28)nizione di complesso. Consideriamo x ∈ ker d ⊆ C . Essendo C contrattile si ha che esiste per ogni p p p l’omomor(cid:28)smo h : C → C tale che d h +h d = Id , da cui: p p p+1 p+1 p p−1 p C d (h (x))+h (d (x)) = Id (x) , p+1 p p−1 p C dove h (d (x)) = h (0) = 0 e Id (x) = x. Risulter(cid:224) d (h (x)) = x, da cui x ∈ Im p−1 p p−1 C p+1 p d . p+1 Riportiamo alcuni risultati che saranno utili nella prossima sezione, riducendoci al caso particolare di complessi di catene, sapendo per(cid:242) che vale per complessi generici. Teorema 1.1.1. Consideriamo una successione esatta corta di complessi di catene α β 0 −−−−→ C −−−−→ D −−−−→ F −−−−→ 0 . Allora per ogni p esiste σ : H (F) → H (C) tale che la seguente successione p p p−1 ··· −−σ−p+−→1 H (C) −−−α∗−→ H (D) −−−β∗−→ H (F) −−−σp−→ H (C) −−−α∗−→ ··· p p p p−1 sia esatta. Per la dimostrazione si fa riferimento a [HS97, Teorema 2.1]. In vista di ci(cid:242), diremo che ad ogni successione esatta corta di complessi (di catene) corrisponde una successione esatta lunga in omologia. Segue direttamente il seguente corollario: Corollario 1.1.2. Data la successione esatta corta di complessi di catene α β 0 −−−−→ C −−−−→ D −−−−→ F −−−−→ 0 avremo che - α Ł un quasi-isomor(cid:28)smo ⇐⇒ F Ł aciclico ; - β Ł un quasi-isomor(cid:28)smo ⇐⇒ C Ł aciclico. Riportiamo ora un risultato di classi(cid:28)cazione che sar(cid:224) utilizzato sia nel primo capitolo, per il calcolo dei gruppi di omologia, sia nel secondo capitolo, per de(cid:28)nire la struttura dei moduli dell’omologia di persistenza. Teorema 1.1.3 (di struttura). Dato D dominio a ideali principali, (1) ogni D-modulo (cid:28)nitamente generato Ł isomorfo a (cid:20) (cid:21) Dβ ⊕ (cid:77)(cid:0)D/a D(cid:1) , i i con β ∈ Z numero di Betti di D e a ∈ D tale che a |a , ∀i. i i i+1