Archetype-based approach for modelling of electroencephalographic/event-related potentials data and metadata Ing. Václav Papež Doctoral thesis submitted in partial fulfillment of the requirements for a degree of Doctor of Philosophy in specialization Computer Science and Engineering Supervisor: Ing. Roman Moucˇek, Ph.D. Department: Department of Computer Science and Engineering Plzenˇ 2017 Archetypový prˇístup k modelování dat a metadat z oblasti elektroencefalografie a evokovaných potenciálu˚ Ing. Václav Papež Disertacˇní práce k získání akademického titulu doktor v oboru Výpocˇetní technika Školitel: Ing. Roman Moucˇek, Ph.D. Katedra: Katedra informatiky a výpocˇetní techniky Plzenˇ 2017 IdedicatethisthesistomygrandfatherwhohasalwayswishedtoseemefinishingwhatI haveoncestarted. Declaration/Prohlášení IherebydeclarethatthisdissertationismyownoriginalworkandIhaveacknowledged allsourcesusedandhavecitedtheseinthereferencesection. Prohlašuji, že jsem disertacˇní práci vypracoval samostatneˇ, s použitím citovaných pra- menu˚ uvedenýchvseznamu,jenžjesoucˇástítétopráce. Ing. VáclavPapež Friday23rd June,2017,Plzenˇ Acknowledgements I would like to acknowledge all members of the neuroinformatics research group at the Department of Computer Science and Technologies, University of West Bohemia (the Department),headedbyIng. RomanMoucˇek,Ph.D.,mysupervisorandfriend. Iwouldlike tothankRomanandhisgroupforgivingmevaluableadvicethroughoutmyPh.D.studies, and for providing me with wonderful opportunities in exciting neuroinformatics research community. IwouldalsoliketothankDrHeatherLeslieandMs. SiljeLjoslandBakke,membersof theopenEHRcommunity,fortheirconsultationsregardingtheachetypingprocess,andDr Kenan Direk and Dr Ghazaleh Fatemifar, friends and colleagues, for helping me with the languagerevision. I am grateful to doc. Ing. Josef Kohout, Ph.D., head of the bio-informatics division at the Department, and doc. Ing. Pˇremek Brada, MSc., Ph.D., head of the Department, for theirencouragement,motivation,andforallowingmetofurthermyacademicskillsthrough variousinternationalresearchfellowshipsandevents. I would also like to express gratitude to my alma matter, University of West Bohemia, forgivingmetheopportunitytogainpricelessknowledge,uncovermyabilitiesandbecame abettermaninbothprofessionalandpersonallife. Finally, my deepest gratitude belongs to those who stood by me and supported me all thetime;tomybelovedparentsandgrandparents,tomydarlingpartnerZuzana,andtomy dearestfriends. Abstract Currently,thereisnocommondatastandardintheexperimentalelectroencephalography/event- relatedpotential(EEG/ERP)domain. Existingstandardizationeffortsaremainlybasedon theconventionalapproachesandusegenericdataformatsandcontainers(e.g. HDF5,odML) popularintheresearchcommunity. Thisworkdrawsonthemedical/healthcharacteristicsof EEG/ERP data and investigates the feasibility of applying openEHR (an archetype-based approach for electronic health recordsrepresentation) to modelling data stored in EEGBase, aportalfor experimental EEG/ERPdatamanagement. Theworkevaluatesre-usageofexist- ingopenEHRarchetypesandproposesasetofnewarchetypestogetherwiththeopenEHR templatescoveringthedomain. Themaingoalsoftheworkareto(i)linkexistingEEGBase data/metadataandopenEHRarchetypestructures;(ii)proposeanewopenEHRarchetype set describingthe EEG/ERP domainsince this set ofarchetypes currently doesnot exist in publicrepositories. Apartfromthat,theworkdescribescommondatamodels(e.g. relational,object-oriented) and compares their expressive power in order to (i) determine the elements, which these modelshaveincommon;(ii)buildadatamodelhierarchyaccordingtotheirexpressivepower. The work uses the proposed archetypes and their reference models as semantic schemata to derive a specific data model for each level of the hierarchy. Finally, the work describes a newly proposed personal electronic health records system for research purposes, which servesasafirstuse-caseofobtainedresults. Abstrakt Vsoucˇasnédobeˇ neexistujeobecnýdatovýstandardvoblastiexperimentálníelektroencefalo- grafieametodyevokovanýchpotenciálu˚ (EEG/ERP).Stávajícísnahyovytvoˇrenítakového standardujsouzveˇtšinyzaloženynakonvencˇníchpˇrístupechavyužívajígenerickédatové formáty a kontejnery (napˇr. HDF5, odML) oblíbené ve veˇdecké komuniteˇ. Tato práce využívá medicínských/zdravotních charakteristik EEG/ERP dat a prozkoumává vhodnost použití openEHR (zpu˚sob reprezentace elektronických zdravotních záznamu˚ založených naarchetypech)kmodelovánídatuloženýchvEEGBase,portáluprozprávuexperimentál- níchEEG/ERPdat. PrácevyhodnocujeopeˇtovnépoužitíexistujícíchopenEHRarchetypu˚ anavrhujesadunovýcharchetypu˚ spolusopenEHRšablonamipokrývajícímidanouoblast. Hlavními cíli práce jsou (i) propojení existujících EEGBase dat/metadat se strukturami archetypu˚; (ii) návrh nových archetypu˚ popisujících EEG/ERP doménu, jelikož tyto v soucˇasnédobeˇ neexistujíveveˇrejnýchrepozitáˇrích. Krom výše uvedeného, práce popisuje stávající beˇžné datové modely (napˇr. relacˇní, objektoveˇ orientovaný)aporovnávájejichvyjadˇrovacísíluzaúcˇelem(i)vymezení prvku˚, které majítyto modelyspolecˇné; (ii)vystaveˇní hierarchiedatových modelu˚ v závislostina jejich vyjadˇrovací síle. Práce využívá navržených archetypu˚ a jejich referencˇních modelu˚ jakosémantickýchschématkodvozeníspecifickýchdatovýchmodelu˚ projednotlivévrstvy hierarchie. V záveˇru práce popisuje noveˇ navržený systém osobní zdravotní knížky pro výzkumnéúcˇely,kterýsloužíjakoprvnípˇrípadužitízískanýchvýsledku˚. Table of contents Listoffigures xii Listoftables xv Nomenclature xix I Opening 1 1 Introduction 2 II Work Context, Materials and Methods 4 2 Electroencephalography/Event-RelatedPotentials 5 2.1 Brainactivity,neurons,synapses . . . . . . . . . . . . . . . . . . . . . . . 5 2.2 Electroencephalography . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.3 Event-RelatedPotentials . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.4 EEG/ERPLaboratory . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8 3 Neuroinformatics 9 3.1 Aimsofneuroinformatics . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 3.2 InternationalNeuroinformaticsCoordinatingFacility . . . . . . . . . . . . 10 3.3 Neuroinformaticsdataandmetadata . . . . . . . . . . . . . . . . . . . . . 11 3.3.1 Datavsmetadata . . . . . . . . . . . . . . . . . . . . . . . . . . . 11 3.3.2 Formats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12 3.3.3 Ontologiesandterminologies . . . . . . . . . . . . . . . . . . . . 17 3.3.4 Databases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 3.3.5 Dataformatfeatures . . . . . . . . . . . . . . . . . . . . . . . . . 23 Tableofcontents ix III Data Modelling 26 4 Datamodelsandstorages 27 4.1 (Entity-)Relationalmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.1.1 Elements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 4.1.2 Relationshipsbetweenrelations . . . . . . . . . . . . . . . . . . . 28 4.1.3 Relationalalgebra . . . . . . . . . . . . . . . . . . . . . . . . . . 29 4.1.4 ERmodelconstructionandgraphicalrepresentation . . . . . . . . 29 4.1.5 StructuredQueryLanguage . . . . . . . . . . . . . . . . . . . . . 32 4.2 Object-orientedmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 4.2.1 Thecore . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 4.2.2 OOmodelexample . . . . . . . . . . . . . . . . . . . . . . . . . . 35 4.2.3 UnifiedModellingLanguage . . . . . . . . . . . . . . . . . . . . . 36 4.2.4 UMLClassdiagramconstruction . . . . . . . . . . . . . . . . . . 38 4.2.5 Object-relationaldatabases . . . . . . . . . . . . . . . . . . . . . . 41 4.2.6 Object-orienteddatabase . . . . . . . . . . . . . . . . . . . . . . . 41 4.3 eXtensibleMarkupLanguage . . . . . . . . . . . . . . . . . . . . . . . . . 41 4.4 XMLwithinrelationaldatabases . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.1 StructuredXMLType . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.2 UnstructuredXMLType . . . . . . . . . . . . . . . . . . . . . . . 43 4.4.3 BinaryXMLType . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 4.5 Ontology-basedmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.5.1 LinkedData . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 4.5.2 Ontologies . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 4.5.3 Semanticweb . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55 4.6 NoSQLdatabases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56 5 Mappingbetweenthemodelsofvariouslevelsofexpressiveness 57 5.1 SpokenwordtoERmodel . . . . . . . . . . . . . . . . . . . . . . . . . . 57 5.2 ERmodeltospokenword . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.3 ERmodeltoOOmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.4 OOmodeltoERmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.5 OOmodeltoXSD . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58 5.6 XSDtoOOmodel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59 5.7 ERmodeltoRDF/OWL . . . . . . . . . . . . . . . . . . . . . . . . . . . 60 5.8 OOmodeltoRDF/OWL . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 5.9 XMLandXSDtoRDF/XSD . . . . . . . . . . . . . . . . . . . . . . . . . 62 Tableofcontents x 5.10 RDF/OWLtomodelswithlessexpressiveness . . . . . . . . . . . . . . . . 63 5.11 Semantichierarchy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 64 IV Electronic Health Records 66 6 ElectroencephalographyrecordingasanElectronicHealthRecord 67 6.1 Computablehealthandmedicalrecords . . . . . . . . . . . . . . . . . . . 67 6.2 Overviewofclinical/medicalstandards . . . . . . . . . . . . . . . . . . . . 69 6.2.1 CEN/ISO13606 . . . . . . . . . . . . . . . . . . . . . . . . . . . 69 6.2.2 openEHR . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70 6.2.3 HealthLevelSeven . . . . . . . . . . . . . . . . . . . . . . . . . . 72 6.2.4 DASTA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 7 EEG/ERPdomaininopenEHRconcept 75 7.1 ExperimentalEEG/ERPdomaininEHRstandards . . . . . . . . . . . . . 75 7.2 DesignofEEGarchetypesandtemplates . . . . . . . . . . . . . . . . . . . 76 7.2.1 Conceptsdetermination . . . . . . . . . . . . . . . . . . . . . . . 76 7.2.2 Conceptsaggregationandattributeselimination . . . . . . . . . . . 77 7.2.3 Bindingarchetypeswithexternalterminologies . . . . . . . . . . . 82 7.3 Proposedarchetypes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85 7.3.1 EEG/ERPResultarchetype . . . . . . . . . . . . . . . . . . . . . . 85 7.3.2 Experimentscenarioarchetype . . . . . . . . . . . . . . . . . . . . 86 7.3.3 Problem/Diagnosisarchetype . . . . . . . . . . . . . . . . . . . . 87 7.3.4 Medicationorderarchetype . . . . . . . . . . . . . . . . . . . . . 88 7.3.5 openEHRtemplates . . . . . . . . . . . . . . . . . . . . . . . . . 88 V Results 89 8 Results 90 8.1 Summaryofcreatedarchetypes . . . . . . . . . . . . . . . . . . . . . . . . 90 8.2 ExemplaryEEG/ERPexperimentdescribedinanarchetype-drivenway . . 91 8.3 openEHRarchetypesinthesemantichierarchy . . . . . . . . . . . . . . . 91 8.3.1 Dictionary . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94 8.3.2 Entity-relationalmodel . . . . . . . . . . . . . . . . . . . . . . . . 94 8.3.3 Object-orientedmodel . . . . . . . . . . . . . . . . . . . . . . . . 95 8.3.4 Ontology . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 96
Description: