ebook img

Angewandte Bioinformatik: Eine Einführung PDF

196 Pages·2018·7.404 MB·German
Save to my drive
Quick download
Download
Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.

Preview Angewandte Bioinformatik: Eine Einführung

Paul M. Selzer · Richard J. Marhöfer Oliver Koch Angewandte Bioinformatik Eine Einführung Übungs- beispiele 2. Aufl age mit Lösungen AngewandteBioinformatik PaulM.Selzer RichardJ.Marhöfer OliverKoch Angewandte Bioinformatik EineEinführung 2.,überarbeiteteundaktualisierteAuflage PaulM.Selzer OliverKoch BoehringerIngelheimVetmedicaGmbH FakultätfürChemieund IngelheimamRhein,Deutschland ChemischeBiologie TUDortmund RichardJ.Marhöfer Dortmund,Deutschland MSDAnimalHealthInnovationGmbH Schwabenheim,Deutschland ISBN978-3-662-54134-0 ISBN978-3-662-54135-7(eBook) https://doi.org/10.1007/978-3-662-54135-7 DiesesLehrbuchwurdebegründetvonPaulM.Selzer,RichardJ.MarhöferundAndreasRohwer. DieDeutscheNationalbibliothekverzeichnetdiesePublikationinderDeutschenNationalbibliografie; detailliertebibliografischeDatensindimInternetüberhttp://dnb.d-nb.deabrufbar. SpringerSpektrum ©Springer-VerlagGmbHDeutschland2018 DasWerkeinschließlichallerseinerTeileisturheberrechtlichgeschützt.JedeVerwertung,dienicht ausdrücklichvomUrheberrechtsgesetzzugelassenist,bedarfdervorherigenZustimmungdesVer- lags.DasgiltinsbesonderefürVervielfältigungen,Bearbeitungen,Übersetzungen,Mikroverfilmun- genunddieEinspeicherungundVerarbeitunginelektronischenSystemen. DieWiedergabevonGebrauchsnamen,Handelsnamen,Warenbezeichnungenusw.indiesemWerk berechtigtauchohnebesondereKennzeichnungnichtzuderAnnahme,dasssolcheNamenimSin- nederWarenzeichen-undMarkenschutz-Gesetzgebungalsfreizubetrachtenwärenunddahervon jedermannbenutztwerdendürften. DerVerlag,dieAutorenunddieHerausgebergehendavonaus,dassdieAngabenundInformationen indiesemWerkzumZeitpunktderVeröffentlichungvollständigundkorrektsind.WederderVerlag nochdieAutorenoderdieHerausgeberübernehmen,ausdrücklichoderimplizit,GewährfürdenIn- haltdesWerkes,etwaigeFehleroderÄußerungen.DerVerlagbleibtimHinblickaufgeografische ZuordnungenundGebietsbezeichnungeninveröffentlichtenKartenundInstitutionsadressenneu- tral. GedrucktaufsäurefreiemundchlorfreigebleichtemPapier SpringerSpektrumistTeilvonSpringerNature DieeingetrageneGesellschaftistSpringer-VerlagGmbHDeutschland DieAnschriftderGesellschaftist:HeidelbergerPlatz3,14197Berlin,Germany V Vorwort DieBioinformatik isteinejunge aufstrebendeWissenschaft,dieEndederachtzi- ger,AnfangderneunzigerJahredesletztenJahrhundertseinenSiegeszugdurchalle LifescienceswieBiologie,Biochemie,Medizin,PharmazieundChemiebegonnen hat.DenErfolgverdanktsieu.a.derrasantverlaufendenEntwicklungimBereich derInformatik unddendamiteinhergehendenHardware-undSoftwareentwick- lungen.DieseKomponentengepaartmiteinersichebenfallsrasantentwickelnden Biotechnologie(Sequenzierung,Microarrays,Proteomiketc.),habendenanhalten- den Bioinformatikboom mit verursacht. Nicht zuletzt war für die Bereitstellung unddie weltweite Verbreitung derbioinformatischen Werkzeuge und Ergebnisse dergleichzeitigeDurchbruchdesWorldWideWebverantwortlich. Heute gehören bioinformatische Techniken wie Sequenzsuchen mit dem BLAST-Algorithmus, paarweise und multiple Sequenzvergleiche, Abfragen bio- logischer Datenbanken, die Erstellung phylogenetischer Untersuchungen und vieles mehr zum täglichen Handwerkszeug eines Naturwissenschaftlers. Dieser TrendsetztsichnachwievorkontinuierlichfortundprägtmaßgeblichdasLeben einesjedenWissenschaftlersderLifesciences.VielederentsprechendenSoftware- produkte haben längst ihre kryptischen Formen verloren, sind sehr intuitiv und benutzerfreundlichgewordenundstehenüberdasInternetjedemWissenschaftler zur Verfügung. Man muss heute kein Informatiker sein, um komplexe, wissen- schaftlicheFragestellungenmitbioinformatischenWerkzeugenzubearbeiten.Man mussjedochdie biologischen Grundlagenverstehen,die Existenzsowie denOrt derVerfügbarkeit derWerkzeugekennenund ihre Handhabung sowiedie Inter- pretationderErgebnissesicherbeherrschen. DievorliegendeumfassendaktualisiertezweiteAuflagediesesBuchsbasiertauf langjährigenLehrveranstaltungenvonProf.Dr.PaulM.SelzeramInterfakultären InstitutfürBiochemiederEberhardKarlsUniversitätTübingensowieaufinterna- tionalenLehrveranstaltungeninvielfachenEU-FP7-undHorizon-2020-Program- men.BisheuteexistiertkeinvergleichbaresArbeitsbuch,dasmitseinenÜbungen undLösungendirektimUnterrichteingesetztwerdenkann.Aufgrunddesgroßen nationalenErfolgsdererstendeutschenAuflage(2004)sowiedesinternationalen ErfolgsdererstenenglischenAuflage(2008)habensichdieAutorendazuentschlos- sen,derzweitenvorliegendendeutschenAuflageeinezweiteenglischeAuflagein naher Zukunft folgen zu lassen. Alle drei Autoren waren gemeinsam in der for- schendenpharmazeutischenIndustrieimBereichderBioinformatikundChemie- informatik tätig und habenaufihren individuellenKarrierewegen weitereFelder derindustriellenundakademischenNaturwissenschaftenerschlossen.DasZieldes Lehrbuchsistes,eineEinführungindietäglicheAnwendungdervielfältigenCom- putational-Biology-Werkzeuge zu geben und gleichzeitig einen ersten Überblick über das mittlerweile sehr komplexe Fachgebiet zu liefern. Es geht jedoch nicht darum,FormelnoderAlgorithmenzubeschreibenodergarherzuleiten,sondern darum,deminteressiertenStudentenundWissenschaftlereinenschnellen,struk- turiertenZugangzurComputationalBiologyzugeben.DeshalbsindProgrammier- VI Vorwort kenntnisseodertiefgehendeInformatikkenntnissefürdasStudiumunddieAnwen- dungdesLehrbuchsnichterforderlich. WichtigeTeilgebietederComputationalBiologywerdenindenjeweiligenKapi- telnvorgestelltunddurchweiterführendeLiteratursowieWWW-Verweiseergänzt. AusführlicheÜbungenundLösungensollendazuanimieren,direktamComputer dieThematikunddenUmgangmitderSoftwarezuerlernen.Wennmöglichsind dieÜbungensogewählt,dassBeispielewieetwaProtein-oderNukleotidsequenzen austauschbarsind.DieserlaubtdemLeser,nachdemerdasPrinzipverstandenhat, auchsolcheArbeitsbeispielezuwählen, dienähermitseinemwissenschaftlichen Interesseverknüpftsind.DirekteTexteingabeninComputerprogrammesinddurch denSchrifttypCourierundEingabendurchdasBetätigenvonSchaltflächensind durcheinekursiveSchreibweisegekennzeichnet.Einabschließendes,ausführliches Glossarsolldabeihelfen,DefinitionenundTerminologienderComputationalBio- logyschnellzuerfassen. Wir danken unserem ehemaligen Kollegen und Mitautor der ersten Auflage HerrnDr.AndreasRohwerfürseineBeiträge,dieüberarbeitetnachwievorinder zweiten Auflagevon Bedeutungsind.FrauChristiane Ehrt und FrauLina Hum- beck–TUDortmund–dankenwirganzbesondersfürdasaufmerksameLektorat unddieaktivePrüfungallerÜbungenundLösungen.FrauDr.SandraNoackdan- kenwirfürdiekonstruktivenDiskussionsbeiträge.FrauStefanieWolfvomSpringer Verlag danken wir für die kontinuierliche Unterstützung bei derUmsetzung der zweitenAuflage. Ingelheim,Worms,DortmundimJanuar2018 VII Der Kreislauf der genetischen Information Die genetische Information wird mit einem 4-Buchstaben-Alphabet gespeichert undinProteineübersetzt,dieihrerseitsdurchein20-Buchstaben-Alphabetcodiert sind. Proteine falten sich zu dreidimensionalen Strukturen, die lebenswichtige FunktionenineinzelligenodermehrzelligenOrganismenausüben.DieseOrganis- menstehenkontinuierlichuntereinemstarkenSelektionsdruck,derwiederumzu VeränderungenindergenetischenInformationführt. IX Titelbild DasTitelbildzeigtdasdreidimensionalemolekulareSzenarioeinesProtein-DNA- Komplexes.DerTranskriptionsaktivator Gal4vonSaccharomycescerevisiaebindet aneinDNA-Oligomer(PDB-ID1D66).DasProteinistalsRibbon-Modelldarge- stellt,wobei˛-HelicesrotundLoop-Regionengelbgezeigtsind.DieSeitenketten derAminosäurensindindenLoop-Bereichennichtdargestellt.FürdasDNA-Oli- gomerwurdedielokaleKrümmungdermolekularenOberflächefarbcodiert,wo- beizunehmendeKrümmungdurchdunklereFarbwerteangezeigtwerden(Brick- mannJ,Exner TE,Keil M,MarhöferRJ[2000] Molecular graphics –trendsand perspectives.JMolMod6:328–340).DieStrukturwurdemiteinerSiliconGraphics Octane2unddemProgrammpaketMOLCAD/Sybyl(TriposInc.)erzeugt(Brick- mannJ,GoetzeT,HeidenW,MoeckelG,Reiling S,Vollhardt H,ZachmannCD [1995]Interactive visualization of molecular scenarioswith MOLCAD/Sybyl.In: BowieJE(Hrsg)Datavisualizationinmolecularscience–toolsforinsightandin- novation.Addison-WesleyPublishingCompanyInc,Reading,Massachusetts,USA, S83–97). XI Eine kurze Historie der Bioinformatik DerersteAlgorithmus zum Vergleichvon Protein- oderDNA-Sequenzen wurde 1970vonNeedlemanundWunschveröffentlicht(s.7Kap.3).DamitistdieDiszi- plinBioinformatiknureinJahrjüngeralsderInternetvorläuferARPANETundein JahrälteralsE-Mail,die1971durchRayTomlinsonerfundenwurde.DerBegriff Bioinformatik wurde jedocherst1978gebräuchlich,alsHogewegihn als„Studi- eninformatischerProzesseinbiologischenSystemen“definierte(Hogeweg[1978] SimulationofCellularForms.InFrontiersinSystemModelling.ZeiglerBP(Ed), Simulation Councils, Inc., S. 90–95). Die Brookhaven Protein Data Bank (PDB) wurdeebenfalls1971gegründet.InderPDBwerdenbisheuteProteinkristallstruk- turengesammelt(s.7Kap.2).ZunächstentwickeltesichdieneueDisziplinrelativ langsam,bis1977dievollständigeGenomsequenzdesBakteriophagen(cid:2)X174ver- öffentlicht wurde (Sanger etal.[1977] Nucleotide sequenceof bacteriophage phi X174DNA.Nature265:687–695).KurzdaraufwurdezumerstenMaldasSoftware- paketIntelliGeneticsSuitezurAnalysevonDNAundProteinsequenzeneingesetzt (1980). Im darauffolgenden Jahr publizierten Smith und Waterman (s. 7Kap.3) einenweiterenAlgorithmusfürdenVergleichvonSequenzenundIBMbrachteden erstenPersonalcomputer(PC)aufdenMarkt.ImJahr1982brachteeinSpin-offder UniversityofWisconsin,dieGeneticsComputerGroup,unterdemNamenWis- consinSuiteeinProgrammpaketzurSequenzanalyseaufdenMarkt.Sowohldieses ProgrammpaketalsauchdieIntelliGeneticsSuitewarenzunächstSammlungenre- lativkleiner,einzelnerProgramme,dieüberdieKommandozeilebedientwurden. SpäterfolgtedanneinegrafischeBenutzeroberflächefürdieWisconsinSuite,was eineeinfachereBedienungermöglichte.WährenddieIntelliGeneticsSuiterelativ baldvomMarktverschwand,wardieWisconsinSuiteunterdemNamenGCGnoch bisindie2000er-Jahrehineinkommerziellerhältlich. Die Veröffentlichung der Polymerasekettenreaktion (PCR) durch Mullis und Mitarbeiter im Jahr 1986 stellt einen Meilenstein für die Molekularbiologie und gleichzeitigfürdieBioinformatik dar(Mullisetal.[1986]Specificenzymaticam- plificationofDNAinvitro:thepolymerasechainreaction.ColdSpringHarbSymp QuantBiol51Pt1:263–273).ImgleichenJahrwurdedieSWISS-Prot-Datenbank gegründet,undThomasRoderickprägtedenBegriffGenomics,womiterdiewis- senschaftliche Disziplin der Sequenzierung und Beschreibung ganzer Genome beschrieb(Kuska[1998]Beer,Bethesda,andbiology: how„genomics“cameinto being.J.Natl.CancerInst90:93).ZweiJahrespäter–1988–wurdedasNational Centerfor Biotechnology Information (NCBI)gegründet.DasNCBIbetreibt bis heuteeinederwichtigstenprimärenDatenbanken (.Abb.1;s.7Kap.2).Imglei- chenJahr startete die Humangenominitiative und der FAST-Algorithmus wurde veröffentlicht(s.7Kap.3).AlsdasCERNimJahr1991dieProtokolleveröffentlich- te,diedasWorldWideWeb(WWW)beschreiben,wurdeeineneueÄraeingeläutet (https://home.cern/topics/birth-web; https://timeline.web.cern.ch/timelines/The- birth-of-the-World-Wide-Web).DasWWWermöglichteeserstmals,bioinforma- tischeWerkzeugezureinfachenBenutzungzurVerfügungzustellen.Gleichwohl dauerteesnocheinigeJahre,bisdiesauchtatsächlichderFallwar.Ebenfalls1991 XII EinekurzeHistoriederBioinformatik o- e cl u N here gle Erste Behandlung von Lungenkrebs mit CRISPR-Cas9-Gensc Epigenomkartevon 127 humanen Gewebetypen und Zellen erstellt 19.000 –20.000 proteincodierende Gene im menschlichen Genom nachgewiesen Science kürt Krebsimmuntherapie als Durchbruch des Jahres Erste klinische Exomsequenzierungzur Re(cid:4)ung eines erkrankten Kindes Erstes Neandertalergenom RNA-Seq; erstes Genom von Krebszellen Nature kürt NGS zur Methode des Jahres NGS –Solexa NGS –Roche 454 H. sapiens offiziellfer(cid:3)ggestellt M. musculus, P. falciparum, A. gambiae „Gapped BLAST“H. sapiens 1. Entwurf S. cerevisieaD. melanogasterH. influenzaedbSNPMicroarrayC. elegans Jahr nBank-DatenbankdesNCBIinVerbindungmiteinigenMeilensteinenderBioinformatik.dbESTExpressedSequenceTagdatabase;dbSNPSinNGSNextGenerationSequencing.(UnterMitwirkungvonDr.QuangHonTran) ffymetrixDNA dbEST klungderGemDatabase; A BLAST Entwicmorphis b.1oly bP eraapnesaB nedrailliM .Atide

See more

The list of books you might like

Most books are stored in the elastic cloud where traffic is expensive. For this reason, we have a limit on daily download.