Informatik aktuell Herausgeber: W. Brauer im Auft rag der Oesellschaft fUr Informatik (01) M. Baumann R. Grebe (Hrsg.) Parallele Datenverarbeitung mit dem Transputer 4. Transputer-Anwender-Treffen TAT '92 Aachen, 22.-23. September 1992 Springer-Verlag Berlin Heidelberg New York London Paris Tokyo Hong Kong Barcelona Budapest Herausgeber Martin Baumann Reinhard Grebe Institut fUr Physiologie der Medizinischen Fakultat Klinikum der RWTH Aachen PauwelsstraBe 30, W-5100 Aachen TAT '92 CR Subject Classification (1992): C.1.2, C.2.1, C.3, D.3.4, 1.2.9, 1.4.0, 1.6.3 ISBN -13: 978-3-540-56534-5 e-ISBN -13: 978-3-642-78123-0 DOl: 10.1007/978-3-642-78123-0 Dieses Werk ist urheberrechtlich geschiitzt. Die dadurch begriindeten Rechte, insbesonde re die der Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfliltigung auf anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur auszugsweiser Verwertung, vorbehalten. Eine VervieIniitigung dieses Werkes oder von Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestim mungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland yom 9. September 1965 in der jeweils geltenden Fassung zullissig. Sie ist grundslitzlich vergiitungspflichtig. Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes. © Springer-Verlag Berlin Heidelberg 1993 Satz: Reproduktionsfertige Vorlage yom Autor/Herausgeber 33/3140-543210 - Gedruckt auf sliurefreiem Papier Vorwort Die 'Parallele Datenverarbeitung mit dem Transputer' wird mehr und mehr zu einem zwar unsichtbaren, aber allgegenwartigen Bestandteil unseres taglichen Lebens. Trans puter finden sich heute bereits genausogut im Photokopierer wie in der Steuerung von FertigungsstraBen oder in Supercomputern. Diese Entwicklung spiegelt sich in dem anhaltenden Interesse an dem jahrlichen Transputer-Anwender-Treffen TAT wider, in den Teilnehmerzahlen bei diesem Treffen, dem Engagement der Teilnehmer und der Quantitat, aber und besonders auch der Qualitat der Anwenderbeitrage. Selbst die immer wieder enttauschten Hoffnungen iiber das sich weiter und weiter hinauszogernde Erscheinen des T9000 haben dem keinen Abbruch tun konnen. (Bei Erscheinen dieses Bandes ist er dann wohl verfiigbar!) Die weite Verbreitung und selbstverstandliche Anwendung von Transputern hat zur Folge, daB die Anforderungen an die Softwareumgebungen fUr diese Hardware steigen. Transputeranwender sind nicht mehr nur Spezialisten und Transputerenthusiasten, sondern normale Programmierer, die selbstverstandlich nicht bereit sind, auf den gewohnten Komfort ihrer Entwicklungswerkzeuge zu verzichten. Neu- und Weiter entwicklungen entsprechender Umgebungen und Werkzeuge werden in einer Reihe theoretischer und praktischer Beitrage in diesem Band vorgestellt: Sogar ein Versuch zur Realisierung eines automatisch parallelisierenden Compilers wird beschrieben. In diesen Zusammenhang gehoren natiirlich auch die Bemiihungen urn eine Standard i sierung im Bereich der transputerbasierten parallelen Datenverarbeitung. Ein Schritt in diese Richtung ist die Definition des durch eine Gruppe von Transputerherstellern und -anwendern aus Industrie und Wissenschaft auf dem TAT vorgestellten Binary Compatibility Standard (BCS). Dieser Standard soli sicherstellen, daB T9000-Anwendun gen, die auf unterschiedlichen Systemen entwickelt worden sind, auf allen T9000-Syste men laufen, die dem BCS-Standard geniigen. Allgemein wird es kiinftig immer mehr darum gehen, anstelle maBgeschneiderter, spezieller KomplettlOsungen fUr spezielle Hardware leicht zu wartende und gut portier bare Partiallosungen zu entwickeln. Die Entwicklung und Etablierung entsprechender Standards soll durch das TAT und nicht zuletzt diesen Band angeregt und erleichtert werden. Eine Entwicklung der jiingsten Vergangenheit ist die Etablierung von zentralen Hochst leistungs-Rechnern auf Transputerbasis mit tausend und mehr Prozessoren. Diese stellen dann das obere Ende, das Optimum, der skalierbaren Rechnerleistung dar, die einem Transputeranwender zur Zeit zur VerfUgung gestellt werden kann. Diese Rechner bieten ihm die Moglichkeit, auch groBte Aufgaben der Datenverarbeitung -z.B. bei der Simula tion komplexer Systeme -in Angriff zu nehmen und diese so, wie er sie auf einem kleineren Transputersystem entwickelt hat, interaktiv oder im Batchbetrieb abarbeiten zu lassen. Mit den Problemen von Betrieb, Wartung, Zugangsregelung etc. bei solchen groBen MultiUser-Systemen beschiiftigt sich ein eigener Beitrag in diesem Band. Urn die Kontinuitat in der Erscheinungsweise des Bandes zu wahren, haben wir die inhaltliche Aufteilung dieses Bandes an die der Vorjahre angelehnt. VI Wie auch schon in den Vorjahren durfen wir uns bei vielen ehrenamtIichen Mitarbeitern bedanken, die das Treffen und damit diesen Band erst moglich gemacht haben. Fur ihre Anregungen und Ideen bedanken wir uns bei Herrn Prof. Oberschelp und Herrn Prof. Schmid-Schonbein; der Firma Parsytec durfen wir rur die Zusammenarbeit danken. Den vielen ehrenamtlichen Helfern aus dem Institut rur Physiologie sei ebenso gedankt wie der VerwaItung des K1inikums der RWTH Aachen. Aachen, den 24.12.1992 Martin Baumann Reinhard Grebe Inhaltsverzeichnis I Transputer-Systeme 1.1 Systemprogrammierung und Evaluation Mapping und Lastverteilung in parallelen Systemen B. Monien und R. LUling ......................................... . Parallelisierungsmoglichkeiten formal spezifizierter Protokolle K. Wemheuer und S. Bohmer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 11 Protokollanalyse mit Transputernetzen T. Braun ...................................................... 21 Leistungsanalyse dezentraler Transputer-Systeme basierend auf FOOl Links O. Popovic und H. Westphal ....................................... 31 CANDELA - Eine Sprache zur Beschreibung von Topologien H. Kuchen, H. Stoltze und F. Lucking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 41 Zur Simulation von shared-memory auf Transputernetzwerken T. Seifert und E. Speckenmeyer ..................................... 51 Eine Umgebung zur Evaluierung paralleler Logiksimulationsverfahren P. Lanches und u.G. Baitinger ..................................... 61 I.2 BenutzeroberfHichen und Hard- / Softwareumgebungen Rechenzentrums-Software fUr Parallelrechner F. Ramme und T. Romke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 72 Oynamische Oeadlockerkennung nir Parallelprogramme X. Huang und C. Steigner ......................................... 83 Portable Parallele Applikationsprogrammierung mit PARMACS H.-C. Hoppe ................................................... 93 Parallelisierung objekt-basierter Programme auf einem Transputer-Netzwerk U. Frohlings lind C. Weise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 101 TRAPPER: Eine graphische Software-Entwicklungsumgebung fUr MIMD-Parallelrechner C. Scheidler, L. Schafers und O. Kramer-Fuhrmann . . . . . . . . . . . . . . . . . . . .. 112 Das Transputer-Lehrsystem J.W. Meyer und V. Klinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 122 VIII 1.3 Sprachen und Algorithmenenmickiung Die Programmiersprache Modula-P J. Vollmer ................................................... 132 Graph + C - Eine Graphische Programmiersprache fUr Transputer G. Wirtz .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 143 Parallele nichtlineare Finite-Element-Berechnung mit der parallel erweiterten Computer-Adaptive Language par_CAL K.R. Leimbach und P.K. Umesha .................................. 153 Evolutionare Algorithmen auf Transputerfarmen zur Uisung schwieriger Optimierungsprobleme J. Sprave und H.-P. Schwefel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 164 Ein massiv paralleler, genetischer Algorithmus zur Uisung eines Bin-Packing-Problems P. Schwenderling, B. Kroger und O. Vornberger ........................ 172 Abbildung Neuronaler Netzwerke auf Mehrprozessorsysteme T. Reski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 182 Selbstorganisierende Neuronale Netze auf Transputern A. Ultsch, G. Guimaraes, D. Korus und H. Li . . . . . . . . . . . . . . . . . . . . . . . .. 194 Parallelisierung von Heuristiken fUr groBe Traveling-Salesman-Probleme A. Bachem und M. Wottawa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 204 Parallele Vorverarbeitungsschritte fUr die verteilte Logiksimulation P. Lanches und u.G. Baitinger .................................... 214 Ein Algorithmus flir die parallele Analyse formaler Sprachen auf Transputer-Netzen J. Lampe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 225 Ein paralleler SAT-Solver auf Transputern M. Bohm und E. Speckenmeyer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 235 Eine parallele Implementation des Karmakar-Verfahrens A. Bachem und M. Strietzel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 245 Bidirektionale Mehrzielmethode zur Uisung von Zweipunkt-Randwertaufgaben T. Meis, R. Scheurer und W. Siegel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 255 Numerische Uisung ebener Probleme der linearen Elastizitatstheorie mit der direkten Randelementmethode auf einem MIMD-Parallelrechner O. Klaas, M. Kreienmeyer und E. Stein .............................. 265 IX n Transputer-Systeme ILl BiIdverarbeitung und Grafik Hierarchische Generierung von Formprimitiven als Basis der parallelen Bilderkennung V. Schwolle, A. Brennecke, L. Priese und G. Windhorst .................. 275 Objekterkennung in Verkehrsszenen auf Transputern B. Blochl und L. Tsinas ....... 285 0 0 •• 0 0 0 0 0 • 0 • 0 0 •••••••• 0 ••• 0 0 • 0 • • • •• Eine parallel-verteilte Architektur fUr Rechnersehen und Telerobotik Y.D. Sanchez Ao 295 0 ••••• 0 0 0 0 0 0 ••• 0 0 •• 0 0 • 0 • 0 • 0 0 ••••• 0 ••••••••••• 0 0 11.2 Mef3technik und Signalverarbeitung Transputer steuern Industrieroboter P. Drews und So Arnold . 304 0 •• 0 • 0 0 0 0 0 0 0 •••• 0 0 ••••• 0 ••••• 0 0 •• 0 0 • 0 • 0 • 0 Geschwindigkeitsuntersuchung eines Fuzzy-Logie-Systems filr Echtzeitanwendungen T. Pfeifer und P.W. Plapper 314 Modellgestiitzte Bildfolgenanalyse zur beriihrungslosen Erfassung ebener Bewegungen K. Dietmayer 324 0 • 0 0 0 ••••••••• 0 •• 0 0 0 •••• 0 0 ••• 0 •••••••• 0 ••••• 0 • 0 •• Transputereinsatz in der kardiologischen Grundlagenforschung: Untersuchungen an isolierten Herzmuskelzellen D. Kulsch, So Popping, A. Ladwig, H. Rose und H. Kammermeier 334 TeilentladungsmeBgerat mit transputerbasierter on-line StOrunterdriickung U. Kopf und K. Feser 344 0 ••• 0 •• 0 0 0 • 0 0 • 0 0 0 0 •• 0 0 •••• 0 • 0 0 • 0 ••••• 0 0 ••• , 11.3 ModellbiIdung und Simulation Parallele Simulation mit Transputern D. Clemens .. 352 0 ••••• 0 ••• 0 • 0 0 0 • 0 • 0 0 •• 0 •••••••••••• 0 0 • 0 •••••• 0 •• Transient - Ein Werkzeug zur verteilten Simulation mechatronischer Systeme unter Echtzeitbedingungen A. Engelke und Mo Busetti .. 362 0 • 0 ••• 0 •• 0 0 ••• 0 ••••••• 0 • • • • • • • • • • • • •• Aniisthesie Simulation auf einem Parallelrechner mit SystemSpecs JoE. Boillat, P.G. Kropf und P. Schwab .. 380 0 ••••••• 0 ••••• 0 ••••••••••••• 0 x Simulation von Membranformen ohne implizite Symrnetrie J. Hektor, W. Schnitzler W. Form und R. Grebe ........................ 391 Autorenverzeichnis ............................................. 401 Mapping und Lastverteilung in parallelen Systemen * Burkhard Monien, Reinhard Liiling Un iversitat-G H Paderborn e-mail: [email protected]@uni-paderborn.de Abstrakt. Dieser Artikel gibt einen Uberblick iiber die zur Abbildung eines verteilten Algorithmus auf ein paralleles System entwickelten Me thoden. Wir stellen dazu eine Reihe von Ergebnissen aus den Bereichen Mapping und dynamischer Lastverteilung vor. Die Ergebnisse im Be reich dynamischer Lastverteilungsverfahren werden anhand eines Bei spiels motiviert. 1 Einleitung Zur effizienten Losung eines vorgegebenen Problems auf heut.e verfiigbaren par allelen/verteilten Rechensystemen ist es notwendig das Losungverfahren funk tional zu separieren oder die zu behandelnden Daten zu part.itionieren. Danach sind diese Teilalgorithmen bzw. Dat.en auf das Prozessornetzwerk abzubilden, so daB der gesamt.e Organisat.ionsaufwand fiir die vert.eilte Berechnung minimal ist. Dies kann sowohl vor Ausfiihrung, als auch zur Laufzeit. des Programms geschehen. Das Problem der automat.ischen Part.itionierung und somit automatischen Parallelisierung vorhandener sequentieller Programme ist nach allgemeinem Er kennt.nisstand nur fiir einige Anwendungsklassen moglich. Allgemeingiiltige Ver fahren, die auch fiir sehr groBe Prozessoranzahlen skalierbar sind, sind nicht zu erwal'ten. 1m dem Problemkreis der Algorit.hmen-bzw. Datenabbildung konnt.en in den letzten Jahl'en eine Vielzahlunt.el'schiedlichstel' Verfahren entwickelt wer den. Diese Verfahren nutzen die Chal'akterist.ik des abzubildenden Algorithmus und des zugrundeliegenden Pl'ozessornetzwerkes aus. Sie sind ellt.weder Teil ei nes Anwenderprogrammes oder bilden eine Schicht des Betriebssystems, so daB die Organisation der Lastvert.eilung aut.omatisch durch das Betriebssystem eines Parallelrechners iibernommen wird. In diesem Artikel werden eine Reihe unterschiedlicher Verfahren vorgest.ellt. Dazu unterscheiden wir insgesamt. vier Klassen vert.eilter Berechllungen. Charak terisierungsmerkmale sind der Zeit.pullkt. der Last.entstehung (statisch vorgege ben oder dynamisch zur Laufzeit) und die Beziehungen zwischen den einzelnen Lastelementen. Hier unterscheidet man den Fall, daB Kommunikationen oder Pdizedenzrelationen zwischen den Lastelementen zur Laufzeit auft.reten und den Fall, daB die Lastelemente unabhangig voneinander berechnet werden konnen. * Diese Arbeit wllrde durch das Bundesministeriulll fiir Forschllng und Technologie (BMFT) im Rahmen des PARAWAN Projektes (413-5839-ITR 9007 BO) Iluterstiitzt