Table Of ContentInformatik aktuell
Herausgeber: W. Brauer
im Auft rag der Oesellschaft fUr Informatik (01)
M. Baumann R. Grebe (Hrsg.)
Parallele Datenverarbeitung
mit dem Transputer
4. Transputer-Anwender-Treffen TAT '92
Aachen, 22.-23. September 1992
Springer-Verlag
Berlin Heidelberg New York
London Paris Tokyo
Hong Kong Barcelona
Budapest
Herausgeber
Martin Baumann
Reinhard Grebe
Institut fUr Physiologie der Medizinischen Fakultat
Klinikum der RWTH Aachen
PauwelsstraBe 30, W-5100 Aachen
TAT '92
CR Subject Classification (1992): C.1.2, C.2.1, C.3, D.3.4, 1.2.9, 1.4.0,
1.6.3
ISBN -13: 978-3-540-56534-5 e-ISBN -13: 978-3-642-78123-0
DOl: 10.1007/978-3-642-78123-0
Dieses Werk ist urheberrechtlich geschiitzt. Die dadurch begriindeten Rechte, insbesonde
re die der Ubersetzung, des Nachdrucks, des Vortrags, der Entnahme von Abbildungen
und Tabellen, der Funksendung, der Mikroverfilmung oder der Vervielfliltigung auf
anderen Wegen und der Speicherung in Datenverarbeitungsanlagen, bleiben, auch bei nur
auszugsweiser Verwertung, vorbehalten. Eine VervieIniitigung dieses Werkes oder von
Teilen dieses Werkes ist auch im Einzelfall nur in den Grenzen der gesetzlichen Bestim
mungen des Urheberrechtsgesetzes der Bundesrepublik Deutschland yom 9. September
1965 in der jeweils geltenden Fassung zullissig. Sie ist grundslitzlich vergiitungspflichtig.
Zuwiderhandlungen unterliegen den Strafbestimmungen des Urheberrechtsgesetzes.
© Springer-Verlag Berlin Heidelberg 1993
Satz: Reproduktionsfertige Vorlage yom Autor/Herausgeber
33/3140-543210 - Gedruckt auf sliurefreiem Papier
Vorwort
Die 'Parallele Datenverarbeitung mit dem Transputer' wird mehr und mehr zu einem
zwar unsichtbaren, aber allgegenwartigen Bestandteil unseres taglichen Lebens. Trans
puter finden sich heute bereits genausogut im Photokopierer wie in der Steuerung von
FertigungsstraBen oder in Supercomputern. Diese Entwicklung spiegelt sich in dem
anhaltenden Interesse an dem jahrlichen Transputer-Anwender-Treffen TAT wider, in
den Teilnehmerzahlen bei diesem Treffen, dem Engagement der Teilnehmer und der
Quantitat, aber und besonders auch der Qualitat der Anwenderbeitrage. Selbst die immer
wieder enttauschten Hoffnungen iiber das sich weiter und weiter hinauszogernde
Erscheinen des T9000 haben dem keinen Abbruch tun konnen. (Bei Erscheinen dieses
Bandes ist er dann wohl verfiigbar!)
Die weite Verbreitung und selbstverstandliche Anwendung von Transputern hat zur
Folge, daB die Anforderungen an die Softwareumgebungen fUr diese Hardware steigen.
Transputeranwender sind nicht mehr nur Spezialisten und Transputerenthusiasten,
sondern normale Programmierer, die selbstverstandlich nicht bereit sind, auf den
gewohnten Komfort ihrer Entwicklungswerkzeuge zu verzichten. Neu- und Weiter
entwicklungen entsprechender Umgebungen und Werkzeuge werden in einer Reihe
theoretischer und praktischer Beitrage in diesem Band vorgestellt: Sogar ein Versuch zur
Realisierung eines automatisch parallelisierenden Compilers wird beschrieben.
In diesen Zusammenhang gehoren natiirlich auch die Bemiihungen urn eine Standard i
sierung im Bereich der transputerbasierten parallelen Datenverarbeitung. Ein Schritt in
diese Richtung ist die Definition des durch eine Gruppe von Transputerherstellern und
-anwendern aus Industrie und Wissenschaft auf dem TAT vorgestellten Binary
Compatibility Standard (BCS). Dieser Standard soli sicherstellen, daB T9000-Anwendun
gen, die auf unterschiedlichen Systemen entwickelt worden sind, auf allen T9000-Syste
men laufen, die dem BCS-Standard geniigen.
Allgemein wird es kiinftig immer mehr darum gehen, anstelle maBgeschneiderter,
spezieller KomplettlOsungen fUr spezielle Hardware leicht zu wartende und gut portier
bare Partiallosungen zu entwickeln. Die Entwicklung und Etablierung entsprechender
Standards soll durch das TAT und nicht zuletzt diesen Band angeregt und erleichtert
werden.
Eine Entwicklung der jiingsten Vergangenheit ist die Etablierung von zentralen Hochst
leistungs-Rechnern auf Transputerbasis mit tausend und mehr Prozessoren. Diese stellen
dann das obere Ende, das Optimum, der skalierbaren Rechnerleistung dar, die einem
Transputeranwender zur Zeit zur VerfUgung gestellt werden kann. Diese Rechner bieten
ihm die Moglichkeit, auch groBte Aufgaben der Datenverarbeitung -z.B. bei der Simula
tion komplexer Systeme -in Angriff zu nehmen und diese so, wie er sie auf einem
kleineren Transputersystem entwickelt hat, interaktiv oder im Batchbetrieb abarbeiten zu
lassen. Mit den Problemen von Betrieb, Wartung, Zugangsregelung etc. bei solchen
groBen MultiUser-Systemen beschiiftigt sich ein eigener Beitrag in diesem Band.
Urn die Kontinuitat in der Erscheinungsweise des Bandes zu wahren, haben wir die
inhaltliche Aufteilung dieses Bandes an die der Vorjahre angelehnt.
VI
Wie auch schon in den Vorjahren durfen wir uns bei vielen ehrenamtIichen Mitarbeitern
bedanken, die das Treffen und damit diesen Band erst moglich gemacht haben. Fur ihre
Anregungen und Ideen bedanken wir uns bei Herrn Prof. Oberschelp und Herrn Prof.
Schmid-Schonbein; der Firma Parsytec durfen wir rur die Zusammenarbeit danken. Den
vielen ehrenamtlichen Helfern aus dem Institut rur Physiologie sei ebenso gedankt wie
der VerwaItung des K1inikums der RWTH Aachen.
Aachen, den 24.12.1992
Martin Baumann
Reinhard Grebe
Inhaltsverzeichnis
I Transputer-Systeme
1.1 Systemprogrammierung und Evaluation
Mapping und Lastverteilung in parallelen Systemen
B. Monien und R. LUling ......................................... .
Parallelisierungsmoglichkeiten formal spezifizierter Protokolle
K. Wemheuer und S. Bohmer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 11
Protokollanalyse mit Transputernetzen
T. Braun ...................................................... 21
Leistungsanalyse dezentraler Transputer-Systeme basierend auf FOOl Links
O. Popovic und H. Westphal ....................................... 31
CANDELA - Eine Sprache zur Beschreibung von Topologien
H. Kuchen, H. Stoltze und F. Lucking . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 41
Zur Simulation von shared-memory auf Transputernetzwerken
T. Seifert und E. Speckenmeyer ..................................... 51
Eine Umgebung zur Evaluierung paralleler Logiksimulationsverfahren
P. Lanches und u.G. Baitinger ..................................... 61
I.2 BenutzeroberfHichen und Hard- / Softwareumgebungen
Rechenzentrums-Software fUr Parallelrechner
F. Ramme und T. Romke . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 72
Oynamische Oeadlockerkennung nir Parallelprogramme
X. Huang und C. Steigner ......................................... 83
Portable Parallele Applikationsprogrammierung mit PARMACS
H.-C. Hoppe ................................................... 93
Parallelisierung objekt-basierter Programme auf einem Transputer-Netzwerk
U. Frohlings lind C. Weise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 101
TRAPPER: Eine graphische Software-Entwicklungsumgebung
fUr MIMD-Parallelrechner
C. Scheidler, L. Schafers und O. Kramer-Fuhrmann . . . . . . . . . . . . . . . . . . . .. 112
Das Transputer-Lehrsystem
J.W. Meyer und V. Klinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 122
VIII
1.3 Sprachen und Algorithmenenmickiung
Die Programmiersprache Modula-P
J. Vollmer ................................................... 132
Graph + C - Eine Graphische Programmiersprache fUr Transputer
G. Wirtz .. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 143
Parallele nichtlineare Finite-Element-Berechnung mit der parallel
erweiterten Computer-Adaptive Language par_CAL
K.R. Leimbach und P.K. Umesha .................................. 153
Evolutionare Algorithmen auf Transputerfarmen zur Uisung
schwieriger Optimierungsprobleme
J. Sprave und H.-P. Schwefel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 164
Ein massiv paralleler, genetischer Algorithmus zur Uisung
eines Bin-Packing-Problems
P. Schwenderling, B. Kroger und O. Vornberger ........................ 172
Abbildung Neuronaler Netzwerke auf Mehrprozessorsysteme
T. Reski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 182
Selbstorganisierende Neuronale Netze auf Transputern
A. Ultsch, G. Guimaraes, D. Korus und H. Li . . . . . . . . . . . . . . . . . . . . . . . .. 194
Parallelisierung von Heuristiken fUr groBe Traveling-Salesman-Probleme
A. Bachem und M. Wottawa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 204
Parallele Vorverarbeitungsschritte fUr die verteilte Logiksimulation
P. Lanches und u.G. Baitinger .................................... 214
Ein Algorithmus flir die parallele Analyse formaler Sprachen
auf Transputer-Netzen
J. Lampe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 225
Ein paralleler SAT-Solver auf Transputern
M. Bohm und E. Speckenmeyer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 235
Eine parallele Implementation des Karmakar-Verfahrens
A. Bachem und M. Strietzel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 245
Bidirektionale Mehrzielmethode zur Uisung von
Zweipunkt-Randwertaufgaben
T. Meis, R. Scheurer und W. Siegel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .. 255
Numerische Uisung ebener Probleme der linearen Elastizitatstheorie
mit der direkten Randelementmethode auf einem MIMD-Parallelrechner
O. Klaas, M. Kreienmeyer und E. Stein .............................. 265
IX
n
Transputer-Systeme
ILl BiIdverarbeitung und Grafik
Hierarchische Generierung von Formprimitiven
als Basis der parallelen Bilderkennung
V. Schwolle, A. Brennecke, L. Priese und G. Windhorst .................. 275
Objekterkennung in Verkehrsszenen auf Transputern
B. Blochl und L. Tsinas ....... 285
0 0 •• 0 0 0 0 0 • 0 • 0 0 •••••••• 0 ••• 0 0 • 0 • • • ••
Eine parallel-verteilte Architektur fUr Rechnersehen und Telerobotik
Y.D. Sanchez Ao 295
0 ••••• 0 0 0 0 0 0 ••• 0 0 •• 0 0 • 0 • 0 • 0 0 ••••• 0 ••••••••••• 0 0
11.2 Mef3technik und Signalverarbeitung
Transputer steuern Industrieroboter
P. Drews und So Arnold . 304
0 •• 0 • 0 0 0 0 0 0 0 •••• 0 0 ••••• 0 ••••• 0 0 •• 0 0 • 0 • 0 • 0
Geschwindigkeitsuntersuchung eines Fuzzy-Logie-Systems
filr Echtzeitanwendungen
T. Pfeifer und P.W. Plapper 314
Modellgestiitzte Bildfolgenanalyse zur beriihrungslosen Erfassung
ebener Bewegungen
K. Dietmayer 324
0 • 0 0 0 ••••••••• 0 •• 0 0 0 •••• 0 0 ••• 0 •••••••• 0 ••••• 0 • 0 ••
Transputereinsatz in der kardiologischen Grundlagenforschung:
Untersuchungen an isolierten Herzmuskelzellen
D. Kulsch, So Popping, A. Ladwig, H. Rose und H. Kammermeier 334
TeilentladungsmeBgerat mit transputerbasierter on-line StOrunterdriickung
U. Kopf und K. Feser 344
0 ••• 0 •• 0 0 0 • 0 0 • 0 0 0 0 •• 0 0 •••• 0 • 0 0 • 0 ••••• 0 0 ••• ,
11.3 ModellbiIdung und Simulation
Parallele Simulation mit Transputern
D. Clemens .. 352
0 ••••• 0 ••• 0 • 0 0 0 • 0 • 0 0 •• 0 •••••••••••• 0 0 • 0 •••••• 0 ••
Transient - Ein Werkzeug zur verteilten Simulation
mechatronischer Systeme unter Echtzeitbedingungen
A. Engelke und Mo Busetti .. 362
0 • 0 ••• 0 •• 0 0 ••• 0 ••••••• 0 • • • • • • • • • • • • ••
Aniisthesie Simulation auf einem Parallelrechner mit SystemSpecs
JoE. Boillat, P.G. Kropf und P. Schwab .. 380
0 ••••••• 0 ••••• 0 ••••••••••••• 0
x
Simulation von Membranformen ohne implizite Symrnetrie
J. Hektor, W. Schnitzler W. Form und R. Grebe ........................ 391
Autorenverzeichnis ............................................. 401
Mapping und Lastverteilung in parallelen Systemen *
Burkhard Monien, Reinhard Liiling
Un iversitat-G H Paderborn
e-mail: [email protected]@uni-paderborn.de
Abstrakt. Dieser Artikel gibt einen Uberblick iiber die zur Abbildung
eines verteilten Algorithmus auf ein paralleles System entwickelten Me
thoden. Wir stellen dazu eine Reihe von Ergebnissen aus den Bereichen
Mapping und dynamischer Lastverteilung vor. Die Ergebnisse im Be
reich dynamischer Lastverteilungsverfahren werden anhand eines Bei
spiels motiviert.
1 Einleitung
Zur effizienten Losung eines vorgegebenen Problems auf heut.e verfiigbaren par
allelen/verteilten Rechensystemen ist es notwendig das Losungverfahren funk
tional zu separieren oder die zu behandelnden Daten zu part.itionieren. Danach
sind diese Teilalgorithmen bzw. Dat.en auf das Prozessornetzwerk abzubilden,
so daB der gesamt.e Organisat.ionsaufwand fiir die vert.eilte Berechnung minimal
ist. Dies kann sowohl vor Ausfiihrung, als auch zur Laufzeit. des Programms
geschehen.
Das Problem der automat.ischen Part.itionierung und somit automatischen
Parallelisierung vorhandener sequentieller Programme ist nach allgemeinem Er
kennt.nisstand nur fiir einige Anwendungsklassen moglich. Allgemeingiiltige Ver
fahren, die auch fiir sehr groBe Prozessoranzahlen skalierbar sind, sind nicht zu
erwal'ten. 1m dem Problemkreis der Algorit.hmen-bzw. Datenabbildung konnt.en
in den letzten Jahl'en eine Vielzahlunt.el'schiedlichstel' Verfahren entwickelt wer
den. Diese Verfahren nutzen die Chal'akterist.ik des abzubildenden Algorithmus
und des zugrundeliegenden Pl'ozessornetzwerkes aus. Sie sind ellt.weder Teil ei
nes Anwenderprogrammes oder bilden eine Schicht des Betriebssystems, so daB
die Organisation der Lastvert.eilung aut.omatisch durch das Betriebssystem eines
Parallelrechners iibernommen wird.
In diesem Artikel werden eine Reihe unterschiedlicher Verfahren vorgest.ellt.
Dazu unterscheiden wir insgesamt. vier Klassen vert.eilter Berechllungen. Charak
terisierungsmerkmale sind der Zeit.pullkt. der Last.entstehung (statisch vorgege
ben oder dynamisch zur Laufzeit) und die Beziehungen zwischen den einzelnen
Lastelementen. Hier unterscheidet man den Fall, daB Kommunikationen oder
Pdizedenzrelationen zwischen den Lastelementen zur Laufzeit auft.reten und den
Fall, daB die Lastelemente unabhangig voneinander berechnet werden konnen.
* Diese Arbeit wllrde durch das Bundesministeriulll fiir Forschllng und Technologie
(BMFT) im Rahmen des PARAWAN Projektes (413-5839-ITR 9007 BO) Iluterstiitzt