next up previous contents
Next: Implementierung Up: No Title Previous: LAPACK: SGETRF und SGETRS

Test und Resultate

Was wir erreichten

Fehlerkontrolle

Die Korrektheit der Resultate überprüften wir mit zwei verschiedenen Programmen (siehe auch Abschnitt 8.7 auf Seite gif:

Die errechneten Werte stimmen für alle getesteten Matrixgrössen und MUSIC-Konfigurationen. Abbildung 7.1 zeigt den relativen Fehler in Abhängigkeit der Matrixgrösse.

  figure326
Abbildung: Relativer Fehler tex2html_wrap_inline1962 in Abhängigkeit der Matrixdimension  

Performance

Tabelle 7.1 zeigt die erreichten Performancewerte auf der Minimalkonfiguration (3 Prozessoren) und Tabelle 7.2 zeigt die Performance auf der Maximalkonfiguration (63 Prozessoren).

  table335
Tabelle 7.1: LINPACK und LAPACK Performance in Mflop/s auf MUSIC-1 (3 Prozessoren)  

  table355
Tabelle 7.2: LINPACK und LAPACK Performance in Mflop/s auf MUSIC-21 (63 Prozessoren)  

  figure375
Abbildung: Performance in Abhängigkeit der Matrixgrösse für verschiedene Systeme, ungeblockter Algorithmus 

  figure382
Abbildung: Performance in Abhängigkeit der Matrixgrösse für verschiedene Systeme, geblockter Algorithmus 

Speedup

Die Minimalkonfiguration des MUSIC-Systems hat 3 Prozessoren. Wir haben zwar ein Programm geschrieben, das auf nur einem Prozessor arbeitet, zur Berechnung des Speedups kann dieses Programm jedoch nicht herbeigezogen werden, da es nicht gleich optimiert worden ist, wie das Programm für das Mehrprozessorsystem. Wir haben deshalb unseren Speedup immer gegenüber dem Dreiersystem berechnet und normiert. Das Dreiersystem bekommt also einen Speedup von 3. Abbildungen 7.4 und 7.5 zeigen den Speedup für den ungeblockten sowie den geblockten Algorithmus. Abbildung 7.6 zeigt die Effizienz des Speedups ( tex2html_wrap_inline1992 ) für ein tex2html_wrap_inline1914 System.

  figure395
Abbildung: Speedup in Abhängigkeit der Anzahl Prozessoren für verschiedene Matrixgrössen, ungeblockter Algorithmus 

  figure402
Abbildung: Speedup in Abhängigkeit der Anzahl Prozessoren für verschiedene Matrixgrössen, geblockter Algorithmus 

  figure409
Abbildung: tex2html_wrap_inline1992 für ein tex2html_wrap_inline1914 System, ungeblockter Algorithmus 

Speedupmodell

Der Speedup berechnet sich wie folgt:

displaymath416

wobei in unserem Fall tex2html_wrap_inline2072 ist. Wir kommen zu guten Übereinstimmungen im Speedup, wenn wir wie folgt einsetzen:

displaymath425

displaymath429

displaymath432

displaymath437


next up previous contents
Next: Implementierung Up: No Title Previous: LAPACK: SGETRF und SGETRS

Martin Frey
Tue Jun 17 10:28:58 MET DST 1997