Identification of Performance-Relevant Configuration Options

Aus SDQ-Wiki
Ausschreibung (Liste aller Ausschreibungen)
Typ Bachelorarbeit
Aushang BA Identifikation relevanter Optionen.pdf
Betreuer Wenden Sie sich bei Interesse oder Fragen bitte an:

Larissa Schmid (E-Mail: larissa.schmid@kit.edu, Telefon: +49-721-608-45981)

Motivation

Um aufwändige Simulationen in verschiedenen wissenschaftlichen Disziplinen effizient durchführen zu können, wird massiv parallele Software genutzt. Für jede Simulation, die durchgeführt werden soll, muss eine neue Konfiguration der Software ausgewählt werden. Diese Konfiguration besteht z.B. aus dem zu simulierenden Material, zu verwendenden Algorithmen sowie deren Parametern. Dabei ist jedoch unklar, wie sich die einzelnen Konfigurations-Optionen auf die Performance der Software auswirken. Insbesondere ist nicht klar, welche Optionen die Laufzeit überhaupt maßgeblich beeinflussen und welche keinen Einfluss darauf haben. Es gibt bereits einen erarbeiteten Ansatz, der existierende Performance-Modellierungstechniken nutzt, um mit Messungen der Software auf kleiner Skala herauszufinden, welche Optionen einen Einfluss auf die Performance haben. Dieser wurde allerdings bisher nur mit einer Fallstudie vorläufig evaluiert.

Aufgabenstellung

In dieser Arbeit soll untersucht werden, ob der existierende Ansatz auch bei weiteren Fallstudien gute Ergebnisse liefert und was sich für generelle Empfehlungen hinsichtlich seiner Anwendung ergeben. Teilaufgaben der Arbeit sind:

  • Benchmarken verschiedener konfigurierbarer, wissenschaftlicher Software
  • Anwenden des Vorgehens zur Performance-Modellierung
  • Evaluation des Vorgehens hinsichtlich Akkuratheit der Erkennung von relevanten Optionen sowie Ableiten von Empfehlungen zur Anzahl der Messungen

Motivation

In order to carry out complex simulations in various scientific disciplines efficiently, parallel software is used on a massive scale. A new software configuration must be selected for each simulation that is to be carried out. This configuration consists, for example, of the material to be simulated, the algorithms to be used and their parameters. However, it is unclear how the individual configuration options affect the performance of the software. In particular, it is not clear which options have a significant influence on the runtime and which have no influence at all. There is already a developed approach that uses existing performance modeling techniques to find out which options have an influence on performance by measuring the software on a small scale. However, this has so far only been provisionally evaluated with a case study.

Task

The aim of this thesis is to investigate whether the existing approach also delivers good results in other case studies and what general recommendations can be made regarding its application. Sub-tasks of the thesis are:

  • Benchmarking different configurable, scientific software
  • Applying the performance modeling approach
  • Evaluation of the approach with regard to the accuracy of recognizing relevant options and deriving recommendations for the number of measurements