Performance-Modellierung von verteiltem Rechnen

Aus SDQ-Wiki
Ausschreibung (Liste aller Ausschreibungen)
Typ Masterarbeit
Aushang MA HEP.pdf
Betreuer Wenden Sie sich bei Interesse oder Fragen bitte an:

Larissa Schmid (E-Mail: larissa.schmid@kit.edu, Telefon: +49-721-608-45981)

Thema

Motivation

Experimente in der Hochenergiephysik erzeugen immense Mengen an Daten, die analysiert werden müssen. Um eine Analyse der Daten durchführen zu können, werden die einzelnen Analyse-Jobs auf verschiedene Rechenzentren verteilt. Dabei ist entscheidend, dass die Jobs sowie die jeweils benötigten Daten gut verteilt werden – unter der Ungewissheit, in welchem Rechenzentrum wann wie viele Rechenkapazitäten frei werden. Softwarearchitektursimulatoren ermöglichen es, Abschätzungen über die Performance in Abhängigkeit von den verwendeten Ressourcen durchzuführen sowie verschiedene mögliche Szenarien zu simulieren und können solche Entscheidungen so unterstützen.


Aufgabenstellung

In dieser Arbeit soll untersucht werden, wie gut Palladio geeignet ist, die verteilte Ausführung von Jobs zu modellieren und zu simulieren, um auf Basis der Simulationsergebnisse Entwurfsentscheidungen treffen zu können, z.B. darüber, wie Jobs verteilt werden sollen und wann Daten transferiert werden sollen. Teilaufgaben der Arbeit sind:

  • Untersuchen, wie mit bereits bestehenden Modellierungs-Elementen Ausführungsszenarien der Hochenergiephysik abgebildet werden können
  • Evaluation anhand einer Fallstudie
  • Herausarbeiten von nötigen Änderungen, um zu besseren Vorhersagen zu gelangen

English Translation

Motivation

Experiments in high-energy physics generate immense amounts of data that need to be analyzed. To be able to perform an analysis of the data, the individual analysis jobs are distributed to different data centers. It is crucial that the jobs as well as the data required per job are well-distributed - under the uncertainty of which data center will free up how much computing capacity and when. Software architecture simulators make it possible to perform estimates of performance depending on the resources used and to simulate various possible scenarios, and can thus support such decisions.

Task

The purpose of this work is to investigate how well the software architecture simulator Palladio is suited to model and simulate the distributed execution of jobs in order to make design decisions based on the simulation results, such as how jobs should be distributed and when data should be transferred. Subtasks of the work are:

  • Investigate how existing modeling elements can be used to represent high-energy physics execution scenarios
  • Evaluation by means of a case study
  • Work out necessary changes to achieve better predictions