Trace Link Recovery zwischen natürlichsprachiger Dokumentation und Formalen Modellen

Aus SDQ-Wiki
Ausschreibung (Liste aller Ausschreibungen)
Typ
Aushang
Betreuer Wenden Sie sich bei Interesse oder Fragen bitte an:

Jan Keim (E-Mail: jan.keim@kit.edu, Telefon: +49-721-608-45994)

Tätigkeit

Bei dieser Tätigkeit besteht die hauptsächliche Tätigkeit darin, Ideen umzusetzen, um Beziehungen (Trace Links) zwischen natürlichsprachiger Dokumentation und Formalen Modellen zu erstellen. Das Hauptziel hierbei ist, dass zu Textstellen die entsprechenden Stellen im Modell gefunden werden können und ebenso anders herum zu Modellelementen die entsprechenden Stellen im Text.

Hierbei soll nicht nur ein einfaches String-Matching angewandt werden, sondern beispielsweise der Text soll ausreichend analysiert und Erkenntnisse über die Aussagen (maschinell) gewonnen werden. Auch sollen hierbei möglichst viele Informationen aus beiden Artefakten genutzt werden wie beispielsweise über Relationen. Dabei werden Sie Techniken des Natural Language Processing/Understanding (NLP/NLU) sowie des Information Retrievals (IR) soweit weitere geeignete Techniken einsetzen und in Ihrer Arbeit umsetzen. Der Fokus hierbei wird sein, aktuelle Technologien wie u.a. Machine-Learning-Verfahren umzusetzen, um die Verarbeitung bzw. Teile der Verarbeitung zu verbessern.

Vorkenntnisse / Voraussetzungen

Vorkenntnisse sind vor allem in Java gefordert. Weiterhin wären Erfahrungen mit Maven und Git vorteilhaft. Vorkenntnisse in NLP oder IR werden nicht vorausgesetzt, erleichtern aber den Einstieg.