Nachrichten, Gerüchte, Meldungen und Berichte aus der IT-Szene

Redaktion: Heinz Schmitz


KI übernimmt Arbeit von Software-Ingenieuren

Programmcode
Software soll selbst lernen, welche Anpassung in welcher Situation die beste ist, indem sie Feedback zur Laufzeit sammelt und auswertet.. (Quelle: Pexels/Pixabay)

Wir leben in einer schnelllebigen, vernetzten Welt. In dieser wächst der Bedarf an selbstadaptiver Software, also Software, die in der Lage ist, sich selbstständig an wechselnde Umgebungssituationen anzupassen. Beispiele sind schwankende Übertragungsbandbreiten, eine wechselnde Anzahl von Nutzern oder sich ändernde Benutzerpräferenzen. Eine wesentliche Aufgabe bei der Entwicklung selbstadaptiver Software ist es vorzugeben, wann und wie eine Anpassung erfolgen soll. Das ist jedoch schwierig, weil die Ingenieure zum Zeitpunkt der Entwicklung meist nicht alle möglichen Umgebungssituationen der Software vorhersehen können. Dieser Herausforderung begegnet das paluno-Team mit Online Reinforcement Learning, einem Verfahren der Künstlichen Intelligenz.

 

Die Idee dahinter: Die Software lernt selbst, welche Anpassung in welcher Situation die beste ist, indem sie Feedback zur Laufzeit sammelt und auswertet. Gute Anpassungen führen zu positivem Feedback, schlechte Anpassungen zu einem negativen. So lernt die Software durch Ausprobieren, möglichst gute Rückmeldungen zu sammeln. Damit übernimmt die Künstliche Intelligenz die bisherige manuelle Tätigkeit der Software-Ingenieure: festlegen, wann und wie eine Anpassung erfolgen soll.

 

Adaptionslogik

Schematische Darstellung eines Selbstadaptiven Systems und die Automatisierung durch Künstliche Intelligenz (in blau) (Quelle: uni-due)

 

„Bisherige Methoden des Online Reinforcement Learning haben jedoch noch einen Haken“, sagt Dr. Andreas Metzger, Leiter des Bereichs Adaptive Systeme bei paluno. „Die so genannte Explorationsrate muss manuell feinjustiert werden. Das ist die Wahrscheinlichkeit, dass die Software eine neue Anpassung ausprobiert, anstatt sich auf bekannte, sichere Anpassungen zu beschränken.“

 

Weil das auf Kosten der Automatisierbarkeit geht, setzt das paluno-Team einen neuartigen Lernalgorithmus ein: Dieser wird Policy-based Reinforcement Learning genannt und kommt ohne eine Feinjustierung der Explorationsrate aus. Erste Tests bei selbstadaptiven Systemen für das Geschäftsprozessmanagement und für Web-Anwendungen waren erfolgreich. Ihre Erkenntnisse wollen die Wissenschaftler nun auch für die Entwicklung von selbstadaptiven Transportmanagement-Systemen und Smart-Home-Systemen anwenden.

 

Originalveröffentlichungen:

Alexander Palm, Andreas Metzger and Klaus Pohl: Online Reinforcement Learning for Self-Adaptive Information Systems. In: Schahram Dustdar, Eric Yu, Camille Salinesi, Dominique Rieu and Vik Pant (eds.): 32nd Int'l Conference on Advanced Information Systems Engineering (CAiSE 2020), Grenoble, France, June 8-12, 2020, Volume 12127 of LNCS, Springer, 2020, 169-184.

 

Andreas Metzger, Tristan Kley and Alexander Palm: Triggering Proactive Business Process Adaptations via Online Reinforcement Learning. In: Dirk Fahland, Chiara Ghidini, Jörg Becker and Marlon Dumas (eds.): 18th Int'l Conference on Business Process Management (BPM 2020), Sevilla, Spain, September 13-18, 2020, Volume 12168 of Lecture Notes in Computer Science, Springer, 2020.

 

Siehe auch:

https://sse.uni-due.de/forschung/projekte/dataportsb

https://sse.uni-due.de/forschung/projekte/enact

Zurück