Im Zuge der Digitalisierung und Verbreitung des Internet of Things (IoT) kommt es zu einem vermehrten Datenaustausch zwischen verschiedenen Organisationen. Dieser muss von menschlichen Akteuren autorisiert werden. Es findet somit eine Mensch-Maschine-Interaktion statt, in welcher die Regeln zum Datenaustausch in ein für Maschinen verständliches Format gebracht werden. Die Open Digital Rights Language (ODRL) [1] ist eine Richtlinienausdruckssprache und ermöglicht die Definition von menschen- und maschinenlesbaren Nutzungsrechten. Für technisch weniger versierte Menschen kann die Formulierung in der ORDL-Syntax eine Herausforderung sein und so die Anbindung verhindern. Darüber hinaus kann die Verwendung falscher Begriffe zu ungewollten Ergebnissen führen. Bei der niederschwelligen Erstellung können nutzerfreundliche Policy-Generatoren helfen, bspw. in Form eines Baukastens Zusätzliches Potenzial liegt in der Anbindung von Large Language Models (LLMs), zu deren bekanntesten Vertretern ChatGPT gehört, indem sie natürliche Sprache in ODRL-Policies übersetzen [2]. Andererseits können mit Hilfe von LLMs existierende ODRL-Policies validiert werden, um Vertrauen in diese Technologie zu stärken.
Während ODRL anfangs entwickelt wurde, um den wachsenden Anforderungen des digitalen Rechtemanagements gerecht zu werden, sind die Anwendungsbereiche heutzutage vielfältig. So werden ODRL-Policies aktuell in verschiedenen Forschungsfeldern wie Datenräumen und Datentreuhänder genutzt. Konkret werden diese Themen am MMI in Forschungsprojekten wie S3I-X [3], DTMForst [4] und CO2For-IT [5] untersucht. Diese verfolgen das gemeinsame Ziel, den Datenaustausch im Forstbereich zu vereinfachen und gleichzeitig das notwendige Vertrauen zwischen den Nutzern herzustellen. Hier werden heutzutage häufig noch veraltete und unsichere Technologien genutzt oder Daten gar nicht ausgetauscht, da das technische Knowhow sowie das gegenseitige Vertrauen fehlen [6]. Ziel dieser Arbeit ist daher die Konzeption, prototypische Umsetzung und der Vergleich verschiedener Policy-Generatoren (mit und ohne LLM-Unterstützung), sowie die anschließende Evaluierung, inwiefern diese im Forstbereich sinnvoll eingesetzt werden können.
Aufgaben
- Herausarbeiten des Stands der Technik in der Policy-Generierung und Möglichkeiten Nutzer bei der Erstellung zu unterstützen
- Erstellen von Policies in Beispielszenarien im Forstsektor
- Erstellen prototypischer User Interfaces als Policy-Generator für die Eingabe der Nutzungsregeln und Umwandlung in ODRL-Policies
- Anbindung von Large Language Modellen zur teilautomatisierten Erstellung und Validierung von ODRL-Policies
- Evaluierung der Policy-Generatoren in einer Feldstudie mit verschiedenen Nutzergruppen
[1] https://www.w3.org/TR/odrl-model/
[2] Arnold, Benedikt T., et al. “Towards Enabling FAIR Dataspaces Using Large Language Models.” arXiv preprint arXiv:2403.15451 (2024).
[3] https://www.kwh40.de/s3i-x/
[4] https://www.kwh40.de/dtmforst/
[5] https://www.kwh40.de/co2for-it/
[6] https://ceur-ws.org/Vol-3462/DEco1.pdf
Betreuer: Maximilian Hermans und Lennart Schinke