Artikel
KI mit Kontext: Wie Produktontologien technische Support-Chats verbessern
„Wie kann ich am Elektronenmikroskop XY die Kathode wechseln?“, könnte eine typische Frage sein, die ein Servicetechniker in einen Support-Chat eingibt. Verfügt das Question-Answering-System (QA) nur über eine generische KI ohne produktspezifischen Kontext, werden auch die Antworten nur generisch sein. Wahrscheinlich ist, dass die Antwort schlicht falsch ist oder elementare Informationen fehlen – zum Beispiel der Hinweis, dass ein Spezialwerkzeug benötigt wird. In unserem Umfeld der technischen Kommunikation ist es aber essenziell, dass die Antworten verlässlich und kontextbezogen sind und aus gesicherten Quellen kommen. Nur dann ist so ein technisches Q&A ein leistungsstarkes Werkzeug.
Um unternehmensspezifische Informationen in ein Sprachmodell einzubinden, wird die Methode Retrieval Augmented Generation (RAG) eingesetzt. Kurz erklärt, werden dabei Dokumente in Seiten oder Abschnitte unterteilt und in eine Vektordatenbank geschrieben. Diese Vektoren werden mit der Nutzerfrage abgeglichen. Diese Methode funktioniert zwar recht gut, hat aber große Schwächen, wenn die Frage semantisch nicht auf die möglichen Antworten passt.
Fragen, die von einem RAG-Chat im technischen Umfeld nur schwer beantwortet werden können, sind erfahrungsgemäß folgende:
- Fragen nach Definitionen (Was ist ein …) –> Problem: Sicherstellen der exakten Definition
- Fragen nach Hierarchien (Woraus besteht …) –> Problem: potenzielle Unvollständigkeit der Information
- Fragen nach verwandten Inhalten (related docs z. B. Zusatzinfos aus aktuellen Meldungen) –> Problem: keine Verknüpfung dieser Informationsarten
- Fragen nach spezifischen Merkmalen –> Problem: zu große Ähnlichkeiten der Informationen
- Aggregationsfragen (Anzahl, Summe, Minimum, Maximum) –> Problem: fehlender Kontext, keine Kenntnis über den kompletten Datenbestand
- Vergleichsfragen (z. B. Vergleich desselben Merkmals bei zwei Produkten) –>Problem: Erkennen von Zusammenhängen
„Understanding of Question“ – die Frage zu analysieren und zu erkennen, welche Konzepte und Zusammenhänge dahinter liegen – stellt also auch für ein Question-Answering-System eine Hürde dar, das durch RAG produktspezifische Informationen zur Verfügung hat. Eine Lösung wäre es, statt eine Antwort neu generieren zu lassen, die KI nur dazu zu verwenden, eine Einordnung zu treffen oder die Suchanfrage zu konkretisieren. Die Antwort würde dann am Ende einfach aus der Datenbank kommen. Es gibt aber auch noch eine andere Option.
Wie kann ein Support-Chat mit RAG darüber hinaus verbessert werden?
Um ein QA-System, das RAG verwendet, weiter zu verbessern, brauchen wir eine semantische Struktur, die sowohl die Verknüpfungen zwischen den Daten als auch deren Bedeutung abbildet. Dafür eignen sich Wissensgraphen, die konkrete Informationen als Knoten und deren Beziehungen als Kanten darstellen. Grundlage dafür ist eine Ontologie, zum Beispiel eine Produktontologie, die die relevanten Begriffe, Kategorien und möglichen Relationen definiert.
Zusätzlich benötigen wir Metadaten, die Daten nicht nur beschreiben, sondern auch helfen, ihre Bedeutung zu verstehen. Hierzu zählen Kontextinformationen wie etwa das Alter einer Information oder die Quelle, aus der sie stammt, ebenso semantische Relationen in der Ontologie. Solche semantischen Metadaten verbinden Informationen mit Bedeutungsebenen und machen sie maschinell interpretierbar.
Exkurs: Der iiRDS-Standard als semantischer Strukturgeber für technische RAG-Chats
In der technischen Redaktion gibt es einen guten Startpunkt, um ein technisches Q&A durch eine semantische Struktur zu ergänzen: iiRDS, ein Standard, der Metadaten für die Auszeichnung von technischen Informationen vorgibt. Er definiert Informationstypen (z. B. Concept oder Task), es gibt administrative und funktionale Metadaten und es gibt einige wenige Produktmetadaten (Komponenten und Produktfeature).
Ausschließlich mit iiRDS-Klassen lassen sich einfache Vorgänge gut abbilden: Ein Topic referenziert eine Komponente, die Teil eines Produktes ist. Damit kann in der technischen Dokumentation z. B. auf eine Komponente referenziert werden, ohne dass die (veränderliche) Artikelnummer genannt wird. Dafür müssen Prozedur und Komponente mit einem entsprechenden Metadatum versehen werden, welches es ermöglicht, den konkreten Artikel zu finden.

Falls die Struktur, die für das technische Q&A abgebildet werden soll, komplexer ist als das, lässt sich die Informationswelt dieses Standards auch erweitern. Es können neue Klassen oder Subklassen der vorgegebenen iiRDS-Klassen gebildet werden. Außerdem können neue Klassen mit denen des Standards verbunden werden, um eine neue Produktontologie aufzubauen oder eine bestehende zu erweitern.
Wie sieht eine erweitere iiRDS-Produktontologie in der Praxis aus?

„Wie tausche ich die Pumpe beim Antrieb meiner Maschine L50? Aber es ist das US-Model. Was ist die Nenndrehzahl des Antriebs?“ Eine solche Frage ist für einen Support-Chat selbst mit RAG so komplex, dass es eine Produktontologie zur Beantwortung braucht. Denn diese Frage umfasst: Welches Produkt? Welche Komponente? Welcher Markt? Welche Eigenschaften?
Aus dem reinen iiRDS-Standard lässt sich das nicht alles beantworten. Dafür muss die Produktontologie bzw. deren Metadatenmodell um vier Klassen erweitert werden: eine Marktklasse, eine Device-Klasse (die Beziehung zwischen Gerät und Produkt), eine Property-Klasse und eine Property-Value-Klasse. Die letzten beiden als eine Welt für die Merkmalsdefinition.
Eine Frage wie die nach der Nenndrehzahl lässt sich nun beantworten, weil das Informationsobjekt (hier eine Tabelle mit technischen Daten, die diese Werte enthält) sowohl mit einem Produkt als auch einem Gerät referenziert ist. So kann das QA-System unterscheiden, welches die richtige Datenquelle ist.
Vorteile von Semantik im technischen Q&A
Wird ein Question-Answering-System, das RAG verwendet, durch semantische Produktdaten erweitert, verbessert das die Qualität der Antworten.
- Durch die Kategorisierung von Wissen wird die Suche von Informationen effizienter.
- Strukturierte Daten führen zu relevanten Antworten, da das Sprachmodell den Kontext und die Beziehung zwischen den Konzepten besser versteht.
- In komplexen Themen finden Nutzer die benötigten Informationen leichter, weil die Navigation verbessert ist.
- Durch den Vergleich von Benutzerfragen mit bekannten Konzepten erkennt das System die Absicht und das Interesse der Nutzer besser.
Ausblick: Semantik als Kompass für KI-Systeme
Moderne Question-Answering-System wie ein Support-Chat sind bereits jetzt wichtige Werkzeuge, um Nutzerfragen effizient zu beantworten. Mit der Weiterentwicklung von generativer KI und deren wachsender Autonomie wird in Zukunft auch die Bedeutung von semantischen Informationen steigen, um KI-Antworten und deren Entscheidungen zu leiten. Ein Mittel, um das zu erreichen, ist die Verwendung von semantischen Strukturen wie Produktontologien, angereichert mit Bedeutung schaffenden Metadaten.
Sowohl in der direkten Informationsbereitstellung z. B. in einem Portal oder in einem Chat verbessert das die Auffindbarkeit, Verwaltbarkeit, Relevanz und die Analyse beziehungsweise Extraktion von Informationen. Für die steigende Autonomie von KI – AI Agents stehen in den Startlöchern – können wir so eine Leitplanke schaffen. Für uns in der technischen Kommunikation sollte das Motivation genug sein, die Pflege von Metadaten und Produktontologien systematisch voranzutreiben und Technologien wie Knowledge Graphs gezielt einzusetzen.
Abonnieren Sie den kostenfreien Newsletter von PANTOPIX.
Wir informieren Sie gerne regelmäßig über neue Artikel.

From Legacy Systems to DITA: Case Studies in Successful Migration
Dieser Artikel befasst sich mit den Erkenntnissen und Erfahrungen aus erfolgreichen Migrationsprojekten, die auf zwei von PANTOPIX durchgeführten Fallstudien beruhen.

Knowledge Graphen und Large Language Models: die perfekte Kombination!
Out-of-the-Box-Lösungen für RAG-Systeme verbreiten sich immer weiter. Sie versprechen, das Wissen eines Unternehmens aus Dokumenten wie PDFs oder Word-Dateien mithilfe von Large Language Models (LLMs) in Form eines Chats zugänglich zu machen.

Semantische Schichten von PIM-Systemen
Unternehmen verlassen sich auf Product Information Management (PIM)-Systeme, um Produktinformationen zu erstellen, zu verwalten und über verschiedene Kanäle zu verteilen. Wir bieten Softwarelösungen für PIM-Systeme für unsere Industriekunden an.
Contact us
Maximilian Gärber
Partner & Managing Director
- max.gaerber@pantopix.com
