Vorträge

Property Modelling for Product Ontology using Vector Embeddings driven by LLMS and OCR

Die Identifizierung von Entitäten und Beziehungen aus heterogenen Datenquellen im Zusammenhang mit der technischen Dokumentation ist ein wichtiger Teil des Aufbaus einer Wissensdatenbank. Technische Daten bestehen aus Tabellen, Rohtexten und Bildern zu verschiedenen Produkten. Wir verwenden vortrainierte LLM- und OCR-Modelle, um Produkte und Produkteigenschaften aus diesen Quellen zu identifizieren. Die extrahierten Produktinformationen werden nun mithilfe von Vektoreinbettungen disambiguiert und auf spezifische Entitäten und Beziehungen in unserer PIM-Ontologie abgebildet. Dieser Einsatz von KI-Tools hilft uns beim Aufbau einer viel konkreteren Wissensdatenbank für unsere Kunden im Vergleich zu Standard-Datentransformationsansätzen, die nur mit strukturierten Daten arbeiten und regelbasiert sind.

Sie konnten nicht am PoolParty Summit teilnehmen?
Kein Problem! Schauen Sie sich einfach die Aufzeichnung an.

Ihr Ansprechpartner

Maraike Heim
Senior Marketing Manager