Webinar

21. März 2024

Property Modelling for Product Ontology using Vector Embeddings driven by LLMS and OCR

Die Identifizierung von Entitäten und Beziehungen aus heterogenen Datenquellen im Zusammenhang mit der technischen Dokumentation ist ein wichtiger Teil des Aufbaus einer Wissensdatenbank. Technische Daten bestehen aus Tabellen, Rohtexten und Bildern zu verschiedenen Produkten. Wir verwenden vortrainierte LLM- und OCR-Modelle, um Produkte und Produkteigenschaften aus diesen Quellen zu identifizieren. Die extrahierten Produktinformationen werden nun mithilfe von Vektoreinbettungen disambiguiert und auf spezifische Entitäten und Beziehungen in unserer PIM-Ontologie abgebildet. Dieser Einsatz von KI-Tools hilft uns beim Aufbau einer viel konkreteren Wissensdatenbank für unsere Kunden im Vergleich zu Standard-Datentransformationsansätzen, die nur mit strukturierten Daten arbeiten und regelbasiert sind.

 

Abonnieren Sie den kostenfreien Newsletter von PANTOPIX.
Wir informieren Sie gerne regelmäßig über neue Webinare.

Ihr Ansprechpartner

Prof. Dr. Martin Ley
Senior Consultant