Artikel
Schemasprachen für die Technische Dokumentation
Schemasprachen definieren Regelwerke für XML Dokumente und beschreiben Struktur und Inhalt dieser Dokumente syntaktisch. Das definierte Regelwerk stellt somit sicher, dass das XML Dokument valide ist, also aus korrekten, einheitlichen und maschinenlesbaren Informationseinheiten besteht.
Es gibt grammatik- und regelbasierte Schemasprachen: DTD, XML Schema und Relax NG gehören zu den grammatikbasierten Schemasprachen. Mit ihnen lassen sich Elemente und Attribute definieren und Datentypen festlegen. Aus den definierten Inhaltsmodellen ergibt sich in welcher Reihenfolge, Häufigkeit und Hierarchie ein Element verwendet werden darf. Schematron ist dagegen eine regelbasierte Schemasprache. Mit ihr lassen sich zusätzliche Konventionen formulieren, die die grammatikalischen Regeln einer XML-Anwendung ergänzen.
DTD
Eine Dokumenttypdefinition (engl. document type definition), abgekürzt DTD, ist ein Regelwerk, das die logische Struktur eines Dokuments mit Elementen, Attributen, Entitäten und Notationen beschreibt. In einer DTD wird die Reihenfolge, die Anordnung und die Art des Inhalts festgelegt. Die Anzahl und die Qualität der Elemente bestimmt den Detailgrad einer DTD und damit den Grad der Semantik. DTD ist die verbreitetste Syntax von Dokumententypen.
XML Schema
XML Schema, abgekürzt XSD (XML Schema Definition), wird ebenfalls zur Definition von Strukturen in XML-Dokumenten verwendet. Anders als bei einer DTD wird die Struktur hier selbst als XML-Dokument beschrieben. XML Schema ist primär für den Austausch zwischen Applikationen (z.B. Webservices) und datenintensiven Workflows gedacht. DTDs eignen sich dagegen besser für textlastige Anwendungen.
Was unterscheidet XML Schema von einer DTD?
- XML Schema unterstützt die Verwendung und Erstellung von Datentypen für Elemente und Attribute. Diese können durch Integritätsbedingungen und weitere Kardinalitäten ergänzt werden.
- XML Schema unterstützt Namespaces (Sammlung von Elementen und Attributen, die durch einen IRI gekennzeichnet sind), die Konflikte bei der Verwendung mehrerer Vokabulare vermeiden. DTDs können nur kombiniert werden, wenn keine Namenskonflikte bestehen.
- XML Schema ist selbst in einer XML-Syntax geschrieben und kann einfach von einem XML-Parser validiert werden, DTDs eigene Syntax erfordert einen eigenen Parser.
- Die Definition von Vererbungshierarchien ist in XML Schema möglich.
- In XML Schema sind reihenfolgeunabhängige Strukturen sehr einfach zu definieren.
- XML Schema kann mehr Semantik spezifizieren als DTDs.
- Mit diesen Erweiterungen ist XML Schema gegenüber einer DTD wesentlich mächtiger und ausdrucksstärker, vor allem für die Beschreibung von Daten. Für jede DTD kann ein äquivalentes XML Schema erzeugt werden. Andersherum ist das nicht unbedingt möglich.
Relax NG
Die Regular Language Description for XML New Generation, kurz RELAX NG, ist ebenfalls eine Schemasprache zur Definition der Struktur von XML-Dokumenten und ein internationaler Standard ISO/IEC 1975-2 innerhalb der Document Schema Definition Language. Genau wie XML Schema verwendet auch RELAX NG im Gegensatz zu einer DTD keine eigene Syntax, sondern (wahlweise) XML-basiertes Vokabular. RELAX NG ist mächtiger als DTD aber weniger komplex als XML Schema und auch geeignet, wenn es um die Validierung von Elementen und Attributen in XML-Dokumenten geht. RELAX NG entstand aus dem Wunsch die Nachteile von DTD und XML Schema zu beseitigen: die neue Schemasprache sollte XML-Syntax verwenden und leichtgewichtig sein. Das ist mit RELAX NG gelungen.
Schematron
Schematron ist eine Schemasprache, die keine formale Grammatik verwendet und damit nicht zur Definition (wie DTD und XML Schema), sondern zur Validierung von XML-Dokumenten dient. Es werden Regeln definiert, die in den grammatikbasierten Schemasprachen nicht möglich sind. Seit Mai 2006 ist Schematron 1.6 ein offizieller ISO/IEC-Standard. Schematron stellt eine Ergänzung zu herkömmlichen Schemasprachen dar. Mittlerweile wird Schematron von den gängigen XML-Editoren unterstützt. So stellt beispielsweise der Oxygen Editor eine Schematron Quick Fix Funktionalität zur Verfügung, die Regelverletzungen automatisch erkennt und korrigiert.
Mehr zum Einsatz von Schemasprachen und der Anwendung in der Praxis erfahren Sie in unserem Whitepaper:
DTD & Schematron vs. XML Schema
Wir geben Ihnen einen Einblick in die verschiedenen Schemasprachen und ordnen die unterschiedlichen Begriffe ein. Wir widmen uns der Frage, ob es überhaupt die richtige Schemasprache für die Technische Dokumentation gibt und zeigen in zwei Praxisbeispielen verschiedene Szenarien für den Einsatz von Schemasprachen und den Einsatz von Schematron zur Validierung.
Abonnieren Sie den kostenfreien Newsletter von PANTOPIX.
Wir informieren Sie gerne regelmäßig über neue Artikel.
Semantische Schichten von PIM-Systemen
Unternehmen verlassen sich auf Product Information Management (PIM)-Systeme, um Produktinformationen zu erstellen, zu verwalten und über verschiedene Kanäle zu verteilen. Wir bieten Softwarelösungen für PIM-Systeme für unsere Industriekunden an.
Topic-Orientierung in der Technischen Kommunikation
Die Umstellung von einer Dokumenten-basierten auf eine Topic-orientierte Herangehensweise in der Technischen Kommunikation bringt tiefgreifende Veränderungen mit sich, die zahlreiche Vorteile bieten.
Doch was genau verbirgt sich hinter diesem Begriff der Topic-Orientierung, und warum ist er für die technische Kommunikation so sinnvoll?
PIM-Systeme auf Basis von Wissensgraphen
Industrien verlassen sich auf Product Information Management (PIM)-Systeme, um Produktinformationen zu erstellen, zu verwalten und über verschiedene Kanäle zu verteilen.
Die Herausforderungen, die dabei auftreten, können wir mit der Entwicklung von PIM-Systemen auf der Basis von Wissensgraphen entgegnen.
Ihr Ansprechpartner
Maraike Heim
Senior Marketing Manager
- maraike.heim@pantopix.com