Leistungen Umsetzung

Artikel

Schemasprachen für die Technische Dokumentation

Schemasprachen definieren Regelwerke für XML Dokumente und beschreiben Struktur und Inhalt dieser Dokumente syntaktisch. Das definierte Regelwerk stellt somit sicher, dass das XML Dokument valide ist, also aus korrekten, einheitlichen und maschinenlesbaren Informationseinheiten besteht.

Es gibt grammatik- und regelbasierte Schemasprachen: DTD, XML Schema und Relax NG gehören zu den grammatikbasierten Schemasprachen. Mit ihnen lassen sich Elemente und Attribute definieren und Datentypen festlegen. Aus den definierten Inhaltsmodellen ergibt sich in welcher Reihenfolge, Häufigkeit und Hierarchie ein Element verwendet werden darf. Schematron ist dagegen eine regelbasierte Schemasprache. Mit ihr lassen sich zusätzliche Konventionen formulieren, die die grammatikalischen Regeln einer XML-Anwendung ergänzen.


DTD

Eine Dokumenttypdefinition (engl. document type definition), abgekürzt DTD, ist ein Regelwerk, das die logische Struktur eines Dokuments mit Elementen, Attributen, Entitäten und Notationen beschreibt. In einer DTD wird die Reihenfolge, die Anordnung und die Art des Inhalts festgelegt. Die Anzahl und die Qualität der Elemente bestimmt den Detailgrad einer DTD und damit den Grad der Semantik. DTD ist die verbreitetste Syntax von Dokumententypen.


XML Schema

XML Schema, abgekürzt XSD (XML Schema Definition), wird ebenfalls zur Definition von Strukturen in XML-Dokumenten verwendet. Anders als bei einer DTD wird die Struktur hier selbst als XML-Dokument beschrieben. XML Schema ist primär für den Austausch zwischen Applikationen (z.B. Webservices) und datenintensiven Workflows gedacht. DTDs eignen sich dagegen besser für textlastige Anwendungen.

 

Was unterscheidet XML Schema von einer DTD?

  • XML Schema unterstützt die Verwendung und Erstellung von Datentypen für Elemente und Attribute. Diese können durch Integritätsbedingungen und weitere Kardinalitäten ergänzt werden.
  • XML Schema unterstützt Namespaces (Sammlung von Elementen und Attributen, die durch einen IRI gekennzeichnet sind), die Konflikte bei der Verwendung mehrerer Vokabulare vermeiden. DTDs können nur kombiniert werden, wenn keine Namenskonflikte bestehen.
  • XML Schema ist selbst in einer XML-Syntax geschrieben und kann einfach von einem XML-Parser validiert werden, DTDs eigene Syntax erfordert einen eigenen Parser.
  • Die Definition von Vererbungshierarchien ist in XML Schema möglich.
  • In XML Schema sind reihenfolgeunabhängige Strukturen sehr einfach zu definieren.
  • XML Schema kann mehr Semantik spezifizieren als DTDs.
  • Mit diesen Erweiterungen ist XML Schema gegenüber einer DTD wesentlich mächtiger und ausdrucksstärker, vor allem für die Beschreibung von Daten. Für jede DTD kann ein äquivalentes XML Schema erzeugt werden. Andersherum ist das nicht unbedingt möglich.


Relax NG

Die Regular Language Description for XML New Generation, kurz RELAX NG, ist ebenfalls eine Schemasprache zur Definition der Struktur von XML-Dokumenten und ein internationaler Standard ISO/IEC 1975-2 innerhalb der Document Schema Definition Language. Genau wie XML Schema verwendet auch RELAX NG im Gegensatz zu einer DTD keine eigene Syntax, sondern (wahlweise) XML-basiertes Vokabular. RELAX NG ist mächtiger als DTD aber weniger komplex als XML Schema und auch geeignet, wenn es um die Validierung von Elementen und Attributen in XML-Dokumenten geht. RELAX NG entstand aus dem Wunsch die Nachteile von DTD und XML Schema zu beseitigen: die neue Schemasprache sollte XML-Syntax verwenden und leichtgewichtig sein. Das ist mit RELAX NG gelungen.


Schematron

Schematron ist eine Schemasprache, die keine formale Grammatik verwendet und damit nicht zur Definition (wie DTD und XML Schema), sondern zur Validierung von XML-Dokumenten dient. Es werden Regeln definiert, die in den grammatikbasierten Schemasprachen nicht möglich sind. Seit Mai 2006 ist Schematron 1.6 ein offizieller ISO/IEC-Standard. Schematron stellt eine Ergänzung zu herkömmlichen Schemasprachen dar. Mittlerweile wird Schematron von den gängigen XML-Editoren unterstützt. So stellt beispielsweise der Oxygen Editor eine Schematron Quick Fix Funktionalität zur Verfügung, die Regelverletzungen automatisch erkennt und korrigiert.

Mehr zum Einsatz von Schemasprachen und der Anwendung in der Praxis erfahren Sie in unserem Whitepaper:

DTD & Schematron vs. XML Schema

Wir geben Ihnen einen Einblick in die verschiedenen Schemasprachen und ordnen die unterschiedlichen Begriffe ein. Wir widmen uns der Frage, ob es überhaupt die richtige Schemasprache für die Technische Dokumentation gibt und zeigen in zwei Praxisbeispielen verschiedene Szenarien für den Einsatz von Schemasprachen und den Einsatz von Schematron zur Validierung.

Share on email
Share on linkedin
Share on xing
Share on facebook
Share on twitter

Abonnieren Sie den kostenfreien Newsletter von PANTOPIX.
Wir informieren Sie gerne regelmäßig über neue Artikel.

Artikel

Einfach erklärt: Was bedeutet PIM?

PIM bedeutet zunächst Produktinformationsmanagement und beinhaltet die Verwaltung und Pflege von Produktinformationen. In einem PIM-System werden alle relevanten Produktdaten zentral verwaltet und medienneutral gespeichert oder referenziert, um die Daten für verschiedene Ausgabekanäle verfügbar zu machen.

weiterlesen >
Artikel

Verschiedene Standards für die Industrie 4.0

Um eine informationsgesteuerte Produktion zu ermöglichen, also Informationen maschinenlesbar und austauschbar zu machen, müssen Standards etabliert werden. Sie helfen bei der Beschreibung von Produkten und ebnen damit den Weg zur intelligenten Informationsbereitstellung. Für die Technische Kommunikation sind die Standards ECLASS, VDI 2770 und iiRDS von Relevanz.

weiterlesen >

Ihr Ansprechpartner

Maraike Heim
Senior Marketing Manager

Team Maraike Heim