Leistungen Umsetzung

Artikel

Schemasprachen für die Technische Dokumentation

Schemasprachen definieren Regelwerke für XML Dokumente und beschreiben Struktur und Inhalt dieser Dokumente syntaktisch. Das definierte Regelwerk stellt somit sicher, dass das XML Dokument valide ist, also aus korrekten, einheitlichen und maschinenlesbaren Informationseinheiten besteht.

Es gibt grammatik- und regelbasierte Schemasprachen: DTD, XML Schema und Relax NG gehören zu den grammatikbasierten Schemasprachen. Mit ihnen lassen sich Elemente und Attribute definieren und Datentypen festlegen. Aus den definierten Inhaltsmodellen ergibt sich in welcher Reihenfolge, Häufigkeit und Hierarchie ein Element verwendet werden darf. Schematron ist dagegen eine regelbasierte Schemasprache. Mit ihr lassen sich zusätzliche Konventionen formulieren, die die grammatikalischen Regeln einer XML-Anwendung ergänzen.


DTD

Eine Dokumenttypdefinition (engl. document type definition), abgekürzt DTD, ist ein Regelwerk, das die logische Struktur eines Dokuments mit Elementen, Attributen, Entitäten und Notationen beschreibt. In einer DTD wird die Reihenfolge, die Anordnung und die Art des Inhalts festgelegt. Die Anzahl und die Qualität der Elemente bestimmt den Detailgrad einer DTD und damit den Grad der Semantik. DTD ist die verbreitetste Syntax von Dokumententypen.


XML Schema

XML Schema, abgekürzt XSD (XML Schema Definition), wird ebenfalls zur Definition von Strukturen in XML-Dokumenten verwendet. Anders als bei einer DTD wird die Struktur hier selbst als XML-Dokument beschrieben. XML Schema ist primär für den Austausch zwischen Applikationen (z.B. Webservices) und datenintensiven Workflows gedacht. DTDs eignen sich dagegen besser für textlastige Anwendungen.

 

Was unterscheidet XML Schema von einer DTD?

  • XML Schema unterstützt die Verwendung und Erstellung von Datentypen für Elemente und Attribute. Diese können durch Integritätsbedingungen und weitere Kardinalitäten ergänzt werden.
  • XML Schema unterstützt Namespaces (Sammlung von Elementen und Attributen, die durch einen IRI gekennzeichnet sind), die Konflikte bei der Verwendung mehrerer Vokabulare vermeiden. DTDs können nur kombiniert werden, wenn keine Namenskonflikte bestehen.
  • XML Schema ist selbst in einer XML-Syntax geschrieben und kann einfach von einem XML-Parser validiert werden, DTDs eigene Syntax erfordert einen eigenen Parser.
  • Die Definition von Vererbungshierarchien ist in XML Schema möglich.
  • In XML Schema sind reihenfolgeunabhängige Strukturen sehr einfach zu definieren.
  • XML Schema kann mehr Semantik spezifizieren als DTDs.
  • Mit diesen Erweiterungen ist XML Schema gegenüber einer DTD wesentlich mächtiger und ausdrucksstärker, vor allem für die Beschreibung von Daten. Für jede DTD kann ein äquivalentes XML Schema erzeugt werden. Andersherum ist das nicht unbedingt möglich.


Relax NG

Die Regular Language Description for XML New Generation, kurz RELAX NG, ist ebenfalls eine Schemasprache zur Definition der Struktur von XML-Dokumenten und ein internationaler Standard ISO/IEC 1975-2 innerhalb der Document Schema Definition Language. Genau wie XML Schema verwendet auch RELAX NG im Gegensatz zu einer DTD keine eigene Syntax, sondern (wahlweise) XML-basiertes Vokabular. RELAX NG ist mächtiger als DTD aber weniger komplex als XML Schema und auch geeignet, wenn es um die Validierung von Elementen und Attributen in XML-Dokumenten geht. RELAX NG entstand aus dem Wunsch die Nachteile von DTD und XML Schema zu beseitigen: die neue Schemasprache sollte XML-Syntax verwenden und leichtgewichtig sein. Das ist mit RELAX NG gelungen.


Schematron

Schematron ist eine Schemasprache, die keine formale Grammatik verwendet und damit nicht zur Definition (wie DTD und XML Schema), sondern zur Validierung von XML-Dokumenten dient. Es werden Regeln definiert, die in den grammatikbasierten Schemasprachen nicht möglich sind. Seit Mai 2006 ist Schematron 1.6 ein offizieller ISO/IEC-Standard. Schematron stellt eine Ergänzung zu herkömmlichen Schemasprachen dar. Mittlerweile wird Schematron von den gängigen XML-Editoren unterstützt. So stellt beispielsweise der Oxygen Editor eine Schematron Quick Fix Funktionalität zur Verfügung, die Regelverletzungen automatisch erkennt und korrigiert.

Mehr zum Einsatz von Schemasprachen und der Anwendung in der Praxis erfahren Sie in unserem Whitepaper:

DTD & Schematron vs. XML Schema

Wir geben Ihnen einen Einblick in die verschiedenen Schemasprachen und ordnen die unterschiedlichen Begriffe ein. Wir widmen uns der Frage, ob es überhaupt die richtige Schemasprache für die Technische Dokumentation gibt und zeigen in zwei Praxisbeispielen verschiedene Szenarien für den Einsatz von Schemasprachen und den Einsatz von Schematron zur Validierung.

Abonnieren Sie den kostenfreien Newsletter von PANTOPIX.
Wir informieren Sie gerne regelmäßig über neue Artikel.

Artikel

Knowledge Graph Embeddings

Unterschiedliche Datenquellen in einer Wissensdatenbank zusammenzuführen und die semantische Repräsentation der dort enthaltenen Informationen können die Technische Kommunikation erheblich erleichtern. Der Aufbau einer Wissensdatenbank mithilfe semantischer Wissensgraphen bietet zahlreiche Vorteile, darunter die wichtige Möglichkeit, den Wissensgraphen kontinuierlich zu erweitern. Eine Methode zur Erweiterung des Wissens besteht in der Anwendung von Einbettungen für Wissensgraphen (Knowledge Graph Embeddings).

weiterlesen >
Artikel

Docs-as-Code: Automatisierte Software Dokumentation

Die Welt der Softwareentwicklung verändert sich ständig, und mit ihr auch die Art und Weise, wie wir Software dokumentieren. Eine innovative Methode, die in den letzten Jahren an Popularität gewonnen hat, ist “Docs-as-Code” oder Dokumentation als Code. In diesem Artikel werden wir uns mit dieser spannenden Entwicklung auseinandersetzen und den Anwendungsbereich in der Technischen Dokumentation genauer beleuchten.

weiterlesen >
Artikel

Potenziale von KI in der Technischen Kommunikation

In jüngster Zeit hat KI viel
Aufmerksamkeit erregt, da sie die Möglichkeiten eröffnet manuelle Aufgaben zu automatisieren. Die Innovationskraft dieses Technologiefortschritts wirft jedoch auch die Frage auf, ob wir in der technischen Kommunikation bewährte Ansätze und Methoden – von Metadaten über semantische Informationsmodelle bis hin zu Wissensgraphen – über Bord werfen müssen.

weiterlesen >

Ihr Ansprechpartner

Maraike Heim
Senior Marketing Manager

Team Maraike Heim