XML-Ressourcen

Definition

  • XML = extensible markup language
  • Textformat zur hierarchischen strukturierten Ablage von Daten in Elementen

Syntax

XML als Metasprache

Die XML-Spezifikation bringt zunächst nur einen allgemeinen Regelsatz ohne konkrete Anwendungsmöglichkeiten mit. Beispiele für solche Regeln:

  • Hauptkonstrukt ist das Element. Ein Element kann Attribute haben.
  • Mit den Elementen und Attributen können die Inhalte ausgezeichnet werden, d. h. Eigenschaften zugewiesen. XML ist eine Auszeichnungssprache.
  • Die Elemente (Knoten) können hierarchisch einander über-, neben- oder untergeordnet werden (Eltern-, Geschwister- und Kindknoten) → Baumstruktur.
  • Eine XML-Datei hat genau ein Wurzelelement.
  • Jedes Element (im nachfolgenden Beispiel span) öffnet und schließt. In den meisten Fällen geschieht dies mittels Anfangs- und End-Tag  <span>Lorem ipsum</span>. Alleinstehende Tags (Tags, die nur einen Punkt / die keine Spanne repräsentieren und deswegen keinen Anfangs- und End-Tag haben können) müssen sich selbst schließen  <br />.
  • Die Schachtelung (Nestung) dieser Tags und damit die Elementstruktur muss symmetrisch sein.

Einhaltung der Spezifikation führt zu Wohlgeformtheit.

XML-Sprachen (Dialekte)

Die XML-Spezifikation kann um ein Schema (XML Schema Definition, Dateierweiterung .xsd) oder eine Dokumenttypdefinition (Document Type Description, Erweiterung .dtd) erweitert und das Format so einer konkreten Anwendung zugeführt werden – daher das X (für Extensible) in XML. Eine solche Spezifikation legt u. a. fest, welche Elemente auf welcher Hierarchieebene existieren können oder müssen und wie viele davon; ob ein Element leer sein kann, welche Attribute ein Element haben kann oder muss und welche Werte ein solches Attribut haben kann.

↗ Beispiel für eine DTD-Datei (Dokumenttypdefinition)
↗ Beispiel für eine XSD-Datei (Schema)

NB: Nicht für jeden XML-Dialekt wird der Aufwand betrieben und ein eigenes Schema veröffentlicht. Viele Formate übernehmen synekdochisch den Namen der Metasprache und behalten die Erweiterung .xml.

Einhaltung der Spezifikation führt zu Validität, Wohlgeformtheit vorausgesetzt.

↗ Diese Seite validieren.

Bedeutung

Die erwähnte Erweiterbarkeit und gleichzeitig Strukturiertheit und damit Sicherheit macht XML zu einem beliebten Austauschformat  XLIFF  TMX  TBX, aber eben auch zu einem leistungsfähigen Ressourcenformat  RESX  TS.

xml-DateiScreenshot einer .resx-Ressource (.NET)

Sogar für WYSIWYG wird XML benutzt. DOCX-Dateien basieren auf dem XML-Dialekt WordML. Auch IDML, das Austauschformat für Adobe InDesign, und der E-Book-Standard EPUB basieren auf XML.

(NB: Die zuletzt genannten Formate selbst sind ZIP-Container und zählen nicht zu den XML-Ressourcen in unserem Sinne.)

Ordnerstruktur einer DOCX-DateiScreenshot einer WYSIWYG-Datei (DOCX)

Ordnerstruktur einer DOCX-DateiOrdnerstruktur im zugrunde liegenden ZIP-Archiv

Ausschnitt aus dem WordML-Quelltext eines Word-DokumentsAusschnitt aus dem WordML-Quelltext dieses Dokuments

Filterherstellung in memoQ und Studio

Dateierkennung

grafisch im Filter

  • memoQ: URL des Schemas und / oder Wurzelelement. Die Angabe kann in der Filterdefinition zur Not aber auch unterbleiben. Dann wählt man den passenden Filter eben manuell beim Import.
  • Studio: Wurzelelement und / oder Dateierweiterung und / oder URL der Schemadatei und / oder DOCTYPE und / oder XML-Namensraum; die Angabe muss im Filter selbst erfolgen, weil Trados die Möglichkeit einer manuellen Filterwahl beim Import nicht bietet. Man muss Trados also vorher eine zuverlässige Entscheidungshilfe in die Hand geben.

Inhalt definieren (einsprachige Ressource)

  • memoQ: grafisch
  • Studio: grafisch oder mit XPath

Inhalt definieren (mehrsprachige Ressource)

  • memoQ wird ohne Filter für mehrsprachige XML-Ressourcen ausgeliefert, erlaubt aber dessen benutzerseitige Herstellung grafisch oder mit XPath.
  • Trados Studio wird ohne Filter für mehrsprachige XML-Ressourcen ausgeliefert und erlaubt auch nicht die benutzerseitige Herstellung eines solchen (Stand: Studio 2019 SR 2).

Platzhalter und Inline-Tags definieren

  • memoQ: grafisch im Tab Sonstige Tags und Attribute oder mit RegEx in nachgeschaltetem RegexTagger
  • Trados: klären

Beispieldateien

↗ XML-Ressourcen

  1. SL-Markt 2015 nach Größe (Weltmarkt)
  2. SL-Markt in Deutschland 2015 nach Profil
  3. Übersetzerisches Fremdkonzept in der SL
  4. Was? Übersetzerisches Selbstkonzept in der SL
  5. Wie? Vorgehensmodelle in der Softwarelokalisierung
  6. Desintegration translatorischer Teilprozesse
  7. Kooperationsdistanz in der Softwarelokalsiierung
  8. GILT
  9. Lokalisierung
  10. Internationalisierung
  11. Personalisierung
  12. Kodierung
  13. CSV
  14. Key-Value-Tabellen
  15. XML-Ressourcen
  16. Quelltextdateien
  17. Binärdateien
  18. Typen dateibasierter Ressourcen
  19. Internationalisierung (I18N): Praxis
  20. UI-Textsorten
  21. Linguistische Probleme in der Softwarelokalisierung
  22. Assimilation
  23. Numerusbehandlung (plural handling, pluralization)
  24. Translation Scripting