XML-Ressourcen

Definition

  • XML = extensible markup language
  • Plain-Text-Format zur hierarchischen strukturierten Ablage von Daten in Elementen

Syntax

XML als Metasprache

Die XML-Spezifikation bringt zunächst nur einen allgemeinen Regelsatz ohne konkrete Anwendungsmöglichkeiten mit. Beispiele für solche Regeln:

  • Hauptkonstrukt ist das Element. Ein Element kann Attribute haben.
  • Mit den Elementen und Attributen können die Inhalte ausgezeichnet werden, d. h. Eigenschaften zugewiesen. XML ist eine Auszeichnungssprache.
  • Die Elemente (Knoten) können hierarchisch einander über-, neben- oder untergeordnet werden (Eltern-, Geschwister- und Kindknoten) → Baumstruktur.
  • Eine XML-Datei hat genau ein Wurzelelement.
  • Jedes Element (im nachfolgenden Beispiel span) öffnet und schließt. In den meisten Fällen geschieht dies mittels Anfangs- und End-Tag  <span>Lorem ipsum</span>. Alleinstehende Tags (Tags, die nur einen Punkt / die keine Spanne repräsentieren und deswegen keinen Anfangs- und End-Tag haben können) müssen sich selbst schließen  <br />.
  • Die Schachtelung (Nestung) dieser Tags und damit die Elementstruktur muss symmetrisch sein.

Einhaltung der Spezifikation führt zu Wohlgeformtheit.

XML-Sprachen (Dialekte)

Die XML-Spezifikation kann um ein Schema (XML Schema Definition, Dateierweiterung .xsd) oder eine Dokumenttypdefinition (Document Type Description, Erweiterung .dtd) erweitert und das Format so einer konkreten Anwendung zugeführt werden – daher das X (für Extensible) in XML. Eine solche Spezifikation legt u. a. fest, welche Elemente auf welcher Hierarchieebene existieren können oder müssen und wie viele davon; ob ein Element leer sein kann, welche Attribute ein Element haben kann oder muss und welche Werte ein solches Attribut haben kann.

↗ Beispiel für eine DTD-Datei (Dokumenttypdefinition)
↗ Beispiel für eine XSD-Datei (Schema)

NB: Nicht für jeden XML-Dialekt wird der Aufwand betrieben und ein eigenes Schema veröffentlicht. Viele Formate übernehmen synekdochisch den Namen der Metasprache und behalten die Erweiterung .xml.

Einhaltung der Spezifikation führt zu Validität, Wohlgeformtheit vorausgesetzt.

↗ Diese Seite validieren.

Bedeutung

Die erwähnte Erweiterbarkeit und gleichzeitig Strukturiertheit und damit Sicherheit macht XML zu einem beliebten Austauschformat  XLIFF  TMX  TBX, aber eben auch zu einem leistungsfähigen Ressourcenformat  RESX  TS.

xml-DateiScreenshot einer .resx-Ressource (.NET)

Sogar für WYSIWYG wird XML benutzt. DOCX-Dateien basieren auf dem XML-Dialekt WordML. Auch IDML, das Austauschformat für Adobe InDesign, und der E-Book-Standard EPUB basieren auf XML.

(NB: Die zuletzt genannten Formate selbst sind ZIP-Container und zählen nicht zu den XML-Ressourcen in unserem Sinne.)

Ordnerstruktur einer DOCX-DateiScreenshot einer WYSIWYG-Datei (DOCX)

Ordnerstruktur einer DOCX-DateiOrdnerstruktur im zugrunde liegenden ZIP-Archiv

Ausschnitt aus dem WordML-Quelltext eines Word-DokumentsAusschnitt aus dem WordML-Quelltext dieses Dokuments

Filterherstellung in memoQ und Studio

Dateierkennung

grafisch im Filter

  • memoQ: URL des Schemas und / oder Wurzelelement. Die Angabe kann in der Filterdefinition zur Not aber auch unterbleiben. Dann wählt man den passenden Filter eben manuell beim Import.
  • Studio: Wurzelelement und / oder Dateierweiterung und / oder URL der Schemadatei und / oder DOCTYPE und / oder XML-Namensraum; die Angabe muss im Filter selbst erfolgen, weil Trados die Möglichkeit einer manuellen Filterwahl beim Import nicht bietet. Man muss Trados also vorher eine zuverlässige Entscheidungshilfe in die Hand geben.

Inhalt definieren (einsprachige Ressource)

  • memoQ: grafisch
  • Studio: grafisch oder mit XPath

Inhalt definieren (mehrsprachige Ressource)

  • memoQ wird ohne Filter für mehrsprachige XML-Ressourcen ausgeliefert, erlaubt aber dessen benutzerseitige Herstellung grafisch oder mit XPath.
  • Trados Studio wird ohne Filter für mehrsprachige XML-Ressourcen ausgeliefert und erlaubt auch nicht die benutzerseitige Herstellung eines solchen (Stand: Studio 2019 SR 2).

Platzhalter und Inline-Tags definieren

  • memoQ: grafisch im Tab Sonstige Tags und Attribute oder mit RegEx in nachgeschaltetem RegexTagger
  • Trados: klären

Beispieldateien

↗ XML-Ressourcen

↗ 04-TLG-2011 Übersetzungsprojekt „Softwarelokalisierung“ 2. Semester
  1. SL-Markt 2015 nach Größe (Weltmarkt)
  2. SL-Markt in Deutschland 2015 nach Profil
  3. Übersetzerisches Fremdkonzept in der SL
  4. Was? Übersetzerisches Selbstkonzept in der SL
  5. Wie? Vorgehensmodelle in der Softwarelokalisierung
  6. Desintegration translatorischer Teilprozesse
  7. Kooperationsdistanz in der Softwarelokalsierung
  8. GILT
  9. Lokalisierung
  10. Internationalisierung
  11. Personalisierung
  12. Kodierung
  13. CSV
  14. Key-Value-Tabellen
  15. XML-Ressourcen
  16. Quelltextdateien
  17. Binärdateien
  18. Typen dateibasierter Ressourcen
  19. Internationalisierung (I18N): Praxis
  20. UI-Textsorten
  21. Assimilation
  22. Numerusbehandlung (plural handling, pluralization)
  23. Linguistische Probleme in der Softwarelokalisierung
  24. Translation Scripting

Kontakt, Impressum, Datenschutzerklärung

Bitte beachten Sie die Aktuellen Informationen des Krisenstabs der Universität zum Umgang mit dem Virus COVID-19 („Coronavirus“).
Hochschulrat hat in seiner Sitzung am 3.4. die Einstellung des Sprachschwerpunkts Russisch bestätigt.
Erbringen von Prüfungsleistungen, Abgabe von Hausarbeiten und Auftakt des Sommersemesters in digitaler Form.
Sonderseite des Studienbüros der Philologischen Fakultät zur aktuellen Situation rund um COVID-19
Laut Mitteilung des Rektorats vom 20. März müssen alle Fälle einer Corona-Erkrankung oder ‑Quarantäne auch unter Studierenden an corona@uni-leipzig.de gemeldet werden.
Hinweise zu den Computerpools: Ihre Einstellungen und Daten werden auf Laufwerk U:\ gespeichert. Sollte das Laufwerk bei Ihnen nicht erscheinen, so schreiben Sie bitte von Ihrer studserv-Adresse aus eine Mail an Herrn Sören Kümmeritz, damit dieser Ihren Login mit einträgt.
Für Studierende, die sich nach TOOL-Schluss noch für ein Modul anmelden möchten: Formular Modulanmeldung ausfüllen und im Studienbüro GWZ H5 4.02 abgeben.