XML-Namen

(Auszug aus "XML in a Nutshell" von Elliotte Rusty Harold & W. Scott Means)

Die XML-Spezifikation ist manchmal übergenau und pingelig, dennoch versucht sie, effizient zu sein, wo immer es möglich ist. Eine Methode hierzu besteht darin, nach Möglichkeit für unterschiedliche Dinge die gleichen Regeln zu verwenden. Zum Beispiel entsprechen die Regeln für XML-Elementnamen den Regeln für XML-Attributnamen und auch denen für verschiedene weniger gebräuchliche Konstrukte. All das bezeichnet man gemeinsam als XML-Namen.

Element- und andere XML-Namen dürfen im Wesentlichen jedes beliebige alphanumerische Zeichen enthalten. Dazu gehören die normalen (im Englischen gebräuchlichen) Buchstaben A bis Z und a bis z sowie die Ziffern 0 bis 9. XML-Namen können auch nicht-englische Buchstaben, Zahlen und Ideogramme enthalten, wie etwa ö, ç, Ω und 串. Außerdem dürfen diese drei Interpunktionszeichen enthalten sein:

  • _ (der Unterstrich)
  • - (der Bindestrich)
  • . (der Punkt)

In XML-Namen dürfen keine anderen Interpunktionszeichen vorkommen, etwa Anführungszeichen, Apostrophe, Dollar-Zeichen, Klammern, Prozentzeichen und Semikolons. Der Doppelpunkt ist erlaubt, sein Einsatz ist jedoch für Namensräume reserviert, wie unter Namensräume ausgeführt wird. XML-Namen dürfen keinen Whitespace irgendwelcher Art enthalten, weder normale Leerzeichen noch Zeilenumbruch (Carriage Return), Seitenvorschub (Line Feed), geschützte Leerzeichen oder Ähnliches. Außerdem sind alle Namen, die die Buchstabenfolge XML in beliebiger Groß- oder Kleinschreibung enthalten, für die Standardisierung XML-bezogener W3C-Spezifikationen reserviert.

Anmerkung: Das wichtigste neue Feature in XML 1.1 ist, dass XML-Namen Zeichen enthalten können, die erst in Unicode 3.0 oder später definiert werden. XML 1.0 ist auf die Zeichen beschränkt, die in Unicode 2.0 definiert wurden. Zu den zusätzlichen Schriften, die von XML 1.1 für Namen zulässig gemacht werden, zählen Burmesisch, Mongolisch, Thaana, Kambodschanisch, Yi und Amharisch. (All diese Schriften sind in XML 1.0 in Textinhalten bereits erlaubt. Sie können sie nur nicht verwenden, um Elemente, Attribute oder Entities zu benennen.) Für Entwickler, die diese Schriften in ihrem Markup nicht verwenden müssen, bietet XML 1.1 wenig oder keine Vorteile.
XML 1.1 gestattet auch, dass Namen einige ungewöhnliche Symbole enthalten können, wie das musikalische Symbol für ein sechs-saitiges Griffbrett, und außerdem so ungefähr eine Million Codepunkte, denen zurzeit überhaupt noch keine Zeichen zugeordnet sind. Es wäre aber ziehmlich unvernünftig, das einzusetzen. Wir empfehlen Ihnen eindringlich, sich bei Ihren Namen auch in XML 1.1 auf Buchstaben, Ziffern, Ideogramme und die ausdrücklich erlaubten ASCII-Interpunktionszeichen zu beschränken.

XML-Namen müssen mit einem Buchstaben, einem Ideogramm oder dem Unterstrich beginnen. Am Anfang darf keine Ziffer, kein Bindestrich und kein Punkt stehen. Es gibt für Element- oder andere XML-Namen keine Längenbeschränkung. Damit sind die folgenden Elemente alle wohlgeformt:

  • <KFZ-Kennzeichen>K-LM 1002</KFZ-Kennzeichen>

  • <Tag-Monat-Jahr>23/7/2001</Tag-Monat-Jahr>

  • <vorname>Alan</vorname>

  • <_4-lane>I-610</_4-lane>

  • <téléphone>011 33 91 55 27 55 27</téléphone>

  • <ονομα>Melina Merkouri</ονομα>

Diese Elemente sind nicht zulässig:

  • <Driver's_License_Number>98 NY 32</Driver's_License_Number>

  • <Tag/Monat/Jahr>23/7/2001</Tag/Monat/Jahr>

  • <first name>Alan</first name>

  • <4-lane>I-610</4-lane>

  

<< zurück vor >>

 

 

 

Tipp der data2type-Redaktion:
Zum Thema XML bieten wir auch folgende Schulungen zur Vertiefung und professionellen Fortbildung an:

  


Copyright © 2005 O'Reilly Verlag GmbH & Co. KG
Für Ihren privaten Gebrauch dürfen Sie die Online-Version ausdrucken.
Ansonsten unterliegt dieses Kapitel aus dem Buch "XML in a Nutshell" denselben Bestimmungen, wie die gebundene Ausgabe: Das Werk einschließlich aller seiner Teile ist urheberrechtlich geschützt. Alle Rechte vorbehalten einschließlich der Vervielfältigung, Übersetzung, Mikroverfilmung sowie Einspeicherung und Verarbeitung in elektronischen Systemen.

O’Reilly Verlag GmbH & Co. KG, Balthasarstraße 81, 50670 Köln, kommentar(at)oreilly.de