Weiter: Grammatik Zurück: Kodierungssystem Hoch: Entwicklung eines Kodierungssystems für

Sortierverhalten

Die Notwendigkeit, lexikalisch sortierte Listen von Daten zu erzeugen, entsteht an den Stellen, wo einem Menschen die weitere (manuelle) Suche in Datenbeständen nicht erspart werden kann (z.B. umfangreiches Anfrageergebnis, alphabetischer Index als Hypertext).

Zum Abschluß folgt deshalb noch ein Beispiel zum Sortierverhalten der Kodierung anhand von Tabelle 2. Die Reihenfolge ergibt sich aus einer einfachen Sortierung nach den ASCII-Werten der Zeichen der kodierten Zeichenketten, wie sie jedes Datenbanksystem und jede Standard-Sortierroutine durchführen kann.

  
Table 2: Beispiel zum Sortierverhalten

An der Anordnung der Paare Ampere---Ampère, apfel---äpfel und lambda-Kalkül----Kalkül werden die Schwächen dieser Sortierung deutlich.

Genügt die erreichte Sortierqualität nicht, kann in einem Anwendungsprogramm, wieder unter Verwendung von Standard-Sortierroutinen, nachsortiert werden, indem eine Sortierrepräsentation der Zeichenketten durch einfaches Weglassen aller Erweiterungszeichen erzeugt wird. Tabelle 3 zeigt die sich daraus ergebene Reihenfolge, wobei gleichzeitig die häufig unerwünschte Unterscheidung zwischen Groß- und Kleinschreibung aufgehoben wurde.

  
Table 3: Beispiel nur Nachsortierung

Bei dieser einfachen Variante ist die Reihenfolge für die Zeichenketten, welche gleichen Sortierwert besitzen (Ampere---Ampère, Apfel---apfel---äpfel, Banane---banane, Lambda-Kalkül---lambda-Kalkül----Kalkül) nicht determiniert bzw. vom Sortierverfahren abhängig. Die Behandlung von ß als ss ist auch nicht gewährleistet.



Holger Westphal
Tue Sep 26 15:36:15 MET 1995