Nossikon

Unicode-Fonts für die schweizerische Ortsnamenforschung

View the Project on GitHub idiotikon-ch/nossikon

Zeichen-Mapping

Mapping-Tabellen

Für die folgenden Fonts liegen Mapping-Tabellen als tab-separated values (TSV) vor:

Die Tabellen enthalten in der ersten Spalte jeweils die dezimalen Codepoints des Ausgangsfonts und in den folgenden Spalten die entsprechende Codepoint-Sequenz in Nossikon (NFD-normalisiert). Hier ein paar Beispiele aus den Mappings für Nidwalda:

[Nidwalda]  [Nossikon]
305         105
8800        111  803
710         772
8721        117  815  776
216         del
57          null

Der Wert del bedeutet, dass das Zeichen ersatzlos gelöscht werden soll, null bezeichnet explizit nicht gemappte Zeichen (z.B. weil sie scheinbar unbenutzt sind).

Skript für die Umwandlung

Unter scripts/ ist ein Python3-Skript map.py zu finden, das die Umkodierung von Text erleichtern soll:

$ scripts/map.py mappings/Adlikon.tsv < my_adlikon_file.txt
$ scripts/map.py --to-files mappings/Nidwalda.tsv \
      my_nidwalda_file1.txt my_nidwalda_file2.txt
$ ls
my_nidwalda_file1.txt         my_nidwalda_file2.txt
my_nidwalda_file1.txt.mapped  my_nidwalda_file2.txt.mapped