Unicode-Fonts für die schweizerische Ortsnamenforschung
Für die folgenden Fonts liegen Mapping-Tabellen als tab-separated values (TSV) vor:
Die Tabellen enthalten in der ersten Spalte jeweils die dezimalen Codepoints des Ausgangsfonts und in den folgenden Spalten die entsprechende Codepoint-Sequenz in Nossikon (NFD-normalisiert). Hier ein paar Beispiele aus den Mappings für Nidwalda:
[Nidwalda] [Nossikon]
305 105
8800 111 803
710 772
8721 117 815 776
216 del
57 null
Der Wert del
bedeutet, dass das Zeichen ersatzlos gelöscht werden soll, null
bezeichnet explizit nicht gemappte Zeichen (z.B. weil sie scheinbar unbenutzt sind).
Unter scripts/
ist ein Python3-Skript map.py
zu finden, das die Umkodierung von Text erleichtern soll:
$ scripts/map.py mappings/Adlikon.tsv < my_adlikon_file.txt
$ scripts/map.py --to-files mappings/Nidwalda.tsv \
my_nidwalda_file1.txt my_nidwalda_file2.txt
$ ls
my_nidwalda_file1.txt my_nidwalda_file2.txt
my_nidwalda_file1.txt.mapped my_nidwalda_file2.txt.mapped