Hallo zusammen
Ich habe die Daten der Post inzwischen soweit bearbeitet, dass sie im richtigen Format für das Vergleichsscript sind.
Ich konnte ein wenig mit den Daten experimentieren und habe ein Script geschrieben, welches die Daten (Strassenname, PLZ) einliest und in einer OSM Datei Strassen mit diesen Namen heraussucht und ihnen die PLZ zuordnen kann. Da das Ergebnis sowieso manuell überprüft werden muss (Ein Strassenname kann in zwei Orten vorkommen), mache ich zusätzlich ein Fuzzy-Matching mit Hilfe der Levenshtein Distanz [1]. Wert von zwei bis drei bringen da noch sinnvolle, zusätzliche Treffer.
Ich bin bis jetzt noch nicht dazu gekommen, das Script zu vervollständigen, aber wen es interessiert, es liegt unter [2].
Gruess, Andy
[1] http://de.wikipedia.org/wiki/Levenshtein-Distanz [2] http://www.knitter.ch/src/snipplets/osm/plz.tar.gz (findplz.py <osm> <csv>)