Python, UTF8 und BOM (byte order mark)
Wenn man Dateien im UTF-8 Format speichert mit BOM kann es vorkommen das dass erste Zeichen, was bei euch in Python ankommt nicht das ist, was ihr erwartet habt. Bei mir kam beim lesen ein \ufeff an anstatt dem erwarteten Buchstaben. Sicher könnt man nun sagen, bei der 1. Zeile einfach den 1. Buchstaben ignoreren. Das wäre aber zu einfach!
Weg bekommt ihr die BOM mit folgendem kleinen Konstrukt:
“Zeile”.lstrip( unicode( codecs.BOM_UTF8, “utf8″ ) )