konvertieren von zeichen in utf8 encoding
maexchen 05.03.2004 - 14:06 832 3
maexchen
Little Overclocker
|
Servus! Ich bräuchte Hilfe beim konvertieren von sonderzeichen und umlauten aus anderen sprachen(Slowakisch, Polnisch, etc.) in die entsprechenden utf8 codierung für html. Alle Zeichen sind im "Latin Extended-A" Zeichen Tabelle drinnen. Zum Beispiel soll: š > &_#x0161; (ohne underscore) ť > &_#x0165; (ohne underscore) in die entsprechenden Htmlcodes für Utf 8 Charset umgewandelt werden. Kennt jemand ein Programm oder Script (am besten PHP oder Perl), dass dies machen kann? Danke im voraus, cu maexchen
|
atrox
in fairy dust... I trust!
|
bei solchen umwandlungen mußt halt immer auch wissen woher du umwandelst. welche codepage hat die quelle ?
falls du formular-daten verwendest, dann laß dir doch die form-daten auch gleich als utf-8 schicken.
|
maexchen
Little Overclocker
|
hi atrox!
die texte, die ich bekommen habe, sind in einem word file drinnen bzw. in einer mail und sollen auf eine html seite. slowakisch hat die codepage "windows-1250" und polnisch "ISO-8859-2".
ich habe mir ein php script geschrieben, dass die texte aus einem eingabe formular ausliest und es umwandeln soll. aber das script funktioniert nicht so ganz.
leider konnte ich deinen 2.ten vorschlag von dir nicht testen, da ich nicht weiss wie man die formdaten direkt ins utf-8 format verschickt. falls du aber die konvertierung in die utf-8 zeichen meinst, die man auch mit der php function utf8_encode bekommt (zb: ľ für ľ ) dann nützt es mir leider auch nichts. da ich den entsprechenden htmlcode (&_#x0165; ohne underscore)benötige.
cu maexchen
|
watchout
Legendundead
|
warum brauchst du denn eigentlich den html-code? wenn du das charset richtig definierst solltest du auch kein problem mit den sonderzeichen haben also, sag mal lieber was du damit bezwecken willst, vielleicht gibts ja eine viel bessere/einfachere lösung
|