Finn L wrote:
> Hej alle
>
> Jeg har brug for at kunne initiere en String med en hex værdi og skrive den
> til en fil.
> Følgende virker fint med hex værdier op til 7F.
SKRÅÅÅÅÅÅÅÅK ! Character Encoding ! Character Encoding ! SKRÅÅÅÅÅÅÅÅK !
>>baf!<< - så nu fik jeg den papegøje til at holde næbbet.
--
Nå, men en karakter (char) er et symbol i et skriftsprog. For at
få computere til at kunne arbejde med disse, kodes hver karakter
om til et tal (det er der mange måder at gøre på), og når det skal
skrives i filer kodes disse tal om til en eller flere bytes hver.
Eksempler : US-ASCII : Der er kun ca. 100 karakterer repræsenteret.
De kodes til tal mellem 32 og 127. Disse tal kodes til bytes med
samme værdi.
ISO-1189-1 : Ca. 220 karakterer. Kodes til tal mellem 0 og 255. Disse
tal kodes til bytes med samme værdi.
GB-2312-1980 : Ca 10000 kinesiske tegn, og US-ASCII, og nogle andre
kodes til talpar (a,b) eller tal (a). Alle disse kodes til en byte,
eller to bytes.
Unicode : Ca. 60000 tegn kodes til tal mellem 0 og ... øøh, ca. 60000.
Disse kodes til bytes på en af nogle forskellige måder:
UTF-8: en, to eller tre bytes pr. tal
UTF-16LE: to bytes pr. tal,
UTF-16BE: to bytes pr. tal, men modsat rækkefølge.
(se
www.unicode.org)
Det bliver nu hurtigt forvirrende når men f. eks. ikke er helt sikker på
hvilken encoding ens programmer bruger til at fortolke ens filer efter
når man indlæser, eller til at kode med når programmet skriver igen. Dog
kan det tvangsstyres i f x Java.
Morale : Brug Strings og chars til at repræsentere tegn og andre
sproglige småkomponenter
-- og kun det !
MVH
Søren
--
Fjern de 4 bogstaver i min mailadresse som er indsat for at hindre s...
Remove the 4 letter word meaning "junk mail" in my mail address.