/ Forside / Teknologi / Udvikling / HTML / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
HTML
#NavnPoint
molokyle 11184
Klaudi 5506
bentjuul 3377
severino 2040
smorch 1950
strarup 1525
natmaden 1396
scootergr.. 1320
e.c 1150
10  miritdk 1110
Charset - ÆØÅ problemer
Fra : Daniel_Skov


Dato : 05-07-11 10:28

Hej webdesignere

Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
lave.
På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
man følger et link til de andre sider kan den ikke vise ÆØÅ.

På alle andre sider end forsiden har jeg derfor skiftet charset
til: "iso-8859-1"
Men har hørt noget om, at man ikke bør gøre det er det en skrøne
eller skal jeg finde en anden løsning?

--
Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
- Pædagogiske tutorials på dansk
- Kom godt i gang med koderne
KLIK HER! => http://www.html.dk/tutorials

 
 
Andreas Andersen (05-07-2011)
Kommentar
Fra : Andreas Andersen


Dato : 05-07-11 10:35

Den 05-07-2011 11:27, Daniel_Skov skrev:
> Hej webdesignere
>
> Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
> lave.
> På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
> man følger et link til de andre sider kan den ikke vise ÆØÅ.
>
> På alle andre sider end forsiden har jeg derfor skiftet charset
> til: "iso-8859-1"
> Men har hørt noget om, at man ikke bør gøre det er det en skrøne
> eller skal jeg finde en anden løsning?

Det er en smagssag hvilket charset, man skal bruge, men jeg synes som
minimum, du bør bruge det samme på alle dine sider. Har du gemt alle
filerne i det samme format?

--
Andreas


Daniel_Skov (05-07-2011)
Kommentar
Fra : Daniel_Skov


Dato : 05-07-11 11:57

Andreas Andersen wrote in dk.edb.internet.webdesign.html:
> Den 05-07-2011 11:27, Daniel_Skov skrev:
> > Hej webdesignere
> >
> > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
> > lave.
> > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
> > man følger et link til de andre sider kan den ikke vise ÆØÅ.
> >
> > På alle andre sider end forsiden har jeg derfor skiftet charset
> > til: "iso-8859-1"
> > Men har hørt noget om, at man ikke bør gøre det er det en skrøne
> > eller skal jeg finde en anden løsning?
>
> Det er en smagssag hvilket charset, man skal bruge, men jeg synes som
> minimum, du bør bruge det samme på alle dine sider. Har du gemt alle
> filerne i det samme format?
>
> --
> Andreas
>
Det kommer an på hvad du tænker på?

Jeg har både gif, jpg og andre filformater på hjemmesiden.
Alle sider, hvis det er det du mener, er .html

koder i html5 og css3.


--
Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
- Pædagogiske tutorials på dansk
- Kom godt i gang med koderne
KLIK HER! => http://www.html.dk/tutorials

Andreas Andersen (05-07-2011)
Kommentar
Fra : Andreas Andersen


Dato : 05-07-11 12:10

Den 05-07-2011 12:57, Daniel_Skov skrev:
> Det kommer an på hvad du tænker på?
>
> Jeg har både gif, jpg og andre filformater på hjemmesiden.
> Alle sider, hvis det er det du mener, er .html
>
> koder i html5 og css3.

Prøv at åbne HTML-filerne i Notepad og vælg "Save as". Der er en
dropdown, der hedder "Encoding", hvor du kan vælge UTF-8. Den er på
forhånd sat til det format filen er i i forvejen. Hvis du vælger UTF-8
som dit charset, skal du også gemme HTML-filerne i UTF-8.

--
Andreas

Birger Sørensen (05-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 05-07-11 12:40

Efter mange tanker skrev Daniel_Skov:
> Hej webdesignere
>
> Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
> lave.
> På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
> man følger et link til de andre sider kan den ikke vise ÆØÅ.
>
> På alle andre sider end forsiden har jeg derfor skiftet charset
> til: "iso-8859-1"
> Men har hørt noget om, at man ikke bør gøre det er det en skrøne
> eller skal jeg finde en anden løsning?

Som jeg har forstået tingene er default karakterset før HTML5
ISO-8859-1, iflg. standarderne.
HTML5 vil gerne ændre det til UTF8.
Og med default menes, det der anvendes, hvis du ikke giver noget.
Det er vist nok så sådan, at ikke alle browsere overholder standarderne
på det område. Så uanset hvad du gør, bør der angives karatersæt -
enten i http-headere som serveren sætter, eller i en <meta...>

Og uanset hvad du vælger, skal formatet passe med din kildekode. Hvis
du viser HTML som UTF8, skal din kilde også gemmes i UTF8. Ellers går
det naturligvis galt.
ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange
navne.
Og det problem du har, er formentlig netop med formatet du gemmer
kildekoden i.

Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
men mon ikke han finder på at poste det?

Et par andre gode råd:
Find et andet sted at lære end html.dk
NG kan læses fra google, eller i dit emailprogram eller en newsreader.
Se evt. http://usenet.dk
hmtl.dk er forældet, og har ikke længere andet formål end at konvertere
andres frivillige arbejde til reklameindtægter.

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 14:53

On 05-07-2011 13:40, Birger Sørensen wrote:

> Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
> men mon ikke han finder på at poste det?

> Birger
>

Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation
i fredags

Du kan læse lidt om tegnsæt, og hvordan du gemmer korrekt i forskellige
editorer her:
http://webdesign.ranunkelvej.com/tegnsaet/index.php

Birger; jeg mener at html5 anbefales at bruge utf-8, men da jeg er lige
ved at vinde en etape i tour de france, har jeg ikke tid til at finde
dokumentation

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Birger Sørensen (05-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 05-07-11 15:10

Karl Erik Christensen formulerede tirsdag:
> On 05-07-2011 13:40, Birger Sørensen wrote:
>
>> Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
>> men mon ikke han finder på at poste det?
>
>> Birger
>>
>
> Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation i
> fredags
>
> Du kan læse lidt om tegnsæt, og hvordan du gemmer korrekt i forskellige
> editorer her:
> http://webdesign.ranunkelvej.com/tegnsaet/index.php
>
> Birger; jeg mener at html5 anbefales at bruge utf-8, men da jeg er lige ved
> at vinde en etape i tour de france, har jeg ikke tid til at finde
> dokumentation
>
> Karl Erik.

Det glæder os da, at du nu ikke længere har belæg for at brokke dig

Jeg har tilladt mig at tilføje dit link, til dem jeg finder nyttige på
bbsorensen.dk/?men=Link/Software
Der er lidt forvirring på
http://webdesign.ranunkelvej.com/tegnsaet/page_3.php
omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget
andet.
Enten må du være konsekvent eller forklare forskellen.
Jeg har min brok endnu ^^

Jeg mener også at have set at med HTML5 anbefales UTF8.

Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke
vende tilbage. Så sid stille i sadlen...

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 17:14

On 05-07-2011 16:09, Birger Sørensen wrote:

> Der er lidt forvirring på
> http://webdesign.ranunkelvej.com/tegnsaet/page_3.php
> omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget andet.
> Enten må du være konsekvent eller forklare forskellen.
> Jeg har min brok endnu ^^
>
> Jeg mener også at have set at med HTML5 anbefales UTF8.
>
> Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke
> vende tilbage. Så sid stille i sadlen...
>
> Birger
>

Forskellen på 8859-1 og 8859-15 er beskrevet på:

http://en.wikipedia.org/wiki/ISO/IEC_8859-1

Forskellen er:

ISO/IEC 8859-1 is missing some characters for French and Finnish text
and the euro sign. In order to provide some of these characters, ISO/IEC
8859-15 was developed as an update of ISO/IEC 8859-1

Der gøres også rede for windows-1252 contra 8859-1:

The Windows-1252 codepage coincides with ISO-8859-1 for all codes except
the range 128 to 159 (hex 80 to 9F), where the little-used C1 controls
are replaced with additional characters. Windows-28591 is the actual
ISO-8859-1 codepage

Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.
8859-1 kræver at man skriver &euro; medens man med 8859-15 bare kan
skrive ¤ - det er eneste forskel for os danskere.

Med utf-8 er alt straight forward - bare brug tastaturet og tænk på de
søde sygeplejesker i Frederikshavn

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 18:48

On 05-07-2011 18:13, Karl Erik Christensen wrote:

> Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.

Fejlen er rettet. Forhåbentlig til noget der kan forstås.

http://webdesign.ranunkelvej.com/tegnsaet/page_3.php

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Birger Sørensen (06-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 06-07-11 07:51

Efter mange tanker skrev Karl Erik Christensen:
> On 05-07-2011 18:13, Karl Erik Christensen wrote:
>
>> Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.
>
> Fejlen er rettet. Forhåbentlig til noget der kan forstås.
>
> http://webdesign.ranunkelvej.com/tegnsaet/page_3.php
>
> Karl Erik.

Møj beder ^^

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Birger Sørensen (05-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 05-07-11 21:25

Karl Erik Christensen kom med følgende:
> On 05-07-2011 16:09, Birger Sørensen wrote:
>
>> Der er lidt forvirring på
>> http://webdesign.ranunkelvej.com/tegnsaet/page_3.php
>> omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget andet.
>> Enten må du være konsekvent eller forklare forskellen.
>> Jeg har min brok endnu ^^
>>
>> Jeg mener også at have set at med HTML5 anbefales UTF8.
>>
>> Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke
>> vende tilbage. Så sid stille i sadlen...
>>
>> Birger
>>
>
> Forskellen på 8859-1 og 8859-15 er beskrevet på:
>
> http://en.wikipedia.org/wiki/ISO/IEC_8859-1
>
> Forskellen er:
>
> ISO/IEC 8859-1 is missing some characters for French and Finnish text and the
> euro sign. In order to provide some of these characters, ISO/IEC 8859-15 was
> developed as an update of ISO/IEC 8859-1
>
> Der gøres også rede for windows-1252 contra 8859-1:
>
> The Windows-1252 codepage coincides with ISO-8859-1 for all codes except the
> range 128 to 159 (hex 80 to 9F), where the little-used C1 controls are
> replaced with additional characters. Windows-28591 is the actual ISO-8859-1
> codepage
>
> Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.
> 8859-1 kræver at man skriver &euro; medens man med 8859-15 bare kan skrive ¤
> - det er eneste forskel for os danskere.
>
> Med utf-8 er alt straight forward - bare brug tastaturet og tænk på de søde
> sygeplejesker i Frederikshavn
>
> Karl Erik.

Jow - jeg ved det godt.
Men det gør folk der har tegnproblemer formentlig ikke.
Derfor er det stadig forvirrende, at du skriver filen er gemt som -15
og meta-tagger siger -1.
Det bør i øvrigt hedde -15 i meta tagget, hviss filen er gemt som
sådan-
Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
skrives som entity...

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 22:14

On 05-07-2011 22:24, Birger Sørensen wrote:

> Jow - jeg ved det godt.
> Men det gør folk der har tegnproblemer formentlig ikke.
> Derfor er det stadig forvirrende, at du skriver filen er gemt som -15 og
> meta-tagger siger -1.
> Det bør i øvrigt hedde -15 i meta tagget, hviss filen er gemt som sådan-
> Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
> skrives som entity...
>
> Birger
>

Ja, det gør du Birger, det ved jeg. Men et eller andet sted skulle jeg
jo svare

Og ja - i iso-8859-1 skal euro-tegnet skrives som entity (&euro;), det
har jeg testet

I øvrigt har jeg opdateret siden:
http://webdesign.ranunkelvej.com/tegnsaet/page_3.php

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Erik Olsen (06-07-2011)
Kommentar
Fra : Erik Olsen


Dato : 06-07-11 06:50

Birger Sørensen wrote:

> Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
> skrives som entity...

Jeg må tilstå at jeg ikke kan se problemer i at visse tegn må skrives
som entity. Det gælder under alle omstændigheder visse andre tegn som
"&" og ";"

--
Venlig hilsen/Best regards
Erik Olsen


Birger Sørensen (06-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 06-07-11 07:47

Erik Olsen forklarede den 7/6/2011:
> Birger Sørensen wrote:
>
>> Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
>> skrives som entity...
>
> Jeg må tilstå at jeg ikke kan se problemer i at visse tegn må skrives som
> entity. Det gælder under alle omstændigheder visse andre tegn som "&" og ";"

Forskellen er vel også kun at kildekoden er nemmere at læse uden
entities.
Der er reelt kun 3, man *skal* bruge emtities for: & (&amp;), < (&lt;)
og > (&gt;) - så er der læssevis af andre, som ikke findes i alle
karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad entitien
skulle hedde.
Men bemærk at der er forskel på årsagen. &,< og > er forbudte via
standarderne i HTML og XHTML. De øvrige bruger man entities for, fordi
de ikke findes i det anvendte karaktersæt - &coy; og &trade; f.eks.

Eftersom ¤ ikke findes i ISO-8859-1, skal man altså bruge &euro; hvis
man angiver det som tegnsæt for siden - også selvom man gemmer filen
som ISO-8859-15.
Men jeg er da enig, så længe det ikke går ud over æøå - for så er koden
ikke let læselig.
Det er heller ikke alle, der er klar over at ¤ skrives med ALtGr+5.

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Erik Olsen (06-07-2011)
Kommentar
Fra : Erik Olsen


Dato : 06-07-11 19:54

Birger Sørensen wrote:

> Der er reelt kun 3, man *skal* bruge emtities for: & (&amp;), < (&lt;)
> og > (&gt;) - så er der læssevis af andre, som ikke findes i alle
> karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad
> entitien skulle hedde.

Undskyld, ";" var en tanketorsk fra min side.

--
Venlig hilsen/Best regards
Erik Olsen


Birger Sørensen (06-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 06-07-11 21:35

Erik Olsen tastede følgende:
> Birger Sørensen wrote:
>
>> Der er reelt kun 3, man *skal* bruge emtities for: & (&amp;), < (&lt;)
>> og > (&gt;) - så er der læssevis af andre, som ikke findes i alle
>> karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad
>> entitien skulle hedde.
>
> Undskyld, ";" var en tanketorsk fra min side.

Helt OK - rart at vide at du kun er meneske, som os andre...

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



John (05-07-2011)
Kommentar
Fra : John


Dato : 05-07-11 15:11

Karl Erik Christensen tastede følgende:

>
> Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation i
> fredags
Satans Men så skulle der vel ikke være mere brok fra din side i
fremtiden.

Fantastisk så dygtige kirugerne er i dag. Tænke sig de kan med en kniv
rode i psyken også.
Troede brok var noget man fik i maveregionen.

--
Mvh John
www.wordpresstema.dk
www.wordpress.dk/forum
Aprilia RSV Mille



Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 19:00

On 05-07-2011 16:10, John wrote:

> Troede brok var noget man fik i maveregionen.
>

HA - har du aldrig set tegningen "Biafran artillery"?

Så vil du forstå at brok ikke altid _kun_ sidder i maveregionen

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Daniel_Skov (05-07-2011)
Kommentar
Fra : Daniel_Skov


Dato : 05-07-11 19:12

Birger Sørensen wrote in dk.edb.internet.webdesign.html:
> Efter mange tanker skrev Daniel_Skov:
> > Hej webdesignere
> >
> > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
> > lave.
> > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
> > man følger et link til de andre sider kan den ikke vise ÆØÅ.
> >
> > På alle andre sider end forsiden har jeg derfor skiftet charset
> > til: "iso-8859-1"
> > Men har hørt noget om, at man ikke bør gøre det er det en skrøne
> > eller skal jeg finde en anden løsning?
>
> Som jeg har forstået tingene er default karakterset før HTML5
> ISO-8859-1, iflg. standarderne.
> HTML5 vil gerne ændre det til UTF8.
> Og med default menes, det der anvendes, hvis du ikke giver noget.
> Det er vist nok så sådan, at ikke alle browsere overholder standarderne
> på det område. Så uanset hvad du gør, bør der angives karatersæt -
> enten i http-headere som serveren sætter, eller i en <meta...>
>
> Og uanset hvad du vælger, skal formatet passe med din kildekode. Hvis
> du viser HTML som UTF8, skal din kilde også gemmes i UTF8. Ellers går
> det naturligvis galt.
> ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange
> navne.
> Og det problem du har, er formentlig netop med formatet du gemmer
> kildekoden i.
>
> Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
> men mon ikke han finder på at poste det?
>
> Et par andre gode råd:
> Find et andet sted at lære end html.dk
> NG kan læses fra google, eller i dit emailprogram eller en newsreader.
> Se evt. http://usenet.dk
> hmtl.dk er forældet, og har ikke længere andet formål end at konvertere
> andres frivillige arbejde til reklameindtægter.
>
> Birger
>
> --
> http://varmeretter.dk - billig, sund og hurtig mad
> http://bbsorensen.dk
>

Mange tak for svarene begge to.
Jeg bruger editplus og den gemte i ANSI, ja kært barn har mange navne ;).
Den gemmer nu i utf-8 og det samme står i headeren. Så alt virker fint.

fortsat god aften.

Hilsen Daniel


--
Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
- Pædagogiske tutorials på dansk
- Kom godt i gang med koderne
KLIK HER! => http://www.html.dk/tutorials

Karl Erik Christense~ (05-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 05-07-11 19:29

On 05-07-2011 20:11, Daniel_Skov wrote:

> Mange tak for svarene begge to.
> Jeg bruger editplus og den gemte i ANSI, ja kært barn har mange navne ;).
> Den gemmer nu i utf-8 og det samme står i headeren. Så alt virker fint.
>
> fortsat god aften.
>
> Hilsen Daniel
>

Dejligt at du melder tilbage, at du fik løst problemet Daniel.

Det er desværre ikke alle der giver tilbagemelding.
Det kan være lidt frustrerende for dem der forsøger at hjælpe.

Tak.

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Stig Johansen (06-07-2011)
Kommentar
Fra : Stig Johansen


Dato : 06-07-11 11:37

Birger Sørensen wrote:

> Som jeg har forstået tingene er default karakterset før HTML5
> ISO-8859-1, iflg. standarderne.

Korrekt (bemærk HTML5).

> HTML5 vil gerne ændre det til UTF8.

Ikke korrekt.

HTML5 vil gerne have Win-1252 som standard.
http://en.wikipedia.org/wiki/Windows-1252

> Og med default menes, det der anvendes, hvis du ikke giver noget.

Korrekt, og der står vi i en skillelinie mellem HTML5 og tidligere.

> Det er vist nok så sådan, at ikke alle browsere overholder standarderne
> på det område. Så uanset hvad du gør, bør der angives karatersæt -
> enten i http-headere som serveren sætter, eller i en <meta...>

Både korrekt og....
Jeg vil gætte på at alle browsere respekterer den korrekte måde, nemlig at
sende charset med i HTTP headeren fra serveren.

Lad mig lave en analogi:
Vi går ind på et bibliotek.
Her er bøger opdelt i reoler med dansk, engelsk, osv, og 'ikke
kategoriseret'.

Ikke kategoriseret kan så underopdeles i undergrupper:
1) Bøger hvor der står i forordene: 'denne bog er på engelsk'.
2) Bøger hvor der intet står.

Kategori 1) svarer til man ikke angiver 'indhold', men beskriver det trods
alt ( aka meta tagget).

Kategori 2) svarer til at man først skal læse noget af den for derefter at
opdage at den er på engelsk og ikke på dansk.

> ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange
> navne.

Hmm... hjaah, win-1252 skiller sig vist lidt ud på linie med iso-8859-1 ;)
Ellers har du næsten ret.

Ansi er en kombination af codepoints og glyphs, og dækker over adskillige
codepages.

> Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
> men mon ikke han finder på at poste det?

Jeg tager hatten af for Karl Erik, at han 'gider', og dette indlæg skal nok
nærmest ses som en impuls til uddybende emner.

--
Med venlig hilsen
Stig Johansen

Kim Ludvigsen (06-07-2011)
Kommentar
Fra : Kim Ludvigsen


Dato : 06-07-11 10:57

Den 06-07-2011 12:36, Stig Johansen skrev:
> Birger Sørensen wrote:
>
>> HTML5 vil gerne ændre det til UTF8.
>
> Ikke korrekt.
>
> HTML5 vil gerne have Win-1252 som standard.
> http://en.wikipedia.org/wiki/Windows-1252

Sådan læser jeg ikke den side. Som jeg forstår det, vil
HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda
behandle ISO-8859-1 som Win-1252.

Der står ikke noget om UTF-8 eller UTF-8 kontra Win-1252
eller ISO-8859-1.

--
Mvh. Kim Ludvigsen
Hold dit livs drømmeferie i Thailand:
http://rejse-til-thailand.dk

Stig Johansen (06-07-2011)
Kommentar
Fra : Stig Johansen


Dato : 06-07-11 12:16

Kim Ludvigsen wrote:

> Den 06-07-2011 12:36, Stig Johansen skrev:
>> Birger Sørensen wrote:
>>
>>> HTML5 vil gerne ændre det til UTF8.
>>
>> Ikke korrekt.
>>
>> HTML5 vil gerne have Win-1252 som standard.
>> http://en.wikipedia.org/wiki/Windows-1252
>
> Sådan læser jeg ikke den side. Som jeg forstår det, vil
> HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda
> behandle ISO-8859-1 som Win-1252.

'The perception is in the eye of the beholder'...

Fra linket:
......
Most modern web browsers and e-mail clients treat the MIME charset
ISO-8859-1 as Windows-1252 in order to accommodate such mislabeling. This
is now standard behavior in the draft HTML 5 specification, which requires
that documents advertised as ISO-8859-1 actually be parsed with the
Windows-1252 encoding.
......

Bemærk 'this is now _standard_...'

Browserne opfører sig som de plejer, så der er ingen ændring der, men
_validatoren_ får strammet op på reglerne.

Browser og validator behøver ikke af hænge sammen - hvad validatoren siger
og browserne gør har i princippet intet med hinanden at gøre.

> Der står ikke noget om UTF-8 eller UTF-8 kontra Win-1252
> eller ISO-8859-1.

Nu var mit indlæg ikke ment som en p*måling, mere en uddybning af Birgers
sentens:
"HTML5 vil gerne ændre det til UTF8."
som jeg ikke føler er en rigtig formulering.

Men da 'forvirringen er total' om diverse karaktersæt, så lad mig henlede
opmærksomheden på:
http://www.iana.org/assignments/character-sets

(Og no har feelings, men man kan se, at iso-8859-15 er ækvivalent med
Latin-9, og ikke latin-1).

Undskyld til Birger ;)

Og UTF-8 er gearet til XML, da det er den mest effektive encoding af
unicode.
Se f.eks:
http://www.utf8.com/

Nu har jeg givet nogle links, som nok er en 'anelsse langhåret', men lad
være med at gå i dybden.

Fremover skal man 'kun' (i vores verden) vælge mellem win-1252 eller utf-8.

Har man ikke behov for 'eksotiske' tegn, er det bedste at vælge win-1252, da
det giver den bedste performance.

Har man læsere, hvor man har behov for 'eksotiske' tegn, skal man vælge
utf-8, der dog er det dårligst performende valg.

Alting er et valg:
a) Bedst performance = win-1252
b) Flexibilitet = utf-8.

--
Med venlig hilsen
Stig Johansen

Kim Ludvigsen (06-07-2011)
Kommentar
Fra : Kim Ludvigsen


Dato : 06-07-11 12:20

Den 06-07-2011 13:16, Stig Johansen skrev:
> Kim Ludvigsen wrote:
>> Den 06-07-2011 12:36, Stig Johansen skrev:
>>>
>>> HTML5 vil gerne have Win-1252 som standard.
>>> http://en.wikipedia.org/wiki/Windows-1252
>>
>> Sådan læser jeg ikke den side. Som jeg forstår det, vil
>> HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda
>> behandle ISO-8859-1 som Win-1252.
>
> 'The perception is in the eye of the beholder'...

Jep, og jeg tror, vi snakker lidt forbi hinanden.

> Fra linket:
> .....
> Most modern web browsers and e-mail clients treat the MIME charset
> ISO-8859-1 as Windows-1252 in order to accommodate such mislabeling. This
> is now standard behavior in the draft HTML 5 specification, which requires
> that documents advertised as ISO-8859-1 actually be parsed with the
> Windows-1252 encoding.
> .....
>
> Bemærk 'this is now _standard_...'

Ja, at ISO-8859-1 behandles som Win-1252. Ikke at Win-1252
er standard frem for UTF-8.

> Nu har jeg givet nogle links, som nok er en 'anelsse langhåret', men lad
> være med at gå i dybden.

Jeg kan ikke se, at linkene har noget med fastsættelse af et
standard-tegnsæt i HTML5 at gøre.

> Fremover skal man 'kun' (i vores verden) vælge mellem win-1252 eller utf-8.

Nemlig, der er ikke et enkelt tegnsæt som standard. Og hvis
endelig der skulle vælges et som standard, ville det ganske
givet ikke være Win-1252. Win-1252 kan være fint nok for os,
men vi er i mindretal, når man ser på verdensplan.

--
Mvh. Kim Ludvigsen
Undgå virus og andet snavs på computeren:
http://pc-sikkerhed.dk

Karl Erik Christense~ (06-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 06-07-11 12:16

On 06-07-2011 12:36, Stig Johansen wrote:

> Jeg tager hatten af for Karl Erik, at han 'gider', og dette indlæg skal nok
> nærmest ses som en impuls til uddybende emner.
>

Tak Stig - men hvor ville jeg ønske at vi kunne samle alle de gode
kræfter, på et super websted.

Jeg blev ærlig talt ret overrasket over at læse, at en spørger i dag
troede at dette forum var en html.dk service.

A'pro'pos tegnsæt, så er der vist ingen foretrukne standart i html5. Kun
"anbefalet" at bruge enten utf-8 eller iso-8859-1, men iso-8859-1 er da
efter min opfattelse allerede forældet, da den ikke er født med euro-tegnet.

Et godt eksempel på hvorfor jeg mener at utf-8 bør anvendes, er Dieter
Britz's side.
Dieter skriver sin side på engelsk, hvilket jo er helt fint når man vil
"internationalisere". Han har et link til nogle billeder "Last
performance of Rusty Båthorns".

Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i
stedet for "å".
Med utf-8 får selv en franskmand vist å'et - at han så vil sige "ce que
l'enfer est-ce un signe", er en anden sag, men han får vist å'et.

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Birger Sørensen (06-07-2011)
Kommentar
Fra : Birger Sørensen


Dato : 06-07-11 17:03

Stig Johansen kom med denne ide:
> Birger Sørensen wrote:
>
>> Som jeg har forstået tingene er default karakterset før HTML5
>> ISO-8859-1, iflg. standarderne.
>
> Korrekt (bemærk HTML5).
>
>> HTML5 vil gerne ændre det til UTF8.
>
> Ikke korrekt.
>
> HTML5 vil gerne have Win-1252 som standard.
> http://en.wikipedia.org/wiki/Windows-1252
>

http://dev.w3.org/html5/spec/semantics.html#character-encoding-declaration
Her hæfter jeg mig ved 2 paragraffer, lidt under overskriften:
"
Authors are encouraged to use UTF-8. Conformance checkers may advise
authors against using legacy encodings. [RFC3629]
Authoring tools should default to using UTF-8 for newly-created
documents. [RFC3629]
"
Og læser det som at W3C - eller i det mindste dem der redigerer dette
HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver
HTML5.

Birger

--
http://varmeretter.dk - billig, sund og hurtig mad
http://bbsorensen.dk



Stig Johansen (07-07-2011)
Kommentar
Fra : Stig Johansen


Dato : 07-07-11 10:35

Birger Sørensen wrote:

> Og læser det som at W3C - eller i det mindste dem der redigerer dette
> HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver
> HTML5.

Birger,

Jeg håber ikke jeg lyder for 'hård', når jeg skriver dette.

1) 'Verden' består ikke kun af HTML.
2) HTML varetages af W3C
3) _Protokoller_ som ikke kun er 'web' varetages af IETF
4) Karakterset og encoding varetages af IANA

Du har selv (indirekte) referet til RFC3629 (IETF):
http://www.ietf.org/rfc/rfc3629.txt

Her gennemgås også forskellen på de forskellige _encodings_
<quote>
ISO/IEC 10646 and Unicode define several encoding forms of their
common repertoire: UTF-8, UCS-2, UTF-16, UCS-4 and UTF-32.
</quote>
Jeg har vist været inde på fordele og ulemper, samt at MS startede med UCS-2
og kører nu UTF-16 (internt).

--
Med venlig hilsen
Stig Johansen

Stig Johansen (07-07-2011)
Kommentar
Fra : Stig Johansen


Dato : 07-07-11 10:48

Birger Sørensen wrote:

> Og læser det som at W3C - eller i det mindste dem der redigerer dette
> HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver
> HTML5.

Glemte lige at kommentere denne:
Der er ingen tvivl om, at hvis man bruger utf-8, eller rettere unicode, så
har vi løst alverdens tegnproblemer, incl. Klingon, som vistnok er
defineret i unicode.

MEN da MS bruger UTF-16, vil det være letter at bruge Win-1252, da man
ellers skal køre 'file save as utf-8' i stedet for 'save' (eller ctrl+s).

Som sagt er alting et 'trade-off' mellem flexibilitet og performance, så
afhængig af behovet, må man tage sit valg.

Bortset fra de steder hvor udbyderene har foretaget valget, der må man 'lov
følge eller land fly'.

--
Med venlig hilsen
Stig Johansen

Kim Ludvigsen (07-07-2011)
Kommentar
Fra : Kim Ludvigsen


Dato : 07-07-11 10:05

Den 07-07-2011 11:48, Stig Johansen skrev:

> MEN da MS bruger UTF-16, vil det være letter at bruge Win-1252, da man
> ellers skal køre 'file save as utf-8' i stedet for 'save' (eller ctrl+s).

Det kommer an på, hvilken editor man bruger. Du har ret mht.
Notesblok, men det er måske ikke den mest brugte editor til
hjemmesider. De fleste mere avancerede editorer kan opsættes
til automatisk at bruge UTF-8.

--
Mvh. Kim Ludvigsen
Standardoverholdende multimedia på hjemmesiden:
http://kimludvigsen.dk/tips-internet-websnedker-multimedia.php

Rune Jensen (06-07-2011)
Kommentar
Fra : Rune Jensen


Dato : 06-07-11 04:19

On 6 Jul., 08:46, Birger Sørensen <s...@bbsorensen.com> wrote:

> Forskellen er vel også kun at kildekoden er nemmere at læse uden
> entities.

....samt at det tager længere tid at lave siden, hvis man skal bruge
entities, hvor det reelt ikke er nødvendigt. Og så er entities faktisk
case-sensitive.

Derudover, så kan det sløve siden, hvis man angiver ét tegnsæt, men
benytter et andet. Browseren bruger det angivne tegnsæt som
udgangspunkt, opdager det ikke er det rigtige, og gentegner derefter
hele siden.

Eller også fejltolker den bare siden, hvilket vel også kan være et
sikkerhedsproblem.

Da UTF-8 over tegn 128 fylder minimum 2 bytes, er det også en
vurdering af, hvor meget og hvor mange gange man kommer til at benytte
specialtegn, da en encoding via entity jo under alle omstædigheder
fylder 4 bytes mindst.

Tegnene æ,ø,å,Æ,Ø,Å kan fint benyttes uden brug af entities, hvis man
benytter samme karatersætangivelse (ISO-8859 vs. UTF.-8) hele vejen
igennem, så der kan man under alle omstændigheder spare tegn i forhold
til at skulle skrive f.eks. .&Aring; for stort Å. Men i ISO-8859
fylder danske tegn så kun én byte, i UTF-8 to.

> (...) Jeg ved ikke hvor du har ; fra - heller ikke hvad entitien
> skulle hedde.

Der er SVJV entities for alt, men du har ret i, der er ikke noget navn
for semikolon - hvilket nok er fordi det ret dobbeltarbejde at bruge
dets entity, når semikolon kun har én betydning. Jeg kender ikke andre
steder i HTML, hvor det har anden betydning.

Men:

&#59;

burde kunne gøre det.

http://www.w3.org/MarkUp/html3/latin1.html


MVH
Rune Jensen

Rune Jensen (06-07-2011)
Kommentar
Fra : Rune Jensen


Dato : 06-07-11 06:10

On 6 Jul., 04:16, Karl Erik Christensen <karle...@none.invalid.com>
wrote:

> Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i
> stedet for "å".

Det synes jeg ikke lyder rirgtigt.

Hvis Dieter gemmer i ISO-8859-1 og giver besked til browseren, enten
via PHP/HTTP-header (charset, tror jeg det heddet) eller via HTML/
meta, at det er ISO8859, som benyttes, så vil denne franskman få vist
de rigtige tegn. Også uden entities.

Problemet er, hvis man gemmer i ISO8859, men giver besked om, man
bruger UTF-8 og vice versal. Så vil man få volapyk.

Og her huskes, at selv om Dieters server ikke sender denne besked, at
serverens information om brugt tegnsæt "overrider" besked i Meta om
brugt tegnsæt, så serveren får fortrinsret.


MVH
Rune Jensen

Karl Erik Christense~ (06-07-2011)
Kommentar
Fra : Karl Erik Christense~


Dato : 06-07-11 19:56

On 06-07-2011 14:09, Rune Jensen wrote:
> On 6 Jul., 04:16, Karl Erik Christensen<karle...@none.invalid.com>
> wrote:
>
>> Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i
>> stedet for "å".
>
> Det synes jeg ikke lyder rirgtigt.

> MVH
> Rune Jensen

Hej Rune.

Nej, jeg ved sgu ikke hvad jeg tænkte på. Det må ha været sommervarmen
der gjorde mig kulret

Karl Erik.

--
http://dmwebdesign.dk - DM i Webdesign
http://ranunkelvej.com/b&o/ - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com - Artikler om webdesign

Rune Jensen (07-07-2011)
Kommentar
Fra : Rune Jensen


Dato : 07-07-11 04:58

On 6 Jul., 11:56, Karl Erik Christensen <karle...@none.invalid.com>
wrote:

> Nej, jeg ved sgu ikke hvad jeg t nkte p . Det m ha v ret sommervarmen
> der gjorde mig kulret

Brug Stigs beskrivelse med et bibliotek, når du skal forklare
charsets. hvis du må for ham. Det er den bedste beskrivelse, som jeg
har set på dansk.

Af en eller anden grund, så er biblioteks-analogier ret gode til at
forklare en del om web. Jeg har også hørt det i forbindelse med
beskrivelse af andre ting end lige charset.

PS: Du burde oprette en nyhedsgruppe-ordbog, jeg synes stadig det
mangler. Jeg ved, der vil være søgning på den, hvis forklaringerne er
a la Stigs, korte og præcise og forståelige. Men testforsøget på
webdesigngruppen.dk viste også, at interessen er der, og at folk er
villige til at bidrage, når de har forstået konceptet. Samt at det er
ganske seriøse bidrag også, og at folk faktisk er meget målrettede,
når de bidrager


MVH
Rune Jensen

Søg
Reklame
Statistik
Spørgsmål : 177558
Tips : 31968
Nyheder : 719565
Indlæg : 6408914
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste