|  | 		    
					
        
         
          
         
	
          | |  | Charset - ÆØÅ problemer Fra : Daniel_Skov
 | 
 Dato :  05-07-11 10:28
 | 
 |  | 
 
            Hej webdesignere
 Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
 lave.
 På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
 man følger et link til de andre sider kan den ikke vise ÆØÅ. 
 På alle andre sider end forsiden har jeg derfor skiftet charset
 til: "iso-8859-1"
 Men har hørt noget om, at man ikke bør gøre det er det en skrøne
 eller skal jeg finde en anden løsning?
 -- 
 Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
  - Pædagogiske tutorials på dansk
  - Kom godt i gang med koderne
 KLIK HER! => http://www.html.dk/tutorials |  |  | 
  Andreas Andersen (05-07-2011) 
 
	
          | |  | Kommentar Fra : Andreas Andersen
 | 
 Dato :  05-07-11 10:35
 | 
 |  | Den 05-07-2011 11:27, Daniel_Skov skrev:
 > Hej webdesignere
 >
 > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
 > lave.
 > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
 > man følger et link til de andre sider kan den ikke vise ÆØÅ.
 >
 > På alle andre sider end forsiden har jeg derfor skiftet charset
 > til: "iso-8859-1"
 > Men har hørt noget om, at man ikke bør gøre det er det en skrøne
 > eller skal jeg finde en anden løsning?
 
 Det er en smagssag hvilket charset, man skal bruge, men jeg synes som
 minimum, du bør bruge det samme på alle dine sider. Har du gemt alle
 filerne i det samme format?
 
 --
 Andreas
 
 
 
 |  |  | 
  Daniel_Skov (05-07-2011) 
 
	
          | |  | Kommentar Fra : Daniel_Skov
 | 
 Dato :  05-07-11 11:57
 | 
 |  | 
 
            Andreas Andersen wrote in dk.edb.internet.webdesign.html:
 > Den 05-07-2011 11:27, Daniel_Skov skrev: 
 > > Hej webdesignere 
 > > 
 > > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at 
 > > lave. 
 > > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når 
 > > man følger et link til de andre sider kan den ikke vise ÆØÅ. 
 > > 
 > > På alle andre sider end forsiden har jeg derfor skiftet charset 
 > > til: "iso-8859-1" 
 > > Men har hørt noget om, at man ikke bør gøre det er det en skrøne 
 > > eller skal jeg finde en anden løsning? 
 >  
 > Det er en smagssag hvilket charset, man skal bruge, men jeg synes som  
 > minimum, du bør bruge det samme på alle dine sider. Har du gemt alle  
 > filerne i det samme format? 
 >  
 > --  
 > Andreas 
 > 
 Det kommer an på hvad du tænker på?
 Jeg har både gif, jpg og andre filformater på hjemmesiden.
 Alle sider, hvis det er det du mener, er .html
 koder i html5 og css3.
 -- 
 Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
  - Pædagogiske tutorials på dansk
  - Kom godt i gang med koderne
 KLIK HER! => http://www.html.dk/tutorials |  |  | 
   Andreas Andersen (05-07-2011) 
 
	
          | |  | Kommentar Fra : Andreas Andersen
 | 
 Dato :  05-07-11 12:10
 | 
 |  | Den 05-07-2011 12:57, Daniel_Skov skrev:
 > Det kommer an på hvad du tænker på?
 >
 > Jeg har både gif, jpg og andre filformater på hjemmesiden.
 > Alle sider, hvis det er det du mener, er .html
 >
 > koder i html5 og css3.
 
 Prøv at åbne HTML-filerne i Notepad og vælg "Save as". Der er en
 dropdown, der hedder "Encoding", hvor du kan vælge UTF-8. Den er på
 forhånd sat til det format filen er i i forvejen. Hvis du vælger UTF-8
 som dit charset, skal du også gemme HTML-filerne i UTF-8.
 
 --
 Andreas
 
 
 |  |  | 
  Birger Sørensen (05-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  05-07-11 12:40
 | 
 |  | 
 
            Efter mange tanker skrev Daniel_Skov:
 > Hej webdesignere
 >
 > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at
 > lave.
 > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når
 > man følger et link til de andre sider kan den ikke vise ÆØÅ. 
 >
 > På alle andre sider end forsiden har jeg derfor skiftet charset
 > til: "iso-8859-1"
 > Men har hørt noget om, at man ikke bør gøre det er det en skrøne
 > eller skal jeg finde en anden løsning?
 Som jeg har forstået tingene er default karakterset før HTML5 
 ISO-8859-1, iflg. standarderne.
 HTML5 vil gerne ændre det til UTF8.
 Og med default menes, det der anvendes, hvis du ikke giver noget.
 Det er vist nok så sådan, at ikke alle browsere overholder standarderne 
 på det område. Så uanset hvad du gør, bør der angives karatersæt - 
 enten i http-headere som serveren sætter, eller i en <meta...>
 Og uanset hvad du vælger, skal formatet passe med din kildekode. Hvis 
 du viser HTML som UTF8, skal din kilde også gemmes i UTF8. Ellers går 
 det naturligvis galt.
 ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange 
 navne.
 Og det problem du har, er formentlig netop med formatet du gemmer 
 kildekoden i.
 Karl Erik har et site, der omhandler problemet. Kan ikke huske linket, 
 men mon ikke han finder på at poste det?
 Et par andre gode råd:
 Find et andet sted at lære end html.dk
 NG kan læses fra google, eller i dit emailprogram eller en newsreader. 
 Se evt. http://usenet.dk hmtl.dk er forældet, og har ikke længere andet formål end at konvertere 
 andres frivillige arbejde til reklameindtægter.
 Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
  Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 14:53
 | 
 |  | 
 
            On 05-07-2011 13:40, Birger Sørensen wrote:
 > Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
 > men mon ikke han finder på at poste det?
 > Birger
 >
 Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation 
 i fredags    Du kan læse lidt om tegnsæt, og hvordan du gemmer korrekt i forskellige 
 editorer her:
http://webdesign.ranunkelvej.com/tegnsaet/index.php Birger; jeg mener at html5 anbefales at bruge utf-8, men da jeg er lige 
 ved at vinde en etape i tour de france, har jeg ikke tid til at finde 
 dokumentation    Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
   Birger Sørensen (05-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  05-07-11 15:10
 | 
 |  | 
 
            Karl Erik Christensen formulerede tirsdag:
 > On 05-07-2011 13:40, Birger Sørensen wrote:
 >
 >> Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
 >> men mon ikke han finder på at poste det?
 >
 >> Birger
 >>
 >
 > Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation i 
 > fredags    >
 > Du kan læse lidt om tegnsæt, og hvordan du gemmer korrekt i forskellige 
 > editorer her:
 > http://webdesign.ranunkelvej.com/tegnsaet/index.php >
 > Birger; jeg mener at html5 anbefales at bruge utf-8, men da jeg er lige ved 
 > at vinde en etape i tour de france, har jeg ikke tid til at finde 
 > dokumentation    >
 > Karl Erik.
 Det glæder os da, at du nu ikke længere har belæg for at brokke dig    Jeg har tilladt mig at tilføje dit link, til dem jeg finder nyttige på
 bbsorensen.dk/?men=Link/Software
 Der er lidt forvirring på
http://webdesign.ranunkelvej.com/tegnsaet/page_3.php omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget 
 andet.
 Enten må du være konsekvent eller forklare forskellen.
 Jeg har min brok endnu ^^
 Jeg mener også at have set at med HTML5 anbefales UTF8.
 Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke 
 vende tilbage. Så sid stille i sadlen...
 Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
    Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 17:14
 | 
 |  | 
 
            On 05-07-2011 16:09, Birger Sørensen wrote:
 > Der er lidt forvirring på
 > http://webdesign.ranunkelvej.com/tegnsaet/page_3.php > omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget andet.
 > Enten må du være konsekvent eller forklare forskellen.
 > Jeg har min brok endnu ^^
 >
 > Jeg mener også at have set at med HTML5 anbefales UTF8.
 >
 > Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke
 > vende tilbage. Så sid stille i sadlen...
 >
 > Birger
 >
 Forskellen på 8859-1 og 8859-15 er beskrevet på:
http://en.wikipedia.org/wiki/ISO/IEC_8859-1 Forskellen er:
 ISO/IEC 8859-1 is missing some characters for French and Finnish text 
 and the euro sign. In order to provide some of these characters, ISO/IEC 
 8859-15 was developed as an update of ISO/IEC 8859-1
 Der gøres også rede for windows-1252 contra 8859-1:
 The Windows-1252 codepage coincides with ISO-8859-1 for all codes except 
 the range 128 to 159 (hex 80 to 9F), where the little-used C1 controls 
 are replaced with additional characters. Windows-28591 is the actual 
 ISO-8859-1 codepage
 Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.
 8859-1 kræver at man skriver € medens man med 8859-15 bare kan 
 skrive ¤ - det er eneste forskel for os danskere.
 Med utf-8 er alt straight forward - bare brug tastaturet og tænk på de 
 søde sygeplejesker i Frederikshavn    Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
     Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 18:48
 | 
 |  |  |  |  | 
      Birger Sørensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  06-07-11 07:51
 | 
 |  |  |  |  | 
     Birger Sørensen (05-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  05-07-11 21:25
 | 
 |  | 
 
            Karl Erik Christensen kom med følgende:
 > On 05-07-2011 16:09, Birger Sørensen wrote:
 >
 >> Der er lidt forvirring på
 >> http://webdesign.ranunkelvej.com/tegnsaet/page_3.php >> omkring ISO-8859-1 og ISO-8859-15. Du skriver du gør et og gør noget andet.
 >> Enten må du være konsekvent eller forklare forskellen.
 >> Jeg har min brok endnu ^^
 >>
 >> Jeg mener også at have set at med HTML5 anbefales UTF8.
 >>
 >> Pas nu på ikke at overanstrenge dig - din brok skulle jo helst ikke
 >> vende tilbage. Så sid stille i sadlen...
 >>
 >> Birger
 >>
 >
 > Forskellen på 8859-1 og 8859-15 er beskrevet på:
 >
 > http://en.wikipedia.org/wiki/ISO/IEC_8859-1 >
 > Forskellen er:
 >
 > ISO/IEC 8859-1 is missing some characters for French and Finnish text and the 
 > euro sign. In order to provide some of these characters, ISO/IEC 8859-15 was 
 > developed as an update of ISO/IEC 8859-1
 >
 > Der gøres også rede for windows-1252 contra 8859-1:
 >
 > The Windows-1252 codepage coincides with ISO-8859-1 for all codes except the 
 > range 128 to 159 (hex 80 to 9F), where the little-used C1 controls are 
 > replaced with additional characters. Windows-28591 is the actual ISO-8859-1 
 > codepage
 >
 > Grunden til at jeg omtaler 8859-1 og så faktisk bruger 8859-15, er en fejl.
 > 8859-1 kræver at man skriver € medens man med 8859-15 bare kan skrive ¤ 
 > - det er eneste forskel for os danskere.
 >
 > Med utf-8 er alt straight forward - bare brug tastaturet og tænk på de søde 
 > sygeplejesker i Frederikshavn    >
 > Karl Erik.
 Jow - jeg ved det godt.
 Men det gør folk der har tegnproblemer formentlig ikke.
 Derfor er det stadig forvirrende, at du skriver filen er gemt som -15 
 og meta-tagger siger -1.
 Det bør i øvrigt hedde -15 i meta tagget, hviss filen er gemt som 
 sådan-
 Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det 
 skrives som entity...
 Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
      Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 22:14
 | 
 |  | 
 
            On 05-07-2011 22:24, Birger Sørensen wrote:
 > Jow - jeg ved det godt.
 > Men det gør folk der har tegnproblemer formentlig ikke.
 > Derfor er det stadig forvirrende, at du skriver filen er gemt som -15 og
 > meta-tagger siger -1.
 > Det bør i øvrigt hedde -15 i meta tagget, hviss filen er gemt som sådan-
 > Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
 > skrives som entity...
 >
 > Birger
 >
 Ja, det gør du Birger, det ved jeg. Men et eller andet sted skulle jeg 
 jo svare    Og ja - i iso-8859-1 skal euro-tegnet skrives som entity (€), det 
 har jeg testet    I øvrigt har jeg opdateret siden:
http://webdesign.ranunkelvej.com/tegnsaet/page_3.php Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
      Erik Olsen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Erik Olsen
 | 
 Dato :  06-07-11 06:50
 | 
 |  | Birger Sørensen wrote:
 
 > Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
 > skrives som entity...
 
 Jeg må tilstå at jeg ikke kan se problemer i at visse tegn må skrives
 som entity. Det gælder under alle omstændigheder visse andre tegn som
 "&" og ";"
 
 --
 Venlig hilsen/Best regards
 Erik Olsen
 
 
 
 |  |  | 
       Birger Sørensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  06-07-11 07:47
 | 
 |  | 
 
            Erik Olsen forklarede den 7/6/2011:
 > Birger Sørensen wrote:
 >
 >> Jeg har ikke testet - men med -1 kan den vist kun vise ¤ hvis det
 >> skrives som entity...
 >
 > Jeg må tilstå at jeg ikke kan se problemer i at visse tegn må skrives som 
 > entity. Det gælder under alle omstændigheder visse andre tegn som "&" og ";"
 Forskellen er vel også kun at kildekoden er nemmere at læse uden 
 entities.
 Der er reelt kun 3, man *skal* bruge emtities for: & (&), < (<) 
 og > (>) - så er der læssevis af andre, som ikke findes i alle 
 karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad entitien 
 skulle hedde.
 Men bemærk at der er forskel på årsagen. &,< og > er forbudte via 
 standarderne i HTML og XHTML. De øvrige bruger man entities for, fordi 
 de ikke findes i det anvendte karaktersæt - &coy; og ™ f.eks.
 Eftersom ¤ ikke findes i ISO-8859-1, skal man altså bruge € hvis 
 man angiver det som tegnsæt for siden - også selvom man gemmer filen 
 som ISO-8859-15.
 Men jeg er da enig, så længe det ikke går ud over æøå - for så er koden 
 ikke let læselig.
 Det er heller ikke alle, der er klar over at ¤ skrives med ALtGr+5.
 Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
        Erik Olsen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Erik Olsen
 | 
 Dato :  06-07-11 19:54
 | 
 |  | Birger Sørensen wrote:
 
 > Der er reelt kun 3, man *skal* bruge emtities for: & (&), < (<)
 > og > (>) - så er der læssevis af andre, som ikke findes i alle
 > karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad
 > entitien skulle hedde.
 
 Undskyld, ";" var en tanketorsk fra min side.
 
 --
 Venlig hilsen/Best regards
 Erik Olsen
 
 
 
 |  |  | 
         Birger Sørensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  06-07-11 21:35
 | 
 |  | 
 
            Erik Olsen tastede følgende:
 > Birger Sørensen wrote:
 >
 >> Der er reelt kun 3, man *skal* bruge emtities for: & (&), < (<)
 >> og > (>) - så er der læssevis af andre, som ikke findes i alle
 >> karaktersæt. Jeg ved ikke hvor du har ; fra - heller ikke hvad
 >> entitien skulle hedde.
 >
 > Undskyld, ";" var en tanketorsk fra min side.
 Helt OK - rart at vide at du kun er meneske, som os andre...    Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
   John (05-07-2011) 
 
	
          | |  | Kommentar Fra : John
 | 
 Dato :  05-07-11 15:11
 | 
 |  | 
 
            Karl Erik Christensen tastede følgende:
 >
 > Det er med glæde at jeg annoncerer at jeg overlevede min brok-operation i 
 > fredags    Satans    Men så skulle der vel ikke være mere brok fra din side i 
 fremtiden.
 Fantastisk så dygtige kirugerne er i dag. Tænke sig de kan med en kniv 
 rode i psyken også.
 Troede brok var noget man fik i maveregionen.    -- 
 Mvh John
www.wordpresstema.dk
www.wordpress.dk/forum Aprilia RSV Mille
            
             |  |  | 
    Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 19:00
 | 
 |  |  |  |  | 
  Daniel_Skov (05-07-2011) 
 
	
          | |  | Kommentar Fra : Daniel_Skov
 | 
 Dato :  05-07-11 19:12
 | 
 |  | 
 
            Birger Sørensen wrote in dk.edb.internet.webdesign.html:
 > Efter mange tanker skrev Daniel_Skov: 
 > > Hej webdesignere 
 > > 
 > > Jeg er lige ved at afslutte en dansk hjemmeside jeg er ved at 
 > > lave. 
 > > På forsiden kan den godt vise ÆØÅ med charset "utf-8", men når 
 > > man følger et link til de andre sider kan den ikke vise ÆØÅ.  
 > > 
 > > På alle andre sider end forsiden har jeg derfor skiftet charset 
 > > til: "iso-8859-1" 
 > > Men har hørt noget om, at man ikke bør gøre det er det en skrøne 
 > > eller skal jeg finde en anden løsning? 
 >  
 > Som jeg har forstået tingene er default karakterset før HTML5  
 > ISO-8859-1, iflg. standarderne. 
 > HTML5 vil gerne ændre det til UTF8. 
 > Og med default menes, det der anvendes, hvis du ikke giver noget. 
 > Det er vist nok så sådan, at ikke alle browsere overholder standarderne  
 > på det område. Så uanset hvad du gør, bør der angives karatersæt -  
 > enten i http-headere som serveren sætter, eller i en <meta...> 
 >  
 > Og uanset hvad du vælger, skal formatet passe med din kildekode. Hvis  
 > du viser HTML som UTF8, skal din kilde også gemmes i UTF8. Ellers går  
 > det naturligvis galt. 
 > ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange  
 > navne. 
 > Og det problem du har, er formentlig netop med formatet du gemmer  
 > kildekoden i. 
 >  
 > Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,  
 > men mon ikke han finder på at poste det? 
 >  
 > Et par andre gode råd: 
 > Find et andet sted at lære end html.dk 
 > NG kan læses fra google, eller i dit emailprogram eller en newsreader.  
 > Se evt. http://usenet.dk > hmtl.dk er forældet, og har ikke længere andet formål end at konvertere  
 > andres frivillige arbejde til reklameindtægter. 
 >  
 > Birger 
 >  
 > --  
 > http://varmeretter.dk  - billig, sund og hurtig mad 
 > http://bbsorensen.dk >  
 Mange tak for svarene begge to.
 Jeg bruger editplus og den gemte i ANSI, ja kært barn har mange navne ;).
 Den gemmer nu i utf-8 og det samme står i headeren. Så alt virker fint.
 fortsat god aften.
 Hilsen Daniel
 -- 
 Vil du lære at kode HTML, XHTML, CSS, SSI, ASP eller ASP.NET?
  - Pædagogiske tutorials på dansk
  - Kom godt i gang med koderne
 KLIK HER! => http://www.html.dk/tutorials |  |  | 
   Karl Erik Christense~ (05-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  05-07-11 19:29
 | 
 |  | 
 
            On 05-07-2011 20:11, Daniel_Skov wrote:
 > Mange tak for svarene begge to.
 > Jeg bruger editplus og den gemte i ANSI, ja kært barn har mange navne ;).
 > Den gemmer nu i utf-8 og det samme står i headeren. Så alt virker fint.
 >
 > fortsat god aften.
 >
 > Hilsen Daniel
 >
 Dejligt at du melder tilbage, at du fik løst problemet Daniel.
 Det er desværre ikke alle der giver tilbagemelding.
 Det kan være lidt frustrerende for dem der forsøger at hjælpe.
 Tak.
 Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
  Stig Johansen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Stig Johansen
 | 
 Dato :  06-07-11 11:37
 | 
 |  | 
 
            Birger Sørensen wrote:
 > Som jeg har forstået tingene er default karakterset før HTML5
 > ISO-8859-1, iflg. standarderne.
 Korrekt (bemærk HTML5).
 > HTML5 vil gerne ændre det til UTF8.
 Ikke korrekt.
 HTML5 vil gerne have Win-1252 som standard.
http://en.wikipedia.org/wiki/Windows-1252 > Og med default menes, det der anvendes, hvis du ikke giver noget.
 Korrekt, og der står vi i en skillelinie mellem HTML5 og tidligere.
 > Det er vist nok så sådan, at ikke alle browsere overholder standarderne
 > på det område. Så uanset hvad du gør, bør der angives karatersæt -
 > enten i http-headere som serveren sætter, eller i en <meta...>
 Både korrekt og....
 Jeg vil gætte på at alle browsere respekterer den korrekte måde, nemlig at
 sende charset med i HTTP headeren fra serveren.
 Lad mig lave en analogi:
 Vi går ind på et bibliotek.
 Her er bøger opdelt i reoler med dansk, engelsk, osv, og 'ikke
 kategoriseret'.
 Ikke kategoriseret kan så underopdeles i undergrupper:
 1) Bøger hvor der står i forordene: 'denne bog er på engelsk'.
 2) Bøger hvor der intet står.
 Kategori 1) svarer til man ikke angiver 'indhold', men beskriver det trods
 alt ( aka meta tagget).
 Kategori 2) svarer til at man først skal læse noget af den for derefter at
 opdage at den er på engelsk og ikke på dansk.
 > ISO-8859-1 hedder også widows1252, latin1, ANSI - kært barn har mange
 > navne.
 Hmm... hjaah, win-1252 skiller sig vist lidt ud på linie med iso-8859-1 ;)
 Ellers har du næsten ret.
 Ansi er en kombination af codepoints og glyphs, og dækker over adskillige
 codepages.
 > Karl Erik har et site, der omhandler problemet. Kan ikke huske linket,
 > men mon ikke han finder på at poste det?
 Jeg tager hatten af for Karl Erik, at han 'gider', og dette indlæg skal nok
 nærmest ses som en impuls til uddybende emner.
 -- 
 Med venlig hilsen
 Stig Johansen
            
             |  |  | 
   Kim Ludvigsen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Kim Ludvigsen
 | 
 Dato :  06-07-11 10:57
 | 
 |  | 
 
            Den 06-07-2011 12:36, Stig Johansen skrev:
 > Birger Sørensen wrote:
 >
 >> HTML5 vil gerne ændre det til UTF8.
 >
 > Ikke korrekt.
 >
 > HTML5 vil gerne have Win-1252 som standard.
 > http://en.wikipedia.org/wiki/Windows-1252 Sådan læser jeg ikke den side. Som jeg forstår det, vil 
 HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda 
 behandle ISO-8859-1 som Win-1252.
 Der står ikke noget om UTF-8 eller UTF-8 kontra Win-1252 
 eller ISO-8859-1.
 -- 
 Mvh. Kim Ludvigsen
 Hold dit livs drømmeferie i Thailand:
http://rejse-til-thailand.dk |  |  | 
    Stig Johansen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Stig Johansen
 | 
 Dato :  06-07-11 12:16
 | 
 |  | 
 
            Kim Ludvigsen wrote:
 > Den 06-07-2011 12:36, Stig Johansen skrev:
 >> Birger Sørensen wrote:
 >>
 >>> HTML5 vil gerne ændre det til UTF8.
 >>
 >> Ikke korrekt.
 >>
 >> HTML5 vil gerne have Win-1252 som standard.
 >> http://en.wikipedia.org/wiki/Windows-1252 > 
 > Sådan læser jeg ikke den side. Som jeg forstår det, vil
 > HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda
 > behandle ISO-8859-1 som Win-1252.
 'The perception is in the eye of the beholder'...
 Fra linket:
 ......
 Most modern web browsers and e-mail clients treat the MIME charset
 ISO-8859-1 as Windows-1252 in order to accommodate such mislabeling. This
 is now standard behavior in the draft HTML 5 specification, which requires
 that documents advertised as ISO-8859-1 actually be parsed with the
 Windows-1252 encoding.
 ......
 Bemærk 'this is now _standard_...'
 Browserne opfører sig som de plejer, så der er ingen ændring der, men
 _validatoren_ får strammet op på reglerne.
 Browser og validator behøver ikke af hænge sammen - hvad validatoren siger
 og browserne gør har i princippet intet med hinanden at gøre.
 > Der står ikke noget om UTF-8 eller UTF-8 kontra Win-1252
 > eller ISO-8859-1.
 Nu var mit indlæg ikke ment som en p*måling, mere en uddybning af Birgers
 sentens:
 "HTML5 vil gerne ændre det til UTF8."
 som jeg ikke føler er en rigtig formulering.
 Men da 'forvirringen er total' om diverse karaktersæt, så lad mig henlede
 opmærksomheden på:
http://www.iana.org/assignments/character-sets (Og no har feelings, men man kan se, at iso-8859-15 er ækvivalent med
 Latin-9, og ikke latin-1).
 Undskyld til Birger ;)
 Og UTF-8 er gearet til XML, da det er den mest effektive encoding af
 unicode.
 Se f.eks:
http://www.utf8.com/ Nu har jeg givet nogle links, som nok er en 'anelsse langhåret', men lad
 være med at gå i dybden.
 Fremover skal man 'kun' (i vores verden) vælge mellem win-1252 eller utf-8.
 Har man ikke behov for 'eksotiske' tegn, er det bedste at vælge win-1252, da
 det giver den bedste performance.
 Har man læsere, hvor man har behov for 'eksotiske' tegn, skal man vælge
 utf-8, der dog er det dårligst performende valg.
 Alting er et valg:
 a) Bedst performance = win-1252
 b) Flexibilitet = utf-8.
 -- 
 Med venlig hilsen
 Stig Johansen
            
             |  |  | 
     Kim Ludvigsen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Kim Ludvigsen
 | 
 Dato :  06-07-11 12:20
 | 
 |  | 
 
            Den 06-07-2011 13:16, Stig Johansen skrev:
 > Kim Ludvigsen wrote:
 >> Den 06-07-2011 12:36, Stig Johansen skrev:
 >>>
 >>> HTML5 vil gerne have Win-1252 som standard.
 >>> http://en.wikipedia.org/wiki/Windows-1252 >>
 >> Sådan læser jeg ikke den side. Som jeg forstår det, vil
 >> HTML5 foretrække Win1252 frem for ISO-8859-1 - og endda
 >> behandle ISO-8859-1 som Win-1252.
 >
 > 'The perception is in the eye of the beholder'...
 Jep, og jeg tror, vi snakker lidt forbi hinanden.
 > Fra linket:
 > .....
 > Most modern web browsers and e-mail clients treat the MIME charset
 > ISO-8859-1 as Windows-1252 in order to accommodate such mislabeling. This
 > is now standard behavior in the draft HTML 5 specification, which requires
 > that documents advertised as ISO-8859-1 actually be parsed with the
 > Windows-1252 encoding.
 > .....
 >
 > Bemærk 'this is now _standard_...'
 Ja, at ISO-8859-1 behandles som Win-1252. Ikke at Win-1252 
 er standard frem for UTF-8.
 > Nu har jeg givet nogle links, som nok er en 'anelsse langhåret', men lad
 > være med at gå i dybden.
 Jeg kan ikke se, at linkene har noget med fastsættelse af et 
 standard-tegnsæt i HTML5 at gøre.
 > Fremover skal man 'kun' (i vores verden) vælge mellem win-1252 eller utf-8.
 Nemlig, der er ikke et enkelt tegnsæt som standard. Og hvis 
 endelig der skulle vælges et som standard, ville det ganske 
 givet ikke være Win-1252. Win-1252 kan være fint nok for os, 
 men vi er i mindretal, når man ser på verdensplan.
 -- 
 Mvh. Kim Ludvigsen
 Undgå virus og andet snavs på computeren:
http://pc-sikkerhed.dk |  |  | 
   Karl Erik Christense~ (06-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  06-07-11 12:16
 | 
 |  | 
 
            On 06-07-2011 12:36, Stig Johansen wrote:
 > Jeg tager hatten af for Karl Erik, at han 'gider', og dette indlæg skal nok
 > nærmest ses som en impuls til uddybende emner.
 >
 Tak Stig - men hvor ville jeg ønske at vi kunne samle alle de gode 
 kræfter, på et super websted.
 Jeg blev ærlig talt ret overrasket over at læse, at en spørger i dag 
 troede at dette forum var en html.dk service.
 A'pro'pos tegnsæt, så er der vist ingen foretrukne standart i html5. Kun 
 "anbefalet" at bruge enten utf-8 eller iso-8859-1, men iso-8859-1 er da 
 efter min opfattelse allerede forældet, da den ikke er født med euro-tegnet.
 Et godt eksempel på hvorfor jeg mener at utf-8 bør anvendes, er Dieter 
 Britz's side.
 Dieter skriver sin side på engelsk, hvilket jo er helt fint når man vil 
 "internationalisere". Han har et link til nogle billeder "Last 
 performance of Rusty Båthorns".
 Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i 
 stedet for "å".
 Med utf-8 får selv en franskmand vist å'et - at han så vil sige "ce que 
 l'enfer est-ce un signe", er en anden sag, men han får vist å'et.
 Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
   Birger Sørensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Birger Sørensen
 | 
 Dato :  06-07-11 17:03
 | 
 |  | 
 
            Stig Johansen kom med denne ide:
 > Birger Sørensen wrote:
 >
 >> Som jeg har forstået tingene er default karakterset før HTML5
 >> ISO-8859-1, iflg. standarderne.
 >
 > Korrekt (bemærk HTML5).
 >
 >> HTML5 vil gerne ændre det til UTF8.
 >
 > Ikke korrekt.
 >
 > HTML5 vil gerne have Win-1252 som standard.
 > http://en.wikipedia.org/wiki/Windows-1252 >
http://dev.w3.org/html5/spec/semantics.html#character-encoding-declaration Her hæfter jeg mig ved 2 paragraffer, lidt under overskriften:
 "
 Authors are encouraged to use UTF-8. Conformance checkers may advise 
 authors against using legacy encodings. [RFC3629]
 Authoring tools should default to using UTF-8 for newly-created 
 documents. [RFC3629]
 "
 Og læser det som at W3C - eller i det mindste dem der redigerer dette 
 HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver 
 HTML5.
 Birger
 -- 
http://varmeretter.dk  - billig, sund og hurtig mad
http://bbsorensen.dk |  |  | 
    Stig Johansen (07-07-2011) 
 
	
          | |  | Kommentar Fra : Stig Johansen
 | 
 Dato :  07-07-11 10:35
 | 
 |  | 
 
            Birger Sørensen wrote:
 > Og læser det som at W3C - eller i det mindste dem der redigerer dette
 > HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver
 > HTML5.
 Birger,
 Jeg håber ikke jeg lyder for 'hård', når jeg skriver dette.
 1) 'Verden' består ikke kun af HTML.
 2) HTML varetages af W3C
 3) _Protokoller_ som ikke kun er 'web' varetages af IETF
 4) Karakterset og encoding varetages af IANA
 Du har selv (indirekte) referet til RFC3629 (IETF):
http://www.ietf.org/rfc/rfc3629.txt Her gennemgås også forskellen på de forskellige _encodings_ 
 <quote>
 ISO/IEC 10646 and Unicode define several encoding forms of their
    common repertoire: UTF-8, UCS-2, UTF-16, UCS-4 and UTF-32. 
 </quote>
 Jeg har vist været inde på fordele og ulemper, samt at MS startede med UCS-2
 og kører nu UTF-16 (internt).
 -- 
 Med venlig hilsen
 Stig Johansen
            
             |  |  | 
    Stig Johansen (07-07-2011) 
 
	
          | |  | Kommentar Fra : Stig Johansen
 | 
 Dato :  07-07-11 10:48
 | 
 |  | Birger Sørensen wrote:
 
 > Og læser det som at W3C - eller i det mindste dem der redigerer dette
 > HTML5 draft - gerne vil have os til at bruge UTF-8 når vi skriver
 > HTML5.
 
 Glemte lige at kommentere denne:
 Der er ingen tvivl om, at hvis man bruger utf-8, eller rettere unicode, så
 har vi løst alverdens tegnproblemer, incl. Klingon, som vistnok er
 defineret i unicode.
 
 MEN da MS bruger UTF-16, vil det være letter at bruge Win-1252, da man
 ellers skal køre 'file save as utf-8' i stedet for 'save' (eller ctrl+s).
 
 Som sagt er alting et 'trade-off' mellem flexibilitet og performance, så
 afhængig af behovet, må man tage sit valg.
 
 Bortset fra de steder hvor udbyderene har foretaget valget, der må man 'lov
 følge eller land fly'.
 
 --
 Med venlig hilsen
 Stig Johansen
 
 
 |  |  | 
     Kim Ludvigsen (07-07-2011) 
 
	
          | |  | Kommentar Fra : Kim Ludvigsen
 | 
 Dato :  07-07-11 10:05
 | 
 |  | 
 
            Den 07-07-2011 11:48, Stig Johansen skrev:
 > MEN da MS bruger UTF-16, vil det være letter at bruge Win-1252, da man
 > ellers skal køre 'file save as utf-8' i stedet for 'save' (eller ctrl+s).
 Det kommer an på, hvilken editor man bruger. Du har ret mht. 
 Notesblok, men det er måske ikke den mest brugte editor til 
 hjemmesider. De fleste mere avancerede editorer kan opsættes 
 til automatisk at bruge UTF-8.
 -- 
 Mvh. Kim Ludvigsen
 Standardoverholdende multimedia på hjemmesiden:
http://kimludvigsen.dk/tips-internet-websnedker-multimedia.php |  |  | 
  Rune Jensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Rune Jensen
 | 
 Dato :  06-07-11 04:19
 | 
 |  | 
 
            On 6 Jul., 08:46, Birger Sørensen <s...@bbsorensen.com> wrote:
 > Forskellen er vel også kun at kildekoden er nemmere at læse uden
 > entities.
 ....samt at det tager længere tid at lave siden, hvis man skal bruge
 entities, hvor det reelt ikke er nødvendigt. Og så er entities faktisk
 case-sensitive.
 Derudover, så kan det sløve siden, hvis man angiver ét tegnsæt, men
 benytter et andet. Browseren bruger det angivne tegnsæt som
 udgangspunkt, opdager det ikke er det rigtige, og gentegner derefter
 hele siden.
 Eller også fejltolker den bare siden, hvilket vel også kan være et
 sikkerhedsproblem.
 Da UTF-8 over tegn 128 fylder minimum 2 bytes, er det også en
 vurdering af, hvor meget og hvor mange gange man kommer til at benytte
 specialtegn, da en encoding via entity jo under alle omstædigheder
 fylder 4 bytes mindst.
 Tegnene æ,ø,å,Æ,Ø,Å kan fint benyttes uden brug af entities, hvis man
 benytter samme karatersætangivelse (ISO-8859 vs. UTF.-8) hele vejen
 igennem, så der kan man under alle omstændigheder spare tegn i forhold
 til at skulle skrive f.eks. .Å for stort Å. Men i ISO-8859
 fylder danske tegn så kun én byte, i UTF-8 to.
 > (...) Jeg ved ikke hvor du har ; fra - heller ikke hvad entitien
 > skulle hedde.
 Der er SVJV entities for alt, men du har ret i, der er ikke noget navn
 for semikolon - hvilket nok er fordi det ret dobbeltarbejde at bruge
 dets entity, når semikolon kun har én betydning. Jeg kender ikke andre
 steder i HTML, hvor det har anden betydning.
 Men:
 ;
 burde kunne gøre det.
http://www.w3.org/MarkUp/html3/latin1.html MVH
 Rune Jensen
            
             |  |  | 
  Rune Jensen (06-07-2011) 
 
	
          | |  | Kommentar Fra : Rune Jensen
 | 
 Dato :  06-07-11 06:10
 | 
 |  | On 6 Jul., 04:16, Karl Erik Christensen <karle...@none.invalid.com>
 wrote:
 
 > Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i
 > stedet for "å".
 
 Det synes jeg ikke lyder rirgtigt.
 
 Hvis Dieter gemmer i ISO-8859-1 og giver besked til browseren, enten
 via PHP/HTTP-header (charset, tror jeg det heddet) eller via HTML/
 meta, at det er ISO8859, som benyttes, så vil denne franskman få vist
 de rigtige tegn. Også uden entities.
 
 Problemet er, hvis man gemmer i ISO8859, men giver besked om, man
 bruger UTF-8 og vice versal. Så vil man få volapyk.
 
 Og her huskes, at selv om Dieters server ikke sender denne besked, at
 serverens information om brugt tegnsæt "overrider" besked i Meta om
 brugt tegnsæt, så serveren får fortrinsret.
 
 
 MVH
 Rune Jensen
 
 
 |  |  | 
   Karl Erik Christense~ (06-07-2011) 
 
	
          | |  | Kommentar Fra : Karl Erik Christense~
 | 
 Dato :  06-07-11 19:56
 | 
 |  | 
 
            On 06-07-2011 14:09, Rune Jensen wrote:
 > On 6 Jul., 04:16, Karl Erik Christensen<karle...@none.invalid.com>
 > wrote:
 >
 >> Med iso-8859-1 vil ikke-nordisk opsatte systemer få vist noget volapyk i
 >> stedet for "å".
 >
 > Det synes jeg ikke lyder rirgtigt.
 > MVH
 > Rune Jensen
 Hej Rune.
 Nej, jeg ved sgu ikke hvad jeg tænkte på. Det må ha været sommervarmen 
 der gjorde mig kulret    Karl Erik.
 -- 
http://dmwebdesign.dk  - DM i Webdesign
http://ranunkelvej.com/b&o/  - Reparation af B&O Red Line højttalere
http://webdesign.ranunkelvej.com  - Artikler om webdesign
            
             |  |  | 
  Rune Jensen (07-07-2011) 
 
	
          | |  | Kommentar Fra : Rune Jensen
 | 
 Dato :  07-07-11 04:58
 | 
 |  | 
 
            On 6 Jul., 11:56, Karl Erik Christensen <karle...@none.invalid.com>
 wrote:
 > Nej, jeg ved sgu ikke hvad jeg t nkte p . Det m ha v ret sommervarmen
 > der gjorde mig kulret    Brug Stigs beskrivelse med et bibliotek, når du skal forklare
 charsets. hvis du må for ham. Det er den bedste beskrivelse, som jeg
 har set på dansk.
 Af en eller anden grund, så er biblioteks-analogier ret gode til at
 forklare en del om web. Jeg har også hørt det i forbindelse med
 beskrivelse af andre ting end lige charset.
 PS: Du burde oprette en nyhedsgruppe-ordbog, jeg synes stadig det
 mangler. Jeg ved, der vil være søgning på den, hvis forklaringerne er
 a la Stigs, korte og præcise og forståelige. Men testforsøget på
 webdesigngruppen.dk viste også, at interessen er der, og at folk er
 villige til at bidrage, når de har forstået konceptet. Samt at det er
 ganske seriøse bidrag også, og at folk faktisk er meget målrettede,
 når de bidrager
 MVH
 Rune Jensen
            
             |  |  | 
 |  |