/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
QP -> ISO 8859-1
Fra : Lars Kongshøj


Dato : 18-05-03 12:53

Er der nogen, der kender et program, der kan oversætte en tekst kodet
med Quoted Printable til ISO 8859-1?

--
Lars Kongshøj
http://www.kongshoj.com/

 
 
Peter Dalgaard BSA (18-05-2003)
Kommentar
Fra : Peter Dalgaard BSA


Dato : 18-05-03 13:36

Lars Kongshøj <lars_kongshoj@hotmail.com> writes:

> Er der nogen, der kender et program, der kan oversætte en tekst kodet
> med Quoted Printable til ISO 8859-1?

Kan metamail ikke det?

--
O__ ---- Peter Dalgaard Blegdamsvej 3
c/ /'_ --- Dept. of Biostatistics 2200 Cph. N
(*) \(*) -- University of Copenhagen Denmark Ph: (+45) 35327918
~~~~~~~~~~ - (p.dalgaard@biostat.ku.dk) FAX: (+45) 35327907

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 14:39

Peter Dalgaard BSA wrote:
> Lars Kongshøj <lars_kongshoj@hotmail.com> writes:
> > Er der nogen, der kender et program, der kan oversætte en tekst kodet
> > med Quoted Printable til ISO 8859-1?
> Kan metamail ikke det?

Muligvis. Jeg kan ikke rigtigt se fra dens man-page, hvordan jeg kan få
den til at behandle en ikke-mail.

--
Lars Kongshøj
http://www.kongshoj.com/

Peter Dalgaard BSA (18-05-2003)
Kommentar
Fra : Peter Dalgaard BSA


Dato : 18-05-03 19:14

Lars Kongshøj <lars_kongshoj@hotmail.com> writes:

> Peter Dalgaard BSA wrote:
> > Lars Kongshøj <lars_kongshoj@hotmail.com> writes:
> > > Er der nogen, der kender et program, der kan oversætte en tekst kodet
> > > med Quoted Printable til ISO 8859-1?
> > Kan metamail ikke det?
>
> Muligvis. Jeg kan ikke rigtigt se fra dens man-page, hvordan jeg kan få
> den til at behandle en ikke-mail.

$ echo Fr=E6kke fr=F8l=E5r | metamail -b -c text/plain -E quoted-printable
Frække frølår

--
O__ ---- Peter Dalgaard Blegdamsvej 3
c/ /'_ --- Dept. of Biostatistics 2200 Cph. N
(*) \(*) -- University of Copenhagen Denmark Ph: (+45) 35327918
~~~~~~~~~~ - (p.dalgaard@biostat.ku.dk) FAX: (+45) 35327907

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 19:43

Peter Dalgaard BSA wrote:
> $ echo Fr=E6kke fr=F8l=E5r | metamail -b -c text/plain -E quoted-printable
> Frække frølår

OK, den kunne også

Så den vil jeg også lige se på i sammenligning med qprint.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 13:45

On Sun, 18 May 2003 13:52:53 +0200, Lars Kongshøj wrote:

> Er der nogen, der kender et program, der kan oversætte en tekst kodet
> med Quoted Printable til ISO 8859-1?

Ja:

perl -MMIME::QuotedPrint -ne 'print decode_qp($_)'

Eksempel:

$ cat fil.txt
Fr=E6kke fr=F8l=E5r
$ perl -MMIME::QuotedPrint -ne 'print decode_qp($_)' fil.txt
Frække frølår
$

(Opfylder dog ikke kravet om at 'oversætter' til ISO 8851-1 - det
giver ikke rigtigt mening at oversætte fra en kodning til et tegnsæt).


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 13:53

On Sun, 18 May 2003 13:52:53 +0200, Lars Kongshøj wrote:

> Er der nogen, der kender et program, der kan oversætte en tekst kodet
> med Quoted Printable til ISO 8859-1?

Ja:

perl -MMIME::QuotedPrint -ne 'print decode_qp($_)'

Eksempel:

$ cat fil.txt
Fr=E6kke fr=F8l=E5r
$ perl -MMIME::QuotedPrint -ne 'print decode_qp($_)' fil.txt
Frække frølår
$

(Opfylder dog ikke kravet om at 'oversætte' til ISO 8851-1 - det giver
ikke rigtigt mening at oversætte fra en kodning til et tegnsæt).


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 14:46

Adam Sjøgren wrote:
> perl -MMIME::QuotedPrint -ne 'print decode_qp($_)'

Tak, det ser jo ud til at virke fint.

Virker dog lidt som at skyde gråspurve med kanoner at starte så tungt et
program for at løse så simpel en opgave.

> (Opfylder dog ikke kravet om at 'oversætte' til ISO 8851-1 - det giver
> ikke rigtigt mening at oversætte fra en kodning til et tegnsæt).

Det vel strengt taget rigtigt, men 8-bitkodning er vel den eneste
praktisk anvendte kodning, når man ser bort fra QP. som vel bare er en
generel tegnsæts-ekstrakodning, som lægges uden på 8-bitkodningen, hvis
ikke jeg har misforstået det totalt.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 14:55

On Sun, 18 May 2003 15:45:30 +0200, Lars Kongshøj wrote:

>> perl -MMIME::QuotedPrint -ne 'print decode_qp($_)'

> Tak, det ser jo ud til at virke fint.

> Virker dog lidt som at skyde gråspurve med kanoner at starte så
> tungt et program for at løse så simpel en opgave.

Tjah, til gengæld var det var nemt at finde

Har du fundet en mere passende størrelse slangebøsse i mellemtiden? En
sed-implementation var måske lige for?

>> (Opfylder dog ikke kravet om at 'oversætte' til ISO 8851-1 - det
>> giver ikke rigtigt mening at oversætte fra en kodning til et
>> tegnsæt).

> Det vel strengt taget rigtigt, men 8-bitkodning er vel den eneste
> praktisk anvendte kodning, når man ser bort fra QP. som vel bare er
> en generel tegnsæts-ekstrakodning, som lægges uden på
> 8-bitkodningen, hvis ikke jeg har misforstået det totalt.

Eller, måske kortere: Quoted-Printable-kodning er fuldstændigt
ligeglad med hvilket tegnsæt teksten er skrevet i, den pakker bare
udvalgte tegn ind.


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 15:41

Adam Sjøgren wrote:
> Har du fundet en mere passende størrelse slangebøsse i mellemtiden? En
> sed-implementation var måske lige for?

Næ, jeg tror jeg lever med perl indtil videre, den er nok implementeret
fint.
Så kigger jeg på et sed-script, en gang når jeg får tid.

> Eller, måske kortere: Quoted-Printable-kodning er fuldstændigt
> ligeglad med hvilket tegnsæt teksten er skrevet i, den pakker bare
> udvalgte tegn ind.

Ja, og da det er tekst fra mails jeg skal behandle, kunne jeg også
riskere at møde UTF, hvilket er endnu en grund til at foretrække perl
indtil videre, så jeg slipper for at forudse alle mulige kombinationer
af diverse tegn og kodninger.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 15:48

On Sun, 18 May 2003 16:40:43 +0200, Lars Kongshøj wrote:

>> Eller, måske kortere: Quoted-Printable-kodning er fuldstændigt
>> ligeglad med hvilket tegnsæt teksten er skrevet i, den pakker bare
>> udvalgte tegn ind.

> Ja, og da det er tekst fra mails jeg skal behandle, kunne jeg også
> riskere at møde UTF, hvilket er endnu en grund til at foretrække
> perl indtil videre, så jeg slipper for at forudse alle mulige
> kombinationer af diverse tegn og kodninger.

Hvorfor det?


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 17:01

Adam Sjøgren wrote:
> On Sun, 18 May 2003 16:40:43 +0200, Lars Kongshøj wrote:
> > Ja, og da det er tekst fra mails jeg skal behandle, kunne jeg også
> > riskere at møde UTF, hvilket er endnu en grund til at foretrække
> > perl indtil videre, så jeg slipper for at forudse alle mulige
> > kombinationer af diverse tegn og kodninger.
> Hvorfor det?

QP-kodningen for ß er vel ikke ens for ISO 8859-1 og UTF-7?

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 18:11

On Sun, 18 May 2003 18:00:44 +0200, Lars Kongshøj wrote:

> QP-kodningen for ß er vel ikke ens for ISO 8859-1 og UTF-7?

QP-kodningen for den byte der indeholder 223 (0xdf) er præcis den
samme uanset hvilket tegnsæt teksten der indeholder den byte er
skrevet i - nemlig =DF.

Den samme værdi i en byte kan have forskellige betydninger i de
forskellige tegnsæt. Men det er QP ligeglad med.


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 18:43

Adam Sjøgren wrote:
>
> On Sun, 18 May 2003 18:00:44 +0200, Lars Kongshøj wrote:
>
> > QP-kodningen for ß er vel ikke ens for ISO 8859-1 og UTF-7?
>
> QP-kodningen for den byte der indeholder 223 (0xdf) er præcis den
> samme uanset hvilket tegnsæt teksten der indeholder den byte er
> skrevet i - nemlig =DF.
>
> Den samme værdi i en byte kan have forskellige betydninger i de
> forskellige tegnsæt. Men det er QP ligeglad med.

Nej, men det har da betydning, hvis man fx. vil skrive et sed-script,
der oversætter en QP-kodet tekst til ISO 8859-1, så er man jo ikke
interesseret i at få et UTF-kodet output ud.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 18:51

On Sun, 18 May 2003 19:42:57 +0200, Lars Kongshøj wrote:

>> QP-kodningen for den byte der indeholder 223 (0xdf) er præcis den
>> samme uanset hvilket tegnsæt teksten der indeholder den byte er
>> skrevet i - nemlig =DF.

>> Den samme værdi i en byte kan have forskellige betydninger i de
>> forskellige tegnsæt. Men det er QP ligeglad med.

> Nej, men det har da betydning, hvis man fx. vil skrive et
> sed-script, der oversætter en QP-kodet tekst til ISO 8859-1, så er
> man jo ikke interesseret i at få et UTF-kodet output ud.

Det giver ikke mening at sige at man vil oversætte QP-kodet tekst til
ISO 8859-1.

Det er det jeg prøver at gøre klart: Quoted-Printable kodning er
_uafhængig af tegnsæt_.


Mvh.

Adam

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 19:06

Adam Sjøgren wrote:
> Det giver ikke mening at sige at man vil oversætte QP-kodet tekst til
> ISO 8859-1.

Jo, det gør da.

Hvis jeg har en mail som i mit mail-program viser et ø i from-headeren,
så vil jeg gerne kunne gemme mailen, køre den gennem
konverteringsprogrammet, og få en fil, hvor ø'et står med
ISO-8859-1-værdien for ø. Det giver da god mening.

Jeg er den forbindelse ikke interesseret i interne datarepræsentationer
i QP, herunder evt. UTF-8. Men det kan da være, at det er smartest at
oversætte det af to trin, hvor man i trin 1 får udtrukket tegnsæt samt
tekstens repræsentation i dette tegnsæt. Det kan vel teknisk set godt
kombineres i et program.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 19:14

On Sun, 18 May 2003 20:06:19 +0200, Lars Kongshøj wrote:

>> Det giver ikke mening at sige at man vil oversætte QP-kodet tekst
>> til ISO 8859-1.

> Jo, det gør da.

Oversættelse af tegnsæt og afkodning af content transfer encoding er
to uafhængige ting.

Du blander dem sammen, hvilket gør det sværere at forstå hvad du
mener, end nødvendigt.

> Hvis jeg har en mail som i mit mail-program viser et ø i
> from-headeren, så vil jeg gerne kunne gemme mailen, køre den gennem
> konverteringsprogrammet, og få en fil, hvor ø'et står med
> ISO-8859-1-værdien for ø. Det giver da god mening.

Naturligvis. Men der oversætter du ikke fra QP til ISO 8859-1. Du
afkoder QP og oversætter derefter fra det oprindelige tegnsæt til ISO
8859-1.

> Jeg er den forbindelse ikke interesseret i interne
> datarepræsentationer i QP, herunder evt. UTF-8.

QP HAR IKKE NOGEN IDÉ OM HVILKET TEGNSÆT TEKSTEN ER I!

Det giver derfor ikke mening at sige tale om QP's interne
datarepræsentation.


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 19:26

Adam Sjøgren wrote:
> Oversættelse af tegnsæt og afkodning af content transfer encoding er
> to uafhængige ting.
> Du blander dem sammen, hvilket gør det sværere at forstå hvad du
> mener, end nødvendigt.

Tja, det er vist mest et definitionsspørgsmål, men lad det være med det.

Nu kom jeg i tanke om, at jeg en gang har hørt om recode, det kan være
at jeg kan bruge det ifm. qprint, hvis sidstnævnte kun kan fjerne
qp-kodningen.

--
Lars Kongshøj
http://www.kongshoj.com/

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 19:41

Adam Sjøgren wrote:
> QP HAR IKKE NOGEN IDÉ OM HVILKET TEGNSÆT TEKSTEN ER I!

Så er den godt dum, for det står jo lige her:

=?iso-8859-1?Q?

OK, det var hvad jeg troede, men så vidt jeg har kunnet sjusse mig frem
til, angiver denne streng bare, hvilket tegnsæt det man vil får ud af en
QP-afkodning er i, og er ikke en del af QP-kodningen.

> Det giver derfor ikke mening at sige tale om QP's interne
> datarepræsentation.

Nej, det gør det så ikke.

--
Lars Kongshøj
http://www.kongshoj.com/

Adam Sjøgren (18-05-2003)
Kommentar
Fra : Adam Sjøgren


Dato : 18-05-03 19:52

On Sun, 18 May 2003 20:41:05 +0200, Lars Kongshøj wrote:

> Adam Sjøgren wrote:
>> QP HAR IKKE NOGEN IDÉ OM HVILKET TEGNSÆT TEKSTEN ER I!

> Så er den godt dum, for det står jo lige her:

> =?iso-8859-1?Q?

Hvad snakker du om?

Ovenstående er en del af RFC 2047-tricket til at have ikke-7-bit tegn
i header-linier.

'Q' angiver at den efterfølgende tekst er kodet med Quoted-Printable
og 'iso-8859-1' angiver hvilket tegnsæt teksten er i, jvnf:

encoded-word = "=?" charset "?" encoding "?" encoded-text "?="

Se <http://rfc.sunsite.dk/rfc/rfc2047.html>.

> OK, det var hvad jeg troede, men så vidt jeg har kunnet sjusse mig frem
> til, angiver denne streng bare, hvilket tegnsæt det man vil får ud af en
> QP-afkodning er i, og er ikke en del af QP-kodningen.

Her er RFC'en: <http://rfc.sunsite.dk/rfc/rfc2045.html>

Det er afsnit 5 og 6 der er relevante.

I fjerde forsøg lykkedes det at få budskabet frem. Pyh.


Mvh.

--
"Från och med nu, så är 'så snart Adam Sjøgren
som möjligt' 53 timmar!" asjo@koldfront.dk

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 19:58

Adam Sjøgren wrote:
> On Sun, 18 May 2003 20:41:05 +0200, Lars Kongshøj wrote:
> > Adam Sjøgren wrote:
> >> QP HAR IKKE NOGEN IDÉ OM HVILKET TEGNSÆT TEKSTEN ER I!
> > Så er den godt dum, for det står jo lige her:
> > =?iso-8859-1?Q?
> Hvad snakker du om?

Rolig, der stod en lille diskret smiley...

> Se <http://rfc.sunsite.dk/rfc/rfc2047.html>.
> Her er RFC'en: <http://rfc.sunsite.dk/rfc/rfc2045.html>

Det kunne godt se ud som, jeg ikke slipper for at rtf-rfc, eller hvad
man nu skal kalde det.

--
Lars Kongshøj
http://www.kongshoj.com/

Peter Makholm (19-05-2003)
Kommentar
Fra : Peter Makholm


Dato : 19-05-03 08:23

Lars Kongshøj <lars_kongshoj@hotmail.com> writes:

>> perl -MMIME::QuotedPrint -ne 'print decode_qp($_)'

> Virker dog lidt som at skyde gråspurve med kanoner at starte så tungt et
> program for at løse så simpel en opgave.

Er det perl eller MMIME::QuotedPrint du finder tungt?

Under antagelse af at det der skal dekodes har samme tegnsæt som
terminalens aktuelle tegnsæt kan man lave noget ligende:

perl -ple 's/%([[:xdigit:]]{2})/pack "H*", $1/ge'

Eventuelt kan man lige pille tegnsæterklæringer ud:

perl -ple 's/=\?[^?]*//g;s/%([[:xdigit:]]{2})/pack "H*", $1/ge'

Jeg tror primært at det er nyttige stykker kode hvis man af en eller
anden grund ikke *kan* gøre det på den rigtige måde.

--
Peter Makholm | One thing you do is prevent good software from
peter@makholm.net | being written. Who can afford to do professional
http://hacking.dk | work for nothing?
| -- Bill Gates

Lars Kongshøj (19-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 19-05-03 18:25

Peter Makholm wrote:
> Lars Kongshøj <lars_kongshoj@hotmail.com> writes:
> > Virker dog lidt som at skyde gråspurve med kanoner at starte så tungt et
> > program for at løse så simpel en opgave.
> Er det perl eller MMIME::QuotedPrint du finder tungt?

perl. Den fylder over 700K her, dertil kommer potentielt biblioteker,
der ellers ikke er loadet.

--
Lars Kongshøj
http://www.kongshoj.com/

Peter Makholm (19-05-2003)
Kommentar
Fra : Peter Makholm


Dato : 19-05-03 18:30

Lars Kongshøj <lars_kongshoj@hotmail.com> writes:

> perl. Den fylder over 700K her, dertil kommer potentielt biblioteker,
> der ellers ikke er loadet.

Hvoraf langt det meste formodentligt allerede er loadet (inklusiv
perl).

--
Peter Makholm | I congratulate you. Happy goldfish bowl to you, to
peter@makholm.net | me, to everyone, and may each of you fry in hell
http://hacking.dk | forever
| -- The Dead Past

Lars Kongshøj (19-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 19-05-03 19:14

Peter Makholm wrote:
> Lars Kongshøj <lars_kongshoj@hotmail.com> writes:
> > perl. Den fylder over 700K her, dertil kommer potentielt biblioteker,
> > der ellers ikke er loadet.
> Hvoraf langt det meste formodentligt allerede er loadet (inklusiv
> perl).

Nej, det er en server:

root@ny> ps -ef | awk '{ print $8 }' | sort -u | grep -v -e '^\[' -e
CMD -e ps -e awk -e sort -e grep
-zsh
/opt/cyrus-imapd-2.1.13/bin/master
/sbin/agetty
/usr/bin/httpd
/usr/libexec/postfix/master
/usr/libexec/slapd
/usr/sbin/klogd
/usr/sbin/syslogd
imapd
init
pickup
qmgr
sshd
root@ny>

--
Lars Kongshøj
http://www.kongshoj.com/

Thomas Overgaard (18-05-2003)
Kommentar
Fra : Thomas Overgaard


Dato : 18-05-03 18:27

Lars Kongshøj wrote:

> Er der nogen, der kender et program, der kan oversætte en tekst kodet
> med Quoted Printable til ISO 8859-1?

Det er vist "qprint" du er ude efter:
<URL: http://www.fourmilab.ch/webtools/qprint/>
--
Thomas O.

This area is designed to become quite warm during normal operation.

Lars Kongshøj (18-05-2003)
Kommentar
Fra : Lars Kongshøj


Dato : 18-05-03 18:50

Thomas Overgaard wrote:
> Lars Kongshøj wrote:
> > Er der nogen, der kender et program, der kan oversætte en tekst kodet
> > med Quoted Printable til ISO 8859-1?
> Det er vist "qprint" du er ude efter:
> <URL: http://www.fourmilab.ch/webtools/qprint/>

Tak, det ser jo ud til at være lige det jeg leder efter:

root@ny:/usr/src/qprint-1.0> echo Fr=E6kke fr=F8l=E5r | ./qprint -d
Frække frølår

Perfekt

Den burde de have smidt på freshmeat...

--
Lars Kongshøj
http://www.kongshoj.com/

Søg
Reklame
Statistik
Spørgsmål : 177560
Tips : 31968
Nyheder : 719565
Indlæg : 6408942
Brugere : 218888

Månedens bedste
Årets bedste
Sidste års bedste