Edmund wrote in <ammspe$780hv$1@ID-157131.news.dfncis.de>:
> Jeg så en udsendelse i Tv(provst kontor Fyn) hvor man på et kontor
> scannede alle indkomne breve.
> Vil det normalt være billedfiler den laver, eller bruger man OCR så
> output bliver et document.
Jeg ved ikke hvad man plejer at gøre, men jeg mener helt bestemt at Oticon
kører OCR.
De OCR-programmer jeg har set, ville jeg ikke bruge til den slags. Layoutet
går oftest i fløjten, og er layoutet avanceret nok, går meningen med hele
siden ofte tabt.
Det kan da godt være at de store dyre gulbelagte programmer kan klare OCR
uden at man mister noget vigtigt. Hvis man har penge til det, så lyder det
da meget godt. Jeg kan også forestille mig at det nogle gange er rart at
kunne copy/paste indholdet fra papir-breve. :)
Skulle jeg lave sådan noget i et mindre firma, ville jeg nok bare scanne
brevene ind som billeder. Det fylder bare uhyggeligt meget.
De fleste breve er egentlig bare sort og hvis, og så måske et logo i fine
farver i et hjørne.
Der kan man vel sætte et program op til at tage alt hvad der er "næsten
hvidt", og gøre det "helt hvidt". Allerede der bliver kompressionen af
billedet uhyggeligt meget bedre.
Så kan man tage områderne uden de vilde farve, og lave "helt grå" i stedet
for "næsten grå". Så bliver kompression igen et stykke bedre.
Jeg prøvede lige med et brev, jeg havde liggende, Der er farvelogo i to af
hjørnerne, og en underskrift med en meget blå pen.
Jeg scannede ind i 200 dpi, kørte levels (dog manuelt), fjernede farver
(markerede dog manuelt tre firkanter til farve), og gemte i PNG-format.
Sådan ét A4-ark blev til 1.2 mb.
En udskrift ligner en farve-fotokopi.
Jeg kunne nok godt have noget ned i 100 dpi eller derunder, så ville jeg
spare meget plads. Husk, halv dpi kræver kun det kvarte plads.
Desuden kunne jeg have valgt et format med kvalitetstab, det ville måske
også spare noget plads.
--
Mvh.
Niels Andersen
(la nels. anersyn.)