Kandu.dk - Scanning til tekstgenkendelse


/ Forside / Teknologi / Multimedie & design / Andet multimedie / Nyhedsindlæg

Glemt dit kodeord?

Brugernavn*

Kodeord *

Husk mig

Brugerservice

Kom godt i gang

Bliv medlem

Seneste indlæg

Find en bruger

Stil et spørgsmål

Skriv et tip

Fortæl en ven

Pointsystemet

Kontakt Kandu.dk

Emnevisning

Kategorier

Alfabetisk

Karriere

Interesser

Teknologi

Reklame

Top 10 brugere

Andet multimedie

#	Navn	Point
1	refi	19159
2	Klaudi	14015
3	severino	5400
4	pallebhan..	4553
5	molokyle	4203
6	o.v.n.	3762
7	tedd	3707
8	bentjuul	3670
9	transor	2817
10	miritdk	2644

Scanning til tekstgenkendelse
Fra : Marianne

Dato : 10-11-02 19:34

Hej

Er der en, der kan give mig lidt tips til at scanne for senere
tekstgenkendelse.

Jeg scanner fra en alm. hus-scanner (HP2200), og jeg benytter det
medfølgende software.
Bogen, jeg scanner fra, er trykt på gulligt papir med sorte bogstaver. Jeg
forsøger at scanne med så stor opløsning som muligt (output: text and
image), og det giver 300 dpi. Scanneren skulle kunne scanne med 600 dpi, men
det kan jeg ikke få den til.

Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem !
Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til 'graytone',
øger kontrasten til '50', øger brightness til så meget, at baggrunden er på
den sikre side af hvid. Endelig konverterer jeg til RGB for at kunne gemme
som TIF (hvilket mit OCR-program kræver).

Nogen gange bliver resultatet tilfredsstillende, men ofte er bogstaverne for
udviskede og ikke markante nok til at kunne blive genkendt.

Er der råd for dette ???

På forhånd tak

mvh
Marianne

Studio Smalbro (10-11-2002)

Kommentar
Fra : Studio Smalbro

Dato : 10-11-02 21:04

Det lyder fornuftiigt nok med de "øvelser" du har gang i med photoshop. Det
kunne muligvis svare sig at eksperimentere med baggrundsfarven. Du forsøger
at få baggrundsfarven væk, men det er vigtigt for dig er at bogstavet står
skarpt. Det kan godt stå skarpt på en gul baggrund. Når du forsøger at
fjerne baggrundsfarven gør du sikkert også bogstaverne mere uldne, fordi
noget af den farveinfo der går i den sorte forsvinder. Men OCR programmet er
ret vigtigt. Jeg bruger selv OmniPage Pro, som er det bedste af dem jeg har
prøvet. Jeg kan ikke huske hvad det koster. Det har en god brugerflade og et
fornuftigt dansk ordforråd.
Kh
Bjørn

"Marianne" <hoyen@lundbak.dk> wrote in message
news:3dcea697$0$75411$edfadb0f@dread15.news.tele.dk...
> Hej
>
> Er der en, der kan give mig lidt tips til at scanne for senere
> tekstgenkendelse.
>
> Jeg scanner fra en alm. hus-scanner (HP2200), og jeg benytter det
> medfølgende software.
> Bogen, jeg scanner fra, er trykt på gulligt papir med sorte bogstaver. Jeg
> forsøger at scanne med så stor opløsning som muligt (output: text and
> image), og det giver 300 dpi. Scanneren skulle kunne scanne med 600 dpi,
men
> det kan jeg ikke få den til.
>
> Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem !
> Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til
'graytone',
> øger kontrasten til '50', øger brightness til så meget, at baggrunden er
på
> den sikre side af hvid. Endelig konverterer jeg til RGB for at kunne gemme
> som TIF (hvilket mit OCR-program kræver).
>
> Nogen gange bliver resultatet tilfredsstillende, men ofte er bogstaverne
for
> udviskede og ikke markante nok til at kunne blive genkendt.
>
> Er der råd for dette ???
>
> På forhånd tak
>
>
> mvh
> Marianne
>
>

Digit (10-11-2002)

Kommentar
Fra : Digit

Dato : 10-11-02 21:29

"Marianne" ræsonnerede, og skrev d. 10 nov 2002:

> Er der en, der kan give mig lidt tips til at scanne for senere
> tekstgenkendelse.
>
> Jeg sender dernæst billedet over i Photoshop. Her prøver jeg mig frem
> ! Billedet er i udgangspunktet et bmp-billede. Jeg konverterer til
> 'graytone', øger kontrasten til '50', øger brightness til så meget, at
> baggrunden er på den sikre side af hvid. Endelig konverterer jeg til
> RGB for at kunne gemme som TIF (hvilket mit OCR-program kræver).
>
> Nogen gange bliver resultatet tilfredsstillende, men ofte er
> bogstaverne for udviskede og ikke markante nok til at kunne blive
> genkendt.
>
> Er der råd for dette ???

1. Scan som 'lineart' og brug så høj en opløsning som muligt.

2. Scan som grayscale i så høj en opløsning som muligt. I photoshop
vælger du kommandoen 'threshold' (tærskel på dansk) og sætter en optimal
værdi (læs. læsbarhed).

Noget OCR soft arbejder dog bedst med 300 dpi.

Wayne Fulton (som altid) har en glimrende gennemgang af lineart
<http://www.scantips.com/basics04.html>

--
/Digit

»The enigma lies broken
Searching for those precious moments
Reaching for a higher of existence
Like a newborn migrant in the void«
Dimmu Borgir

Marianne (10-11-2002)

Kommentar
Fra : Marianne

Dato : 10-11-02 23:01

Tak for rådene - det fungerer straks bedre. Glimrende link til
'scantips.com'.

mvh
Marianne

Søg

Reklame

Statistik

Spørgsmål :	177760
Tips :	31970
Nyheder :	719565
Indlæg :	6410487
Brugere :	218906

Månedens bedste

Årets bedste

Sidste års bedste