Martin Larsen wrote:
> Erik Richard Sørensen wrote:
>
>> Hm, egentlig ikke så underligt, hvis man har brugt enten Illustrator
>> eller evt. InDesigns scannemuligheder og indscannet som 'layers'. - Jeg
>> har flere plug-ins til begge, der kan det. - Har også lige checket med
>> ReadIRIS scanneprogrammet alene, og ja, det er scannet som OCR.
>
> Forklar gerne nærmere. Jeg synes ikke det ligner OCR. Der er ikke kommet
> noget som helst karakterbaseret ud af det.
Det kommer an på, hvilken metode, du scanner efter... Scanner du med
'text', vil det blot blive vist som ren tekst (plain text = .txt), og
hvis du så har valgt fx. Word som output format, bliver det til en
blanding af tekst og tabel.
Scanner du som billede (image), vil du kun få ét billede, hvor det hele
er som en enkelt billede, der ikke kan redigeres eller flyttes rundt på.
Scanner du som dokument (file), er det oftest scannerprogrammet, der
vælger output formatet - på PC/Windows oftest Word - igen en blanding af
tekst og tabel, - og på Mac oftest som RTF bliver det også en blanding
af tekst og tabel.
Ud over det har jeg både i Ilustrator og ReadIRIS mulighed for at scanne
direkte til PDF via en plug-in. Den metode giver faktisk også et
redigerbart dokument, hvor der kan ændres og rettes, tilføjes, fjernes
og byttes om på hvert enkelt bogstav og/eller felt.
> Jeg synes også opdelingen i
> felter mildest talt er lidt underlig hvis det skulle være sket
> automatisk.
Nej, neetop når det er automatisk, vælger scannerprogrammet den til
dokumentet bedste løsning. Min vurdering er her, at der er brugt 'file'
som std. indstilling på scannerprogrammet.
> Har du prøvet at flytte rundt på felterne?
Ja, og det kan man sagtens, når der er brugt 'file' som scanningsformat.
> Nu har jeg ikke ReadIRIS, men hvordan ser du med dette at det er scannet
> ind som OCR?
Ved at jeg i ReadIRIS kan 'opløse' hele dokumentet - ikke blot i tekst
og felter, men selve teksten kan også opløses i 'single frames' - altså
hvor hvert enkelt bogstav står som et redigerbart tekstfelt (text box).
Jeg véd fra et par amerikanske bekendte, der er læger, at de nu stort
set kører det hele online, så alt bliver overført til høj-krypterede
computer databaser, hvor det ligger som datablade (cards). Og så er det
blot at lave en såkaldt 'Print to PDF' af det pågældende datablad, så
får du også en fil som den her.
Det, der undrer mig mest her, er, at filen ikke er låst, så den kun er
'kun læse' (read only)... - Og /det/ er knap så smart af den gode Obama,
da det rent faktisk åbner mulighed for manipulation. ...
....Det var som pokker! - Jeg har lige åbnet filen i BBEdit 9.6.2.2880
på min MacPro med OS X 10.5.8. Filen er indscannet med Apple Pages
(iWork 09, Apple Quarts PDFContext) på en computer med Mac OS X 10.6.7
og arkiveret til Preview med PDF 1.3 PDFConvert (Apple modificeret ver.
af Adobe PDF Engine 1.3). Jeg kan også se, at en del data er krypteret,
da BBEdit bruger '¤' som krypteringstegn. - Flere steder i dokumentet
står der fx.
35 0 obj
(¤)
endobj
/Title\ID [ ¤ xxxxxxxxxxxx ) >>[ ID 0 ]
(35 = med linienummeret i dokumentets objektgalleri)
- Så her må både BBEdit og jeg give op.
- BBEdit kan ikke åbne og
vise krypterede data...
De krypterede felter kan godt tyde på, at de felter hører til i den
udvidede fødselsattest, som kun lægerne på fødselshospitalet har adgang
til, og at den 'almindelige' fødselsattest udskrives fra denne, men i
tillempet form.
Jeg vidste godt i forvejen, at flere hospitaler og også The White House
og Pentagon for en stor dels vedkommende bruger Apple computere og OS X,
men at de også bruger noget så dårligt som iWork, - /det/ kommer bag på mig!
mvh. Erik Richard
--
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
Erik Richard Sørensen, Member of ADC, <mac-manNOSP@Mstofanet.dk>
NisusWriter - The Future In Multilingual Text Processing -
www.nisus.com
OpenOffice.org - The Modern Productivity Solution -
www.openoffice.org
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~