"Erlend Klakegg Bergheim" <erlendkb@online.noNOSPAM> skrev i en meddelelse
news:B6bb8.6674$HL2.142741@news2.ulv.nextra.no...
> "Jens Vestergaard" <j@railsoft.dk> skrev i melding
> news:3c6ccde0$0$89096$edfadb0f@dspool01.news.tele.dk...
> > Kan man få adgang til en html-sides links-collection
> > (document.all.tags("A")) *uden* at læse den ind i en browser?
> Hva med å bruke Winsock til å koble til serveren, sende HTTP-headeren.
> Da mottar du kun ren HTML som ikke skal innom noen leser, ingen popup,
> ingen bilder, ingen script, rett og slett kun det du ønsker ...
Jep - det gør jeg også nu, men der er en række vanskeligheder...
> Så søker du etter "<a ", finder den, finner "</a>" som kommer etterpå
Let nok, men hvad står der ind imellem? Der står lidt <font>, lidt <div>,
lidt class=, lidt <b> og meget andet, som jeg skal have sorteret fra, hvis
jeg manuelt parser HTLM'en. Det *gør* jeg rent faktisk nu, men det er ikke
let at ramme rigtigt hver gang.
> Siden du mottar så lite informasjon fra server, så går også hastigheten
> opp. Da kan du hente frem siden du kommer til og snappe med deg det som
> står mellom <title> og </title> ... Hvorfor velge den vanskeligste måten
Det er præcis derfor jeg gerne vil udenom browseren - og altså gør det nu -
men det bliver for tit upræcist med de mange 'mærkelige' ting, webmastere
gør på deres sider nuomdage...
> Lykke til ... =)
Tak!
--
mvh
Jens Vestergaard
www.railsoft.dk