/
Forside
/
Teknologi
/
Udvikling
/
SQL
/
Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn
*
Kodeord
*
Husk mig
Brugerservice
Kom godt i gang
Bliv medlem
Seneste indlæg
Find en bruger
Stil et spørgsmål
Skriv et tip
Fortæl en ven
Pointsystemet
Kontakt Kandu.dk
Emnevisning
Kategorier
Alfabetisk
Karriere
Interesser
Teknologi
Reklame
Top 10 brugere
SQL
#
Navn
Point
1
pmbruun
1704
2
niller
962
3
fehaar
730
4
Interkril..
701
5
ellebye
510
6
pawel
510
7
rpje
405
8
pete
350
9
gibson
320
10
smorch
260
Måske ens.... Sammenlign rækker m. SQL7
Fra :
Soren
Dato :
18-03-01 16:33
Hejsa - jeg kan ikke selv regne den her ud - håber på lidt hjælp.
Jeg ønsker at få vist en række over "forventede" dubletter. De er ikke helt
ens, men næsten.
Problem.
Gammel kundeDB og ny kundeDB - jeg vil gerne matche records.
I den ene record kan navnet fx. være
tbl_OLD
ID: 12345
Name: Dansk Bank
Adr: Vestergade 2
Phone: NULL
tbl_NEW
ID: 1000025
Name: Den Danske Bank A/S
Adr: Vestergade 2-6
Phone 86 12 12 12
Hvordan får jeg listet denne som en potentiel identisk række. Det drejer sig
om 60.000 gamle rækker, op mod 500.000 nye, hvor jeg jo helst ikke vil lave
dubletter, hvis de rent faktisk eksisterer under næsten samme benævnelser.
Jeg forestiller mig noget i retning af følgende.
Soren (
18-03-2001
)
Kommentar
Fra :
Soren
Dato :
18-03-01 16:47
UPS. - det skulle ikke være sendt endnu....
Jeg forestiller mig følgende:
tbl_OLD
ID: 12345
Name: Dansk Bank
Adr: Vestergade 2
Postnr: 8000
Phone: NULL
tbl_NEW
ID: 1000025
Name: Den Danske Bank A/S
Adr: Vestergade 2-6
Postnr: 8000
Phone 86 12 12 12
1. Indlæs navn
2. Check for identisk navn i postnr.
3. Check for identisk adr.
Hvis 2&3 er true - udskriv i én resultat-tabel, med fremmednøgler til de 2
rækker - match: OK
Det er vel meget nemt - men hvad med resten:
?? -Check for størstedelen af name fra tbl_OLD er i name fra tbl_NEW
??-Check for størstedelen af adr fra tbl_OLD er i name - evt. frataget
karakterer bagfra indtil man har fjernet xx% af adressen som
sammenligningsgrundlag.
Fjern mellemrum fra Phone og tjek for ens fx. 6,7 el. 8 første cifre
Skriv i forskellige tabeller afhængigit af resultatet - der kan også være 2
forventede records, hvis der fx. ligger 2 Danske bank på samme Vestergade -
så skal den vel skrive begge rækker.
Er der nogen med erfaring på området?
Tak for hjælpen!
Søren
Lars Kongshøj (
19-03-2001
)
Kommentar
Fra :
Lars Kongshøj
Dato :
19-03-01 01:52
Soren wrote:
> Er der nogen med erfaring på området?
Ja, men den er at du selv bliver nødt til at skræddersy en algoritme til
den slags formål.
--
Lars Kongshøj
Søg
Alle emner
Teknologi
Udvikling
SQL
Indstillinger
Spørgsmål
Tips
Usenet
Reklame
Statistik
Spørgsmål :
177558
Tips :
31968
Nyheder :
719565
Indlæg :
6408929
Brugere :
218888
Månedens bedste
Årets bedste
Sidste års bedste
Copyright © 2000-2024 kandu.dk. Alle rettigheder forbeholdes.