/ Forside / Teknologi / Operativsystemer / Linux / Nyhedsindlæg
Login
Glemt dit kodeord?
Brugernavn

Kodeord


Reklame
Top 10 brugere
Linux
#NavnPoint
o.v.n. 11177
peque 7911
dk 4814
e.c 2359
Uranus 1334
emesen 1334
stone47 1307
linuxrules 1214
Octon 1100
10  BjarneD 875
Slette dupicate files
Fra : Niels Andersen


Dato : 13-03-02 08:35

Jeg vil gerne gennemgå en stak filer for at finde dupletter.
Filer med forskellige navne, men ens indhold, er hvad jeg kalder dupletter,
i denne sammenhæng. Når to ens filer findes, skal den nyeste slettes.

Kender i en nem måde at gøre dette, eller skal jeg i gang med at scripte
selv?


Historien:
Noget gik galt. Jeg har en stak mails, som jeg vist får i 50-100
eksemplarer. De bliver lagt i Maildir-format. Jeg *tror* at headerne er
ens, men det kan godt være at der fx. er en received eller delivered-to
header med anderledes dato. Øvøv.

--
Mvh.

Niels Andersen
Linux 2.4.17 - Debian 3.0


 
 
Jacob Sparre Anderse~ (18-03-2002)
Kommentar
Fra : Jacob Sparre Anderse~


Dato : 18-03-02 19:20

Niels Andersen skrev:

> Jeg vil gerne gennemgå en stak filer for at finde dupletter.
> Filer med forskellige navne, men ens indhold, er hvad jeg kalder dupletter,
> i denne sammenhæng. Når to ens filer findes, skal den nyeste slettes.

Jeg kender ikke lige et færdigt program til formålet, men
hvis vi kan gå ud fra at der ikke er specialtegn som /, ', "
og mellemrum i filnavnene, kan man nok hakke noget sammen.

find et/katalog/ et/andet/katalog -type f -printf
'%s\t%p\n'

giver (med GNU Find) en liste med filstørrelser og -navne.
Du er selvfølgelig kun interesseret i at sammenligne filer
der er lige store, så en tur gennem `sort` vil nok hjælpe
lidt. (og så kan jeg ikke lige finde på mere)

Jacob
--
"Genes don't matter. It's all physics."

Morten Bo Johansen (18-03-2002)
Kommentar
Fra : Morten Bo Johansen


Dato : 18-03-02 21:27

Jacob Sparre Andersen <sparre@nbi.dk> wrote:

JSA> Niels Andersen skrev:

>> Jeg vil gerne gennemgå en stak filer for at finde dupletter.
>> Filer med forskellige navne, men ens indhold, er hvad jeg kalder dupletter,
>> i denne sammenhæng. Når to ens filer findes, skal den nyeste slettes.

JSA> Jeg kender ikke lige et færdigt program til formålet

------------< snip <------< snip <------< snip <------------


Package: fdupes
Description: Identifies duplicate files within given directories.
FDupes uses md5sums and then a byte by byte comparison to find
duplicate files within a set of directories. It has several useful
options including recursion.

JSA> "Genes don't matter. It's all physics."

genes don't matter it's all metaphysics


Morten


--
"Anyone can do any amount of work provided it isn't the work he is supposed
to be doing at that moment." (Robert Benchley)

Christian E. Lysel (18-03-2002)
Kommentar
Fra : Christian E. Lysel


Dato : 18-03-02 19:27

Niels Andersen wrote:

> Jeg vil gerne gennemgå en stak filer for at finde dupletter.
> Filer med forskellige navne, men ens indhold, er hvad jeg kalder dupletter,
> i denne sammenhæng. Når to ens filer findes, skal den nyeste slettes.
>
> Kender i en nem måde at gøre dette, eller skal jeg i gang med at scripte
> selv?


Scripte selv.


Jeg brugte MD5, sidste jeg havde ovenstående behov.


Søg
Reklame
Statistik
Spørgsmål : 177513
Tips : 31968
Nyheder : 719565
Indlæg : 6408599
Brugere : 218887

Månedens bedste
Årets bedste
Sidste års bedste