www.mamboteam.com
www.elsotanillo.net
Home arrow Linux arrow Scripts Bash arrow Linux - Script Bash para encontrar ficheros duplicados con diferentes nombres en el mismo directorio
sábado, 06 de septiembre de 2008
 
 
Web translation / Traduction web

british flagHi, I am translating some of the articles from Spanish to English. If you are interested in one particular article, drop me a line. Maybe you can help me. :)

Salut, je suis en train de traduire des articles d' Espagnol a Français, si tu veux un article, ecri moi. Peut-être tu peux m' aider. :)

Linux - Script Bash para encontrar ficheros duplicados con diferentes nombres en el mismo directorio PDF Imprimir E-Mail
Calificación del usuario: / 0
MaloBueno 
escrito por Juan Sierra Pons   
domingo, 29 de octubre de 2006
Compartelo:
Delicious
Meneame
Mister.Wong

Algunas veces tenemos un directorio lleno de ficheros repetidos con nombres distintos.

Por ejemplo: dentro de un directorio tipo maildir despúes de algún problema podemos tener un montón de ficheros repetidos con nombres diferentes: el mismo mensaje de e-mail varias veces.

Encontrar ficheros duplicados con diferentes nombres en el mismo directorio usando Bash

Este script muestra solo los ficheros que estan mas de una vez y cuantas veces estan repetidos:

md5sum *| sort |uniq -w33 -D

Podemos añadir este script en nuestro fichero .bash_aliases file para tenerlo siempre disponible:

alias EncontrarFicherosDuplicados='md5sum *| sort |uniq -w33 -D'

md5sum obtiene la suma de control MD5 (128-bit) de cada fichero, los cual nos sirve para identificar ficheros repetidos. Los ficheros que tengan igual suma de control son iguales aunque tengan el nombre distinto.

El formato tiene 2 columnas: La primera columna tiene 32 caracteres con la suma de control y la segunda columna con el nombre Ejemplo:

a4d29c43765b0840b5713cb2029c79b2 1161600399.10652.uPsdZ:2,S

Con sort agrupamos los ficheros repetidos segun su suma de control y con uniq -w33 -D comparamos solo esa suma de control (los 32 caracteres y mostramos por pantalla la tupla suma de control + nombre de fichero de ficheros repetidos

Un resultado tipico podria ser:

1ca439f3907b8552a2391a4214b1da9e 1161600477.10652.vA5ww:2,S
1ca439f3907b8552a2391a4214b1da9e 1161600484.10652.RgsF6:2,S

Esto significa que tenemos 1 fichero repetido 2 veces con la suma de control igual a :

1ca439f3907b8552a2391a4214b1da9e

Y que los ficheros son:

1161600477.10652.vA5ww:2,S
1161600484.10652.RgsF6:2,S
Comentarios
Añadir nuevoBuscarRSS
Escribir comentario
Nombre:
Email:
 
Website:
Título:
Código UBB:
[b] [i] [u] [url] [quote] [code] [img] 
 
 
 
Security Image
Por favor introduce el código anti-spam que puedes leer en la imagen.

Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved.

Modificado el ( martes, 01 de enero de 2008 )
 
< Anterior   Siguiente >
Frase celebre del día
Visitas
Imagenes
Linux Howtos
Noticias de Alicante
 
Visto en Barrapunto
Barrapunto
Sindícate
 
Top! Top!