www.mamboteam.com
www.elsotanillo.net
Home arrow Linux arrow Scripts Bash arrow Linux - Script Bash para encontrar ficheros duplicados con diferentes nombres en el mismo directorio
jueves, 20 noviembre 2008
 
 
  • Español
  • English
  • Français
Menu Principal
Home
Windows
Linux
Pictures
Blog
Noticias RSS
Enlaces de interes
Frases Celebres
Mi Clave GPG
Cursos LPI de la UOC
Utilidades
Search
Webmail
Diccionarios Online
El tiempo
Alicante, Spain
Temp: 14°C
Wind Chill: 14°C
Humidity: 67%
Speed: 19 km/h
Direct.: 20°
Barom.: 1023.0 mb
NNE
Show more details
Provided by: 
Web translation / Traduction web

british flagHi, I am translating some of the articles from Spanish to English. If you are interested in one particular article, drop me a line. Maybe you can help me. :)

Salut, je suis en train de traduire des articles d' Espagnol a Français, si tu veux un article, ecri moi. Peut-être tu peux m' aider. :)

Linux - Script Bash para encontrar ficheros duplicados con diferentes nombres en el mismo directorio PDF Print E-mail
User Rating: / 0
PoorBest 
Written by Juan Sierra Pons   
domingo, 29 octubre 2006
Compartelo:
Delicious
Meneame
Mister.Wong
There are no translations available

Algunas veces tenemos un directorio lleno de ficheros repetidos con nombres distintos.

Por ejemplo: dentro de un directorio tipo maildir despúes de algún problema podemos tener un montón de ficheros repetidos con nombres diferentes: el mismo mensaje de e-mail varias veces.

Encontrar ficheros duplicados con diferentes nombres en el mismo directorio usando Bash

Este script muestra solo los ficheros que estan mas de una vez y cuantas veces estan repetidos:

md5sum *| sort |uniq -w33 -D

Podemos añadir este script en nuestro fichero .bash_aliases file para tenerlo siempre disponible:

alias EncontrarFicherosDuplicados='md5sum *| sort |uniq -w33 -D'

md5sum obtiene la suma de control MD5 (128-bit) de cada fichero, los cual nos sirve para identificar ficheros repetidos. Los ficheros que tengan igual suma de control son iguales aunque tengan el nombre distinto.

El formato tiene 2 columnas: La primera columna tiene 32 caracteres con la suma de control y la segunda columna con el nombre Ejemplo:

a4d29c43765b0840b5713cb2029c79b2 1161600399.10652.uPsdZ:2,S

Con sort agrupamos los ficheros repetidos segun su suma de control y con uniq -w33 -D comparamos solo esa suma de control (los 32 caracteres y mostramos por pantalla la tupla suma de control + nombre de fichero de ficheros repetidos

Un resultado tipico podria ser:

1ca439f3907b8552a2391a4214b1da9e 1161600477.10652.vA5ww:2,S
1ca439f3907b8552a2391a4214b1da9e 1161600484.10652.RgsF6:2,S

Esto significa que tenemos 1 fichero repetido 2 veces con la suma de control igual a :

1ca439f3907b8552a2391a4214b1da9e

Y que los ficheros son:

1161600477.10652.vA5ww:2,S
1161600484.10652.RgsF6:2,S
Comments
Add NewSearchRSS
Write comment
Name:
Email:
 
Website:
Title:
UBBCode:
[b] [i] [u] [url] [quote] [code] [img] 
 
 
 
Security Image
Please input the anti-spam code that you can read in the image.

Copyright (C) 2007 Alain Georgette / Copyright (C) 2006 Frantisek Hliva. All rights reserved.

Last Updated ( martes, 01 enero 2008 )
 
< Prev   Next >
Frase celebre del día
Visitas
Imagenes
Linux Howtos
Visto en Barrapunto
Barrapunto
Sindícate
 
Top! Top!