Limpiando archivos repetidos desde la Consola

1 comment
El día de hoy me dio un rato por ordenar mis archivos, antes de ir y comenzar la jornada, primero se me vino a la mente hacer algo desde la consola que me permita mostrar los archivos repetidos,  lo primero que se me ocurrio es usar la suma MD5 el hash. Lo que hice fue armar lo siguiente.


md5sum *| sort |uniq -w33 -D



Paso a explicar como funciona md5sum es para generar la suma md5 de cada archivo dentro de la carpeta con  sort llegamos a agrupar los ficheros repetidos con el md5 repetido y uniq -w33 -D comparamos solo los hash MD5.

Por comodidad me cree un alias y comenzó la prueba.

Colisión MD5

Colisión MD5 de 2 archivos vacios.

Lo que puede preocupar es que suceda una colisión MD5 entre dos archivos como es este caso el primer tema es Melendi - Calle Pantomima el segundo es otro completamente distinto, procedí a revisar ambos y verificar, y si efectivamente eran lo mismo no contenian nada por lo tanto paso pero viéndolo del lado  positivo que suceda una colisión puede ser algo muy extraño.



Archivos semejantes
Procedo con la verificacion de los 2 archivos y correctamente tenia 2 copias ¬¬°


Ambos son lo mismo 

Otro Ejemplo
Bueno seria mas que bien que la búsqueda sea recursiva mandar como path una carpeta y que lo haga aver que se me ocurre y hago algo o alguien me ayuda.. jejejej

Mañana hare el otro post ya que con fdupes llega a realizar este proceso mas rapido.


1 comentario

  1. Lograron hacer esto con el loop para todo el disco?

    ResponderEliminar