This shows you the differences between two versions of the page.
Next revision | Previous revision | ||
deteccion_de_duplicados [18/08/2010 10:58] fernando creado |
deteccion_de_duplicados [19/08/2010 00:00] |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Detección de duplicados ====== | ||
- | Catalis no cuenta con un mecanismo para alertar al catalogador cuando se va a grabar un registro duplicado en la base de datos. | ||
- | |||
- | A continuación se presenta un método "rápido y sucio" que ayuda a detectar registros sospechosos de ser duplicados. | ||
- | |||
- | Guardamos las siguientes líneas en un archivo que podemos llamar ''duplic.sh'': | ||
- | |||
- | <file> | ||
- | #!/bin/bash | ||
- | |||
- | mx biblio uctab=ansi "fst=1000 0 if s(v100,v110,v111) > '' then v100^a.10,v110^a.10,v111^a.10, else '----------', fi,c11,'/',v250^a.2,'/',replace(replace(v245^a,' /',''),' :','')/" "pft=v1000^*/" now | sort > claves.txt | ||
- | mx seq=claves.txt create=claves now -all | ||
- | mx claves "pft=if v1=ref(mfn-1,v1) then v1/ fi" now > dup-sospechosos.txt | ||
- | </file> | ||
- | |||
- | Luego hacemos que el archivo sea ejecutable: | ||
- | |||
- | <code> | ||
- | $ chmod +x duplic.sh | ||
- | </code> | ||
- | |||
- | Ejecutamos el script con este comando: | ||
- | |||
- | <code> | ||
- | $ ./duplic.sh | ||
- | </code> | ||
- | |||
- | En el archivo ''dup-sospechosos.txt'' encontraremos un listado de las claves asociadas a registros que podrían estar duplicados. | ||
- | |||
- | |||
- | {{tag>catalis admin}} |