User Tools

Site Tools


deteccion_de_duplicados

This is an old revision of the document!


Detección de duplicados

Catalis no cuenta con un mecanismo para alertar al catalogador cuando se va a grabar un registro duplicado en la base de datos.

A continuación se presenta un método “rápido y sucio” que ayuda a detectar registros sospechosos de ser duplicados.

Guardamos las siguientes líneas en un archivo que podemos llamar duplic.sh:

#!/bin/bash

mx biblio uctab=ansi "fst=1000 0 if s(v100,v110,v111) > '' then v100^a.10,v110^a.10,v111^a.10, else '----------', fi,c11,'/',v250^a.2,'/',replace(replace(v245^a,' /',''),' :','')/" "pft=v1000^*/" now | sort > claves.txt
mx seq=claves.txt create=claves now -all
mx claves "pft=if v1=ref(mfn-1,v1) then v1/ fi" now > dup-sospechosos.txt

Luego hacemos que el archivo sea ejecutable:

$ chmod +x duplic.sh

Ejecutamos el script con este comando:

$ ./duplic.sh

En el archivo dup-sospechosos.txt encontraremos un listado de las claves asociadas a registros que podrían estar duplicados.

deteccion_de_duplicados.1282139889.txt.gz · Last modified: 18/08/2010 00:00 (external edit)