This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
deteccion_de_duplicados [18/08/2010 18:14] fernando |
deteccion_de_duplicados [18/08/2010 19:07] fernando |
||
---|---|---|---|
Line 1: | Line 1: | ||
- | ====== Detección de duplicados ====== | + | ====== Detección de registros bibliográficos duplicados ====== |
<note> | <note> | ||
- | Se agradece todo comentario o sugerencia que contribuya a hacer más comprensible, más usable o más eficiente el método que aquí se presenta. | + | Se agradece todo comentario o sugerencia que contribuya a hacer más comprensible, más usable o más eficiente el método que aquí se presenta. Se puede escribir en esta misma página del wiki, o enviar mensajes al [[http://groups.google.com/group/catalis/browse_thread/thread/17bd2a5661cc08dc|grupo de discusión]]. |
</note> | </note> | ||
Line 9: | Line 9: | ||
Catalis no cuenta con un mecanismo para alertar al catalogador cuando se va a grabar en la base de datos un registro duplicado (aunque tal vez no sería complicado añadirle ese tipo de validación). De modo que, por la salud de nuestro catálogo, nos vemos obligados a realizar periódicamente tareas de control de calidad, que incluyan la detección de registros posiblemente duplicados. | Catalis no cuenta con un mecanismo para alertar al catalogador cuando se va a grabar en la base de datos un registro duplicado (aunque tal vez no sería complicado añadirle ese tipo de validación). De modo que, por la salud de nuestro catálogo, nos vemos obligados a realizar periódicamente tareas de control de calidad, que incluyan la detección de registros posiblemente duplicados. | ||
- | A continuación se presenta un método sencillo que ayuda a detectar registros sospechosos de estar duplicados. Tal como lo mostramos, el método funciona en Linux; con algunas pequeñas adaptaciones puede usarse también en Windows. | + | A continuación se presenta un método sencillo que ayuda a detectar registros sospechosos de estar duplicados. El método, así como lo mostramos, funciona en Linux; con algunas mínimas adaptaciones puede usarse también en Windows. |
Guardamos las siguientes líneas en un archivo que podemos llamar ''duplic.sh'': | Guardamos las siguientes líneas en un archivo que podemos llamar ''duplic.sh'': |