This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
deteccion_de_duplicados [18/08/2010 19:04] fernando |
deteccion_de_duplicados [19/08/2010 10:27] fernando |
||
---|---|---|---|
Line 2: | Line 2: | ||
<note> | <note> | ||
- | Se agradece todo comentario o sugerencia que contribuya a hacer más comprensible, más usable o más eficiente el método que aquí se presenta. | + | Se agradece todo comentario o sugerencia que contribuya a hacer más comprensible, más usable o más eficiente el método que aquí se presenta. Se puede escribir en esta misma página del wiki, o enviar mensajes al [[http://groups.google.com/group/catalis/browse_thread/thread/17bd2a5661cc08dc|grupo de discusión]]. |
</note> | </note> | ||
Line 15: | Line 15: | ||
<file> | <file> | ||
#!/bin/bash | #!/bin/bash | ||
+ | |||
+ | #PATH=/ruta/a/cisis/1660:$PATH | ||
mx biblio \ | mx biblio \ | ||
Line 54: | Line 56: | ||
Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. | Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. | ||
- | Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. | + | Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. Si esa versión de mx no es la predeterminada en la computadora, entonces en ''duplic.sh'' se debe modificar esta línea: |
+ | |||
+ | #PATH=/ruta/a/cisis/1660:$PATH | ||
+ | |||
+ | quitando el ''#'' inicial y reemplazando ''/ruta/a/cisis/1660'' por la ruta que corresponda. | ||
{{tag>catalis admin}} | {{tag>catalis admin}} |