This shows you the differences between two versions of the page.
Both sides previous revision Previous revision | Next revision Both sides next revision | ||
deteccion_de_duplicados [18/08/2010 19:07] fernando |
deteccion_de_duplicados [19/08/2010 10:27] fernando |
||
---|---|---|---|
Line 15: | Line 15: | ||
<file> | <file> | ||
#!/bin/bash | #!/bin/bash | ||
+ | |||
+ | #PATH=/ruta/a/cisis/1660:$PATH | ||
mx biblio \ | mx biblio \ | ||
Line 54: | Line 56: | ||
Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. | Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. | ||
- | Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. | + | Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. Si esa versión de mx no es la predeterminada en la computadora, entonces en ''duplic.sh'' se debe modificar esta línea: |
+ | |||
+ | #PATH=/ruta/a/cisis/1660:$PATH | ||
+ | |||
+ | quitando el ''#'' inicial y reemplazando ''/ruta/a/cisis/1660'' por la ruta que corresponda. | ||
{{tag>catalis admin}} | {{tag>catalis admin}} |