User Tools

Site Tools


deteccion_de_duplicados

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision Both sides next revision
deteccion_de_duplicados [18/08/2010 19:07]
fernando
deteccion_de_duplicados [19/08/2010 10:27]
fernando
Line 15: Line 15:
 <​file>​ <​file>​
 #!/bin/bash #!/bin/bash
 +
 +#​PATH=/​ruta/​a/​cisis/​1660:​$PATH
  
 mx biblio \ mx biblio \
Line 54: Line 56:
 Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://​en.wikipedia.org/​wiki/​Precision_and_recall|tanto en '​precision'​ como en '​recall'​]]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. Es de esperar que este método produzca falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://​en.wikipedia.org/​wiki/​Precision_and_recall|tanto en '​precision'​ como en '​recall'​]]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos.
  
-Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''​mx'',​ que trabaja con claves grandes. Se lo puede descargar desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|el sitio de la BVS]].+Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''​mx'',​ que trabaja con claves grandes. Se lo puede descargar desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|el sitio de la BVS]]. Si esa versión de mx no es la predeterminada en la computadora,​ entonces en ''​duplic.sh''​ se debe modificar esta línea: 
 + 
 +  #​PATH=/​ruta/​a/​cisis/​1660:​$PATH 
 + 
 +quitando el ''#''​ inicial y reemplazando ''/​ruta/​a/​cisis/​1660''​ por la ruta que corresponda.
  
  
 {{tag>​catalis admin}} {{tag>​catalis admin}}
deteccion_de_duplicados.txt · Last modified: 19/08/2010 00:00 (external edit)