User Tools

Site Tools


deteccion_de_duplicados

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
Next revision Both sides next revision
deteccion_de_duplicados [18/08/2010 15:35]
fernando
deteccion_de_duplicados [18/08/2010 18:12]
fernando
Line 18: Line 18:
 #!/bin/bash #!/bin/bash
  
-mx biblio uctab=ansi "fst=1000 0 if s(v100,​v110,​v111) > ''​ then v100^a.10,​v110^a.10,​v111^a.10,​ else '​----------',​ fi,​c11,'/',​v250^a.2,'/',​replace(replace(v245^a,'​ /',''​),'​ :',''​)/" ​"pft=v1000^*/"​ now | sort > claves.txt +mx biblio ​
-mx seq=claves.txt create=claves ​now -all +   uctab=ansi ​
-mx claves ​"​pft=if ​v1=ref(mfn-1,v1) then v1/ fi" now > dup-sospechosos.txt+   "fst=
 +      ​if s(v100,​v110,​v111) > ''​ then v100^a.10,​v110^a.10,​v111^a.10,​ else '​----------',​ fi, 
 +      ​c11,'/',​v008*7.4,'/', ​
 +      ​replace(replace(v245^a,'​ /',''​),'​ :',''​)" ​
 +   ​fullinv=clavesdup \ 
 +   ​now -all 
 +    
 +mx dict=clavesdup ​"​pft=if ​val(v1^t)>1 then v1^*/ fi" now
 </​file>​ </​file>​
  
Line 34: Line 41:
  
 <​code>​ <​code>​
-$ ./duplic.sh+$ ./​duplic.sh ​> dup-sospechosos.txt
 </​code>​ </​code>​
  
Line 40: Line 47:
  
 <​file>​ <​file>​
-GENTILE, E//NOTAS DE ALGEBRA +KARLIN, SA/1959/​MATHEMATICAL METHODS AND THEORY IN GAMES, ​PR 
-KARLIN, SA//​MATHEMATICAL METHODS AND THEORY IN GAMES, ​PROGRA +KLEINFEL/1950/VORLESUNGEN UBER DIE ENTWICKLUNG DER MATHEMA 
-KAUFMANN, //METHODES ET MODELES DE LA RECHERCHE OPERATIONNEL +LIONSJ.-/1973/COURS D'​ANALYSE NUMERIQUE 
-RABSONGU//INTRODUCAO A TEORIA DAS PROBABILIDADES PARA MATE +LIUSTERNIK/1961/ELEMENTS OF FUNCTIONAL ANALYSIS 
-REY PASTOR//LOS PROBLEMAS LINEALES DE LA FISICA+MORGADO, J/​1962/​INTRODUCAO A TEORIA DOS RETICULADOS.
 </​file>​ </​file>​
  
-Es de esperar que este método produzca unos cuantos falsos positivos; por otra parte, no debemos suponer que este método permita ​encontrar a //todos// los duplicados. Es decir, puede andar flojo [[http://​en.wikipedia.org/​wiki/​Precision_and_recall|tanto en '​precision'​ como en '​recall'​]]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos.+Es de esperar que este método produzca unos cuantos falsos positivos; por otra parte, no debemos suponer que nos permitirá ​encontrar a //todos// los duplicados. Es decir, ​el método ​puede andar flojo [[http://​en.wikipedia.org/​wiki/​Precision_and_recall|tanto en '​precision'​ como en '​recall'​]]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos.
  
 Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''​mx'',​ que trabaja con claves grandes. Se lo puede descargar desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|el sitio de la BVS]]. Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''​mx'',​ que trabaja con claves grandes. Se lo puede descargar desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|el sitio de la BVS]].
deteccion_de_duplicados.txt · Last modified: 19/08/2010 00:00 (external edit)