This shows you the differences between two versions of the page.
Both sides previous revision Previous revision Next revision | Previous revision Next revision Both sides next revision | ||
deteccion_de_duplicados [18/08/2010 15:35] fernando |
deteccion_de_duplicados [18/08/2010 18:12] fernando |
||
---|---|---|---|
Line 18: | Line 18: | ||
#!/bin/bash | #!/bin/bash | ||
- | mx biblio uctab=ansi "fst=1000 0 if s(v100,v110,v111) > '' then v100^a.10,v110^a.10,v111^a.10, else '----------', fi,c11,'/',v250^a.2,'/',replace(replace(v245^a,' /',''),' :','')/" "pft=v1000^*/" now | sort > claves.txt | + | mx biblio \ |
- | mx seq=claves.txt create=claves now -all | + | uctab=ansi \ |
- | mx claves "pft=if v1=ref(mfn-1,v1) then v1/ fi" now > dup-sospechosos.txt | + | "fst=1 0 \ |
+ | if s(v100,v110,v111) > '' then v100^a.10,v110^a.10,v111^a.10, else '----------', fi, \ | ||
+ | c11,'/',v008*7.4,'/', \ | ||
+ | replace(replace(v245^a,' /',''),' :','')" \ | ||
+ | fullinv=clavesdup \ | ||
+ | now -all | ||
+ | |||
+ | mx dict=clavesdup "pft=if val(v1^t)>1 then v1^*/ fi" now | ||
</file> | </file> | ||
Line 34: | Line 41: | ||
<code> | <code> | ||
- | $ ./duplic.sh | + | $ ./duplic.sh > dup-sospechosos.txt |
</code> | </code> | ||
Line 40: | Line 47: | ||
<file> | <file> | ||
- | GENTILE, E//NOTAS DE ALGEBRA | + | KARLIN, SA/1959/MATHEMATICAL METHODS AND THEORY IN GAMES, PR |
- | KARLIN, SA//MATHEMATICAL METHODS AND THEORY IN GAMES, PROGRA | + | KLEIN, FEL/1950/VORLESUNGEN UBER DIE ENTWICKLUNG DER MATHEMA |
- | KAUFMANN, //METHODES ET MODELES DE LA RECHERCHE OPERATIONNEL | + | LIONS, J.-/1973/COURS D'ANALYSE NUMERIQUE |
- | RABSON, GU//INTRODUCAO A TEORIA DAS PROBABILIDADES PARA MATE | + | LIUSTERNIK/1961/ELEMENTS OF FUNCTIONAL ANALYSIS |
- | REY PASTOR//LOS PROBLEMAS LINEALES DE LA FISICA | + | MORGADO, J/1962/INTRODUCAO A TEORIA DOS RETICULADOS. |
</file> | </file> | ||
- | Es de esperar que este método produzca unos cuantos falsos positivos; por otra parte, no debemos suponer que este método permita encontrar a //todos// los duplicados. Es decir, puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. | + | Es de esperar que este método produzca unos cuantos falsos positivos; por otra parte, no debemos suponer que nos permitirá encontrar a //todos// los duplicados. Es decir, el método puede andar flojo [[http://en.wikipedia.org/wiki/Precision_and_recall|tanto en 'precision' como en 'recall']]... pero al menos es una ayuda para empezar a limpiar nuestros catálogos. |
Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. | Para mejorar la precisión es conveniente usar la versión 16/60 del utilitario ''mx'', que trabaja con claves grandes. Se lo puede descargar desde [[http://bvsmodelo.bvsalud.org/php/level.php?lang=es&component=28&item=1|el sitio de la BVS]]. |