User Tools

Site Tools


migracion_desde_excel

This is an old revision of the document!


Migración desde Excel a Catalis

Motivados por una consulta y la subsiguiente discusión en el grupo de Catalis, acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información confiable sobre este tema.

Partimos de esta muestra de 10 registros:

(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows – FG)

Los utilitarios CISIS (mx y demás) pueden descargarse desde la página oficial de CISIS (Bireme). Para compatibilidad con Catalis, hay que usar la versión 10/30.

Para examinar los datos con mx, ejecutamos este comando:

mx "seq=femi01.csv;" now

cuya salida es:

mfn=     1 
  1  "1"
  2  "Rais, Hilda"
  3  "Indicios"
  4  "1a"
  5  "Buenos Aires"
  6  "La Campana"
  7  "1984"
  8  "63"
  9  "20x14"
 11  "950-625-006-5"
 12  "Colecci?n Lea Fletcher"
 13  "2? premio iniciaci?n Secretar?a de cultura de la Naci?n 1983"
 14  "2011"
 16  "CAJA 1"
mfn=     2 
  1  "2"
  2  "Rais, Hilda"
  3  "Belvedere"
  4  "1a"
  5  "Buenos Aires"
  6  "Libros deTierra Firme"
  7  "1990"
  8  "56"
  9  "20x14"
 10  ""Colecci?n todos bailan"
 11  " 91""
 13  "Colecci?n Lea Fletcher"
 15  "2011"
 17  "CAJA 1"
mfn=     3 
  1  "3"
  2  "Calabrese, Ana"
  3  "La vida como puede"
  4  "1a"
  5  "Buenos Aires"
  6  "?ltimo Reino"
  7  "1989"
  8  "92"
  9  "21x14"
 11  "950-9418-71-4"
 12  "Colecci?n Lea Fletcher"
 14  "2011"
 16  "CAJA 1"
mfn=     4 
  1  "4"
  2  "Rainis, Romea"
  3  "Sacar la silla a la vereda"
  4  "1a"
  5  "Buenos Aires"
  6  "Libros deTierra Firme"
  7  "2000"
  8  "49"
  9  "20x14"
 10  "Colecci?n todos bailan"
 11  "950-9551-98-8"
 12  "Colecci?n Lea Fletcher"
 14  "2011"
 16  "CAJA 1"
mfn=     5 
  1  "5"
  2  "Racosta, Azucena"
  3  "Loca de la legua"
  4  "1a"
  5  "Buenos Aires"
  6  "Libros deTierra Firme"
  7  "1990"
  8  "50"
  9  "20x14"
 10  ""Colecci?n todos bailan"
 11  " 104""
 13  "Colecci?n Lea Fletcher"
 15  "2011"
 17  "CAJA 1"
mfn=     6 
  1  "6"
  2  "Raznovich, Diana"
  3  "Tiempo de amar y otros poemas"
  4  "1a"
  5  "Buenos Aires"
  6  "Nuevo D?a"
  7  "1963"
  8  "42"
  9  "17x13"
 12  "Colecci?n Lea Fletcher"
 13  "Dedicatoria a J.L. Mangieri"
 14  "2011"
 16  "CUARENTENA"
mfn=     7 
  1  "7"
  2  "Doe, John"
  3  "?-?-?-?-? "
  4  "1a"
  5  "Buenos Aires"
  6  "Botella al Mar"
  7  "1988"
  8  "46"
  9  "20x14"
 11  "950-513-193-X"
 12  "Colecci?n -?-?-?-?-?"
 13  "dummy"
 14  "2011"
 16  "CAJA 1"
mfn=     8 
  1  "8"
  2  "Ponce, Liliana"
  3  "Composici?n (Poes?a 1976-1979)"
  4  "1a"
  5  "Buenos Aires"
  6  "?ltimo Reino"
  7  "1984"
  8  "70"
  9  "21x11"
 11  "950-9418-06-4"
 12  "Colecci?n Lea Fletcher"
 14  "2011"
 16  "CAJA 1"
mfn=     9 
  1  "9"
  2  "Ponce, Liliana"
  3  "Trama continua"
  4  "1a"
  5  "Buenos Aires"
  6  "Corregidor"
  7  "1976"
  8  "50"
  9  "18x13"
 12  "Colecci?n Lea Fletcher"
 13  "Premio Fondo Nacional de las Artes 1975"
 14  "2011"
 16  "CAJA 1"
mfn=    10 
  1  "10"
  2  "Puente, Silvia"
  3  "Otra versi?n de la tragedia"
  4  "1a"
  5  "Buenos Aires"
  6  "Ambigua Selva"
  7  "1989"
  8  "101"
  9  "18x14"
 12  "Colecci?n Lea Fletcher"
 13  "Dedicatoria a Lea Fletcher"
 14  "2011"
 16  "CAJA 1"

Vemos que hay algunos problemas con los caracteres acentuados; luego habrá que volver a eso para resolverlo.

También se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';' dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '|'.

Para hacer una primera prueba de migración, usaremos este archivo pft:

PFT para migración, versión 1

Lo aplicamos mediante este comando:

mx "seq=femi01.csv;" "proc=@migra.pft" create=biblio now
Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores, añadir campos que no fueron tenidos en cuenta, considerar casos que esa pequeña muestra no fueron detectados, etc. etc.
migracion_desde_excel.1340891864.txt.gz · Last modified: 28/06/2012 00:00 (external edit)