User Tools

Site Tools


migracion_desde_excel

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Next revision
Previous revision
Next revision Both sides next revision
migracion_desde_excel [28/06/2012 09:34]
fernando creado
migracion_desde_excel [28/06/2012 10:38]
fernando
Line 4: Line 4:
 Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] en el grupo de Catalis, acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información confiable sobre este tema. Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] en el grupo de Catalis, acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información confiable sobre este tema.
  
 +Partimos de esta muestra de 10 registros:
 +
 +  * {{:​excel:​femicab.xls|Archivo XLS}}
 +  * {{:​excel:​femi01.csv|Archivo CSV}}
 +  * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}
 +
 +(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows -- FG)
 +
 +Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial de CISIS (Bireme)]]. Para compatibilidad con Catalis, hay que usar la versión 10/30.
 +
 +Para examinar los datos con mx, ejecutamos este comando:
 +
 +  mx "​seq=femi01.csv;"​ now
 +
 +cuya salida es:
 +
 +<​file>​
 +mfn=     ​1 ​
 +  1  "​1"​
 +  2  "Rais, Hilda"
 +  3  "​Indicios"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "La Campana"​
 +  7  "​1984"​
 +  8  "​63"​
 +  9  "​20x14"​
 + ​11 ​ "​950-625-006-5"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​13 ​ "2? premio iniciaci?n Secretar?a de cultura de la Naci?n 1983"
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=     ​2 ​
 +  1  "​2"​
 +  2  "Rais, Hilda"
 +  3  "​Belvedere"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Libros deTierra Firme"
 +  7  "​1990"​
 +  8  "​56"​
 +  9  "​20x14"​
 + ​10 ​ ""​Colecci?​n todos bailan"​
 + ​11 ​ " 91""​
 + ​13 ​ "​Colecci?​n Lea Fletcher"​
 + ​15 ​ "​2011"​
 + ​17 ​ "CAJA 1"
 +mfn=     ​3 ​
 +  1  "​3"​
 +  2  "​Calabrese,​ Ana"
 +  3  "La vida como puede"
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "?​ltimo Reino"
 +  7  "​1989"​
 +  8  "​92"​
 +  9  "​21x14"​
 + ​11 ​ "​950-9418-71-4"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=     ​4 ​
 +  1  "​4"​
 +  2  "​Rainis,​ Romea"
 +  3  "Sacar la silla a la vereda"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Libros deTierra Firme"
 +  7  "​2000"​
 +  8  "​49"​
 +  9  "​20x14"​
 + ​10 ​ "​Colecci?​n todos bailan"​
 + ​11 ​ "​950-9551-98-8"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=     ​5 ​
 +  1  "​5"​
 +  2  "​Racosta,​ Azucena"​
 +  3  "Loca de la legua"
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Libros deTierra Firme"
 +  7  "​1990"​
 +  8  "​50"​
 +  9  "​20x14"​
 + ​10 ​ ""​Colecci?​n todos bailan"​
 + ​11 ​ " 104""​
 + ​13 ​ "​Colecci?​n Lea Fletcher"​
 + ​15 ​ "​2011"​
 + ​17 ​ "CAJA 1"
 +mfn=     ​6 ​
 +  1  "​6"​
 +  2  "​Raznovich,​ Diana"
 +  3  "​Tiempo de amar y otros poemas"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "Nuevo D?a"
 +  7  "​1963"​
 +  8  "​42"​
 +  9  "​17x13"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​13 ​ "​Dedicatoria a J.L. Mangieri"​
 + ​14 ​ "​2011"​
 + ​16 ​ "​CUARENTENA"​
 +mfn=     ​7 ​
 +  1  "​7"​
 +  2  "Doe, John"
 +  3  "?​-?​-?​-?​-?​ "
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Botella al Mar"
 +  7  "​1988"​
 +  8  "​46"​
 +  9  "​20x14"​
 + ​11 ​ "​950-513-193-X"​
 + ​12 ​ "​Colecci?​n -?​-?​-?​-?​-?"​
 + ​13 ​ "​dummy"​
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=     ​8 ​
 +  1  "​8"​
 +  2  "​Ponce,​ Liliana"​
 +  3  "​Composici?​n (Poes?a 1976-1979)"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "?​ltimo Reino"
 +  7  "​1984"​
 +  8  "​70"​
 +  9  "​21x11"​
 + ​11 ​ "​950-9418-06-4"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=     ​9 ​
 +  1  "​9"​
 +  2  "​Ponce,​ Liliana"​
 +  3  "Trama continua"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Corregidor"​
 +  7  "​1976"​
 +  8  "​50"​
 +  9  "​18x13"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​13 ​ "​Premio Fondo Nacional de las Artes 1975"
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +mfn=    10 
 +  1  "​10"​
 +  2  "​Puente,​ Silvia"​
 +  3  "Otra versi?n de la tragedia"​
 +  4  "​1a"​
 +  5  "​Buenos Aires"
 +  6  "​Ambigua Selva"
 +  7  "​1989"​
 +  8  "​101"​
 +  9  "​18x14"​
 + ​12 ​ "​Colecci?​n Lea Fletcher"​
 + ​13 ​ "​Dedicatoria a Lea Fletcher"​
 + ​14 ​ "​2011"​
 + ​16 ​ "CAJA 1"
 +</​file>​
 +
 +Vemos que hay algunos problemas con los caracteres acentuados; luego habrá que volver a eso para resolverlo.
 +
 +También se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.
 +
 +Para hacer una primera prueba de migración, usaremos este archivo pft:
 +
 +{{:​excel:​migra.pft|PFT para migración, versión 1}} 
 +
 +Lo aplicamos mediante este comando:
 +
 +  mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now
 +
 +El pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento.
  
migracion_desde_excel.txt · Last modified: 30/06/2012 00:00 (external edit)