User Tools

Site Tools


migracion_desde_excel

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
migracion_desde_excel [28/06/2012 09:41]
fernando
migracion_desde_excel [30/06/2012 00:00] (current)
Line 2: Line 2:
  
  
-Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] ​en el grupo de Catalis, ​acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información ​confiable ​sobre este tema.+Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una buena fuente de información sobre este tema. 
 + 
 +Partimos de esta muestra de 10 registros, provista por quien envió esa consulta: 
 + 
 +  * {{:​excel:​femicab.xls|Archivo XLS}} 
 +  * {{:​excel:​femi01.csv|Archivo CSV}} 
 +  * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}} 
 + 
 +(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows --- //Fernando Gómez, 2012/​06/​28//​) 
 + 
 +Las columnas de esa tabla Excel tienen los siguientes títulos: 
 + 
 +    N° INV 
 +    AUTOR (Apellido, Nombre) 
 +    TÍTULO 
 +    EDICIÓN 
 +    LUGAR 
 +    EDITORIAL 
 +    AÑO 
 +    N° Pags 
 +    DIMENSIONES 
 +    SERIE 
 +    ISBN 
 +    PROCEDENCIA 
 +    Observaciones 
 +    FECHA INGRESO 
 +    FECHA BAJA 
 +    UBICACIÓN 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    CDU 1 
 +    CDU 2 
 +    TITULO UNIFORME 630 
 +    PERSONA 600 
 +    INSTITUCION 610 
 +    WEB 856 
 + 
 + 
 +Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial de CISIS (Bireme)]]. Para tener compatibilidad con Catalis, hay que usar la versión 10/30. 
 + 
 +Para examinar los datos del archivo csv con mx, ejecutamos este comando: 
 + 
 +  mx "​seq=femi01.csv;"​ now 
 + 
 +cuya salida es: 
 + 
 +<​file>​ 
 +mfn=     1  
 +  1  "​1"​ 
 +  2  "Rais, Hilda"​ 
 +  3  "​Indicios"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "La Campana"​ 
 +  7  "​1984"​ 
 +  8  "​63"​ 
 +  9  "​20x14"​ 
 + ​11 ​ "​950-625-006-5"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​13 ​ "2? premio iniciaci?n Secretar?a de cultura de la Naci?n 1983"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=     2  
 +  1  "​2"​ 
 +  2  "Rais, Hilda"​ 
 +  3  "​Belvedere"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Libros deTierra Firme"​ 
 +  7  "​1990"​ 
 +  8  "​56"​ 
 +  9  "​20x14"​ 
 + ​10 ​ ""​Colecci?​n todos bailan"​ 
 + ​11 ​ " 91""​ 
 + ​13 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​15 ​ "​2011"​ 
 + ​17 ​ "CAJA 1" 
 +mfn=     3  
 +  1  "​3"​ 
 +  2  "​Calabrese,​ Ana" 
 +  3  "La vida como puede"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "?​ltimo Reino"​ 
 +  7  "​1989"​ 
 +  8  "​92"​ 
 +  9  "​21x14"​ 
 + ​11 ​ "​950-9418-71-4"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=     4  
 +  1  "​4"​ 
 +  2  "​Rainis,​ Romea"​ 
 +  3  "Sacar la silla a la vereda"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Libros deTierra Firme"​ 
 +  7  "​2000"​ 
 +  8  "​49"​ 
 +  9  "​20x14"​ 
 + ​10 ​ "​Colecci?​n todos bailan"​ 
 + ​11 ​ "​950-9551-98-8"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=     5  
 +  1  "​5"​ 
 +  2  "​Racosta,​ Azucena"​ 
 +  3  "Loca de la legua"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Libros deTierra Firme"​ 
 +  7  "​1990"​ 
 +  8  "​50"​ 
 +  9  "​20x14"​ 
 + ​10 ​ ""​Colecci?​n todos bailan"​ 
 + ​11 ​ " 104""​ 
 + ​13 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​15 ​ "​2011"​ 
 + ​17 ​ "CAJA 1" 
 +mfn=     6  
 +  1  "​6"​ 
 +  2  "​Raznovich,​ Diana"​ 
 +  3  "​Tiempo de amar y otros poemas"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "Nuevo D?a" 
 +  7  "​1963"​ 
 +  8  "​42"​ 
 +  9  "​17x13"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​13 ​ "​Dedicatoria a J.L. Mangieri"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "​CUARENTENA"​ 
 +mfn=     7  
 +  1  "​7"​ 
 +  2  "Doe, John"​ 
 +  3  "?​-?​-?​-?​-?​ " 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Botella al Mar" 
 +  7  "​1988"​ 
 +  8  "​46"​ 
 +  9  "​20x14"​ 
 + ​11 ​ "​950-513-193-X"​ 
 + ​12 ​ "​Colecci?​n -?​-?​-?​-?​-?"​ 
 + ​13 ​ "​dummy"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=     8  
 +  1  "​8"​ 
 +  2  "​Ponce,​ Liliana"​ 
 +  3  "​Composici?​n (Poes?a 1976-1979)"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "?​ltimo Reino"​ 
 +  7  "​1984"​ 
 +  8  "​70"​ 
 +  9  "​21x11"​ 
 + ​11 ​ "​950-9418-06-4"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=     9  
 +  1  "​9"​ 
 +  2  "​Ponce,​ Liliana"​ 
 +  3  "Trama continua"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Corregidor"​ 
 +  7  "​1976"​ 
 +  8  "​50"​ 
 +  9  "​18x13"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​13 ​ "​Premio Fondo Nacional de las Artes 1975"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +mfn=    10  
 +  1  "​10"​ 
 +  2  "​Puente,​ Silvia"​ 
 +  3  "Otra versi?n de la tragedia"​ 
 +  4  "​1a"​ 
 +  5  "​Buenos Aires"​ 
 +  6  "​Ambigua Selva"​ 
 +  7  "​1989"​ 
 +  8  "​101"​ 
 +  9  "​18x14"​ 
 + ​12 ​ "​Colecci?​n Lea Fletcher"​ 
 + ​13 ​ "​Dedicatoria a Lea Fletcher"​ 
 + ​14 ​ "​2011"​ 
 + ​16 ​ "CAJA 1" 
 +</​file>​ 
 + 
 +Problemas que saltan a la vista: 
 + 
 +  * Los caracteres acentuados no aparecen correctamente;​ luego habrá que volver a eso para resolverlo. 
 +  * Se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​. 
 + 
 +Teniendo en cuenta la estructura de la tabla, que vimos más arriba, y los registros de muestra, podemos comenzar a establecer la correspondencia entre la estructura de datos original y la de MARC 21/Catalis. Por ejemplo, el título (campo 2 en el original) debe ir al subcampo 245$a, mientras que la editorial (campo 6 en el original) debe ir al subcampo 260$b. 
 + 
 + 
 +Para hacer una primera prueba de migración, usaremos este archivo pft: {{:​excel:​migra.pft|PFT para migración, versión 1}}. Ese archivo, escrito en el [[lenguaje_de_formateo|lenguaje de formateo CISIS]] (documentación disponible en [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|esta página]]), puede ser visto como un script que especifica cómo convertir cada registro de esos que vimos arriba, en un registro equivalente en formato MARC 21. 
 + 
 +<note important>​ 
 +Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores,​ añadir campos que no fueron tenidos en cuenta, considerar casos que en esa pequeña muestra no están representados,​ etc. etc. 
 +</​note>​ 
 + 
 +Aplicamos el pft mediante este comando: 
 + 
 +  mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now 
 + 
 +que crea el archivo maestro ''​biblio''​ y produce la siguiente salida: 
 + 
 +<​file>​ 
 +mfn=     1  
 +  1  "​000001"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aRais,​ Hilda."​ 
 +245  "##​^aIndicios."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLa Campana,​^c1984."​ 
 +300  "##​^a63 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a9506250065"​ 
 +859  "##​^p1"​ 
 +mfn=     2  
 +  1  "​000002"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRais,​ Hilda."​ 
 +245  "##​^aBelvedere."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a56 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 91""​ 
 +859  "##​^p2"​ 
 +mfn=     3  
 +  1  "​000003"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aCalabrese,​ Ana."​ 
 +245  "##​^aLa vida como puede."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1989."​ 
 +300  "##​^a92 p. ;^c21x14 cm." 
 + ​20 ​ "##​^a9509418714"​ 
 +859  "##​^p3"​ 
 +mfn=     4  
 +  1  "​000004"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s2000####​xx# ​                ​und#​d"​ 
 +100  "##​^aRainis,​ Romea."​ 
 +245  "##​^aSacar la silla a la vereda."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c2000."​ 
 +300  "##​^a49 p. ;^c20x14 cm." 
 +490  "##​^aColecci?​n todos bailan"​ 
 + ​20 ​ "##​^a9509551988"​ 
 +859  "##​^p4"​ 
 +mfn=     5  
 +  1  "​000005"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRacosta,​ Azucena."​ 
 +245  "##​^aLoca de la legua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a50 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 104""​ 
 +859  "##​^p5"​ 
 +mfn=     6  
 +  1  "​000006"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1963####​xx# ​                ​und#​d"​ 
 +100  "##​^aRaznovich,​ Diana."​ 
 +245  "##​^aTiempo de amar y otros poemas."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bNuevo D?​a,​^c1963."​ 
 +300  "##​^a42 p. ;^c17x13 cm." 
 +859  "##​^p6"​ 
 +mfn=     7  
 +  1  "​000007"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1988####​xx# ​                ​und#​d"​ 
 +100  "##​^aDoe,​ John."​ 
 +245  "##​^a?​-?​-?​-?​-?​ ." 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bBotella al Mar,​^c1988."​ 
 +300  "##​^a46 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a950513193X"​ 
 +859  "##​^p7"​ 
 +mfn=     8  
 +  1  "​000008"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aComposici?​n (Poes?a 1976-1979)."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1984."​ 
 +300  "##​^a70 p. ;^c21x11 cm." 
 + ​20 ​ "##​^a9509418064"​ 
 +859  "##​^p8"​ 
 +mfn=     9  
 +  1  "​000009"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1976####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aTrama continua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :​^bCorregidor,​^c1976."​ 
 +300  "##​^a50 p. ;^c18x13 cm." 
 +859  "##​^p9"​ 
 +mfn=    10  
 +  1  "​000010"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aPuente,​ Silvia."​ 
 +245  "##​^aOtra versi?n de la tragedia."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bAmbigua Selva,​^c1989."​ 
 +300  "##​^a101 p. ;^c18x14 cm." 
 +859  "##​^p10"​ 
 +</​file>​ 
 + 
 +Para probar esta base en Catalis, hay que seguir las indicaciones de la página [[como_crear_una_base_en_catalis|]],​ sección //Acceso a una base ya existente//​. 
 + 
 +Reiteramos que esto es solamente un ensayo de migración; la base resultante no es 100% MARC, aunque se aproxima. 
  
-{{:​excel:​femicab.xls|Archivo XLS (muestra de 10 registros)}} 
migracion_desde_excel.1340887290.txt.gz · Last modified: 28/06/2012 00:00 (external edit)