User Tools

Site Tools


migracion_desde_excel

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
migracion_desde_excel [28/06/2012 10:57]
fernando
migracion_desde_excel [30/06/2012 00:00] (current)
Line 2: Line 2:
  
  
-Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] ​en el grupo de Catalis, ​acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información ​confiable ​sobre este tema.+Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una buena fuente de información sobre este tema.
  
-Partimos de esta muestra de 10 registros:+Partimos de esta muestra de 10 registros, provista por quien envió esa consulta:
  
   * {{:​excel:​femicab.xls|Archivo XLS}}   * {{:​excel:​femicab.xls|Archivo XLS}}
Line 10: Line 10:
   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}
  
-(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows -- FG)+(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows --- //Fernando Gómez, 2012/​06/​28//​)
  
-Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial ​de CISIS (Bireme)]]. Para compatibilidad con Catalis, hay que usar la versión 10/30.+Las columnas ​de esa tabla Excel tienen los siguientes títulos:
  
-Para examinar los datos con mx, ejecutamos este comando:+    N° INV 
 +    AUTOR (Apellido, Nombre) 
 +    TÍTULO 
 +    EDICIÓN 
 +    LUGAR 
 +    EDITORIAL 
 +    AÑO 
 +    N° Pags 
 +    DIMENSIONES 
 +    SERIE 
 +    ISBN 
 +    PROCEDENCIA 
 +    Observaciones 
 +    FECHA INGRESO 
 +    FECHA BAJA 
 +    UBICACIÓN 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    CDU 1 
 +    CDU 2 
 +    TITULO UNIFORME 630 
 +    PERSONA 600 
 +    INSTITUCION 610 
 +    WEB 856 
 + 
 + 
 +Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial de CISIS (Bireme)]]. Para tener compatibilidad con Catalis, hay que usar la versión 10/30. 
 + 
 +Para examinar los datos del archivo csv con mx, ejecutamos este comando:
  
   mx "​seq=femi01.csv;"​ now   mx "​seq=femi01.csv;"​ now
Line 168: Line 199:
 </​file>​ </​file>​
  
-Vemos que hay algunos problemas con los caracteres acentuados; luego habrá que volver ​eso para resolverlo.+Problemas ​que saltan ​la vista:
  
-También se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.+  * Los caracteres acentuados no aparecen correctamente;​ luego habrá que volver a eso para resolverlo. 
 +  * Se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.
  
-Para hacer una primera prueba ​de migraciónusaremos este archivo pft:+Teniendo en cuenta la estructura ​de la tablaque vimos más arriba, y los registros de muestra, podemos comenzar a establecer la correspondencia entre la estructura de datos original y la de MARC 21/Catalis. Por ejemplo, el título (campo 2 en el original) debe ir al subcampo 245$a, mientras que la editorial (campo 6 en el original) debe ir al subcampo 260$b.
  
-{{:​excel:​migra.pft|PFT para migración, versión 1}}  
  
-Lo aplicamos mediante ​este comando: +Para hacer una primera prueba de migración, usaremos ​este archivo pft: {{:excel:migra.pft|PFT para migración, versión 1}}. Ese archivo, escrito en el [[lenguaje_de_formateo|lenguaje de formateo CISIS]] (documentación disponible en [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|esta página]]), puede ser visto como un script que especifica cómo convertir cada registro de esos que vimos arriba, en un registro equivalente en formato MARC 21.
- +
-  mx "​seq=femi01.csv;"​ "​proc=@migra.pft" create=biblio now+
  
 <note important>​ <note important>​
-Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores,​ añadir campos que no fueron tenidos en cuenta, considerar casos que esa pequeña muestra no fueron detectados, etc. etc.+Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores,​ añadir campos que no fueron tenidos en cuenta, considerar casos que en esa pequeña muestra no están representados, etc. etc.
 </​note>​ </​note>​
 +
 +Aplicamos el pft mediante este comando:
 +
 +  mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now
 +
 +que crea el archivo maestro ''​biblio''​ y produce la siguiente salida:
 +
 +<​file>​
 +mfn=     ​1 ​
 +  1  "​000001"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1984####​xx# ​                ​und#​d"​
 +100  "##​^aRais,​ Hilda."​
 +245  "##​^aIndicios."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bLa Campana,​^c1984."​
 +300  "##​^a63 p. ;^c20x14 cm."
 + ​20 ​ "##​^a9506250065"​
 +859  "##​^p1"​
 +mfn=     ​2 ​
 +  1  "​000002"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1990####​xx# ​                ​und#​d"​
 +100  "##​^aRais,​ Hilda."​
 +245  "##​^aBelvedere."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​
 +300  "##​^a56 p. ;^c20x14 cm."
 +490  "##​^a"​Colecci?​n todos bailan"​
 + ​20 ​ "##^a 91""​
 +859  "##​^p2"​
 +mfn=     ​3 ​
 +  1  "​000003"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1989####​xx# ​                ​und#​d"​
 +100  "##​^aCalabrese,​ Ana."
 +245  "##​^aLa vida como puede."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1989."​
 +300  "##​^a92 p. ;^c21x14 cm."
 + ​20 ​ "##​^a9509418714"​
 +859  "##​^p3"​
 +mfn=     ​4 ​
 +  1  "​000004"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s2000####​xx# ​                ​und#​d"​
 +100  "##​^aRainis,​ Romea."​
 +245  "##​^aSacar la silla a la vereda."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c2000."​
 +300  "##​^a49 p. ;^c20x14 cm."
 +490  "##​^aColecci?​n todos bailan"​
 + ​20 ​ "##​^a9509551988"​
 +859  "##​^p4"​
 +mfn=     ​5 ​
 +  1  "​000005"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1990####​xx# ​                ​und#​d"​
 +100  "##​^aRacosta,​ Azucena."​
 +245  "##​^aLoca de la legua."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​
 +300  "##​^a50 p. ;^c20x14 cm."
 +490  "##​^a"​Colecci?​n todos bailan"​
 + ​20 ​ "##^a 104""​
 +859  "##​^p5"​
 +mfn=     ​6 ​
 +  1  "​000006"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1963####​xx# ​                ​und#​d"​
 +100  "##​^aRaznovich,​ Diana."​
 +245  "##​^aTiempo de amar y otros poemas."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bNuevo D?​a,​^c1963."​
 +300  "##​^a42 p. ;^c17x13 cm."
 +859  "##​^p6"​
 +mfn=     ​7 ​
 +  1  "​000007"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1988####​xx# ​                ​und#​d"​
 +100  "##​^aDoe,​ John."
 +245  "##​^a?​-?​-?​-?​-?​ ."
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bBotella al Mar,​^c1988."​
 +300  "##​^a46 p. ;^c20x14 cm."
 + ​20 ​ "##​^a950513193X"​
 +859  "##​^p7"​
 +mfn=     ​8 ​
 +  1  "​000008"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1984####​xx# ​                ​und#​d"​
 +100  "##​^aPonce,​ Liliana."​
 +245  "##​^aComposici?​n (Poes?a 1976-1979)."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1984."​
 +300  "##​^a70 p. ;^c21x11 cm."
 + ​20 ​ "##​^a9509418064"​
 +859  "##​^p8"​
 +mfn=     ​9 ​
 +  1  "​000009"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1976####​xx# ​                ​und#​d"​
 +100  "##​^aPonce,​ Liliana."​
 +245  "##​^aTrama continua."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :​^bCorregidor,​^c1976."​
 +300  "##​^a50 p. ;^c18x13 cm."
 +859  "##​^p9"​
 +mfn=    10 
 +  1  "​000010"​
 +905  "​n"​
 +906  "​a"​
 +907  "​m"​
 +908  "#"​
 +909  "#"​
 +917  "​5"​
 +918  "#"​
 +919  "#"​
 +  8  "​000000s1989####​xx# ​                ​und#​d"​
 +100  "##​^aPuente,​ Silvia."​
 +245  "##​^aOtra versi?n de la tragedia."​
 +250  "##​^a1a."​
 +260  "##​^aBuenos Aires :^bAmbigua Selva,​^c1989."​
 +300  "##​^a101 p. ;^c18x14 cm."
 +859  "##​^p10"​
 +</​file>​
 +
 +Para probar esta base en Catalis, hay que seguir las indicaciones de la página [[como_crear_una_base_en_catalis|]],​ sección //Acceso a una base ya existente//​.
 +
 +Reiteramos que esto es solamente un ensayo de migración; la base resultante no es 100% MARC, aunque se aproxima.
 +
  
migracion_desde_excel.1340891864.txt.gz · Last modified: 28/06/2012 00:00 (external edit)