User Tools

Site Tools


migracion_desde_excel

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
migracion_desde_excel [28/06/2012 10:37]
fernando
migracion_desde_excel [30/06/2012 00:00] (current)
Line 2: Line 2:
  
  
-Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] ​en el grupo de Catalis, ​acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información ​confiable ​sobre este tema.+Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una buena fuente de información sobre este tema.
  
-Partimos de esta muestra de 10 registros:+Partimos de esta muestra de 10 registros, provista por quien envió esa consulta:
  
   * {{:​excel:​femicab.xls|Archivo XLS}}   * {{:​excel:​femicab.xls|Archivo XLS}}
Line 10: Line 10:
   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}
  
-(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows -- FG)+(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows --- //Fernando Gómez, 2012/​06/​28//​)
  
-Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial ​de CISIS (Bireme)]]. Para compatibilidad con Catalis, hay que usar la versión 10/30.+Las columnas ​de esa tabla Excel tienen los siguientes títulos:
  
-Para examinar los datos con mx, ejecutamos este comando:+    N° INV 
 +    AUTOR (Apellido, Nombre) 
 +    TÍTULO 
 +    EDICIÓN 
 +    LUGAR 
 +    EDITORIAL 
 +    AÑO 
 +    N° Pags 
 +    DIMENSIONES 
 +    SERIE 
 +    ISBN 
 +    PROCEDENCIA 
 +    Observaciones 
 +    FECHA INGRESO 
 +    FECHA BAJA 
 +    UBICACIÓN 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    CDU 1 
 +    CDU 2 
 +    TITULO UNIFORME 630 
 +    PERSONA 600 
 +    INSTITUCION 610 
 +    WEB 856 
 + 
 + 
 +Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial de CISIS (Bireme)]]. Para tener compatibilidad con Catalis, hay que usar la versión 10/30. 
 + 
 +Para examinar los datos del archivo csv con mx, ejecutamos este comando:
  
   mx "​seq=femi01.csv;"​ now   mx "​seq=femi01.csv;"​ now
Line 168: Line 199:
 </​file>​ </​file>​
  
-Vemos que hay algunos problemas con los caracteres acentuados; luego habrá que volver ​eso para resolverlo.+Problemas ​que saltan ​la vista:
  
-También se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.+  * Los caracteres acentuados no aparecen correctamente;​ luego habrá que volver a eso para resolverlo. 
 +  * Se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.
  
-Para hacer una primera prueba ​de migraciónusaremos este archivo pft:+Teniendo en cuenta la estructura ​de la tablaque vimos más arriba, y los registros de muestra, podemos comenzar a establecer la correspondencia entre la estructura de datos original y la de MARC 21/Catalis. Por ejemplo, el título (campo 2 en el original) debe ir al subcampo 245$a, mientras que la editorial (campo 6 en el original) debe ir al subcampo 260$b.
  
-{{:​excel:​migra.pft|PFT para migración, versión 1}}  
  
-Lo aplicamos ​mediante este comando:+Para hacer una primera prueba de migración, usaremos este archivo pft: {{:​excel:​migra.pft|PFT para migración, versión 1}}. Ese archivo, escrito en el [[lenguaje_de_formateo|lenguaje de formateo CISIS]] (documentación disponible en [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|esta página]]), puede ser visto como un script que especifica cómo convertir cada registro de esos que vimos arriba, en un registro equivalente en formato MARC 21. 
 + 
 +<note important>​ 
 +Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores,​ añadir campos que no fueron tenidos en cuenta, considerar casos que en esa pequeña muestra no están representados,​ etc. etc. 
 +</​note>​ 
 + 
 +Aplicamos el pft mediante este comando:
  
   mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now   mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now
  
-El pft aún no está depuradopero puede dar una primera idea de cómo es el procedimiento.+que crea el archivo maestro ''​biblio''​ y produce la siguiente salida: 
 + 
 +<​file>​ 
 +mfn=     1  
 +  1  "​000001"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aRaisHilda."​ 
 +245  "##​^aIndicios."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLa Campana,​^c1984."​ 
 +300  "##​^a63 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a9506250065"​ 
 +859  "##​^p1"​ 
 +mfn=     2  
 +  1  "​000002"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRais,​ Hilda."​ 
 +245  "##​^aBelvedere."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a56 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 91""​ 
 +859  "##​^p2"​ 
 +mfn=     3  
 +  1  "​000003"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aCalabrese,​ Ana."​ 
 +245  "##​^aLa vida como puede." 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1989."​ 
 +300  "##​^a92 p. ;^c21x14 cm." 
 + ​20 ​ "##​^a9509418714"​ 
 +859  "##​^p3"​ 
 +mfn=     4  
 +  1  "​000004"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s2000####​xx# ​                ​und#​d"​ 
 +100  "##​^aRainis,​ Romea."​ 
 +245  "##​^aSacar la silla a la vereda."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c2000."​ 
 +300  "##​^a49 p. ;^c20x14 cm." 
 +490  "##​^aColecci?​n todos bailan"​ 
 + ​20 ​ "##​^a9509551988"​ 
 +859  "##​^p4"​ 
 +mfn=     5  
 +  1  "​000005"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRacosta,​ Azucena."​ 
 +245  "##​^aLoca de la legua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a50 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 104""​ 
 +859  "##​^p5"​ 
 +mfn=     6  
 +  1  "​000006"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1963####​xx# ​                ​und#​d"​ 
 +100  "##​^aRaznovich,​ Diana."​ 
 +245  "##​^aTiempo de amar y otros poemas."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bNuevo D?​a,​^c1963."​ 
 +300  "##​^a42 p. ;^c17x13 cm." 
 +859  "##​^p6"​ 
 +mfn=     7  
 +  1  "​000007"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1988####​xx# ​                ​und#​d"​ 
 +100  "##​^aDoe,​ John."​ 
 +245  "##​^a?​-?​-?​-?​-?​ ." 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bBotella al Mar,​^c1988."​ 
 +300  "##​^a46 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a950513193X"​ 
 +859  "##​^p7"​ 
 +mfn=     8  
 +  1  "​000008"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aComposici?​n (Poes?a 1976-1979)."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1984."​ 
 +300  "##​^a70 p. ;^c21x11 cm." 
 + ​20 ​ "##​^a9509418064"​ 
 +859  "##​^p8"​ 
 +mfn=     9  
 +  1  "​000009"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1976####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aTrama continua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :​^bCorregidor,​^c1976."​ 
 +300  "##​^a50 p. ;^c18x13 cm." 
 +859  "##​^p9"​ 
 +mfn=    10  
 +  1  "​000010"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aPuente,​ Silvia."​ 
 +245  "##​^aOtra versi?n de la tragedia."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bAmbigua Selva,​^c1989."​ 
 +300  "##​^a101 p. ;^c18x14 cm." 
 +859  "##​^p10"​ 
 +</​file>​ 
 + 
 +Para probar esta base en Catalis, hay que seguir las indicaciones de la página [[como_crear_una_base_en_catalis|]],​ sección //Acceso a una base ya existente//​. 
 + 
 +Reiteramos que esto es solamente un ensayo ​de migración; la base resultante no es 100% MARC, aunque se aproxima. 
  
migracion_desde_excel.1340890674.txt.gz · Last modified: 28/06/2012 00:00 (external edit)