User Tools

Site Tools


migracion_desde_excel

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revision Previous revision
Next revision
Previous revision
migracion_desde_excel [28/06/2012 10:38]
fernando
migracion_desde_excel [30/06/2012 00:00] (current)
Line 2: Line 2:
  
  
-Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] ​en el grupo de Catalis, ​acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una fuente de información ​confiable ​sobre este tema.+Motivados por [[https://​groups.google.com/​forum/?​hl=es&​fromgroups#​!topic/​catalis/​03e4DddWuvY|una consulta y la subsiguiente discusión]] acerca de un procedimiento adecuado para migrar datos desde una planilla Excel hacia Catalis, vamos a intentar que esta página sea una buena fuente de información sobre este tema.
  
-Partimos de esta muestra de 10 registros:+Partimos de esta muestra de 10 registros, provista por quien envió esa consulta:
  
   * {{:​excel:​femicab.xls|Archivo XLS}}   * {{:​excel:​femicab.xls|Archivo XLS}}
Line 10: Line 10:
   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}   * {{:​excel:​femi01-unix.csv|Archivo CSV (con saltos de línea tipo Unix)}}
  
-(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows -- FG)+(Hago estas pruebas en Linux, por eso puede ser que aparezcan algunas pequeñas diferencias con respecto a la salida de los mismos comandos ejecutados en Windows --- //Fernando Gómez, 2012/​06/​28//​)
  
-Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial ​de CISIS (Bireme)]]. Para compatibilidad con Catalis, hay que usar la versión 10/30.+Las columnas ​de esa tabla Excel tienen los siguientes títulos:
  
-Para examinar los datos con mx, ejecutamos este comando:+    N° INV 
 +    AUTOR (Apellido, Nombre) 
 +    TÍTULO 
 +    EDICIÓN 
 +    LUGAR 
 +    EDITORIAL 
 +    AÑO 
 +    N° Pags 
 +    DIMENSIONES 
 +    SERIE 
 +    ISBN 
 +    PROCEDENCIA 
 +    Observaciones 
 +    FECHA INGRESO 
 +    FECHA BAJA 
 +    UBICACIÓN 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    DESCRIPTOR 
 +    CDU 1 
 +    CDU 2 
 +    TITULO UNIFORME 630 
 +    PERSONA 600 
 +    INSTITUCION 610 
 +    WEB 856 
 + 
 + 
 +Los utilitarios CISIS (mx y demás) pueden descargarse desde [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|la página oficial de CISIS (Bireme)]]. Para tener compatibilidad con Catalis, hay que usar la versión 10/30. 
 + 
 +Para examinar los datos del archivo csv con mx, ejecutamos este comando:
  
   mx "​seq=femi01.csv;"​ now   mx "​seq=femi01.csv;"​ now
Line 168: Line 199:
 </​file>​ </​file>​
  
-Vemos que hay algunos problemas con los caracteres acentuados; luego habrá que volver ​eso para resolverlo.+Problemas ​que saltan ​la vista:
  
-También se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.+  * Los caracteres acentuados no aparecen correctamente;​ luego habrá que volver a eso para resolverlo. 
 +  * Se advierte un problema en los registros 2 y 5, causado por la presencia de un carácter ';'​ dentro de un dato, lo que hace que la parte final del campo 10 quede como campo 11, y a partir de ahí todas las etiquetas de los campos quedan desplazadas. Por eso conviene utilizar como delimitador en el archivo CSV un carácter más seguro, como p.ej. '​|'​.
  
-Para hacer una primera prueba ​de migraciónusaremos este archivo pft:+Teniendo en cuenta la estructura ​de la tablaque vimos más arriba, y los registros de muestra, podemos comenzar a establecer la correspondencia entre la estructura de datos original y la de MARC 21/Catalis. Por ejemplo, el título (campo 2 en el original) debe ir al subcampo 245$a, mientras que la editorial (campo 6 en el original) debe ir al subcampo 260$b.
  
-{{:​excel:​migra.pft|PFT para migración, versión 1}}  
  
-Lo aplicamos ​mediante este comando:+Para hacer una primera prueba de migración, usaremos este archivo pft: {{:​excel:​migra.pft|PFT para migración, versión 1}}. Ese archivo, escrito en el [[lenguaje_de_formateo|lenguaje de formateo CISIS]] (documentación disponible en [[http://​bvsmodelo.bvsalud.org/​php/​level.php?​lang=es&​component=28&​item=1|esta página]]), puede ser visto como un script que especifica cómo convertir cada registro de esos que vimos arriba, en un registro equivalente en formato MARC 21. 
 + 
 +<note important>​ 
 +Este pft aún no está depurado, pero puede dar una primera idea de cómo es el procedimiento. Hay que corregir indicadores,​ añadir campos que no fueron tenidos en cuenta, considerar casos que en esa pequeña muestra no están representados,​ etc. etc. 
 +</​note>​ 
 + 
 +Aplicamos el pft mediante este comando:
  
   mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now   mx "​seq=femi01.csv;"​ "​proc=@migra.pft"​ create=biblio now
  
-El pft aún no está depuradopero puede dar una primera idea de cómo es el procedimiento.+que crea el archivo maestro ''​biblio''​ y produce la siguiente salida: 
 + 
 +<​file>​ 
 +mfn=     1  
 +  1  "​000001"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aRaisHilda."​ 
 +245  "##​^aIndicios."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLa Campana,​^c1984."​ 
 +300  "##​^a63 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a9506250065"​ 
 +859  "##​^p1"​ 
 +mfn=     2  
 +  1  "​000002"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRais,​ Hilda."​ 
 +245  "##​^aBelvedere."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a56 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 91""​ 
 +859  "##​^p2"​ 
 +mfn=     3  
 +  1  "​000003"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aCalabrese,​ Ana."​ 
 +245  "##​^aLa vida como puede." 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1989."​ 
 +300  "##​^a92 p. ;^c21x14 cm." 
 + ​20 ​ "##​^a9509418714"​ 
 +859  "##​^p3"​ 
 +mfn=     4  
 +  1  "​000004"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s2000####​xx# ​                ​und#​d"​ 
 +100  "##​^aRainis,​ Romea."​ 
 +245  "##​^aSacar la silla a la vereda."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c2000."​ 
 +300  "##​^a49 p. ;^c20x14 cm." 
 +490  "##​^aColecci?​n todos bailan"​ 
 + ​20 ​ "##​^a9509551988"​ 
 +859  "##​^p4"​ 
 +mfn=     5  
 +  1  "​000005"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1990####​xx# ​                ​und#​d"​ 
 +100  "##​^aRacosta,​ Azucena."​ 
 +245  "##​^aLoca de la legua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bLibros deTierra Firme,​^c1990."​ 
 +300  "##​^a50 p. ;^c20x14 cm." 
 +490  "##​^a"​Colecci?​n todos bailan"​ 
 + ​20 ​ "##^a 104""​ 
 +859  "##​^p5"​ 
 +mfn=     6  
 +  1  "​000006"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1963####​xx# ​                ​und#​d"​ 
 +100  "##​^aRaznovich,​ Diana."​ 
 +245  "##​^aTiempo de amar y otros poemas."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bNuevo D?​a,​^c1963."​ 
 +300  "##​^a42 p. ;^c17x13 cm." 
 +859  "##​^p6"​ 
 +mfn=     7  
 +  1  "​000007"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1988####​xx# ​                ​und#​d"​ 
 +100  "##​^aDoe,​ John."​ 
 +245  "##​^a?​-?​-?​-?​-?​ ." 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bBotella al Mar,​^c1988."​ 
 +300  "##​^a46 p. ;^c20x14 cm." 
 + ​20 ​ "##​^a950513193X"​ 
 +859  "##​^p7"​ 
 +mfn=     8  
 +  1  "​000008"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1984####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aComposici?​n (Poes?a 1976-1979)."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^b?ltimo Reino,​^c1984."​ 
 +300  "##​^a70 p. ;^c21x11 cm." 
 + ​20 ​ "##​^a9509418064"​ 
 +859  "##​^p8"​ 
 +mfn=     9  
 +  1  "​000009"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1976####​xx# ​                ​und#​d"​ 
 +100  "##​^aPonce,​ Liliana."​ 
 +245  "##​^aTrama continua."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :​^bCorregidor,​^c1976."​ 
 +300  "##​^a50 p. ;^c18x13 cm." 
 +859  "##​^p9"​ 
 +mfn=    10  
 +  1  "​000010"​ 
 +905  "​n"​ 
 +906  "​a"​ 
 +907  "​m"​ 
 +908  "#"​ 
 +909  "#"​ 
 +917  "​5"​ 
 +918  "#"​ 
 +919  "#"​ 
 +  8  "​000000s1989####​xx# ​                ​und#​d"​ 
 +100  "##​^aPuente,​ Silvia."​ 
 +245  "##​^aOtra versi?n de la tragedia."​ 
 +250  "##​^a1a."​ 
 +260  "##​^aBuenos Aires :^bAmbigua Selva,​^c1989."​ 
 +300  "##​^a101 p. ;^c18x14 cm." 
 +859  "##​^p10"​ 
 +</​file>​ 
 + 
 +Para probar esta base en Catalis, hay que seguir las indicaciones de la página [[como_crear_una_base_en_catalis|]],​ sección //Acceso a una base ya existente//​. 
 + 
 +Reiteramos que esto es solamente un ensayo ​de migración; la base resultante no es 100% MARC, aunque se aproxima. 
  
migracion_desde_excel.1340890734.txt.gz · Last modified: 28/06/2012 00:00 (external edit)