6/nov/2008: Chat con Raúl. Planteo de la necesidad de realizar una migración desde CEPAL a MARC, para poder mostrar la base en el OPAC con cierta urgencia. La calidad de los datos es mala, pero es mejor que nada.
30/nov/2008: Base enviada por Raúl. Archivos: americ.fdt
, americ.mst
, americ.xrf
.
23/dic/2008: Archivo maestro convertido a Linux. Creación de esta página en el wiki. Para el análisis nos basamos en el realizado para la base de mapas.
Uso de subcampos
Sólo se usa el subcampo ^b, como separardor entre apellido y nombre, en el campo 16 y en el campo 10 (sólo una ocurrencia).
En el MFN 1007 hay un error en el campo 16: Gay^BClaudio
Registros sin título:
Eliminación de espacios usando mxcp clean
(hecho).
Hay dos registros donde este campo no toma el valor “Biblioteca Americana - Museo Mitre”:
$ mx americ_clean "pft=if v1<>'Biblioteca Americana - Museo Mitre' then mfn,x3,v1/ fi" now 001203 ZZBiblioteca Americana - Museo Mitre 004700 çBiblioteca Americana - Museo Mitre
¿Qué deberíamos verificar? Que no haya repetidos, que no falten números, … ¿?
En general tiene la forma nn-nn-nn
, aunque hay algunas variantes: nn-nn
, MF
, etc.
¿Hay que hacer alguna verificación?
7461 registros tienen el valor M
; 2 registros tienen el valor S
.
Campo ausente en el MFN 3285.
Todos tienen el valor m
.
Todos contienen el valor m
excepto estos dos:
000102 ms 000146 ms
Presente en un único registro: 7078.
Presente en un único registro: 7223.
Presente en un único registro: 7223.
Presente solamente en dos registros:
001285 3 v 007223 12 v
Hay 3352 valores diferentes. Por supuesto, entre ellos hay duplicados con pequeñas diferencias, tales como
Acevedo Diaz^bEduardo Acevedo Díaz^bEduardo Alencar^bJose de Alencar^bJosé de Alençar^bJose de
Algunas observaciones sobre la forma en que está ingresado este campo.
Paz^bMarcos, comp Rosa^bAlejandro, comp
Rohde^bJorge J Gordon^bEduardo G
[Palacio^bManuel] [Palacios^bPedro] [Boote^bSamuel] Gebhardt^bVictor [et al.]
378 nombres diferentes.
Quizás convenga darle un vistazo al listado alfabético para detectar posibles problemas.
Hay 97 registros que contienen esta nota como parte del título:
Se encuentra registrado en la base MC bajo el MFN xxx
Ejemplos:
[Mapas. Argentina]. Se encuentra registrado en la Base MC bajo el MFN 2604 Facsímile de tres mapas del atlas de Félix de Azara. Se encuentra registrado en la Base MC bajo el MFN 2605 República Argentina : Carta de las comunicaciones postales y telegráficas. Se encuentra registrado en la Base MC bajo el MFN 2607
Se podría hacer una conversión automática que elimine esas notas del campo de título y las traslade a un campo de notas. Hay unos pocos casos para corregir a mano pues se apartan del patrón “Se encuentra registrado en la Base MC bajo el MFN”:
Se encuentra registrado en la Base MC bajo el MFN 2519 Se encuentra registrada en la Base MC bajo el MFN 2532 Se encuentra registrado en la Bas MC bajo el MFN 2538 Se encuentra registrado bajo el MFN 2563 Se encuentra registrado bajo el MFN 2566 Se encuentra registrado en la Bas MC bajo el MFN 2600; 3 v
Llama la atención la presencia de <..>:
146 p., clxxx; <27 p.> <34 p.>, 465 p 69 p., <16 p.> <40 p.> xii; 274 p., <6 p.> lx; 330 p., <5 p.> 83 p, <3 p> <36 p>
Sólo presente en 4 registros:
000345 x; 224 p 000584 vii; 323 p 003644 2 v 004250 2 v
Único caso:
002225 Colón^bCristóbal
Único caso:
005183 República Argentina. Poder Ejecutivo
Único caso:
001968 10 v
Hay 3594 valores diferentes.
En gran cantidad de casos se trata de imprentas.
Inspeccionando el listado alfabético se pueden detectar fácilmente irregularidades y posibles errores.
Casos especiales:
7 s. e 1 s. ed 426 s.e 2 s.e. 2 s.ed 1 `s.e
388 valores diferentes.
Hay dos casos que usan <..>. ¿Será un error y deberían ir corchetes?
000656 <Madrid> 001039 <Philadelphia>
Algunos casos extraños:
$ mx americ_clean "pft=if p(v40) and size(v40)<>2 or v40<>s(mpu,v40,mpl) then mfn,x3,v40+| ; |/ fi" now 000185 R 000190 1755 000306 a 000308 [FR] 002460 México 002564 USa 002836 Fr 003275 MXa 003369 E 003444 FRa 003929 Ar 004587 UYa 005828 ARAR 006819 Ar 007175 Cl
Esta es la lista de valores presentes en el campo, donde casi todos los números se han reemplazado por “nn”. Se advierte que hay inconsistencias en el uso de abreviaturas y puntuación.
1884 nn p nn v 37 x 50 xm., ilus cm cm nn cm., ilus diagrs., nn cm diags., ilus., nn cm diags., nn cm il., nn cm ilus., diagrs. nn cm ilus., diagrs., nn cm ilus., diags., nn cm ilus., map., nn cm ilus., map.; nn cm ilus., maps ilus., maps., diags., nn cm ilus., maps, nn cm ilus., maps. nn cm ilus., maps., nn cm ilus., maps.,nn cm ilus., maps., tabls., nn cm ilus., maps., tbls., nn cm ilus., nn cm ilus.; nn cm ilus., tabls., nn cm map., ilus., nn cm map, nn cm map., nn cm map.; nn cm maps., diags., nn cm maps., ilus., nn cm maps, nn cm maps., nn cm maps.,nn cm maps., tabls., nn cm maps., tbls.,diags., nn cm map., tabls, nn cm map., tabls., nn cm mps., diags., nn cm nncm nn cm nn cm., encarpetado nn cm., il nn cm., ilis., tabls nn cm., il., mapa nn cm., il., mapas nn cm., ilu., maps nn cm ., ilus nn cm, ilus nn cm. ilus nn cm., ilus nn cm., ilus., map nn cm. ilus., maps nn cm., ilus., maps nn cm., ilus., maps., tabls nn cm., ilus., map., tabls nn cm., ilus., tabls nn cm, map nn cm., map nn cm, mapa nn cm., mapa nn cm., mapas nn cm., map., ilus nn cm., maps nn cm., maps., diags., tabls nn cm., maps., ilus nn cm., maps., planos nn cm., maps., tabls nn cm., nn cm nn cm (pág. de nn x nn cm, plegada) nn cm., plano nn cm., tabl nn cm., tabls nn cm., tabls., map nn cm x nn cm nn cm. x nn cm nn cm x nn cm., ilus nn x nn cm nn x nn cm, ilus nn x nn cm., ilus nn x nn cm., ilus., map nn x nn cm., ilus., maps tabl., nn cm tabls., map., nn cm tabls., maps., nn cm tabls., nn cm viii; 248 p
Esta es la lista de valores presentes en el campo, donde los años se han reemplazado por “nnnn”.
[18??] [183?] [184-] a abril de nnnn an III April, nnnn [c. nnnn] c. nnnn enero de nnnn febrero de nnnn fines s. XIX julio nnnn nnnn <nnnn> [nnnn [nnnn?] [nnnn] [nnnn]? nnnn (?) nnnn1 [nnnn - nnnn] nnnn - nnnn nnnn-nnnn nnnn y nnnn setiembre de nnnn s.f s. XIX
Ausente, salvo en este registro (por error):
mfn= 3651 47 "itre,"
Es repetible.
Cuando el campo incluye nombres personales “destacados”, éstos aparecen encerrados entre marcas <. . .>
y en forma inversa, como se ve en estos ejemplos:
Dedicado por los traductores a <Mitre, Bartolomé> El autor figura como <Lieber, Francisco> Traducción dirigida por <Mitre, Bartolomé> y Vedia de la 2. ed. brasileña <== ERROR? Con introducción por Enrique <Peña> y presentado por éste el 30 de diciembre de 1899 <Biblioteca de "La Nación"> Elk redactor fue Francisco de Paula <Castañeda>
Para una correcta presentación de estas notas, los nombres deberán ingresarse en forma directa (se puede hacer la conversión automáticamente).
También se usa esa técnica para algunas notas de idioma:
Obra en castellano y <alemán>
Valores presentes (años reemplazados por NNNN):
? (?) 1 NNN NNNN NNNN AC NNNN - ? 23 de diciembre de 1598 43 476 5000 A. C. 55 a. C. a.C. AC ?AC ? AC ¿? AC c. NNNN ca. NNNN fines s. XVI fines s. XVIII prehistoria s.f s. I siglo XVI s. IX s. VII a. C s. X s. XII s. XIII s. XIV s. XIX s. XV s. xvi s XVI s.XVI s. XVI s XVII s. XVII s. XVIII s. XVI - XVII . XVIII x. XVIII
Valores presentes (en el listado los años están reemplazados por 'NNNN'):
NNNN 1860 y 1867 [188-] 480 A. C. 9 de abril de1605 c. 1830 s. XIX s. XV s. XVI s. XVII s XVIII s. XVIII
Repetible.
Datos ingresados en MAYUSCULAS sin acentos.
Total: 1018 descriptores diferentes. La lista completa está en un archivo aparte. LUEGO LO ADJUNTO
No se repite.
Datos ingresados en MAYUSCULAS sin acentos.
Listado completo:
24 ARTES Y ENTRETENIMIENTOS 1 CIENCIA POLITICA 187 CIENCIAS APLICADAS 230 CIENCIAS PURAS 2427 CIENCIAS SOCIALES 6 FILOSOFIA Y DISCIPLINAS AFINES 853 GENERALIDADES 2594 GEOGRAFIA E HISTORIA 402 LENGUAS 421 LITERATURA 318 RELIGION