Requisitos técnicos de los proyectos de...
Transcript of Requisitos técnicos de los proyectos de...
Requisitos técnicos de los proyectos de digitalización de patrimonio bibliográfico
y de prensa histórica de la SGCB
Madrid, 11 de marzo de 2016
Subdirección General de Coordinación Bibliotecaria
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
2
Página
2/19
CONTROL DE CAMBIOS
Versión Fecha Resumen cambios
1.0
10-03-2015
Versión inicial
1.0.1 02-10-2015 Corrección menor en
p. 9
1.1 10-02-2016 Cambios en los
perfiles de metadatos
METS y en la entrega
de soportes
1.1.1 11-03-2016 Ampliación del cambio
anterior
1.1.2 11-05-2016 Correcciones menores
y añadir comentarios
en ejemplos del Anexo
1.1.3 21-06-2018 Correcciones menores
© Ministerio de Cultura y Deporte, 2016
El presente informe pertenece a la Subdirección General de Coordinación Bibliotecaria del Ministerio de Cultura y Deporte y está bajo una licencia de Creative Commons
Reconocimiento-NoComercial-CompartirIgual 4.0 Internacional
(http://creativecommons.org/licenses/by-nc-sa/4.0/deed.es_ES) y por ello está permitido copiar, distribuir y comunicar públicamente esta obra bajo las condiciones siguientes: Reconocimiento — Debe reconocer los créditos de la obra de la manera especificada haciendo referencia expresa a la Subdirección General de Coordinación Bibliotecaria del
Ministerio de Cultura y Deporte y al identificador http://hdl.handle.net/10421/8981 en http://travesia.mcu.es. Dicho reconocimiento no podrá en ningún caso sugerir que el Ministerio de Cultura y Deporte presta apoyo a dicho tercero o apoya el uso que hace de su obra. No comercial — No puede utilizar esta obra para fines comerciales.
Compartir bajo la misma licencia — Si altera o transforma esta obra, o genera una obra derivada, sólo puede distribuir la obra generada bajo una licencia idéntica a ésta.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
3
Página
3/19
Contenido
Introducción .......................................................................................... 5
1. Digitalización de colecciones de patrimonio bibliográfico ........................ 7 1.1 Requisitos del proceso de digitalización ....................................... 7 1.2 Control de calidad y supervisión de los servicios ............................ 8 1.3 Metadatos ................................................................................ 8 1.4 Propiedad intelectual ............................................................... 10 1.5 Requisitos técnicos y de entrega de los soportes ......................... 11
2. Digitalización de Publicaciones Seriadas – Prensa Histórica .................. 13 2.1 Requisitos técnicos del proceso de digitalización .......................... 13 2.2 Control de calidad y supervisión de los servicios .......................... 14 2.3 Metadatos .............................................................................. 14 2.4 Propiedad intelectual ............................................................... 16 2.5 Requisitos técnicos y de entrega de soportes .............................. 16 2.6 OCR ...................................................................................... 17
3. Bibliografía .................................................................................... 17
4. Anexo I. Ejemplos de archivos METS y OCR para la Biblioteca Virtual del
Patrimonio Bibliográfico (monografías) y la Biblioteca Virtual de Prensa
Histórica ........................................................................................ 19
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
5
Página
5/19
Introducción
La Dirección General del Bellas Artes y Bienes Culturales y de Archivos y
Bibliotecas del Ministerio de Cultura y Deporte ha llevado a cabo una estrategia de
digitalización y de promover la accesibilidad en línea del material cultural y la
preservación digital alineada con la Recomendación de la Comisión Europea,
publicada en el Diario Oficial de la Unión Europea de 24 de agosto de 2006, cuyo
objetivo es contribuir a la acción coordinada de los estados miembro en estos
ámbitos y en la que se insta a dichos estados a que refuercen las estrategias y los
objetivos nacionales para la digitalización y la conservación digital, contribuyan a
Europeana —punto común multilingüe de acceso al patrimonio cultural europeo—
, mejoren las condiciones marco para la digitalización y la accesibilidad en línea,
refuercen la coordinación dentro de los estados miembros y contribuyan a una
visión global efectiva de los progresos a nivel europeo.
Dentro de esta estrategia la Dirección General ha puesto en marcha, con cargo a
sus presupuestos, distintos proyectos de digitalización de carácter cooperativo en
los que participan tanto las distintas administraciones públicas como instituciones
y fundaciones privadas. Entre estos proyectos se encuentran:
La Biblioteca Virtual de Prensa Histórica http://prensahistorica.mcu.es
La Biblioteca Virtual del Patrimonio Bibliográfico http://bvpb.mcu.es
Hispana, Directorio y recolector de proyectos de digitalización y agregador
de contenidos de Europeana.
Por otro lado ha promovido la creación de bibliotecas digitales de instituciones
públicas y privadas conforme a la normativa de Europeana mediante las
convocatorias anuales de ayudas a proyectos de digitalización. Uno de los
requisitos de obligado cumplimiento de estas ayudas es que todo lo que se
digitalice con cargo a las ayudas de la Dirección General tiene que ser accesible a
través de Europeana.
El presente documento detalla los perfiles técnicos de los proyectos de
digitalización que la SGCB promueve o desarrolla. Estos perfiles concretan, dentro
de los márgenes de las normas técnicas, aquellos aspectos que requieren ser
definidos con más concreción.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
7
Página
7/19
1. Digitalización de colecciones de patrimonio bibliográfico
1.1 Requisitos del proceso de digitalización
La empresa o servicio de digitalización se encargará de poner los medios técnicos
e informáticos y el material necesario para la realización de dichos servicios
(escáneres, ordenadores, programas de digitalización, posible instalación de una
red local, discos duros USB, etc.), así como de su transporte e instalación en los
diferentes centros donde se desarrolle el servicio.
El centro directivo responsable del proyecto de digitalización establecerá los
controles necesarios para que los espacios destinados a la digitalización cumplan
las condiciones de seguridad y estén dotados de los medios que garanticen que el
material bibliográfico no sufra ningún desperfecto durante el proceso de
digitalización.
Las empresas o servicios de digitalización, como norma general y cuando sea
posible, deberán utilizar escáneres aéreos, evitando una excesiva manipulación o
el empleo de prensalibros en la medida de lo posible.
En ningún caso los ejemplares podrán ser desencuadernados o guillotinados y se
deberá asegurar la correcta manipulación de los mismos.
Se realice la captura a doble página o a página simple, se entregarán imágenes de
páginas simples, no imágenes con dobles páginas.
En caso de que se incorporen marcas de agua, serán de pequeño tamaño y no se
superpondrán al contenido del documento.
Las páginas que se digitalicen junto a cartas de color, habrán de digitalizarse dos
veces, utilizándose para la carga en las bibliotecas digitales y la visualización la
imagen sin carta de color.
Se evitarán o recortarán los bordes negros de las imágenes. Las imágenes deben
incluir todo el documento y entregarse sin bordes negros o con bordes negros de
tres milímetros como máximo.
La digitalización de los documentos impresos y manuscritos, así como la del resto
de materiales monográficos (fotografías, postales, carteles, planos, grabados,
mapas, música impresa, etc.) se realizará en color o escala de grises según las
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
8
Página
8/19
características del documento original, ya sea en su totalidad o en algunas de sus
partes. En todo caso, los originales en color serán digitalizados en color.
Como mínimo se generará una copia de las obras digitalizadas en formato TIFF y
otra en formato JPEG como formatos de máxima calidad y formato comprimido y
optimizado para su lectura en internet, respectivamente.
Las copias de preservación (TIFF) serán digitalizadas con una resolución mínima de
400 ppi y en una escala de 256 gamas de grises (8 bits) o de 16,7 millones de
colores (24 bits).
La copia de difusión (JPEG) tendrá una resolución mínima de 200 a 300 ppi y la
misma profundidad de color que la copia de preservación.
1.2 Control de calidad y supervisión de los servicios
El centro directivo responsable del proyecto se reservará el derecho de inspección
y revisión del desarrollo y ejecución de los servicios objeto del contrato.
Durante la ejecución de los trabajos de digitalización, la empresa o servicio de
digitalización se comprometerá, en todo momento, a facilitar a las personas
designadas por el centro directivo que gestione el proyecto, la información y
documentación que éstas soliciten para disponer de un pleno conocimiento de las
circunstancias en que se desarrollan los trabajos, así como de los eventuales
problemas que puedan plantearse y de las tecnologías, métodos y herramientas
utilizados para resolverlos. En particular deberán comunicarse las incidencias que
puedan producirse a lo largo del proceso de digitalización, tales como falta de texto,
páginas deterioradas, ilegibilidad del original, errores de numeración, etc., de
manera que el centro directivo responsable del proyecto de digitalización pueda
indicar a la empresa o servicio de digitalización los procedimientos que se deben
llevar a cabo para gestionar estas incidencias.
Tanto por parte de la empresa digitalizadora, como por parte del centro directivo
responsable del proyecto, ha de realizarse un seguimiento del trabajo durante la
ejecución del mismo. La empresa o servicio de digitalización habrá de subsanar lo
más rápidamente posible los errores detectados con este control de calidad.
La empresa o servicio de digitalización deberá garantizar el correcto funcionamiento
de los trabajos realizados durante el plazo de un año a contar desde la fecha de
finalización del servicio, obligándose a realizar gratuitamente durante dicho tiempo
las correcciones y modificaciones necesarias para subsanar los errores que
eventualmente pudieran descubrirse.
1.3 Metadatos
Se emplearán metadatos MARC21 para describir las obras y archivos METS para
describir y/o cargar los objetos digitales.
En cuanto a los archivos MARC21, se utilizará la información bibliográfica y de
fondos del Catálogo Colectivo del Patrimonio Bibliográfico
(http://ccpb_opac.mcu.es/cgi-brs/CCPB/abnetopac ) si ésta existiera.
En principio, y salvo que se acordara previamente otra cosa, el centro directivo
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
9
Página
9/19
responsable del proyecto de digitalización es el encargado de proporcionar a la
empresa o servicio de digitalización los registros MAR21 bibliográficos y la
información de fondos de las obras que se van a digitalizar. La empresa o servicio
de digitalización utilizará estos registros para embeberlos en los registros METS,
teniendo buen cuidado en hacer coincidir los números de control, códigos de
biblioteca y signaturas de los registros MARC21 y de los METS.
Las Bibliotecas Virtuales de la S.G.C.B. trabajan con MARC21 bibliográfico, de
fondos y de autoridades. También se enriquecen los registros bibliográficos
incluyendo los campos MARC21/RDA 264, 336, 337 y 338.
Para los proyectos subvencionados por la S.G.C.B. es obligatoria la utilización del
formato MARC21 bibliográfico para describir las obras. Además es recomendable la
utilización de registros de fondos y de autoridad en MARC21 y su enriquecimiento
según lo indicado en el párrafo anterior. En todo caso, si no se utilizan registros de
fondos, es necesario incluir la información de fondos en campos 85X del formato
MARC21 bibliográfico. En concreto habría que utilizar el campo 852 con el código
de institución (en el subcampo $a) y la signatura (en el subcampo $j).
En cuanto a los registros METS, salvo que se acuerde previamente otra cosa, será
la empresa o servicio de digitalización la encargada de generar y entregar para
cada monografía (obra impresa, manuscrito, material fotográfico, partituras,
mapas, etc.) un archivo METS de carga y otro para preservación. Estos METS
deberán ceñirse al Perfil METS de la Biblioteca Virtual del Patrimonio bibliográfico,
al que se puede acceder en la siguiente dirección:
http://www.loc.gov/standards/mets/mets-registered-profiles.html
Este perfil está orientado a la creación de METS que sirvan para representar,
preservar e ingestar los objetos digitales que se archivan y ofrecen al público en la
Biblioteca Virtual de Patrimonio Bibliográfico del Ministerio de Cultura y Deporte.
También puede ser utilizado para ingestar objetos digitales y/o metadatos en otras
bibliotecas digitales y bases de datos y, en general, para registrar, trasmitir y
almacenar metadatos y objetos digitales.
En particular los METS para carga de monografías deben respetar las siguientes
especificaciones:
• Los METS deben incluir direcciones correctas a los namespaces y a los
schemas utilizados, y deben estar bien formados y ser válidos.
• Deben incluir una sección de metadatos descriptivos (dmdSec) que embeba
el registro bibliográfico en formato MARC21XML y, a continuación, el registro
de fondos en formato MARC21XML de fondos. En los proyectos subvencionados
se podrá sustituir el registro MARC21XML de fondos por información de fondos
en el campo 852 del registro bibliográfico.
• Deben incluir una sección de metadatos descriptivos (dmdSec) en la que se
relacione la imagen que va servir como icono representativo de la obra
(normalmente una portada o ilustración).
• En el caso de los contratos de digitalización de la S.G.C.B, los METS deben
incluir una sección de archivo (fileSec), que en un único fileGrp agrupe
elementos file para cada imagen JPG de las que conforman la obra. Además,
en etiquetas FLocat para cada elemento file se incluirán la direcciones a las
imágenes correspondientes. Las direcciones de los METS apuntarán a las
imágenes de difusión que se encuentran en los mismos discos duros que estos
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
10
Página
10/19
METS (véase apartado 1.5). En el caso de las subvenciones para digitalización
otorgadas por la S.G.C.B. la sección de archivo podrá incluir direcciones bien a
versiones en JPG o PDF de las obras digitalizadas.
• Se incluirá una sección de mapa estructural (strucMap) con atributo
TYPE=”PHYSICAL”. Si la sección de archivo correspondiente (fileSec) hace
referencia a una versión en formato JPG de la obra, este mapa estructural
(strucMap) debe incluir la información de paginación.
En cuanto a los archivos METS para preservación de monografías deberán ceñirse
a las siguientes especificaciones:
• Incluirán los metadatos que se precisan para la preservación de la copia
digital. Estos metadatos se obtendrán del Diccionario de Datos de PREMIS, en
su versión vigente a la firma del contrato.
• Asimismo, se incluirá en el METS información sobre derechos de propiedad
intelectual según el esquema METSRigths en el que se detallarán las
características de derecho de uso de las publicaciones según determine el
Ministerio de Cultura y Deporte a través de la Subdirección General de
Coordinación Bibliotecaria.
• Se incluirá una sección de archivo (fileSec) con enlaces a las imágenes de
preservación.
Los METS de carga y preservación para monografías podrán fusionarse en una única
versión.
Una vez terminado el servicio de digitalización la empresa o servicio de
digitalización deberá entregar los archivos MARC21 y los METS de las obras
digitalizadas a la institución responsable del proyecto.
1.4 Propiedad intelectual
Como norma general, en el marco de los proyectos de digitalización gestionados o
subvencionados por la Subdirección General de Coordinación Bibliotecaria, sólo se
digitalizarán obras que estén en el dominio público o cuyos derechos pertenezcan
a la institución responsable del proyecto de digitalización. Como excepción a esta
norma, podrán digitalizarse obras sujetas a derechos de la propiedad intelectual
cuando se hayan cedido previamente los derechos de reproducción y comunicación
pública, por medio de un convenio o acuerdo, a la institución responsable del
proyecto de digitalización.
El titular de los derechos de propiedad intelectual de las imágenes resultantes del
servicio de digitalización será la institución encargada del proyecto de digitalización,
no pudiéndose reproducir las mismas sin el permiso previo de dicha institución.
Como excepción a lo indicado en el párrafo anterior, en el caso de los proyectos de
digitalización subvencionados por la Subdirección General de Coordinación
Bibliotecaria, dicha Subdirección será la única propietaria de la copia que la entidad
subvencionada ha de entregarle (véase apartado 1.5), entendiéndose cedidos los
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
11
Página
11/19
derechos de reproducción y comunicación pública para esta copia, para su carga en
la Biblioteca Virtual del Patrimonio Bibliográfico o en la Biblioteca Virtual de Prensa
Histórica, según corresponda. Las instituciones responsables de estos proyectos
deberán tener en cuenta este requisito en caso de que lleguen a acuerdos o firmen
convenios de cesión de derechos de terceros.
De acuerdo con las recomendaciones de la Comisión Europea, los materiales que
se encuentren en el dominio público se mantendrán en el dominio público después
de su digitalización.
Los metadatos resultantes de la digitalización se licenciarán bajo CC0 1.0, y serán
reutilizables sin restricción, incluidos los fines comerciales tal como se especifica en
el Acuerdo de intercambio de datos con Europeana publicado el 1 de julio de 2012.
La empresa o servicio de digitalización se comprometerá a garantizar la
confidencialidad de los datos recibidos en el marco del servicio de digitalización y a
no hacer ningún uso de los mismos fuera de lo establecido en acuerdo o contrato
previo, siendo responsable de las consecuencias que se deriven del incumplimiento
de este apartado. Así mismo no podrá hacer ningún uso de los registros e imágenes
generados mediante el servicio de digitalización ni de los registros o imágenes que
le puedan ser entregados para la realización de dicho servicio por la institución
conservadora de los fondos a digitalizar o el centro directivo que gestione el
proyecto.
1.5 Requisitos técnicos y de entrega de los soportes
Como mínimo la empresa o servicio de digitalización generará y entregará a la
entidad responsable del proyecto una copia de las obras digitalizadas en formato
TIFF 6.0/ISO 12639:2004 y otra en formato JPEG/ISO/IEC 10918:1994, como
formatos de máxima calidad y formato comprimido y optimizado para su lectura en
internet, respectivamente. Se recomienda entregar al menos dos copias de las
imágenes de preservación (TIFF).
En los contratos de digitalización de la Subdirección General de Coordinación
Bibliotecaria se exigirá la entrega de tres copias de los contenidos digitalizados:
● Copia 1.
Se entregará en discos duros USB 3.0 nuevos que contengan:
-Imágenes de preservación en formato TIFF sin marca de agua.
-Las correspondientes imágenes de difusión en formato JPEG con marca de
agua. La marca de agua consistirá en las siglas del Ministerio de cultura y
Deporte seguidas del año de digitalización, por ejemplo: “M.C.D. 2018”.
-Los correspondientes archivos de reconocimiento óptico de caracteres XML-
ALTO.
-Los correspondientes registros MARC21 bibliográficos y de fondos.
-METS de carga para las imágenes de difusión.
-METS de preservación para las imágenes de preservación.
● Copia 2.
Copia con los mismos contenidos que la anterior.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
12
Página
12/19
● Copia 3: copia para las instituciones.
Se entregará a la S.G. C.B. una copia, en discos duros nuevos USB 3.0, de los
contenidos del contrato separados por institución. Cada uno de los discos que
conforma esta copia contendrá exclusivamente los objetos digitales y
metadatos de una institución. Dichos contenidos incluirán:
-Imágenes de preservación en formato TIFF, sin marca de agua.
-Las correspondientes imágenes de difusión en formato JPEG, sin marca de
agua.
-Los correspondientes archivos de reconocimiento óptico de caracteres XML-
ALTO.
-Los correspondientes registros MARC21 bibliográficos y de fondos.
-METS de carga para las imágenes de difusión.
-METS de preservación para las imágenes de preservación.
Los ficheros con las obras digitalizadas se estructurarán en un directorio formado
por un primer nivel correspondiente a la institución cuyos fondos se hayan
digitalizado y un segundo nivel con el título, la signatura o el número de control del
registro bibliográfico de cada obra digitalizada. En el caso de que el mismo disco
contuviera varios formatos, el segundo nivel sería el formato y el tercero el
correspondiente al título.
Los metadatos se incluirán en carpetas independientes, una para cada formato
(METS, MARC21 bibliográfico, MARC21 de fondos, MARC21 de autoridades...).
Dentro de cada disco, todos los archivos METS correspondientes a los fondos de
una biblioteca se incluirán en una misma carpeta. Igualmente, dentro de cada disco,
los archivos MARC21 correspondientes a los fondos de una misma biblioteca se
incluirán en una misma carpeta.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
13
Página
13/19
2. Digitalización de Publicaciones Seriadas – Prensa Histórica
2.1 Requisitos técnicos del proceso de digitalización
La empresa o servicio de digitalización se encargará de poner los medios técnicos
e informáticos y el material necesario para la realización de dichos servicios
(escáneres, ordenadores, programas de digitalización, posible instalación de una
red local, discos duros USB, etc.), así como de su transporte e instalación en los
diferentes centros donde se desarrolle el servicio.
El centro directivo responsable del proyecto de digitalización establecerá los
controles necesarios para que los espacios destinados a la digitalización cumplan
las condiciones de seguridad y estén dotados de los medios que garanticen que el
material bibliográfico no sufra ningún desperfecto durante el proceso de
digitalización.
Las empresas o servicios de digitalización, como norma general y cuando sea
posible, deberán utilizar escáneres aéreos, evitando una excesiva manipulación o
el empleo de prensalibros en la medida de lo posible.
En ningún caso los ejemplares podrán ser desencuadernados o guillotinados y se
deberá asegurar la correcta manipulación de los mismos.
Se realice la captura a doble página o a página simple, se entregarán imágenes de
páginas simples, no imágenes con dobles páginas.
En caso de que se incorporen marcas de agua, serán de pequeño tamaño y no se
superpondrán al contenido del documento.
Las páginas que se digitalicen junto a cartas de color, habrán de digitalizarse dos
veces, utilizándose para la carga en las bibliotecas digitales y la visualización la
imagen sin carta de color.
Se evitarán o recortarán los bordes negros de las imágenes. Las imágenes deben
incluir todo el documento y entregarse sin bordes negros o con bordes negros de
tres milímetros como máximo.
La digitalización de las publicaciones seriadas se realizará en escala de grises si la
publicación original es monocromática como suele ser el caso de la prensa. En todo
caso, los originales en color serán digitalizados en color. Si la publicación contiene
páginas en color y otras en blanco y negro, se digitalizarán en color las páginas en
color y en escala de grises las páginas en blanco y negro.
Como mínimo se generará una copia de las obras digitalizadas en formato TIFF y
otra en formato JPEG, como formatos de máxima calidad y formato comprimido y
optimizado para su lectura en internet, respectivamente.
Las copias de preservación (TIFF) serán digitalizadas con una resolución mínima de
400 ppi y en una escala de 256 gamas de grises (8 bits) o de 16,7 millones de
colores (24 bits).
La copia de difusión (JPGE) tendrá una resolución mínima de 200 a 300 ppi y la
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
14
Página
14/19
misma profundidad de color que la copia de preservación.
2.2 Control de calidad y supervisión de los servicios
Véase el apartado 1.2.
2.3 Metadatos
En el marco de los proyectos y ayudas de digitalización de la Subdirección General
de Coordinación Bibliotecaria se emplearán metadatos MARC21 para describir las
seriadas y archivos METS con metadatos descriptivos MODS para describir y/o
cargar los objetos digitales correspondientes a dichas publicaciones seriadas.
En cuanto a los archivos MARC21, se utilizará la información bibliográfica y de
fondos del Catálogo Colectivo del Patrimonio Bibliográfico si ésta existiera.
En principio, y salvo que se acordara previamente otra cosa, el centro directivo
responsable del proyecto de digitalización es el encargado de proporcionar a la
empresa o servicio de digitalización los registros MAR21 bibliográficos y la
información de fondos de las obras que se van a digitalizar. La empresa o servicio
de digitalización deberá generar registros METS, siguiendo las especificaciones
indicadas más adelante, teniendo buen cuidado de hacer coincidir los números de
control, códigos de biblioteca y signaturas de los registros MARC21 y de los METS.
Las Bibliotecas Virtuales de la S.G.C.B. trabajan con MARC21 bibliográfico, de
fondos y de autoridades. En los pliegos de los contratos de digitalización de esta
Subdirección se exigirá la utilización de estos tres formatos para describir y
clasificar las obras a digitalizar. También se enriquecen los registros bibliográficos
incluyendo los campos MARC21/RDA 264, 336, 337 y 338, y los registros de fondos
incluyendo los campos MARC21/RDA 337 y 338 y los campos 853 y 866 (según ISO
10324:1997/Z39.71:2006) con la información de periodicidad, numeración y
fondos existentes. Se utilizan además registros de materias vinculados con los
correspondientes términos de la Lista de Encabezamientos de Materia para
Bibliotecas Públicas convertida a SKOS (Simple Knowledge Organization System)
que se encuentra en https://id.sgcb.mcu.es poniendo el identificador (URI) del
registro en SKOS en el campo 024 del registro MARC21 de autoridades.
Para los proyectos subvencionados por esta Subdirección es obligatoria la utilización
del formato MARC21 bibliográfico para describir las obras. Además es recomendable
la utilización de registros de fondos y de autoridad en MARC21, y su enriquecimiento
según lo indicado en el párrafo anterior. En todo caso, si no se utilizan registros de
fondos, es necesario incluir la información de fondos en campos 85X del formato
MARC21 bibliográfico. En concreto habría que utilizar el campo 852 con el código
de institución (en el subcampo $a) y la signatura (en el subcampo $j).
En cuanto a los registros METS, salvo que se acuerde previamente otra cosa, será
la empresa o servicio de digitalización la encargada de generar y entregar para
cada número de publicación seriada un archivo METS de carga y otro para
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
15
Página
15/19
preservación. Estos METS deberán ceñirse al Perfil METS Profile for historical
newspapers, al que se puede acceder en la siguiente dirección:
http://www.loc.gov/standards/mets/test/ndnp/00000010.html
El archivo METS para carga de publicaciones periódicas deberá ceñirse a las
siguientes especificaciones:
• Los METS deben incluir direcciones correctas a los namespaces y a los
schemas utilizados, y deben estar bien formados y ser válidos.
• Deben incluir una sección de metadatos descriptivos (dmdSec) que embeba
el registro bibliográfico en formato MODS, con información normalizada de
numeración y cronología según se indica en el ejemplo que se encuentra en el
apartado 3 del Anexo I de este documento.
• En el caso de los contratos de digitalización de la S.G.C.B, los METS deben
incluir una sección de archivo (fileSec), que en un único fileGrp agrupe
elementos file para cada imagen JPG de las que conforman la obra. Además,
en etiquetas FLocat para cada elemento file se incluirán la direcciones a las
imágenes correspondientes. Las direcciones de los METS apuntarán a las
imágenes de difusión que se encuentran en los mismos discos duros que estos
METS. En el caso de las subvenciones para digitalización otorgadas por la
S.G.C.B. la sección de archivo podrá incluir direcciones bien a versiones en JPG
o PDF de las obras digitalizadas.
• Se incluirá una sección de mapa estructural (strucMap) con atributo
TYPE=”LOGICAL”. Si la sección de archivo correspondiente (fileSec) hace
referencia a una versión en formato JPG de la obra, este mapa estructural
(strucMap) debe incluir la información de paginación.
En cuanto a los archivos METS para preservación de publicaciones seriadas deberán
ceñirse a las siguientes especificaciones:
• Incluirán los metadatos que se precisan para la preservación de la copia
digital. Estos metadatos se obtendrán del Diccionario de Datos de PREMIS, en
su versión vigente a la firma del contrato.
• Asimismo, se incluirá en el METS información sobre derechos de propiedad
intelectual según el esquema METSRigths en el que se detallarán las
características de derecho de uso de las publicaciones según determine el
Ministerio de Cultura y Deporte a través de la Subdirección General de
Coordinación Bibliotecaria.
• Se incluirá una sección de archivo (fileSec) con enlaces a las imágenes de
preservación.
Los METS de carga y preservación para publicaciones seriadas podrán fusionarse
en una única versión.
Una vez terminado el servicio de digitalización la empresa o servicio de
digitalización deberá entregar los archivos MARC21 y los METS de las obras
digitalizadas a la institución responsable del proyecto.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
16
Página
16/19
2.4 Propiedad intelectual
Véase el apartado 1.4.
2.5 Requisitos técnicos y de entrega de soportes
Como mínimo la empresa o servicio de digitalización generará y entregará a la
entidad responsable del proyecto una copia de las obras digitalizadas en formato
TIFF 6.0/ISO 12639:2004 y otra en formato JPEG/ISO/IEC 10918:1994, como
formatos de máxima calidad y formato comprimido y optimizado para su lectura en
internet, respectivamente. Se recomienda entregar al menos dos copias de las
imágenes de preservación (TIFF).
En los contratos de digitalización de la Subdirección General de Coordinación
Bibliotecaria se exigirá la entrega de tres copias de los contenidos digitalizados:
● Copia 1.
Se entregará en discos duros USB 3.0 nuevos que contengan:
-Imágenes de preservación en formato TIFF sin marca de agua.
-Las correspondientes imágenes de difusión en formato JPEG con marca de
agua. La marca de agua consistirá en las siglas del Ministerio de cultura y
Deporte seguidas del año de digitalización, por ejemplo: “M.C.D. 2018”.
-Los correspondientes archivos de reconocimiento óptico de caracteres XML-
ALTO.
-Los correspondientes registros MARC21 bibliográficos y de fondos.
-METS de carga para las imágenes de difusión.
-METS de preservación para las imágenes de preservación.
● Copia 2.
Copia con los mismos contenidos que la anterior.
● Copia 3: copia para las instituciones.
Se entregará a la S.G. C.B. una copia, en discos duros nuevos USB 3.0, de los
contenidos del contrato separados por institución. Cada uno de los discos que
conforma esta copia contendrá exclusivamente los objetos digitales y
metadatos de una institución. Dichos contenidos incluirán:
-Imágenes de preservación en formato TIFF, sin marca de agua.
-Las correspondientes imágenes de difusión en formato JPEG, sin marca de
agua.
-Los correspondientes archivos de reconocimiento óptico de caracteres XML-
ALTO.
-Los correspondientes registros MARC21 bibliográficos y de fondos.
-METS de carga para las imágenes de difusión.
-METS de preservación para las imágenes de preservación.
Los ficheros con las obras digitalizadas se estructurarán en un directorio formado
por un primer nivel correspondiente a la institución cuyos fondos se hayan
digitalizado y un segundo nivel con el título, la signatura o el número de control del
registro bibliográfico de cada obra digitalizada y un tercer nivel correspondiente al
año. Podrán incluirse niveles adicionales (meses, días) si se considera necesario.
En el caso de que el mismo disco contuviera varios formatos, el segundo nivel sería
el formato, el tercero el título y el cuarto el año.
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
17
Página
17/19
Los metadatos se incluirán en carpetas independientes, una para cada formato
(METS, MARC21 bibliográfico, MARC21 de fondos, MARC21 de autoridades...).
Dentro de cada disco, todos los archivos METS correspondientes a los fondos de
una biblioteca se incluirán en un mismo directorio. Igualmente, dentro de cada
disco, los archivos MARC21 correspondientes a los fondos de una misma biblioteca
se incluirán en un mismo directorio.
2.6 OCR
En los contratos de digitalización de la Subdirección General de Coordinación
Bibliotecaria se exigirá procesado de OCR (Optical Character Recognition) para
todas las páginas digitalizadas con contenido textual, sean de manuscritos,
impresos o publicaciones seriadas; la empresa o servicio de digitalización deberá
entregar un archivo OCR en formato ALTO (Analized Layout and Text Object) por
cada página digitalizada. Estos archivos OCR hacen posible la búsqueda en el texto
de dichas páginas en las bibliotecas virtuales de la Subdirección General de
Coordinación bibliotecaria.
Para los proyectos subvencionados por esta Subdirección se recomienda la
utilización de procesado OCR y programas de gestión de repositorios o bibliotecas
digitales que permitan la búsqueda en el texto. Esta funcionalidad resulta muy útil
y suele ser muy bien valorada por los usuarios.
3. Bibliografía
Unión Europea. Commission’s Recommendation of 27 October 2011 on the digitisation and online accessibility of cultural material and digital preservation (2011/711/EU) [Documento en línea]. Journal of the European Union. L 283/39 (29/10/2011). http://eur-lex.europa.eu/LexUriServ/LexUriServ.do?uri=OJ:L:2011:283:0039:0045:EN:PDF [Consulta: 10-03-2015]. ISSN 1977-0677 IFLA / Guidelines for Plannnig the Digitalization of Rare book and Manuscript Collections [Documento en línea]. IFLA, 2014. http://www.ifla.org/publications/node/8968 [Consulta: 11-03-2015]. IFLA e ICA / Directrices para proyectos de digitalización de colecciones y fondos de dominio público, en particular para aquellos custodiados en bibliotecas y archivos. [Documento en línea]. Madrid : Ministerio de Cultura. Secretaría General Técnica, 2002. http://www.ifla.org/publications/guidelines-for-digitization-
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
18
Página
18/19
projects-for-collections-and-holdings-in-the-public-domain [Consulta: 11-03-2015]. ISBN 84-8181-274-4 Library of Congress. MARC 21 Format for Bibliographic Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/bibliographic/ [Consulta: 11-03-2015] Library of Congress. MARC 21 Format for Holdings Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/holdings/ [Consulta: 11-03-2015] Library of Congress. MARC 21 Format for Authority Data [Página web]. Library of Congress, October 2014. http://www.loc.gov/marc/authority/ [Consulta: 11-03-2015] Library of Congress. Metadata Encoding & Transmission Standard (METS) [Página web]. http://www.loc.gov/standards/mets/ [Consulta: 11-03-2015] W3C. SKOS Simple Knowledge Organization System. [Página web]. http://www.w3.org/2004/02/skos/ [Consulta: 11-03-2015]
Library of Congress. Metadata Object Description Schema (MODS) [Página web].
http://www.loc.gov/standards/mods/ [Consulta: 11-03-2015]
METAe project group, Library of Congress. Analyzed Layout and Text Object (ALTO) [Página web]. http://www.loc.gov/standards/alto/ [Consulta: 11-03-2015]
[MCD – S.G. Coordinación Bibliotecaria]
Requisitos técnicos de los proyectos de digitalización
19
Página
19/19
4. Anexo I. Ejemplos de archivos METS y OCR para la Biblioteca Virtual del Patrimonio Bibliográfico (monografías) y la Biblioteca Virtual de Prensa Histórica
Anexo I disponible en:
http://travesia.mcu.es/portalnb/jspui/handle/10421/8981