Taula de Nova Recerca Departament de Comunicació 5 ... · inteligente, capaz de realizar...

19
Taula de Nova Recerca Departament de Comunicació 5 Noviembre 2015 Francisco BAENA Universidad de Sevilla Proyecto BIDISO IV - Grupo IbemNEWS [email protected] Ontologías Web semántica Datos enlazados Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Transcript of Taula de Nova Recerca Departament de Comunicació 5 ... · inteligente, capaz de realizar...

Taula de Nova Recerca Departament de Comunicació

5 Noviembre 2015

Francisco BAENA Universidad de Sevilla Proyecto BIDISO IV - Grupo IbemNEWS [email protected]

Ontologías Web semántica Datos enlazados

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Impresos informativos de la Edad Moderna Península ibérica - Siglo XVII

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

ORIGINAL PDF/JPG TXT TEI

2003-2013 2014-…

Impresos informativos de la Edad Moderna Península ibérica - Siglo XVII

DIGITALIZACIÓN CODIFICACIÓN

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

1

«Contribuir a la conservación y

accesibilidad de los documentos».

3 «Realizar búsquedas en el texto de

una relación de palabras concretas».

2 «Facilitar el intercambio de datos entre los miembros de la comunidad».

5

«Avanzar en la investigación de la

historia del periodismo».

4 «Transferir el resultado de nuestro trabajo a BIDISO».

Objetivos Digitalización y codificación del patrimonio hemerográfico

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Periodismo impreso – Península ibérica – siglo XVII

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Definición

«Una ontología es una jerarquía de conceptos con atributos y relaciones, que define una terminología consensuada para definir redes semánticas de unidades de información interrelacionadas. Proporciona un vocabulario de clases y relaciones para describir un dominio, poniendo el acento en la compartición del conocimiento y en el consenso en la representación de éste».

Pablo Castells (2003) La Web Semántica

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Definición

«Es la formalización lógica de un ámbito del conocimiento». «Lo mejor de las ontologías es la promesa de mejora de la recuperación de información que implican, cuando consideremos su aplicación a una hemeroteca digital». «Podría servir para proporcionar un sistema de búsqueda inteligente, capaz de realizar inferencias y actuar como si fuera una verdadera inteligencia artificial, pero aún no están implantadas en forma funcional».

Lluís Codina, Rafael Pedraza-Jimenez (2015) Taxonomías y Ontologías:

Qué son y cómo se aplican en Medios de Comunicación

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

1

«Representar (gráficamente) toda la

información contenida en los

documentos». 3 «Realizar búsquedas semánticas e

implícitas».

2 «Facilitar la accesibilidad a esa información».

5

«Definir un vocabulario común y

compartido».

4 «Relacionar todos los datos entre sí».

Ontología Ventajas

6 «Razonar sobre esa base de datos, es

decir, convertir la información en CONOCIMIENTO».

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ejemplos de ontologías BnF

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ejemplos de ontologías BnF

Data.bnf.fr: an overall presentation

The Bibliothèque nationale de France has designed a new project in order to make its data more useful on the Web. It involves transforming existing data, enriching and interlinking the dataset with internal and external resources, and publishing HTML pages for browsing by users and search engines. The raw data is also available in RDF following the principles of linked open data architecture.

Keywords: Linked Data; Semantic Web; metadata; interoperability; RDF; URI;

1. Bibliographic data on the Web:

���� Putting forward BnF data

Library data can be difficult to find on the Web. At the BnF, it is of course possible to access all of the resources and services through our Library Website (www.bnf.fr). But, at present, few of them are indexed by search engines. And, even when they are, it is difficult to sort results from them. Some digital books, even when they are completely and freely available, are sometimes impossible to find if you don’t already know they exist. The data.bnf.fr project can be a way to open the digital library Gallica to a wider public. Moreover, library catalogues are usually stored as relational databases: they are just no use for Web search engines. Users always access the BnF catalogues (mainly, the Main catalogue and the Archive and manuscript catalogue) through library portals, which they often simply don’t know. As a matter of fact, users are very unlikely to find any of our resources directly from a search engine interface, unless they already know about us.

Some links from data.bnf.fr. Data.bnf.fr is a Web interface which gathers full digital document and descriptive data from different catalogues and enables users finding the relevant information in our resources. Our resources should be as visible on the web as the library building in the town. � Structured Data have a value Typed, normalized and labelled data is the basis of Web search. With record identifiers and labels, libraries already identify resources in a uniform way and “link data” Through the links between works, authors and subjects, librarians have been “linking data” for years. They have been providing useful and reliable information through authority files. Indeed, our library catalogue holds more than 12 million records, all structured and linked together. It relies on two million accurate and trustworthy authority records about authors, corporate bodies, works and subjects (RAMEAU1), which are maintained, with permanent URIs (ARK identifiers2 at the BnF3). On the Web, data that are provided by a public institution such as a national library have a specific value,

1 http://rameau.bnf.fr 2 Bermes, Emmanuelle. (2006). Les identifiants pérennes à la BnF. Retrievable from http://bibnum.bnf.fr/identifiants/identifiants-200605.pdf

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ejemplos de ontologías BBC

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ejemplos de ontologías BBC

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ejemplos de ontologías BBC

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Construcción paso a paso

1

«Crear una nube de conceptos».

3 «Agrupar las clases y propiedades».

2 «Definir y clasificar cada concepto».

5

«Revisar la nomenclatura y la

jerarquía de las clases y propiedades,

a fin de normalizarlas».

4 «Determinar el dominio, el rango y la inversa de cada propiedad».

6 «Introducir individuos de ejemplo y

representar la ontología gráficamente».

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Ejemplo de la toma de decisiones

Si un impreso informativo se publica en el año 1625, según su pie de imprenta, e informa de una noticia sucedida el 23 de mayo de 1625, podemos acotar la fecha de publicación mediante un intervalo de tiempo.

seImprimeDesde 1625-05-23T00:00:00Z seImprimeHasta 1625-12-31T23:59:59Z

Problema ¿Cómo debíamos representar las

fechas en nuestra ontología?

Solución 2

«Crear propiedades de datos del tipo

dataTime».

Solución 1 «Importar una ontología de tiempo ya existente (owl-time)».

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología de dominio especializado Periodismo impreso de la Edad Moderna

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna

Ontología Retos pendientes

  Traducir la ontología al inglés.

Conseguir financiación y colaboración institucional.

Solicitar reconocimiento y almacenamiento a W3C para formar parte de los Semantic Web Standards.

Desarrollar una herramienta o asistente que permita poblar la ontología de una forma intuitiva y amigable.

  Poblar la ontología con los impresos informativos que conforman nuestro corpus.

  Alojar la ontología y crear una página web que permita visualizarla y realizar búsquedas semánticas.

Una aplicación de las ontologías al estudio de la prensa de la Edad Moderna