Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
-
Upload
claudia-gutierrez -
Category
Internet
-
view
292 -
download
0
Transcript of Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
Metodología para la creación de un corpus para evaluar el sitio de gobierno abierto chileno
Elena Gamboa ArancibiaOlga AcostaClaudia Gutiérrez
Gobierno Abierto
Transparencia
Colaboración Participación
Gobierno Abierto (Open Gov)
Colaboración con la sociedad
Principios del Gobierno Abierto
La PARTICIPACIÓN en un Gobierno
Abierto implica dar voz a los
ciudadanos en los procesos de toma de decisiones y
diseño de políticas públicas, usando
herramientas tecnológicas que
permitan expresar sus opiniones y
sugerencias sobre el quehacer
gubernamental para mejorar sus
actuaciones y servicios.
La TRANSPARENCIA aplicada al funcionamiento de los gobiernos significa que estos pongan a disposición de la sociedad toda la información relacionada con su actividad, gestión y administración.
La COLABORACIÓN continua entre las instituciones de administración públicade diversos niveles, así como entre el gobierno y ciudadanos, empresas, organizaciones, etc.
Contribuyendo a mejorar las condiciones de vida a través de la creación de aplicaciones, servicios en line, ciudades inteligentes, etc. Los ciudadanos, además de aportar su opinión sobre las políticas públicas, se convierten en socios de los gobiernos .
TECNOLOGÍAS DE LA INFORMACIÓN Y COMUNICACIÓN
DATOS ABIERTOS DE GOBIERNO
Datos Abiertos de Gobierno
• Datos Abiertos (Open Data) su objetivo es poner a disposición de todo el mundo los datos de manera que puedan ser consultados, redistribuidos y reutilizados libremente por cualquiera, respetando siempre la privacidad y seguridad de la información.
• Los Datos Abiertos de Gobierno se refieren a la aplicación de los estándares de los Datos Abiertos a la información que gestionan las Instituciones de Administración Pública u otros organismos dependientes del estado.
Estándares de los Datos Abiertos
1. Completos: Todos los datos públicos deben estar disponibles. Se deben excluir la información personal y sensible.
2. Primarios: Los datos deben ser entregados tal como fueron recolectados de su fuente, con la mayor granularidad posible, sin modificaciones en su forma.
3. No propietarios: Los datos deben estar disponibles en un formato sobre el cual ninguna entidad tenga un control exclusivo
4. Libres de licencias: Los datos no deben estar sujetos a ninguna restricción producto de derechos de autor, patentes, derechos de marca o secreto industrial. Con restricciones que permitan regular la privacidad de las personas y seguridad de las instituciones
.
Estándares de los Datos Abiertos
5. Procesables automáticamente: deben estar en formatos que permitan el procesamiento automático.
6. Oportunos: Los datos deben estar disponibles tan pronto como sea posible con el fin preservar su valor.
7. Accesibles: Los datos deben estar disponibles para el más amplio rango de usuarios y para el más amplio rango de propósitos.
8. No discriminatorios: Los datos deben estar disponibles para todos, sin requerir registro.
Gobierno Abierto en Chile
Ley de Transparencia y Acceso a la Información
Pública
Directorio de Transparencia
Portal de Datos de Gobierno
Transparencia en Chile• La ley de Transparencia de la Función Pública y Acceso a la
Información de la Administración del Estado N° 20.285 establece lo siguiente:
Ley N°20.285
Transparencia de la función en la función Publica
Acceso a la información
Publicación de información en sitio web.
Solicitud de información a través de un formulario
Las instituciones deben publicar en su sitio web la siguiente información:
Los actos y documentos
Las potestades, responsabilidades, funciones o
tareas
Estructura orgánica
Personal de planta y a contrata
Contrataciones para el suministro de bienes muebles.
Trámites, Beneficios y subsidios
Los actos y resoluciones que tengan efectos sobre terceros
Presupuesto asignado, y los informes sobre su ejecución
Mecanismos de participación ciudadana
Mecanismos de participación, representación e intervención
Auditorías Internas
Datos Abiertos de Gobierno en Chile
• Instructivo Presidencial N° 005 sobre Gobierno
Abierto
Instructivo Presidencial N° 002 sobre Políticas de Participación Ciudadana
Creative Commons
Licencia GNU GPL
Open Database License (ODbL):
•Formatos inadecuados•Formatos propietarios•Datos no son intero- perables
Formato
• Datos poco accesibles.
Despliegue
• Contenidos limitados( solo los determinados por la ley)
• Con restricciones de uso..
Contenido
La ley de transparencia en su forma activa no contempla el uso de los estándares de datos abiertos.
Por otra parte, en el portal de datos abiertos no se cumple con los estándares de formato internacionales para su publicación.
Datos No Son InteroperablesDatos No Democratizadores
Problema:
Objetivo General
• Crear un modelo de buenas prácticas para la publicación de los datos abiertos de gobierno tanto en su variable de Formato –Despliegue –Contenido para generar datos abiertos e interoperables para el uso de las personas e instituciones que los requieran.
Objetivos Específicos
• Diseñar un modelo de análisis y evaluación de datos abiertos de gobierno basado en estándares internacionales.
• Evaluar con dicho modelo la publicación de los datos en los sitios de transparencia y en el portal de datos abiertos de gobierno.
Modelo para la Evaluación de los Datos Abiertos
• De acuerdo a los estándares por W3C y el G8 se ha fijado el siguiente modelos de evaluación de datos abiertos:
Indicador Variable Valor
Formato
Tipo Pdf, csv,doc, xls,
xlsx,xml,html,txt, etc.
Procedencia Abierto/propietario
Licenciamiento abierto
Creative Common
GNU GPL
Open Database License
Facilidad de
procesamiento automático s/n
Despliegue
Nivel de navegación
1er nivel
2do nivel
3er nivel
Diseño responsivo s/n
Contenido
URI s/n
Metadatos
Título
Fuente
Descripción
Institución
¿Cómo obtener la información de las variables planteadas en el modelo de
análisis?• Proponemos un proceso de Extracción de
Información para obtener la información de los indicadores propuestos en el modelo.
• El proceso de extracción se realiza en un corpus construido automáticamente con una muestra de entidades de gobierno.
Extracción de Información
• De acuerdo con Riloff y Lorenzen (1999), un sistema de EI obtiene información de textos en lengua natural y para un dominio específico, donde se debe definir previamente el dominio y los tipos de información de interés.
Extracción de Información Sitios de Gobierno
• El proceso de extracción de información en este caso específico tiene como propósito semi-automatizar la obtención de datos relacionados con los indicadores del modelo de evaluación de los sitios de gobierno abierto: Directorio de transparencia Activa y Portal de datos de gobierno.
• Herramientas utilizadas:
Lenguaje de Programación Python
Libreria Beautiful Soup
Sketch Engine
Metodología
Beautiful Soup
La librería Beautiful Soup nos permite la exploración y la extracción del contenido de páginas HTML y XML.
Se obtiene una estructura de datos anidada que facilita la navegación y la extracción de la información relevante mediante las funciones disponibles en el módulo.
En el siguiente link podemos encontrar un tutorial que nos explica como usar los diferentes funciones
http://www.crummy.com/software/BeautifulSoup/bs4/doc/
Sketch Engine
• Es una herramienta computacional que permite construir y analizar corpus.
• Es un programa que se puede consultar en la web: http://www.sketchengine.co.uk/
Sketch Engine
Sketch Engine• Una vez formado el corpus se puede explorar utilizando las
funciones del módulo:
Conclusiones• En muchas investigaciones actuales enfocadas en la extracción de
información (extracción terminológica, extracción de relaciones léxicas, etc.) se ha usado la Web como una fuente enorme de información textual.
• Metodologías como la planteada en nuestro trabajo permiten navegar un sitio Web de forma automática para obtener los URIs vía establecer una profundidad específica en el nivel de navegación y con ellos construir un corpus.
• En el caso concreto de este trabajo, la construcción de un corpus con información de entidades de gobierno nos permitió extraer los datos requeridos para evaluar el sitio.
• A grandes rasgos, vía este proceso de extracción de información fue evidente que no se aplicaba a cabalidad el modelo de datos abiertos por lo que concluimos que la información no es transparente a la ciudadanía.
Conclusiones• Sitios como el evaluado en este trabajo crecen continuamente
y por ello resulta indispensable crear mecanismos de monitoreo automáticos que permitan evaluarlos regularemente para verificar que cumplan con los requerimientos de los modelos en los que fueron concebidos.
• En este sentido, las técnicas de PLN resultan de gran utilidad para automatizar los procesos de extracción o recuperación de información, según sea el caso.
Muchas gracias por su atención.