Monografía datos directos

65
Universidad Interamericana de Puerto Rico Recinto de San Germán Programa de Estudios Graduados Departamento de Matemáticas y Ciencias Aplicadas Datos Directos Monografía sobre una alternativa para la estadística de Puerto Rico Rubén Quiñones Morales PROYECTO CREATIVO – MATH 6900-0 Mayo 2013

description

Cómo aumentar la capacidad de recoleción y publicación de datos estadísticos mediante el uso del internet

Transcript of Monografía datos directos

Page 1: Monografía datos directos

Universidad Interamericana de Puerto Rico Recinto de San Germán Programa de Estudios Graduados Departamento de Matemáticas y Ciencias Aplicadas

Datos DirectosMonografía sobre una alternativa para la estadística de Puerto Rico

Rubén Quiñones Morales

PROYECTO CREATIVO – MATH 6900-0Mayo 2013

Page 2: Monografía datos directos

Resumen

Esta es una monografía para el proyecto creativo de la maestría en artes de matemática

aplicada en la Universidad Interamericana de Puerto Rico Recinto de San Germán. En ella se

desarrolla el tema sobre la escasez y necesidad de datos estadísticos accesibles que existe en

Puerto Rico para hacer nuestras propias investigaciones e inferencias. También propongo un

método que utilizaría la implementación del uso de la computadora para hacer toda

transacción en las agencias gubernamentales con almacenaje virtual de datos. Combinaría

todos los datos mediante una programación que conecte los datos de todas las agencias y los

publique en el instante de ser entrados al sistema. La publicación de esos datos se daría,

creando una página web que además, le daría al usuario la opción de realizar encuestas en

dicha página.

La monografía incluye demostraciones con programas matemáticos existentes que

pueden llevar a cabo la gestión propuesta sin incurrir en grandes gastos. También una forma

matemática de realizar cálculos de un valor mínimo para validar los resultados de las

propuestas encuestas en línea. Justifica la idea expuesta describiendo el éxito de un modelo

similar de recopilación y publicación de datos usado por el Reino Unido.

Page 3: Monografía datos directos

Summary

This monograph is the creative project for the masters in arts of applied mathematics at

the Interamerican University of Puerto Rico San Germán Campus. It develops the theme of

scarcity and need for accessible statistical data that exists in Puerto Rico to do our own research

and inferences. It also proposes a method to implement computer use for any transaction in

government agencies with virtual storage data. Combine all the data using a program that

connects data from all agencies and published at the time of being entered into the system. The

publication of this information would be done by creating a website that also give the user the

option to conduct surveys on the website.

The monograph includes demonstrations with existing mathematical programs that can

carry out the proposed management without incurring large expenses. Also a mathematical

way of performing calculations of a minimum value to validate the results of the proposed

online survey. Justify the expressed idea by describing the success of a similar collection model

and publication of data used by the UK.

Page 4: Monografía datos directos

Dedicatoria

A mi familia.

Por ser siempre fuente de tranquilidad, soporte y refugio.

Page 5: Monografía datos directos

Agradecimiento

En este proyecto intervinieron varias personas que de una u otra forma colaboraron

para que se llevara a cabo. Quiero comenzar agradeciendo a mi familia, la familia Quiñones

Morales, por haber brindado de su tiempo para que yo pudiera realizar libremente la labor en

este trabajo. También quiero agradecer a la profesora Enidsa Arroyo por brindarme asesoría y

ayuda en cuanto a la redacción y ortografía. Al profesor Álvaro Lecompte por aportar ideas de

gran utilidad para el desarrollo del tema y culminación del proyecto. La lista de otras personas

que intervinieron es extensa, así que muchas gracias a todos aquellos que saben que forman

parte de este logro.

A todos, gracias.

Rubén Quiñones Morales

Page 6: Monografía datos directos

Tabla de Contenido

Introducción.......................................................................................................... 1La estadística en la sociedad actual........................................................................2Datos disponibles en Puerto Rico...........................................................................2

tendenciaspr.com.......................................................................................3Instituto de Estadísticas de Puerto Rico.....................................................4

Estadísticas para la vida real...................................................................................5Investigación personal................................................................................6Hallazgos a partir de la investigación..........................................................9

Límites de nuestra estadística..............................................................................10Estadística disponible en la red............................................................................10Datos directos; la solución a la crisis de datos.....................................................11

Datos abundantes, recopilación abundante.............................................12C.I.A World Fact Book...............................................................................12Últimas tendencias de recopilar y presentar datos..................................14Modelo de datos británico.......................................................................15Estrategias para recopilar y presentar datos en Puerto Rico....................16

Expediente electrónico en agencias gubernamentales.......................16EHR...............................................................................................17SUMAC..........................................................................................17Child Welfare Outcomes y SICStA en Puerto Rico.........................19¿Cómo hacer accesibles los datos de expedientes

electrónicos en las agencias del gobierno? ..................................19Creación de perfiles (Data Linking) ..............................................22

Perfil interagencial del ciudadano y protecciónde privacidad....................................................................23

Página web interactiva (Open Data y Encuestas) ...............................25Muestreo aleatorio y valor mínimo de validación

(Parte matemática) ......................................................................27 Incentivos a empresas que aporten datos estadísticos

(Recuperando y explotando big data) ...............................................31Conclusión............................................................................................................33Reseña del autor..................................................................................................34Bibliografía...........................................................................................................35

Page 7: Monografía datos directos

Introducción

La internet ha facilitado el conocimiento a quien quiera adquirirlo y no tan sólo al

especialista en alguna materia. Se considera como una herramienta universal. Esto es

beneficioso porque se puede investigar los pros y contras de un asunto de interés antes de

tomar una decisión. Se puede emitir juicios u opiniones basados en un conocimiento del que

disponemos.

La sociedad actual analiza su entorno cuantitativamente. Cada vez más tiende a tomar

decisiones basadas en datos medidos numéricamente en la mayoría de sus aspectos. Como

ejemplo de esto tenemos a la economía, donde las empresas miden las ganancias, la

producción y la eficacia de su producto mediante datos estadísticos. Además de la economía,

los datos numéricos resultan imprescindibles en la política, seguridad, salud, educación, familia,

ciencias naturales, etc. Podemos hallar respuestas a quién, qué, cómo, cuándo y dónde tan

fácilmente como escribir una palabra clave en el ordenador.

Entonces nos aventuramos a hallar la respuesta a cuánto y nos topamos con que en

Puerto Rico no hay suficientes datos para contestar la mayoría de nuestras dudas al respecto.

Este proyecto creativo está dirigido a facilitar aún más el hallar la respuesta a cuánto. O sea,

está dirigido a facilitar una mayor y mejor recopilación de datos numéricos y el acceso a éstos

para conveniencia de la sociedad. Esto mediante lo que aquí llamamos programación de datos

directos; una recopilación y presentación de los datos usando sistemas computadorizados

directamente desde el individuo a quien pertenecen los datos. Se hace comparación con

modelos estadísticos existentes y se trabaja de forma matemática con algunas de las

situaciones planteadas. A continuación; Datos Directos.

1

Page 8: Monografía datos directos

La estadística en la sociedad actual

Los cambios en la tecnología y en la sociedad se aceleran cada vez más y requieren que

los datos existentes aumenten y mejoren a tono con esos cambios. Mientras más accesibles

sean los datos, mayores serán los cambios y mientras más sean los cambios, mayores deben ser

los datos. Recopilar y publicar los datos cada vez que ocurren los cambios aseguraría un

crecimiento enorme en el conocimiento y en los adelantos.

Para lograr esto necesitaríamos una buena estadística. La estadística necesita datos en

forma numérica. Estos datos deben ser lo más cercanos a la fuente posible para maximizar su

integridad. Debe ser accesible y entendible. El internet y los programas computacionales son

herramientas capaces de lograr esto.

Datos disponibles en Puerto Rico

Hoy día existen datos estadísticos ubicados en fuentes distintas como el gobierno,

universidades, empresas privadas, prensa, etc. Las grandes empresas tienen la capacidad de

recopilar los datos estadísticos que necesiten guardando la información que les interesa y

analizarla internamente. Pero las universidades y agencias gubernamentales son quienes

mayormente exponen datos al público. Lamentablemente, el ciudadano común en Puerto Rico

sólo cuenta con dos fuentes significativas de datos en línea: la página electrónica

tendenciaspr.com y la página electrónica del Instituto de Estadísticas de Puerto Rico. A

continuación una breve descripción de ambas.

2

Page 9: Monografía datos directos

tendenciaspr.com

La Universidad de Puerto Rico lanzó una página por internet llamada

www.tendenciaspr.com trabajada desde el año 2002, con énfasis en la elaboración de

indicadores para comparar la calidad de vida en Puerto Rico. El economista social y profesor de

ciencias sociales en la Facultad de Estudios Generales del Recinto de Río Piedras, doctor Manuel

Lobato Vico, dirige desde el año 2002 el proyecto tendenciaspr.com. A través de este portal de

internet, provee datos y análisis estadísticos sobre aspectos relacionados con

la cultura, economía, educación, población, salud, trabajo y violencia en Puerto Rico. En

esencia, de acuerdo con Lobato Vico, “tendenciaspr.com es un proyecto universitario para la

difusión gratuita de datos e información estadística sobre Puerto Rico, con un diseño que

responde a la lógica del usuario”.

Allí se hallan datos relevantes sobre cada tema especificado anteriormente. Son

presentados en tablas, listas y diagramas que muestran la información de forma grupal.

Muchos son datos originados por el portal tendenciaspr.com o copiados de agencias

gubernamentales de Puerto Rico y Estados Unidos. La gran mayoría de estos datos provienen

de los años 2005 a 2008. Los datos más recientes que se han agregado tratan del año 2010 y se

añadieron a la página electrónica en 2012. Sin embargo contiene enlaces con páginas de

informe estadístico tanto del gobierno de Estados Unidos como de Puerto Rico. Entre ellos, la

página del censo de Estados Unidos y el Instituto de Estadísticas de Puerto Rico los cuales

contienen datos más actualizados.

3

Page 10: Monografía datos directos

Instituto de Estadísticas de Puerto Rico

Diferentes agencias de gobierno tienen alguna información estadística en internet, pero

el Instituto de Estadísticas de Puerto Rico del Estado Libre Asociado de Puerto Rico es el

responsable de publicarlas todas en la página de internet www.estadisticas.gobierno.pr.

Comenzó en el año fiscal 2009 10 con la preparación del Inventario de Estadísticas de Puerto ‐

Rico (Fase I), el cual inscribe los informes estadísticos en el proceso de acreditación.

Dicha agencia tiene las siguientes Misión y Visión:

Misión

Elaborar la política de desarrollo de la función pública estadística; coordinar el servicio de producción de estadísticas de las entidades gubernamentales, y requerir información tanto al sector público como al sector privado.

Visión

El Instituto será la entidad líder en estadísticas. Garantizará al país que cuenta con estadísticas completas, confiables, y de acceso rápido y universal. Inspirará confianza, seriedad y prestigio por sus altos estándares metodológicos. Respaldará objetivamente la gestión gubernamental, promoverá el uso de normas y estándares universales y estimulará la capacidad investigativa entre las nuevas generaciones de profesionales. El Instituto será una entidad pública ágil, con un sentido claro de misión y dirección, y líder en el uso de la tecnología como herramienta de trabajo y servicio, que modelará el trabajo en equipo, la camaradería y convocará a la creación de una comunidad profesional de aprendizaje sobre la metodología estadística, de manera que une a académicos, investigadores, funcionarios públicos, el sector privado y organizaciones sin fines de lucro.

Al igual que tendenciaspr.com muchos de los datos en el Instituto de Estadísticas son

originados por él mismo o copiados de agencias gubernamentales de Puerto Rico y Estados

Unidos. La gran mayoría de estos datos provienen de los años 2005 a 2010, pero contiene

muchos datos de 2012. También contiene enlaces con páginas de informe estadístico del

4

Page 11: Monografía datos directos

gobierno de Estados Unidos y de Puerto Rico. La página tiene información más abundante que

tendenciaspr.com, pero en mi opinión, es más difícil de operar y entender en comparación con

ésta. Aun así, cuenta con un sistema de petición de datos hecha por el usuario a través de

correos electrónicos, de no haber los datos requeridos. Si la petición es más compleja se hace

una petición de datos a la medida la cual conlleva un costo para el usuario.

En ambas páginas se puede hallar mucha información, pero es limitada al querer hacer

un estudio completo con estos datos. Veamos el ejemplo del uso de estadísticas

puertorriqueñas para la vida real.

Estadísticas para la vida real

Se supone que nuestra estadística sirva para resolver problemas de nuestra vida diaria.

De otra forma resultaría inútil tener fuentes de datos propias. Entonces nos preguntamos; ¿son

nuestras estadísticas útiles para nuestra vida real? En un intento de contestar esto utilizamos

un ejemplo que atañe al gobierno.

Actualmente la mayoría de los gobiernos intenta alcanzar unas metas trazadas en un

corto periodo de tiempo (en Puerto Rico, menos de cuatro años). Ante esto la estadística

disponible juega un papel sumamente importante.

Planteamos en este ejemplo que el gobierno de Puerto Rico desea crear un plan para

reducir la criminalidad. Este plan consta de dos partes.

1) Arrestar a los criminales

2) Evitar que acontezcan más crímenes.

Enfoquémonos en la segunda parte de evitar que acontezcan más crímenes. Lo que se

busca es analizar qué causas desencadenan un crimen y las causas de las causas. Al analizar

5

Page 12: Monografía datos directos

cada crimen con sus variantes se nos ocurren diversas posibles causas para cada crimen y para

cada posible causa.

No podemos adjudicar causas específicas simplemente porque se nos ocurre. Entonces

es necesario realizar un estudio exhaustivo de cada una, donde se obtengan datos numéricos y

establecer alguna tendencia de relación entre la posible causa y el crimen o la posible causa.

Este estudio, debería ser muy complicado y tomaría muchísimo tiempo. Es posible que termine

el periodo de gobernación y no se haya implementado un plan de acción para corregir las

causas de los crímenes. Entonces se tomarían soluciones a corto plazo y seguiría la situación

empeorando con los años, repitiéndose la misma historia de periodo en periodo de gobierno

(claro, esto es un ejemplo meramente hipotético).

Investigación personal

Tomando el crimen y las muertes como un sólo problema me di a la tarea de entrar al

internet para identificar una posible causa para éstos. Pensé que el alcohol sería una causa de

muertes comparable a las drogas. Quise analizar mediante un motor de búsqueda la

información que hay en internet sobre Puerto Rico para hallar alguna relación entre muertes en

Puerto Rico y el alcohol. Para tener una idea comparativa hice lo mismo con las drogas.

Obtuve los siguientes datos:

6

Page 13: Monografía datos directos

En el 2012, hubo 134 asesinatos por droga, pero 117 en accidentes de tráfico por

alcohol. Además el 67% de los crímenes fueron llevados a cabo bajo los efectos del alcohol.

Eso nos lleva a aproximar a más de 655 muertos. Un total de 772 muertes por alcohol este año.

Ante la impresión nos vemos tentados a concluir que siempre nos hemos enfocado en

el problema de la droga ilegal cuando el alcohol ha matado a mucho más personas. Pero antes

de tomar conclusiones las preguntas deben ser; ¿De dónde obtuve esos datos? ¿Había

relación entre los datos? ¿Eran confiables esas fuentes? Veremos a continuación que no lo

suficiente para llegar a ninguna conclusión válida.

1) hubo 134 asesinatos por droga

Fuente: Departamento de la Policía de Puerto Rico, División de Estadísticas de la Criminalidad

7

Page 14: Monografía datos directos

2) 117 en accidentes de tráfico por alcohol

Lo había hallado en un periódico del mes de noviembre de 2012. Al tratar de hallar el

reportaje de nuevo, no lo conseguí. La estadística más cercana es de la Comisión para la

Seguridad en el Tránsito del gobierno de Puerto Rico en una tabla del año 2011 que arroja una

cifra de 103 personas.

8

Page 15: Monografía datos directos

Fuente: Oficina de la Comisión para la Seguridad en el Tránsito

La Comisión para la Seguridad en el Tránsito no tiene datos al respecto (alcohol y muertes

de tránsito) del 2012 así que no me permite hacer un análisis comparativo entre las muertes

ocasionadas por drogas ilegales y por alcohol. El formato de la tabla de los años anteriores de

la División de Estadísticas de la Policía de Puerto Rico no incluye a la droga como motivo de

asesinato lo cual impide también hacer esa comparación para esos años.

3) El 67% de los crímenes fueron llevados a cabo bajo los efectos del alcohol.

Esto según datos del sitio web www.salonhogar.com. Esta no es una página oficial ni

hace referencia a ninguna fuente que dé crédito a sus expresiones. No dice para qué año y

tampoco pone a Puerto Rico como lugar de los datos.

En fin, fue una crítica bien intencionada que luce bien, pero carece de datos validables.

No pude ni probar ni invalidar mi hipótesis por falta de datos.

Hallazgos a partir de la investigación

Invertí mucho tiempo buscando esos datos por internet. Al buscar, las primeras

sugerencias que me aparecieron en el buscador fueron tendencias.pr y el Instituto de

Estadísticas de Puerto Rico.

Cada uno tiene su propio buscador de datos. Sin embargo la información que hallé fue

utilizando el buscador de Google porque con los buscadores de cada página mencionada no

9

Page 16: Monografía datos directos

tuve buenos resultados. Algunos resultados de mi búsqueda me llevaron a las direcciones de

ambas páginas. En ellas hallé parte de los datos que mencioné, pero fueron muy escasos.

Un buscador de internet es eficaz si tiene acceso a una cantidad enorme de datos. Así

que para que una fuente se convierta en una buena herramienta de trabajo, al momento de

realizar investigaciones estadísticas, se necesitan muchísimos datos. Nuestras fuentes de datos

tienen muchos datos, pero no lo suficiente para resolver el problema que planteé.

Límites de nuestra estadística

El mayor límite que tiene nuestra estadística puertorriqueña es que carece de datos y

más aun, carece de datos actuales (entiéndase de datos de un año o menos). De haber datos,

hay que rebuscar en menús y tablas cuyo contenido, en ocasiones, es descifrable si se está

familiarizado con términos que se utilizan en la agencia que los produce. Esto limita la

viabilidad del dato buscado.

Estadística disponible en la red

Decidí revisar por internet cómo se encuentran al respecto las páginas de estadísticas

más relevantes en el listado de sugerencias del buscador. Entrando palabras clave en inglés

(statistics) la sugerencia de búsqueda que resaltaba de primera intensión fue UK National

Statistics en www.statistics.gov.uk. Éste tenía mucho más información que nuestras bases de

datos, por lo tanto al usar su buscador aparecían muchas más alternativas para la búsqueda.

Aún así, no conseguí lo que estaba buscando. Su uso es también complicado. El Reino Unido se

divide en Inglaterra, Escocia, Gales e Irlanda del Norte. Cada uno de ellos aporta un informe

estadístico de asuntos distintos y no existe uniformidad para dichos informes. Esto no permite

la colectividad ni comparabilidad entre ellos.

10

Page 17: Monografía datos directos

La segunda sugerencia al buscar en inglés es la página de estadísticas del gobierno de

Estados Unidos, www.fedstats.gov. Esta página resulta un poco más fácil de utilizar y tiene

muchísima información estadística. Los datos no dirigen a conclusiones específicas sobre el

tema de drogas y alcohol por limitaciones similares a los antes analizados.

La universidad de Princeton tiene una página de internet en http://dss.princeton.edu

donde presenta una grandísima cantidad de información, pero se repite la historia. Lo mismo

ocurre con las páginas estadísticas en internet de muchos gobiernos y organizaciones a nivel

internacional.

A pesar del esfuerzo de estas agencias de recopilación de datos estadísticos la mayoría

de los datos disponibles no son continuos sino que son obtenidos por medio de estudios

realizados en un momento y para contestar unas preguntas surgidas en ese momento. Los

reportes se dan en informes largos, complicadas tablas y muchas veces es necesario bajarlos en

PDF o Excel a la computadora. Además los datos recopilados por el área privada, en su mayoría,

no llegan al público común. Esto dificulta la conexión entre datos, el acceso a ellos, la

recuperación de los mismos luego de un tiempo y su vigencia en el momento de buscarlos.

Sabemos que la realización de material estadístico resulta costosa. Además, por el momento

no parece haber una forma costo efectiva de mejorar el acceso a la información en medio de un

marco económico mundial desfavorable. Por tal razón es posible que se esté dejando los

avances estadísticos a un segundo plano para invertir en soluciones inmediatas a problemas

prioritarios. Esto nos deja con el problema de que no tenemos datos suficientes disponibles al

público y que los que hay presentados no son entendibles.

Datos directos; la solución a la crisis de datos

11

Page 18: Monografía datos directos

Dadas las dificultades planteadas entendemos que es necesario crear un sistema de

acceso eficiente y costo asequible a los datos. Para lograr este acceso eficiente a los datos es

necesario crear una poderosa “máquina” de recopilación y publicación sencilla de datos. Crear

esa máquina no debe ser muy difícil ya que el internet y la programación actual ya cuentan con

recursos muy útiles que al unirse lograrían crearla.

Para saber qué recurso utilizar en este nuevo sistema de información debemos analizar

primero lo que debe contener para asegurar su eficiencia. Los datos deben ser abundantes,

accesibles y entendibles. Deben ser actuales si se les requiere. Deben ser comparables. Deben

ser confiables y precisos. Deben ser constatables. Deben presentar sólo lo que se está

buscando. Deben ser lo más cercanos a la fuente posible para maximizar su integridad. Deben

ser continuos. Los datos deben ser enormemente abundantes.

Datos abundantes, recopilación abundante

Para que los datos sean abundantes necesitamos una enorme capacidad de

recopilación. En las agencias internacionales con mayor cantidad de datos el esfuerzo invertido

en la recopilación es igual de enorme que sus datos.

CIA World Factbook

Ejemplo de esto es la CIA (CIA World Factbook). The World Factbook (literalmente,

"Libro Mundial de Hechos") es una publicación anual de la Agencia Central de

Inteligencia (CIA) de los Estados Unidos con información básica tipo almanaque acerca de

diversos países del mundo. El Factbook da un resumen de 2 a 3 páginas de la demografía,

ubicación, capacidad de telecomunicaciones, gobierno, industria, capacidad militar, etc. de

todos los países del mundo.

12

Page 19: Monografía datos directos

El World Factbook es preparado por la CIA para uso del personal del gobierno de los

EE.UU. Como algunas de las otras obras publicadas por el estado federal estadounidense está

en el dominio público.

Actualmente el sitio web del World Factbook se actualiza cada dos semanas. La edición

impresa continúa actualizándose anualmente. La información disponible a 1ro de enero de cada

año se utiliza para conformar la edición anual que se publica a mitad de año.

El World Factbook ha estado disponible para el público desde 1975 y en

formato electrónico desde octubre de 1994. La versión electrónica tiene una media de 6

millones de visitas al mes. Además de la versión oficial impresa también se editan versiones en

CD-ROM, microfichas y cinta magnética.

Según The International Journal of Digital Curation esta base de datos es construida y

mantenida con un gran esfuerzo en recolección, verificación y anotación de datos.

En su investigación, la CIA (Central Intelligence Agency) utiliza fuentes listadas a continuación.

Se consultan, también otras fuentes públicas y privadas no listadas en esta página.

Antarctic Information Program (National Science Foundation)

Armed Forces Medical Intelligence Center (Departamento de Defensa de los Estados Unidos)

Bureau of the Census (Departamento de Comercio de los Estados Unidos)

Bureau of Labor Statistics (Departamento de Trabajo de los Estados Unidos)

Council of Managers of National Antarctic Programs

Defense Intelligence Agency (Departamento de Defensa de los Estados Unidos)

Departamento de Energía de los Estados

Fish and Wildlife Service (Departamento del Interior de los Estados Unidos)

Maritime Administration (Departamento de Transporte de los Estados unidos)

National Geospatial-Intelligence Agency (Departamento de Defensa de los Estados Unidos)

Naval Facilities Engineering Command (Departamento de Defensa de los Estados Unidos)

Office of Insular Affairs (Departamento del Interior de los Estados Unidos)

Office of Naval Intelligence (Departamento de Defensa de los Estados Unidos)

US Board on Geographic

13

Page 20: Monografía datos directos

Unidos Departamento de Estado de los Estados

Unidos

Names (Departamento del Interior de los Estados Unidos)

US Transportation Command (Departamento de Defensa de los Estados Unidos)

Oil & Gas Journal

Según uno de los puntos incluidos en la misión y visión del Instituto de Estadísticas de

Puerto Rico se pretende integrar cada vez más la participación del gobierno, el sector privado y

el público general en la recopilación y publicación de datos estadísticos. Esto sería pieza clave

para una recopilación abundante de datos si se pusiera en vigor. ¿Pero de qué forma

recopilaríamos tanta información? A continuación abundaremos sobre las estrategias que están

surgiendo para recopilar y presentar datos de forma accesible para todos.

Últimas tendencias de recopilar y presentar datos

Los temas que definiremos a continuación han surgido como tendencia en el ámbito de

los datos numéricos en los últimos años:

Data sharing (Intercambio de datos)- Compartir datos es la transferencia de datos entre

dos o más partes. Esto ha estado ocurriendo desde hace muchos años a través de los gobiernos,

organismos de investigación, empresas y otras entidades, facilitar la adopción de decisiones

informadas, la investigación y el debate dentro de los gobiernos y la comunidad en general.

El intercambio de datos puede tomar muchas formas, desde el intercambio de

metadatos (datos sobre los datos), para compartir datos agregados, para compartir encuesta o

datos de registro de la unidad o de un completo conjunto de datos administrativos. El

intercambio de metadatos expone la disponibilidad de datos y es un primer paso clave en el

intercambio de cualquier tipo de datos. En efecto, el intercambio de metadatos puede ser todo

14

Page 21: Monografía datos directos

lo que es posible en algunos casos. En otros casos, compartir datos estadísticos agregados es

todo lo que se requiere por parte del gobierno para informar la toma de decisiones. 

El intercambio de datos puede ser de un solo sentido, de dos vías, o la participación de

múltiples partes o de distribución en el dominio público. En muchos casos, la información

requerida para los propósitos que comparten datos no está fácilmente disponible al dominio

público.

Data linking- El enlace de datos es donde se juntan los registros de dos o más

conjuntos de datos de una manera que se une a los registros de datos separados que

pertenecen a la misma persona o empresa.

Open Data- es una filosofía y práctica que persigue que determinados datos estén

disponibles de forma libre a todo el mundo, sin restricciones de derechos de autor, patentes u

otros mecanismos de control.

Big Data- Cantidad de datos enormes producidas como efecto secundario de cada una

de las gestiones que efectúa cada usuario. Algunas compañías enormes han desarrollado la

recopilación y explotación de esta información para su beneficio. Ejemplo de esto lo son los

grandes datos estadísticos que obtienen las mega tiendas de sus compras y los motores web de

búsqueda de cada gestión que efectúan sus clientes.

Modelo de datos británico

El portal web data.gov.uk del Reino Unido es la fuente de datos más grandes del mundo

con más de 40.000 archivos de datos.

Para lograr esto el gobierno está poniendo en práctica una agenda digital por defecto

que hará que sea más fácil para la gente hacer cosas como pagar su impuesto de matriculación,

15

Page 22: Monografía datos directos

pruebas de conducción de libros, declaraciones de impuestos completas, o solicitar su pensión

pública en línea. Y esta transformación digital, según su propulsor Francis Maude, Ministro de la

Oficina del Gabinete, también va a generar miles de millones de ahorro para el contribuyente.

En combinación con esto se implementó un plan de mayor compartición de datos (Data

sharing) entre las agencias que incluyen procedimientos de fácil acceso a datos personales.

Entonces los datos se publican a través de data.gov.uk. Según Maude, ahora es posible

(mediante Data Linking) compartir datos de distintas agencias a través de data.gov.uk sin que la

información que necesitan tenga que estar en el mismo servidor de la computadora. Las

personas pueden examinar, por ejemplo, datos de registros de empleo, sus estadísticas

criminales locales, pueden comparar el rendimiento de medicina general en el manejo de los

casos de cáncer, los padres pueden juzgar el éxito de las escuelas y colegios particulares, entre

otros (Open Data).

Estrategias para recopilar y presentar datos en Puerto Rico

Aplicando los principios usados en este modelo, sugerimos las siguientes estrategias:

- Crear y utilizar un expediente electrónico en agencias gubernamentales como base de datos (Data Linking y Data Share).

- Crear una página web interactiva que presente los datos y provea también para que el usuario haga su propia encuesta en ella (Open Data y encuestas).

- Incentivar a compañías e instituciones educativas que provean datos estadísticos (recolectar y explotar datos grandes).

Veamos con más detalles cada una de esas estrategias:

Expediente electrónico en agencias gubernamentales (Data linking)

16

Page 23: Monografía datos directos

Recientemente algunas de las agencias gubernamentales han adoptado o están en

planes de adoptar sistemas electrónicos de manejo de expedientes. Ejemplo de esto son: EHR,

SUMAC y SICStA sobre los que abundaremos enseguida.

EHR-Record electrónico de salud

Es la colección longitudinal de información electrónica sobre la salud de las personas

que incluye los datos pertinentes a la salud de un individuo y la información sobre los

ciudadanos provistos. Los EHRs pueden contener una variedad de datos, incluyendo datos

demográficos, historial médico, medicamentos y alergias, estado de vacunas, resultados de

pruebas de laboratorio, imágenes de radiología, signos vitales, estadísticas personales como la

edad y el peso, y la información de facturación. Un EHR se genera y se mantiene dentro de una

institución, como un hospital, una red de distribución integrada, clínica o consultorio médico,

para dar a los pacientes, los médicos y otros proveedores de atención de salud, empleadores y

pagadores o aseguradores acceso a la historia clínica de un paciente a través de las

instalaciones. En algunos casos, este intercambio puede ocurrir por medio de sistemas de

información en toda la empresa y otras redes de información o intercambios conectados a la

red.

Estados Unidos trazó un periodo de diez años para tener en operación en la nación

americana (incluyendo a P.R.) un sistema de expedientes de salud electrónicos (“Electronic

Health Records” o “EHR”). A partir del 2015 Medicare estará aplicando penalidades en los

pagos de aquellos proveedores que no hagan uso del EHR.

17

Page 24: Monografía datos directos

SUMAC

Para explicar este sistema electrónico usamos las palabras dichas en comunicados de

prensa por Sonia Ivette Vélez Colón y por Federico Hernández Denton (Directora

Administrativa de los Tribunales y Presidente del Tribunal Supremo de Puerto Rico

respectivamente).

“SUMAC es un proyecto que busca dotar a todas las secretarías de los tribunales de un solo sistema electrónico que le permita el manejo y movimiento del expediente. Ello logrará uniformidad y permitirá un seguimiento ágil y sencillo para la obtención rápida y oportuna de la información”, explicó Sonia Ivette Vélez Colón durante la presentación

del proyecto.

Rama Judicial de P.R, Comunicado de prensa, 21 de agosto de 2009 http://www.ramajudicial.pr/Prensa/2009/8-21-09.htm

“Este sistema desarrollado por la Rama Judicial permite integrar en una sola base de datos la información de todos los casos que se presentan en los tribunales del país y los procesos de trabajo asociados a su manejo. Además, agiliza el manejo de los casos por parte de los jueces y juezas y del personal de Secretaría y permite contabilizar apropiadamente toda la gestión que se realiza con el fin de obtener de manera rápida la información necesaria para la toma de decisiones judiciales y administrativas”, expresó Hernández Denton.

SUMAC comenzó en la Región Judicial de Humacao como proyecto piloto en el año 2010

y ya se encuentra en plena operación. Con esta nueva herramienta tecnológica el Ministerio

Público radica de manera electrónica las denuncias de delitos graves y sus menos graves

relacionados lo que agiliza su procesamiento. El sistema incluye todas las etapas del proceso

criminal, desde la vista de causa para arresto hasta la sentencia. Todo el manejo del caso se

hace de forma digital.

“SUMAC nos acerca cada vez más a la meta de lograr la implantación de un sistema de radicación electrónica en los Tribunales del País. Al contar todos los Tribunales con un

18

Page 25: Monografía datos directos

mismo sistema, el trámite judicial será más ágil. Ya estamos listos para su expansión a las regiones judiciales de Fajardo y Carolina. Luego se extenderá a San Juan y Bayamón y para el verano del 2013 confiamos contar con SUMAC en las trece regiones judiciales”, anunció Hernández Denton.

Hernández Denton supervisa operación de nuevo sistema unificado de manejo y administración de casos en el Centro Judicial de Humacao, Ed. Microjuris.com Puerto Rico, 17 febrero 2012:http://aldia.microjuris.com/2012/02/17/hernandez-denton-supervisa-operacion-de-nuevo-sistema-unificado-de-manejo-y-administracion-de-cosas-en-el-centro-judicial-de-humacao/

Child Welfare Outcomes Report y SICStA (Sistema de Cuidado Sustituto y Adopción) en Puerto Rico

La Administración de Familias y Niños (Departamento de Familia de Puerto Rico) está

requerida por la Administración Federal de Familias y Niños de los Estados Unidos (Children’s

Bureau) de que recopile y presente datos de los casos que atiende. Para cumplir con estos

requisitos se está implementando el uso, por ejemplo, de la aplicación SICStA como

herramienta de recolección de todos los elementos de datos requeridos por AFCARS (The

Adoption and Foster Care Analysis and Reporting System).

Ésta a su vez colecciona información a nivel de caso de las agencias estatales y tribales

título IV-E (Programas de Asistencia de Adopción y Cuidado de Crianza). Se le requiere a cada

agencia de título IV-E que someta datos de AFCARS dos veces por año.

¿Cómo hacer accesibles los datos de expedientes electrónicos de las agencias del gobierno? (Data Sharing-Parte Programática del Proyecto)

Al buscar datos acerca de la relación entre alcohol y/o drogas con muertes en Puerto

Rico utilicé el recurso de petición de datos por correo electrónico que tiene la página del

Instituto de Estadísticas de Puerto Rico. En dos días laborables me respondió Idania R.

Rodríguez Ayuso, Gerente de Proyectos Estadísticos del Instituto de Estadísticas. Me dio

19

Page 26: Monografía datos directos

información muy valiosa sobre el tema, incluyendo archivos adjuntos y enlaces. Respondió mi

correo electrónico con copias a encargados de informes estadísticos de otras agencias como:

Administración de Corrección, ASSMCA y Policía de Puerto Rico.

Al ver que la agencia encargada de mostrar los datos de Puerto Rico tiene estrecha

relación con las demás agencias que le proveen los datos se hace fácil pensar que se puede

utilizar esa colaboración para crear una sola herramienta interagencial de colección de datos.

El gobierno de Puerto Rico debe generalizar el uso de transacciones electrónicas y autorizar al

Instituto de Estadísticas para obtener y publicar los datos de forma directa. También el Instituto

de Estadísticas debería tener potestad para solicitar a las agencias incluir datos adicionales que

ésta les requiera. Veamos cuan simple sería ese proceso:

Existen programas de computadoras que pueden obtener datos de documentos hechos

en otros formatos e incluso del internet. Utilizando una programación de interfaz se puede

crear un programa que exporte los datos de interés automáticamente a una hoja de cálculo.

Esto permitiría extraer en tiempo real los datos que se desea publicar monitoreado por el

encargado de estadísticas de una agencia siguiendo los estándares de confidencialidad exigidos

por ley.

Un ejemplo de esto, expuesto en forma sencilla, es la aplicación Microsoft Excel, capaz

de crear una hoja de cálculo vinculada a datos web externos y actualizados automáticamente.

También existen aplicaciones como Excel Web App, Share Point y Google Drive, de las que, si no

se utilizan, se puede aprender. Con estas aplicaciones se puede crear un documento

colaborando con otros usuarios en los cuales todos pueden editarlo en tiempo real. No habría

que buscar la última versión de un archivo, porque solo hay una versión.

20

Page 27: Monografía datos directos

Ya que habíamos mencionado un ejemplo con Excel, hablemos del Excel Web App. Un

libro en Microsoft Excel puede ser cargado en un sitio web para que otros usuarios puedan

interactuar con los datos en directo, incluso escribir algunos datos. Funciona aun cuando se

quiera colaborar con alguien que tiene una versión de Excel distinta a la nuestra. Esto permite

trabajar en el archivo junto con otras personas en el mismo sitio web. En Microsoft Excel 2010,

puede comenzar a usar Excel Web App al guardar el libro en SkyDrive o en su biblioteca de

SharePoint.

Cuando se abre un libro en SkyDrive o SharePoint, Excel Web App lo abre en el

explorador y, desde aquí, puede desplazarse por el libro, ordenar, filtrar, expandir y contraer

tablas dinámicas, e incluso realizar de nuevo los cálculos del libro.

También puede usar el comando Buscar para buscar palabras o frases. Al igual que en

una página web, puede seleccionar el contenido de una hoja de cálculo y copiarla de modo que

esté disponible para pegarla en otra aplicación.

Es un ejemplo de cómo lograríamos una conexión directa del Instituto de Estadísticas a

los datos según éstos vayan surgiendo en cada agencia. O sea, sincronizaríamos los datos de las

agencias con la base de datos del Instituto de Estadísticas. Si nos fijamos, estos métodos son

gratis o baratos, accesibles y muy eficaces al transportar los datos sin necesidad de

contratación de agencias privadas costosas o mano de obra adicional. De esta forma un usuario

tendría el acceso directo y en tiempo real al dato que necesite en el momento y de cualquier

agencia que provenga dicho dato. Realizando un trabajo colaborativo de las agencias con el

Instituto de Estadísticas se puede lograr esta programación. Así la información puede ser

21

Page 28: Monografía datos directos

registrada y publicada en el momento directa y automáticamente por El Instituto de

Estadísticas a través de la red. Para lograr que esto llegue de igual forma al público habría que

rediseñar o crear una página web interactiva donde se presenten los datos obtenidos.

Creación de perfiles (Data linking)

Al momento de analizar datos podemos darnos cuenta de que las cifras de dos datos no

necesariamente son comparables. Como ejemplo podemos tomar que obtengo las cifras de

diabéticos en Puerto Rico. También obtengo el número de pacientes que padecen del corazón.

Quiero comparar ambos números a ver si muestran altos indicios de relación entre ellos. Esto

no serviría como estudio de precisión significativa porque no sé cuáles de los pacientes con

diabetes tienen enfermedades del corazón y viceversa. Entonces se debe crear un perfil del

individuo que lo vincule con cada información intra e interagencial que le corresponde. Por

ejemplo, el Departamento de Salud registra a un ciudadano que padece de alcoholismo y el

Departamento de la Policía registra que tiene un accidente automovilístico. Si se crea un perfil

vinculador que proteja la privacidad del ciudadano, ambos datos estarían incluidos cuando se

comparen las dos cifras y se podría establecer una relación comparativa. Cada ciudadano

atendido por una agencia tendría en el Instituto de Estadísticas un perfil que incluya los datos

que le corresponden en todas las demás agencias.

Esta no es una consigna sencilla, dada la complejidad de esta encomienda. Para

empezar, necesitamos un sistema uniforme de identificación de pacientes y ciudadanos,

22

Page 29: Monografía datos directos

seguido por nomenclaturas uniformes y sistemas que se puedan entender entre sí. Y si

consideramos la población actual de 295, 734,134 habitantes, la magnitud de la tarea es

increíble. La creación de identificadores de ciudadanos sin utilizar el número de Seguro Social

(ya que hay varias compañías privadas en el proceso) es sólo uno de los grandes problemas de

este sistema propuesto.

Entonces; ¿Cómo lograríamos crear ese perfil interagencial protegiendo la identidad y

privacidad del ciudadano?

El perfil interagencial del ciudadano y la protección de privacidad

Deseamos poder transferir los datos de la agencia al Instituto de Estadísticas sin perder

su vínculo con el ciudadano del que se obtienen y mantener íntegro el perfil interagencial de

éste. Una forma de transferir esos datos, manteniendo conexión entre ellos, sería mediante la

información personal y el número de seguro social. Pero sabemos que en el proceso de

recopilación y almacenaje intervienen muchas personas y compañías privadas. Entonces

debemos velar por proteger esa información.

Si tomamos como ejemplo el caso del Record Electrónico de Salud vemos que los datos

son recopilados por una clínica, un laboratorio, hospital y etc., usando un programa de una

compañía privada. A esos datos tiene acceso el Departamento de Salud de Puerto Rico quien

presta informes estadísticos al Instituto de Estadísticas. Expuesto en un mapa de conceptos

queda de la siguiente forma:

23

Page 30: Monografía datos directos

1 4

2 3Entonces el paciente debe tener un número de identificación (id) que no permita a la

parte privada vincularlo a su información personal. La agencia (Departamento de Salud en este

caso) entonces vincularía este id con el seguro social de forma que al aportar los datos al

Instituto de Estadísticas, éstos se acomoden en el mismo renglón que se acomodaron los datos

de otras agencias concernientes a este individuo. Usando el diagrama, queda explicado así:

Nótese que el usuario sólo tendría el acceso por internet a los datos numéricos

publicados de forma colectiva protegiendo así la privacidad del paciente. O sea, el dato se

24

Page 31: Monografía datos directos

reflejaría dentro de la suma de todos los datos como éste y quedaría disponible

inmediatamente para el acceso al público. Por ejemplo; ingresé los datos de que Pedro

Fernández quedó desempleado, pero lo único que se vería en el sistema sería el aumento de

uno a la cantidad total de desempleados, que es lo que se presenta. No hay datos

confidenciales ni individuales disponibles. Al ser mediante un programa que tome y publique

los totales en forma automática, el Instituto de Estadística no necesitaría averiguar quién quiere

la información y para qué ni censurar si da acceso o no porque ya está pre configurado. Eso

elimina cualquier dificultad en la solución. Este acceso que el público tendría se lograría

mediante la creación de una página web interactiva.

Página Web Interactiva (Open Data y encuestas)

La página web interactiva presentaría los datos que sean obtenidos mediante la

recopilación actual y con el expediente electrónico. La mayoría de los datos debería aparecer

en tiempo real, como se explicó en la sección del expediente electrónico. En esta página se

debe crear cuentas de usuarios para que también puedan colaborar en la entrada de datos

estadísticos respaldados por una fuente referida (estilo Wikipedia). Que provea también para

que el usuario haga su propia encuesta en dicha página (Una práctica similar a la de Facebook,

pero con almacenamiento de datos para hallar fácilmente en la búsqueda). Que se garantice la

seguridad y confidencialidad de la data de los usuarios. Que cuente con un sistema de petición

de datos hecha por el usuario a través de correo electrónico, de no haber los datos requeridos.

Que incluya un buscador de datos o motor de búsqueda que dirija a una respuesta de un solo

dato numérico y no de una tabla o reporte informativo. Que pueda filtrar su búsqueda por

fechas. Que además del resultado en forma de cifra, le presente un enlace que dirija al informe

25

Page 32: Monografía datos directos

o la fuente de procedencia de la cifra. Que contenga enlaces con páginas de informe estadístico

de otras fuentes. Que se pueda buscar varios datos a la vez y compararlos uno al lado del otro.

Que se pueda calcular medidas de tendencia y obtener gráficas de los datos buscados. Que se

creen aplicaciones de esta página para tecnología móvil y redes sociales para expandir el acceso

a la página. Que contenga un foro público en el cual se discutan temas acerca de datos y

resultados estadísticos de interés social.

Esto resultaría en una verdadera herramienta estadística tanto para la empresa privada

como para el gobierno y el individuo en general.

Imaginemos a un médico que ha visto a varios pacientes con dolor abdominal que no

alivia. Este dolor es recurrente y no parece haber mejoría con el tiempo. Al haber visto ya

muchos casos de este tipo, el doctor decide hacer un estudio a grande escala. Somete a sus

pacientes a un cuestionario que prepara en la página de datos directos que estamos

proponiendo. En esta página también pueden contestar otras personas que entren a la página y

deseen hacerlo. Como en toda encuesta, no se muestra nombres ni información personal, por

diseño del mismo sistema. Las variables que hay que seleccionar o no, tienen que ver con

síntomas y hábitos como alimentación y medicamentos que consume.

Muchos pacientes publican el estudio por alguna red social en internet y comienzan

otras personas a contestar el cuestionario. Algunos pacientes informaron en el foro tener

mejoría cuando abandonaron los lácteos, así que muchos optaron por tomar leche libre de

lactosa. Estos últimos no mostraron mejoría. Entonces el galeno nota que la mayoría contestó

afirmativo en la alternativa de sarpullido en el cuerpo y algunos síntomas cutáneos.

Inmediatamente les escribe que tomen leche de almendras en lugar de leche libre de lactosa.

26

Page 33: Monografía datos directos

Sus pacientes experimentaron mejoría casi inmediata y recomendaron la alternativa en el foro.

Como los datos son directos y continuos, se comienza a notar en la página una disminución en

las cifras de los síntomas y menos relación entre ellos. Se envió a los pacientes a que se

realizaran pruebas de alergia a la caseína (otra proteína presente en la leche) y dieron positivo a

dicha prueba. De inmediato el médico publica un informe de los resultados.

Los datos de ese estudio no se detienen porque se hizo popular dentro de la misma

página y en su aplicación a las redes sociales. Esos números irán variando y aumentando según

pase el tiempo continuamente y estarán accesibles y actuales en el momento que se les

requiera. El número de los beneficiados por ese sencillo estudio sería enorme.

Tal vez el doctor hubiera sabido la respuesta en el momento o tal vez es un diagnóstico

más complicado de lo que se me ocurre, pero es un ejemplo de qué magnitud, eficacia y

posibilidades ofrecería un sistema de esta índole. Además el encuestador no tuvo que pagar

nada por realizar el estudio que, de ser de otra forma, nunca lo hubiera hecho.

Para lograr la participación de tantas personas en dicha página ésta debe ser

sumamente atractiva y sencilla. O sea, se debe usar estrategias de mercadeo para que la página

compita con cualquier página de entretenimiento o interés general. Más aún, si se logra tanta

participación del público, aumentarían las peticiones especiales por pago que tiene la página

del Instituto de Estadísticas. El Instituto podría añadir más tipos de servicio a cierto costo. Esto

acarrearía una entrada sustancial de fondos y haría de esta entidad una más autosustentable.

Muestreo aleatorio y valor mínimo de validación (parte matemática)

En el ejemplo anterior el médico interrogó a todos sus pacientes facilitándoles el acceso

a internet. Contó con todos los elementos del estudio. ¿Pero qué tal una encuesta abierta sobre

27

Page 34: Monografía datos directos

un tema? Ya que no todo el mundo contestaría dicha encuesta no incluiría a todos los

elementos estudiados. Esto hace necesaria la toma de una muestra aleatoria representativa de

la población. Una preocupación que puede surgir es el hecho de que no todos en Puerto Rico

tienen acceso a internet. Por lo tanto las encuestas a través de internet no son del todo

aleatorias porque no representan al total de la población.

Entonces tendríamos dos opciones para validar el muestreo por internet. La primera,

hacer una encuesta por internet y una manual a no usuarios para tomarlos a todos en

consideración. Pero el propósito de la encuesta cibernética es ahorrarse, hasta donde sea

posible, el trabajo y costo de encuestar de la forma tradicional. Entonces escogemos encuestar

sólo a través de internet creando un margen de error o algún valor mínimo de ventaja

comparativa que le dé validez a ese muestreo.

Un valor mínimo de validación de un resultado en una encuesta cibernética se puede

deducir si conocemos el porciento de usuarios de internet en Puerto Rico. Un estudio dado a

conocer por la Asociación de Ejecutivos de Ventas y Mercadeo de Puerto Rico (SME, por sus

siglas en inglés) y la firma de investigación de mercado Estudios Técnicos, reveló que el 45% de

la población de Puerto Rico está conectada a Internet. Esto representa un crecimiento de un 9.3

por ciento desde la más reciente edición del estudio Puerto Rico Internet Market Study que se

llevó a cabo en mayo de 2008. Cabe destacar que la investigación contempla únicamente a

personas mayores de 12 años que fueron parte de dos rondas de entrevistas personales.

Sin duda este número será observado con mucho interés por la industria de la tecnología y

las telecomunicaciones pues se espera continúe creciendo a pasos agigantados en los próximos

meses cuando se estima habrá un gran despunte de ofertas de celulares con conexión de data.

28

Page 35: Monografía datos directos

Se proyecta que para el 2015, un 60% de la población puertorriqueña sea usuaria de

Internet. Estos resultados anuales se deben llevar a porcentaje.

Entonces se puede usar dos pasos para comenzar a buscar un valor mínimo que valide

nuestra encuesta:

1) Se hace un estudio anual acerca de cuántos ciudadanos tienen o no acceso a internet.

2) Creamos una fórmula que represente los valores que se tendría si se realizara una

muestra por internet y otra a los no usuarios. a x1+b x2+a y1+b y2=1

Para esta fórmula debemos identificar las variables.

a=porcentaje deusuariosde internetb=porcentaje denousuarios de internetx1=porcentaje de larespuesta x a travésde internetx2=porcentaje de larespuesta x denousuariosy1=porcentaje de la respuesta y a través de internety2=porcentaje de la respuesta y de nousuarios

Imaginemos que según una encuesta durante el año 2016, el 65% de los

puertorriqueños tiene acceso a internet y el 35% no lo tiene. Se realiza una encuesta

cibernética y una manual para contestar una pregunta que tiene dos posibles alternativas de

contestación. Se encuesta a 100 personas por internet y a 100 no usuarios de internet.

Imaginemos que las posibles contestaciones son sí o no. Al sumar los sí cibernéticos y

manuales, se pondera de forma que los primeros llevan un peso de .65 mientras que .35 debe

ser el peso para los no usuarios. Esto para hacer cada cifra proporcional a la relación que existe

entre usuarios y no usuarios.

El 48% de los encuestados por internet contestó sí y el 52% de éstos contestó no. La

encuesta manual no se realiza, así que debemos imaginarnos una encuesta manual con el peor

de los escenarios para la respuesta con más votos en el internet.

29

Page 36: Monografía datos directos

Usando los datos de este ejemplo, el valor mínimo para el ganador se logra

desarrollando la siguiente fórmula:

resultados en internet resultados encuesta manual No>Sí No<Síx1> y1 x2< y2

Para que sea una respuesta ganadora definitiva el no cibernético ponderado debe

ganarle al sí manual ponderado aun cuando esta última haya obtenido el 100% de los votos.

No cibernético > Sí manualax1>by2

Entonces; .65 x1>.35 y2

Si todos los encuestados de forma manual votaron Sí;

.65 x1>.35 (1)

x1>.35.65

x1> .54

Para que no sea ganador definitivo, tiene que obtener más del 54% de los votos.

Entonces para declarar una respuesta como alternativa dominante su valor debe ser mayor que

el cociente de su peso sobre el peso otorgado a la alternativa con menos votos en internet. De

esta forma una encuesta por internet queda validada y confiable.

x1>ba

Recordemos que los valores de ay b dependen del estudio sobre usuarios de internet

para el año en que se realice la encuesta.

30

Page 37: Monografía datos directos

Hasta este punto ni el gobierno ni el ciudadano habrían tenido grandes gastos que no se

haya proyectado en la actualidad sin que exista este sistema. Entonces sería conveniente la

inversión en incentivos a empresas privadas que aporten datos estadísticos considerables.

Incentivos a empresas que aporten datos estadísticos (recuperando y explotando Big Data)

El Gobierno Federal ha establecido diversos programas que promueven la adopción de

tecnología EHR (Record Electrónico de salud) y que apoyen al proveedor de servicios de salud

durante este proceso. Principalmente ha establecido criterios para certificar los sistemas de

EHR, el uso significativo de estos sistemas y a su vez programas de incentivos que contemplen

la retribución al proveedor del costo de estos sistemas y tecnologías de informática. El

Gobierno de Puerto Rico aprobó el programa de Incentivos Medicaid el cual retribuye hasta

$63,750, comenzando con el desembolso de $20,250 en el primer año al haber adquirido o

implantado el sistema de EHR. El otro programa que está en vigor desde el 2011 es el de

Medicare el cual comenzaba con una retribución de $44,000 y se reduce hasta $24,000 si el

primer año de adopción fuera en el 2014.

Ambos programas exigen al proveedor el adquirir un sistema de EHR que tenga la

certificación ONC-ATCB (siglas de certificación) y el demostrar métricas de uso significativo

(“Meaningful Use”) para asegurar la continuidad del pago de incentivos por el periodo

establecido de hasta 6 años. En el presente, sus pagos de Medicare pueden tener una

reducción de hasta 1.5% por no estar reportando el uso de la receta electrónica, una

funcionalidad que le debe ofrecer el sistema EHR. A partir del 2015 Medicare estará aplicando

31

Page 38: Monografía datos directos

penalidades en los pagos de aquellos proveedores que no hagan uso del EHR. Hoy todo

proveedor que califique en estos programas de incentivos tiene la oportunidad de recibir un

incentivo económico sobre su costo de adquirir un sistema EHR y evitar penalidades.

Recomendamos que el gobierno le otorgue fondos al Instituto de Estadísticas

destinados a fomentar el desarrollo y reporte de datos en las empresas. Una forma es

incentivar a los proveedores de salud para que provean más datos estadísticos de los que les

exige el sistema de Medicaid o Medicare. Esto desencadenaría una competencia entre las

compañías que brindan servicio de expediente electrónico logrando así su participación.

Además de las empresas de la salud, Puerto Rico cuenta con compañías bancarias,

farmacéuticas, universidades y muchas otras entidades privadas que realizan continuamente

estudios estadísticos como parte de sus proyectos. Normalmente esos datos no llegan al

público. Incentivar la aportación de esos datos traería consigo un gran crecimiento a nuestra

base de datos. Lograríamos entrar en el mundo del Big Data.

32

Page 39: Monografía datos directos

Conclusión

Ya vimos que, a pesar de los adelantos, tenemos una carencia de datos accesibles. Esto

dificulta la respuesta a preguntas de índole cuantitativa que nos surgen a diario. También

dificulta el desarrollo de investigaciones que necesiten la estadística como recurso.

La alternativa que presenta este trabajo es el acceso directo a los datos usando

expedientes electrónicos de las agencias gubernamentales, incentivos a las agencias privadas

mas una página web pública interactiva de recopilación y publicación de datos. Ya vemos que

ha sido posible implementarse de forma similar en el Reino Unido logrando convertirse en la

mayor fuente de datos del mundo. El acceso a los datos directos sólo sería posible mediante

una coordinación entre las agencias gubernamentales y el sector privado con el Instituto de

Estadísticas de Puerto Rico. Sería necesario reunir expertos en el área de diseño y desarrollo

web, como en los programas utilizados por las agencias colaboradoras. Es necesario que este

sistema logre enlazarlos a todos como una sola unidad de recopilación y publicación de datos y

conquistar al público para que participe en este proceso.

De lograrse el acceso a los datos directos, la cantidad de datos numéricos aumentaría

enormemente logrando mejores decisiones en cualquier faceta de nuestra sociedad.

33

Page 40: Monografía datos directos

Reseña del Autor

Rubén Quiñones Morales nació en Mayagüez, Puerto Rico el día 17 de diciembre de

1976. Fue criado en el pueblo de Isabela, donde cursó los estudios primarios y se graduó de la

Escuela Superior Francisco Mendoza en mayo de 1994. Para el mismo año inició estudios

universitarios en la Universidad de Puerto Rico en Aguadilla (UPRA). En mayo de 1999 obtuvo el

grado de bachillerato en Educación Secundaria de Biología en la Universidad Interamericana de

Puerto Rico Recinto de Aguadilla.

Luego de trabajar para empresas de manufactura, ventas y de servicio al cliente,

comenzó a trabajar en el año 2002 como maestro de ciencias y matemáticas para escuelas

públicas y privadas. En el año 2005 le fue otorgada la certificación de enseñanza de

matemáticas de escuela secundaria emitida por el Departamento de Educación de Puerto Rico.

Desde el año 2010 imparte cursos de matemática en el centro de estudios Ramey Job Corps en

Aguadilla, Puerto Rico.

En el año 2010 inició estudios de maestría en matemática aplicada en la Universidad

Interamericana de Puerto Rico Recinto de San Germán. En el mes de mayo de 2013 se gradúa

de dicha maestría.

34

Page 41: Monografía datos directos

Bibliografía

A Good Practice Guide to Sharing your Data with Others. Version 1 (November 2009). National Statistical Services, Australia: http://www.nss.gov.au/nss/home.nsf/NSS/E6C05AE57C80D737CA25761D002FD676?opendocument

Alan Travis (Tuesday 24 April 2012). Government revives plan for greater data-sharing between agencies, The Guardian: http://www.guardian.co.uk/politics/2012/apr/23/government-plan-share-personal-data.

Alba (Apellido desconocido), Más de millón y medio de usuarios de Internet en Puerto Rico (17 de mayo de 2010). Tecnología Libre: http://ricardoalcocer.com/blog/articulos/mas-de-millon-y-medio-de-usuarios-de-internet-en-puerto-rico/

Big data mining, fairness and privacy (Sunday, 12th May 2013). Privacy Observatory Magazine: http://www.privacyobservatory.org/issues/14-issue-1/40-big-data-mining-fairness-and-privacy

Children’s Bureau, Reporting System, 7 abril 2013 http://www.acf.hhs.gov/programs/cb/research-data-technology/reporting-systems

Cómo vincular datos de internet con Excel 2007(18-05-2010). Efecto Placebo.com: http://www.efectoplacebo.com/2010/05/vincular-datos-de-internet-con-excel-2007/

Consecuencias del alcoholismo, Recuperado el 3 de enero de 2013 del sitio http://www.salonhogar.com/ciencias/sicologia/alcoholismo/consecuenciasdelalcoholismo.html

Electronic Health Record, Recuperado el 3 de mayo de 2013 del sitio Web: http://en.wikipedia.org/wiki/Electronic_health_recordFatales por Alcohol Años 2007-2011. Comisión para la Seguridad en el Tránsito, Gobierno de Puerto Rico: http://comisionparalaseguridadeneltransito.com/cststats/Fatales%20por%20Alcohol%202007-2011.pdf

Hernández Denton supervisa operación de nuevo sistema unificado de manejo y administración de casos en el Centro Judicial de Humacao, Ed. Microjuris.com Puerto Rico, 17 febrero 2012: http://aldia.microjuris.com/2012/02/17/hernandez-denton-supervisa-operacion-de-nuevo-sistema-unificado-de-manejo-y-administracion-de-cosas-en-el-centro-judicial-de-humacao/

35

Page 42: Monografía datos directos

Laura E. Morales Torres, La adopción del Record Electrónico de Salud; ¿Por qué ahora? Recuperado el 13 de marzo de 2013 del sitio Web de la Asociación Médica de Puerto Rico: http://asocmedpr.org/contenido/expediente_electr%C3%B3nico_de_salud_ahora.pdf

Manuel A. Quilichini, El Reto del Récord Médico Electrónico en Puerto Rico. Recuperado el 13 de marzo de 2013 del sitio Web Quilichini & Fernández- Bermúdez,P.S.C: http://qcblaw.com/ppt/tech/ehr2.htm

María L. Carrillo de Sevilla, Administration for Families and Children (7 abril 2013). http://fosteringcourtimprovement.org/CFSR/CFSR2Reports/PR/PIPReport2ndRoundCFSR.pdf

Melvies Rodríguez Torres, Analista de Datos de Accidentes, CST; revisada el 6 de agosto de 2012. Recuperado el 14 de marzo de 2013 de http://comisionparalaseguridadeneltransito.com/cststats/Fatales%20por%20Alcohol%202007-2011.pdf

Peter Buneman, Heiko Müller, EdinburghChris Rusbridge, 2009. Curating the CIA World Factbook, The International Journal of Digital Curation Issue 3, [Version digital PDF] Volume 4 | School of Informatics, University of Digital Curation Centre, University of Edinburgh Abstract pag. 1

Policía de Puerto Rico (PPR), División de Estadísticas de la Criminalidad Delitos Tipo I Tema: 1.8 Otras estadísticas sociales, demográficas y conexas diciembre 2012 http://www.estadisticas.gobierno.pr/iepr/Estadisticas/InventariodeEstadisticas/tabid/186/c tl/view_detail/mid/775/report_id/00975852-e14a-4339-a6c8-ab23fd36d2a1/Default.aspx

Rama Judicial de P.R, Comunicado de prensa, 21 de agosto de 2009. http://www.ramajudicial.pr/Prensa/2009/8-21-09.htm

Speech Francis Maude in South Africa: transparency and public service reform (3 April 2013). Cabinet Office: https://www.gov.uk/government/speeches/francis-maude-in-south-africa-transparency-and-public-service-reform

The World Fact Book. Recuperado el 3 de mayo de 2013 del sitio Web CIA World Factbook: https://www.cia.gov/library/publications/the-world-factbook/index.html

The World Factbook, Recuperado el 3 de mayo de 2013 del sitio Web Wikipedia: http://es.wikipedia.org/wiki/The_World_Factbook

Walker, J. R.& Taylor, T. (1998). The Columbia Guide to Online Style. Recuperado el 3 de abril de 2003 del sitio Web del Columbia University Press: http://www.columbia.edu/cu/cup/cgos/idx_basic.html

36