Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf ·...

41
Cómo hacer el mal con datos Daniel Villatoro @dani_agent

Transcript of Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf ·...

Page 1: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Cómo hacer el mal con datos

Daniel Villatoro @dani_agent

Page 2: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Génesis • [2011] Doctor en IA Distribuída - IIIA-CSIC.

• [2012] Investigador Smartcities – BDigital.

• [2014] Senior Data Scientist – BBVAData.

• [2014] CoFounder – Databeers.

• [2015] Senior Data Scientist – Vodafone.

DISCLAIMER:

NO SE LO QUE QUIEREN LOS CLIENTES, PERO SE

HABLAR CON LOS DE NEGOCIO Y RESPONDER SUS

PREGUNTAS CON DATOS.

Page 3: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son
Page 4: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Hipótesis de Bennet & Ross • Para un Data Scientist

– Hacer el bien intencionadamente es difícil, y hacer el mal intencionadamente tambien es difícil.

– Hacer el mal accidentalmente es muy sencillo.

• Hipótesis: – Cada data scientist tiene la capacidad de hacer el bien si piensa sobre su

trabajo y sus consecuencias.

• Hipótesis Nula: – Cada data scientist tiene la capacidad de hacer el mal si NO piensa sobre

su trabajo y sus consecuencias.

Page 5: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Tu camino a la Data-Dominación

Mundial empieza aquí

• Hacer el mal no implica necesariamente grandes acciones: – Todos tenemos la habilidad de hacer el mundo un

poco peor.

• Repasaremos los mayores errores que los data scientist podemos cometer.

• Grandes consejos para maximizar el mal con el menor esfuerzo.

Page 6: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Escoge a los mejores compinches

• ¿Quién es un buen data scientist?

Page 7: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Olvida las preguntas y pon muchas V´s

Reporte de Gastos

con Big Data

Page 8: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son
Page 9: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

En caso de existir pregunta,

responder sin datos

Page 10: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Procesos de Decisión

Máquina Recoge

Máquina Almacena

Humano Analiza

Humano Predice

Humano Decide

Error Comunic.

• Análisis Detallado: Malentendido o distorsionado

• Dashboards de Métricas: Contradictorios o

confusos.

• Informes Mensuales: Ignorados después de dos

iteraciones.

• Equipos de Analíticas internos: sobrecargados y

sin poder de accionabilidad.

Error Comunic.

Page 11: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

“In God we trust,

all others bring

data” W. Edgard Deming

Page 12: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Correlación y Causalidad

Page 13: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Epilepsia con Visualizaciones

Page 14: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Miente con Datos

Page 15: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Piecharts

Page 16: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Dashboards del Horror

Page 17: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

No te fijes en el impacto

Page 18: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Olvida las consecuencias

Page 19: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Refuerza los bias

Page 20: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Desvela al Individuo

Page 21: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son
Page 22: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

“Conseguimos que cientos de miles

de personas se fueran a la cama 23

minutos antes, y conseguir que el

72% se fueran antes a la cama y

conseguir 7 horas de sueño”

Altera su comportamiento

Page 23: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Alterando el comportamiento para

tus propios fines

+300.000

votantes

Page 24: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Idea: In 2013 and 2014 Lavazza launched a campaign on Twitter with the hashtag #ineedcoffee

Data collection and analysis : collection of all

tweets + analysis and statistics of language,

timestamps, content and city of all tweets.

Action: Portogruaro as the city that more need coffee:

- Lavazza troupe spent 1 whole day in Portogruaro

- Free breakfast (with Lavazza coffee!) for everybody

- Press and local media, Twitter activity and huge press exposure

What’s the city where people talk more about hard awakening?

Twitter y marketing

Page 25: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

00,150,3

0,450,6

101214161820

‘Tweet for Treats’ campaign: creating engaging content

Data and Patterns

Data show that there is a drop in pizza sales on

Monday lunchtime

Campaign

Reduce the price of the pizza for 1 day according to how may

people tweeted at lunchtime with the hashtag #letsdolunch

£7.74

9am 11am

£15.99

CONSUMPTION PATTERNS BY TIME OF DAY

Result

- 8.000+ tweets

- Engaged Dominos’ current Facebook fans and Twitter followers and attracted new ones

- Improved customer loyalty by providing a incentive for being a follower of its brand

- Showed how cross-social media interaction through Twitter and Facebook can foster deeper integration with a campaign

Twitter y ..mas marketing

Page 26: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

¿me espían a través de mis datos?

Page 27: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

¿qué es la privacidad?

Page 28: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

el disfraz como medida de privacidad

la privacidad tiene que ver con lo que la gente quiere que sea privado

Page 29: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

¿los datos son el fin de la privacidad?

Page 30: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

no

Page 31: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

no, pero hace falta un esfuerzo pedagógico

para que se entienda las implicaciones

Page 32: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Titulares Aterradores

Page 33: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Reflexiones sobre la privacidad

Page 34: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

¿Cuanto pagarías por privacidad?

+5% precio a cambio

de privacidad

The effect of online privacy information on purchasing behavior: An experimental

study. JY Tsai, S Egelman, L Cranor, A Acquisti - Information Systems Research, 2011

Page 35: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

¿Privacidad a cualquier precio?

• Se reparten en un centro comercial tarjetas de crédito:

– 10$ anónimas.

– 12$ traceables a la persona.

• Oportunidad de cambio.

– 52.1% de los anónimos mantienen la anonimicidad.

– 9,7% de los traceables prefieren ser anónimos.

What is privacy worth? A Acquisti, LK John, G Loewenstein - The Journal of Legal

Studies, 2013

Page 36: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

La paradoja de la privacidad

De aquellos usuarios que se autodenominaron como grandes

defensores de su privacidad, y que mostrarían incomodidad si

se descubre su orientación sexual o política o los nombres de

sus parejas:

– 48% revelaron su orientación sexual online.

– 47% revelaron su orientación política online.

– 21% revelaron el nombre de su pareja.

Silent listeners: The evolution of privacy and disclosure on facebook. F

Stutzman, R Gross, A Acquisti - Journal of privacy and confidentiality, 2013

Page 37: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

REPASO • Busca mejores compinches: malos data scientists.

• Olvida las preguntas, y si las hay respóndelas sin datos.

• Confunde Correlación y Causalidad.

• Usa las peores visualizaciones y los dashboards más saturados, con mucho pie-chart en 3D.

– Si usas una buena visualización, miente con datos.

• Olvida las consecuencias de tus análisis, promoviendo todo tipo de discriminación.

• Revela al individuo y manipula su comportamiento.

• Promueve el terror con titulares muy tendenciosos.

Page 38: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son
Page 39: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Algunas Datatalks

Page 40: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

Donde

Page 41: Como hacer el mal con datoscdn.bdigital.org/PDF/BigDataCongress15/Databeers_DaniVillatoro.pdf · –Cada data scientist tiene la capacidad de hacer el mal si NO ... ¿los datos son

FIN @dani_agent