“Estructurando Información Desestructurada”
como tarea para la Escucha Activa
consulting, s.a.
auto
ritas
2
El mundo tenológico era
solitario
consulting, s.a.
auto
ritas
3
y aunque podía ser divertido
consulting, s.a.
auto
ritas
4
no había COMUNICACIÓN
real
...y los humanos NECESITAMOS comunicarnos!!
consulting, s.a.
auto
ritas
5
Entonces nació la Web
El 16/02/1991 Tim Berners Lee
presentaba su proyecto World
Wide Web
Mike Sendall, directivo del CERN,
catalogaba la propuesta como
“Vage, but exciting”
consulting, s.a.
auto
ritas
6
a partir de la red Internet
consulting, s.a.
auto
ritas
7
y todo el mundo creo su propia
página Web
consulting, s.a.
auto
ritas
8
Pero seguía sin haber
COMUNICACIÓN real
consulting, s.a.
auto
ritas
9
Se comenzó a hablar de una nueva actitud
consulting, s.a.
auto
ritas
10
CONSUMER
PRODUCER
germinándose la Web 2.0
Consume contenidos, es la gran mayoría.Puede ser productor a su vez, pero en otro lugar y momento. Puede comentar contenidos
Crea contenidos, páginas Web, y aunque puede responder a comentarios, no crea conversación. Suele ser consumidor, pero en otro lugar y momento
PROSUMER
Crea y consume contenidos, participa, colabora, comparte, genera conversación.La Web 2.0 se construye de manera colaborativa entre las personas, en Blogs, Wikis, Foros, Redes Sociales... que mantienen una premisa antropológica común, la necesidad humana de COMUNICARSE
1.0
2.0
consulting, s.a.
auto
ritas
11
y empezándose a hablar de la
Web 3.0
“La Web 3.0 es la Web 2.0 sin barreras” Tim Berners Lee
3.0
consulting, s.a.
auto
ritas
12
Surgen nuevos conceptos, ahora
posibles
consulting, s.a.
auto
ritas
13
como la Escucha Activa
“Active Listening: more than just paying attention” Kathryn Robertson
consulting, s.a.
auto
ritas
14
¿escuchar todo lo que se dice en la
Web?
• > 500 millones de usuarios de Facebook
• > 150 millones de usuarios de Twitter
• > 90 millones de Webs• > 150 millones de blogs• aprox. 1000 exabytes anuales
EXCESO DE INFORMACIÓN DESESTRUCTURADA
consulting, s.a.
auto
ritas
15
Todo problema conlleva una oportunidad
Aprendizaje Automático: Para
inferir nuevos modelos a partir de
los datos existentes, para
dotar de inteligencia a
nuestras aplicaciones
Natural Language Processing:
Porque el contenido textual de la Web está escrito en el lenguaje humano
Data Mining: Para identificar patrones válidos, novedosos,
potencialmente útiles y
deseablemente comprensibles a
partir de los datos
consulting, s.a.
auto
ritas
16
y una forma nueva de gestionar
consulting, s.a.
auto
ritas
17
Veamos un ejemplo
150.000.000+
Media de edad 38,4
Usuarios
45%
0 - 12 13 - 17 18 - 34 35 - 49 50+
Sexo 47% vs 53% 47% 53%
consulting, s.a.
auto
ritas
18
en un pequeño territorio
consulting, s.a.
auto
ritas
19
se habla de muchos temas
consulting, s.a.
auto
ritas
20
unos muy hablados, otros muy relevantes
Qué temas tienen más
influencia en la gente
Qué temas importan a más
gente
consulting, s.a.
auto
ritas
21
y con diferentes curvas de
crecimiento
Cuándo y en qué debemos
actuar
Qué temas son emergentes y qué temas son
sustituidos
consulting, s.a.
auto
ritas
22
y lo hacen miles de usuarios
13/5/2011
0
67,5
135
202,5
270
MurderersShow
nerea_beleber
tuitrafico_feed
consulting, s.a.
auto
ritas
23
unos que hablan mucho, otros que
son muy escuchados
@kicorangel
Tweets: 2.519Followers: 248
True reach: 122
@ladygaga
Tweets: 850Followers: 10.619.808
True reach: 3.767.356
consulting, s.a.
auto
ritas
24
en múltiples idiomas
Inglésestoy sin internet ¬¨¬¨ fuuuuck!!!
Finlandés... euskocaja, como euskolabel, euskotren, euskomueble... XDDD
PortuguésFlowah Powah!
AlemánVierrrrrrrrrrrrnes, egunon!!
consulting, s.a.
auto
ritas
25
y desde diferentes
ubicaciones
consulting, s.a.
auto
ritas
26
y aunque hay meta-datos
Biografía Localización Idioma
TIME LINE
consulting, s.a.
auto
ritas
27
los problemas son múltiples
Biografía Localización Idioma
• No se rellena• No contiene
información significativa
• No se corresponde con la realidad de sus intereses
• No se rellena• Se rellena con
una ubicación falsa
• Se actualiza con la posición GPS
• Ambigüedad de ubicación
• No se rellena• Se deja por
defecto EN• Se rellena con
info. falsa• Se escribe en
diferentes idiomas
La terminología utilizada dista de cualquier lengua oficial. PSEUDO-ARGOT
TL
consulting, s.a.
auto
ritas
y hay que resolverlos con
R&D
Recuperación y almacenamiento
Recuperación de información desde múltiples fuentes de datos, heterogéneas, con restricciones técnicas y legales, almacenamiento de grandes cantidades de información, indexación y búsqueda. Escalabilidad
ClusterAgrupación de contenidos, identificación de temas a partir del cluster de terminología, procesamiento translingüístico. Identificación de coherencia conversacional
Influencia
Tendencia
Identificación de influenciadores, cálculo de la influencia, tipología de influenciador
Identificación de trending topics, ajuste de la distribución de la evolución de la tendencia, detección de hot themes
ClasificaciónClasificación de la información, determinación de idioma, tipo de fuente, origen y, a ser posible, sugerencia de sentimiento
consulting, s.a.
auto
ritas
“Estructurar la información desestructurada existente en la
Web, nos permite tratarla y descubrir conocimiento útil para la
Escucha Activa”
29
Francisco Manuel Rangel Pardo
CTO - Autoritas Consulting@kicorangel