Memoria de Título

66
Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación Jaime A. Terán Moya Prof. Patrocinante: Sra. Andrea Rodríguez T. Agosto, 2007

description

Análisis de la Comunidad Científica Nacional en Ciencias de la Computación - Memoria de Título para optar a Ingeniero Civil Informático en la Universidad de Concepción, Chile. Nota máxima.

Transcript of Memoria de Título

Page 1: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Jaime A. Terán Moya

Prof. Patrocinante: Sra. Andrea Rodríguez T.

Agosto, 2007

Page 2: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

• Descripción General y Objetivos

• Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Page 3: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Descripción General y Objetivos

Page 4: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Descripción General

• ¿Ciencias de la Computación?

• Comunidades como Redes Sociales

• ¿Por qué es importante evaluar?

• ¿Cómo hacerlo?

Page 5: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Objetivos

• Definición e incorporación de información a un modelo de datos.

• Análisis y comparación de métricas.

Page 6: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Redes Complejas

• Alto número de unidades dinámicas e interconectadas

• Topología Característica

• Small World Networks

• Scale Free Networks

Page 7: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

• Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Page 8: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Métricas e Indicadores Analizados

Page 9: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Dos Perspectivas

Page 10: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones

• cito a, citado por

• Temporalidad

• Medios de Publicación

Page 11: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones 2

• Referencias/Publicaciones

• H-Index

• Número de publicaciones

Page 12: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría

• Caracterización topológica de la red

• Centralidad de nodos en la red

Page 13: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 2

• Topología

• Distribución de Grados de la red

• Presencia y tamaño de un componente gigante

• Ruta mínima promedio

• Coeficiente de clustering

Page 14: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 3

• Centralidad

• Número de Co-autores

• Cercanía (closeness)

Page 15: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 4

• Centralidad

• Interconexión (betweenness)

• PageRank

Page 16: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Page 17: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Fuentes de Información e Integración

Page 18: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Page 19: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Ventajas:

• XML (390+MiB) + DTD

• Clasificación de documentos

• Información por documento

Page 20: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Problemas:

• Referencias cruzadas

• Baja capacidad de ingreso

• Sesgo

• Identificación de personas

Page 21: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Page 22: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Ventajas:

• Resultados ordenados por relevancia

• Número de citas actualizado

• Listado ‘citado por’

Page 23: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Problemas:

• No API o XML

• Resultados no 100% fiables

Page 24: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Page 25: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Ventajas:

• Acceso vía Web Services

• Búsqueda exacta según diferentes criterios

• Relaciones ‘cita a’ y ‘citado por’ entre documentos indexados

Page 26: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Problemas:

• Pobre en material relativo a Ciencias de la Computación

• Acceso restringido

Page 27: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Page 28: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

toDB()

¿Existe?

Rescatar ID PUBInsertar

Rescatar ID PUB

SINO

¿Autor en

cola?

¿Existe?

Rescatar ID AUTInsertar

SINO

Rescatar ID AUT

NO SI

Relacionar ID

PUB + ID AUT

¿Existe

Journ/Conf?

Rescatar ID

JOUR/CONFInsertar

Rescatar ID

JOUR/CONF

SINO

Relacionar ID

PUB + ID JOUR/

CONF

fin

Page 29: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Page 30: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Frontend PHP

Page 31: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Page 32: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Citas Web of Science

DB

XML

Publicaciones

¿Publicación

en cola?

NO

Título, Año

searchRetrieve ¿datos?

SI

ut

citingArticles

inicio

fin

SI

¿datos?

SI

NO

Page 33: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

277/834

33,2 %

Page 34: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Citas Google Scholar

DB

¿Publicación

en cola?

Construcción

URL

¿citas?

actualizar

inicio

fin

Publicaciones

nacionales y

autores

cURL

NO

SI

SI

NO

Page 35: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar v/s Web of Science

Comparando las Top 10:

• Top 10 WoS tienen datos en GS

• 6 previas al 2000 en WoS, 2 en GS

Sin embargo:

• WoS no considera auto-citas

• WoS sólo considera datos indexados

Page 36: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Problemas

• Incompletitud y accesibilidad de relaciones

• Tamaño del grafo

• Nombres

Page 37: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

✓ Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Page 38: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Análisis de Datos

Page 39: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Referencias

Page 40: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Métricas

• Número de Publicaciones

• H-Index en base a los datos de GS

• H-Index en base a los datos de WoS

• Número de co-autores

• Citas promedio en base a GS y el número de publicaciones

• Citas promedio en base a WoS y el número de publicaciones

Page 41: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Ranking & Comparación

Rank #Pubs 1          

Rank Co-A 0,791429882 1        

Rank h-GS 0,889590105 0,674904654 1      

Rank h-WoS 0,784187662 0,623087252 0,803371338 1    

Rank avgGS 0,55462994 0,406154185 0,796117283 0,649332508 1 

Rank avgWoS 0,531160828 0,391395307 0,599777774 0,874112818 0,642437539 1

  Rank #Pubs Rank Co-A Rank h-GS Rank h-WoS Rank avgGS Rank avgWoS

Relación entre h-index y número de publicaciones

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80

#Publicaciones por autor

h-i

nd

ex (

GS

)

Relación entre h-index según GS y WoS

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80

h-index (GS)

h-i

nd

ex (

Wo

S)

Page 42: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones por autor

Publicaciones por autor

0

2

4

6

8

10

12

1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148

Publicaciones

Au

tore

s

Page 43: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Dónde publican los autores nacionales?

5

610

11

13

18

15

26

18

33

25

36

31

40

37

44

41

50

45

56

0

20

40

60

80

100

120

Top 10 Top 20 Top 30 Top 40 Top 50 Top 60 Top 70 Top 80 Top 90 Top 100

¿Dónde se publican los artículos?

En ConferenciaEn Journal

s

Page 44: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Dónde publican los autores nacionales?

45

5680

121

109

192

136

265

157

344

182

419

202

499

221

580

228

604

0

100

200

300

400

500

600

700

800

900

Top 100 Top 200 Top 300 Top 400 Top 500 Top 600 Top 700 Top 800 Top 900

¿Dónde se publican los artículos?

En ConferenciaEn Journal

Page 45: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

27% Revistas73% Actas de Conferencias

Page 46: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Evolución Temporal

0

20

40

60

80

100

120

140

2006

*20

0520

0420

0320

0220

0120

0019

9919

9819

9719

9619

9519

9419

9319

9219

9119

90

1975

-198

9

#Pubs#en Revistas#en Conferencias

Page 47: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Actas de mayor publicación nacional

0

5

10

15

20

25

30

35

40

SCCC

CRIWG

SPIRE

CPM

LA-WEB

LATIN

SAC

SPIRE/CRIWG

PODS

CIARP

Actas con mayor publicación nacional

Page 48: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas de mayor publicación nacional

0

2

4

6

8

10

12

14

16

Theo

r. C

om

put.

Sci

.

Inf.

Pro

cess

. Le

tt.

Alg

ori

thm

ica

J. D

iscr

ete

Alg

ori

thm

s

Act

a I

nf.

CoRR

BIT

Com

pute

rs &

OR

Patt

ern R

ecognitio

n

Patt

ern R

ecognitio

nLe

tter

s

Revistas con mayor publicación nacional

Page 49: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas/Actas de mejor rendimiento según GS

0

5

10

15

20

25

30

35

40

45

50

POD

S

CoR

R

CPM C

P

Alg

ori

thm

ica

Inf.

Pro

cess

.Le

tt

SPIR

E/C

RIW

G

SAC

J. D

iscr

ete

Alg

ori

thm

s

Theo

r. C

om

put.

Sci

.

Revistas / Actas con mayor tasa de citas por publicación según GS

Page 50: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas/Actas de mejor rendimiento según WoS

0

1

2

3

4

5

6

CoR

R

POD

S

Act

a In

f.

CPM

Theo

r. C

omput.

Sci

. SW

AT

Alg

ori

thm

ica

Inf.

Pro

cess

.Le

tt

CP

SPI

RE/C

RIW

G

Revistas / Actas con mayor tasa de citas por publicación según WoS

Page 51: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Investigadores por Institución

Investigadores por Institución

3%

21%

1%

30%1%

17%

6%

1%3%

14%

3%

EMPRESA

PUC

PUCV

UCHILE

UCN

UDEC

UFRO

UMAG

USACH

UTFSM

UVALPO

Page 52: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones por Institución

Publicaciones por Institución

1% 10%0%

59%

0%

9%

1%2%1%

15%2%

EMPRESA

PUC

PUCV

UCHILE

UCN

UDEC

UFRO

UMAG

USACH

UTFSM

UVALPO

Page 53: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría

Page 54: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autores por componentes

Page 55: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Distribución de Grados

Distribución de grados

0

50

100

150

200

250

300

350

400

450

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Grado

mero

de n

od

os

y = 256,69x−2,004

Page 56: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Distribución de Pesos

Distribución de pesos

0

100

200

300

400

500

600

0..1

1..2

2..3

3..4

4..5

5..6

6..7

7..8

8..9

9..10

10..11

11..12

12..13

13..14

14..15

15..16

16..17

Rango

Fre

cuen

cia

y = 487,44x−2,1123

Page 57: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Indicadores Topológicos

Page 58: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Componente Gigante

Page 59: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Rankings

Page 60: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

PageRank

Page 61: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

✓ Fuentes de Información e Integración

✓ Análisis de Datos

• Conclusiones y Trabajo Futuro

Page 62: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Conclusiones y Trabajo Futuro

Page 63: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Conclusiones

• Estado del arte

• Interpretación de métricas

• Caracterización de la red

• Co-Autoría de Primer Grado

• Herramientas disponibles

Page 64: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Trabajo Futuro

• Incorporar áreas de trabajo por investigador

• Disponibilidad de datos vía XML

• Definir nuevas perspectivas de análisis

• Definir mecanismos de comparación de comunidades a nivel macro

Page 65: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Preguntas?

Page 66: Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Jaime A. Terán Moya

Prof. Patrocinante: Sra. Andrea Rodríguez T.

Agosto, 2007

¡Gracias!