Memoria de Título

Post on 27-Jun-2015

814 views 0 download

description

Análisis de la Comunidad Científica Nacional en Ciencias de la Computación - Memoria de Título para optar a Ingeniero Civil Informático en la Universidad de Concepción, Chile. Nota máxima.

Transcript of Memoria de Título

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Jaime A. Terán Moya

Prof. Patrocinante: Sra. Andrea Rodríguez T.

Agosto, 2007

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

• Descripción General y Objetivos

• Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Descripción General y Objetivos

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Descripción General

• ¿Ciencias de la Computación?

• Comunidades como Redes Sociales

• ¿Por qué es importante evaluar?

• ¿Cómo hacerlo?

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Objetivos

• Definición e incorporación de información a un modelo de datos.

• Análisis y comparación de métricas.

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Redes Complejas

• Alto número de unidades dinámicas e interconectadas

• Topología Característica

• Small World Networks

• Scale Free Networks

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

• Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Métricas e Indicadores Analizados

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Dos Perspectivas

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones

• cito a, citado por

• Temporalidad

• Medios de Publicación

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones 2

• Referencias/Publicaciones

• H-Index

• Número de publicaciones

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría

• Caracterización topológica de la red

• Centralidad de nodos en la red

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 2

• Topología

• Distribución de Grados de la red

• Presencia y tamaño de un componente gigante

• Ruta mínima promedio

• Coeficiente de clustering

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 3

• Centralidad

• Número de Co-autores

• Cercanía (closeness)

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría 4

• Centralidad

• Interconexión (betweenness)

• PageRank

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

• Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Fuentes de Información e Integración

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Ventajas:

• XML (390+MiB) + DTD

• Clasificación de documentos

• Información por documento

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

DBLP

Problemas:

• Referencias cruzadas

• Baja capacidad de ingreso

• Sesgo

• Identificación de personas

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Ventajas:

• Resultados ordenados por relevancia

• Número de citas actualizado

• Listado ‘citado por’

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar

Problemas:

• No API o XML

• Resultados no 100% fiables

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Ventajas:

• Acceso vía Web Services

• Búsqueda exacta según diferentes criterios

• Relaciones ‘cita a’ y ‘citado por’ entre documentos indexados

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Web of Science

Problemas:

• Pobre en material relativo a Ciencias de la Computación

• Acceso restringido

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

toDB()

¿Existe?

Rescatar ID PUBInsertar

Rescatar ID PUB

SINO

¿Autor en

cola?

¿Existe?

Rescatar ID AUTInsertar

SINO

Rescatar ID AUT

NO SI

Relacionar ID

PUB + ID AUT

¿Existe

Journ/Conf?

Rescatar ID

JOUR/CONFInsertar

Rescatar ID

JOUR/CONF

SINO

Relacionar ID

PUB + ID JOUR/

CONF

fin

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Frontend PHP

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Modelo de Datos

idtipo_fkjournal_fktituloañodblp_keycitas_gscitas_wos

Publicación

idpublicacion_fkautor_fkposicion

Publicación_autor

idnombre

Autor

idnombre1nombre2apellido1apellido2institucion_fkdepartamento_fk

Autor_fondecyt

autor_idautor_fondecyt_fk

Autor_dblp_fondecyt

idnombrepais

Institución

idtitulotipo

Revista/Conf

idnombre

Departamento

idinstitucion_fkdepartamento_fk

Institucion_Depto

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Citas Web of Science

DB

XML

Publicaciones

¿Publicación

en cola?

NO

Título, Año

searchRetrieve ¿datos?

SI

ut

citingArticles

inicio

fin

SI

¿datos?

SI

NO

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

277/834

33,2 %

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Citas Google Scholar

DB

¿Publicación

en cola?

Construcción

URL

¿citas?

actualizar

inicio

fin

Publicaciones

nacionales y

autores

cURL

NO

SI

SI

NO

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Google Scholar v/s Web of Science

Comparando las Top 10:

• Top 10 WoS tienen datos en GS

• 6 previas al 2000 en WoS, 2 en GS

Sin embargo:

• WoS no considera auto-citas

• WoS sólo considera datos indexados

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Problemas

• Incompletitud y accesibilidad de relaciones

• Tamaño del grafo

• Nombres

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

✓ Fuentes de Información e Integración

• Análisis de Datos

• Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Análisis de Datos

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Referencias

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Métricas

• Número de Publicaciones

• H-Index en base a los datos de GS

• H-Index en base a los datos de WoS

• Número de co-autores

• Citas promedio en base a GS y el número de publicaciones

• Citas promedio en base a WoS y el número de publicaciones

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Ranking & Comparación

Rank #Pubs 1          

Rank Co-A 0,791429882 1        

Rank h-GS 0,889590105 0,674904654 1      

Rank h-WoS 0,784187662 0,623087252 0,803371338 1    

Rank avgGS 0,55462994 0,406154185 0,796117283 0,649332508 1 

Rank avgWoS 0,531160828 0,391395307 0,599777774 0,874112818 0,642437539 1

  Rank #Pubs Rank Co-A Rank h-GS Rank h-WoS Rank avgGS Rank avgWoS

Relación entre h-index y número de publicaciones

0

10

20

30

40

50

60

70

80

0 10 20 30 40 50 60 70 80

#Publicaciones por autor

h-i

nd

ex (

GS

)

Relación entre h-index según GS y WoS

0

10

20

30

40

50

60

70

0 10 20 30 40 50 60 70 80

h-index (GS)

h-i

nd

ex (

Wo

S)

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones por autor

Publicaciones por autor

0

2

4

6

8

10

12

1 8 15 22 29 36 43 50 57 64 71 78 85 92 99 106 113 120 127 134 141 148

Publicaciones

Au

tore

s

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Dónde publican los autores nacionales?

5

610

11

13

18

15

26

18

33

25

36

31

40

37

44

41

50

45

56

0

20

40

60

80

100

120

Top 10 Top 20 Top 30 Top 40 Top 50 Top 60 Top 70 Top 80 Top 90 Top 100

¿Dónde se publican los artículos?

En ConferenciaEn Journal

s

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Dónde publican los autores nacionales?

45

5680

121

109

192

136

265

157

344

182

419

202

499

221

580

228

604

0

100

200

300

400

500

600

700

800

900

Top 100 Top 200 Top 300 Top 400 Top 500 Top 600 Top 700 Top 800 Top 900

¿Dónde se publican los artículos?

En ConferenciaEn Journal

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

27% Revistas73% Actas de Conferencias

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Evolución Temporal

0

20

40

60

80

100

120

140

2006

*20

0520

0420

0320

0220

0120

0019

9919

9819

9719

9619

9519

9419

9319

9219

9119

90

1975

-198

9

#Pubs#en Revistas#en Conferencias

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Actas de mayor publicación nacional

0

5

10

15

20

25

30

35

40

SCCC

CRIWG

SPIRE

CPM

LA-WEB

LATIN

SAC

SPIRE/CRIWG

PODS

CIARP

Actas con mayor publicación nacional

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas de mayor publicación nacional

0

2

4

6

8

10

12

14

16

Theo

r. C

om

put.

Sci

.

Inf.

Pro

cess

. Le

tt.

Alg

ori

thm

ica

J. D

iscr

ete

Alg

ori

thm

s

Act

a I

nf.

CoRR

BIT

Com

pute

rs &

OR

Patt

ern R

ecognitio

n

Patt

ern R

ecognitio

nLe

tter

s

Revistas con mayor publicación nacional

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas/Actas de mejor rendimiento según GS

0

5

10

15

20

25

30

35

40

45

50

POD

S

CoR

R

CPM C

P

Alg

ori

thm

ica

Inf.

Pro

cess

.Le

tt

SPIR

E/C

RIW

G

SAC

J. D

iscr

ete

Alg

ori

thm

s

Theo

r. C

om

put.

Sci

.

Revistas / Actas con mayor tasa de citas por publicación según GS

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Revistas/Actas de mejor rendimiento según WoS

0

1

2

3

4

5

6

CoR

R

POD

S

Act

a In

f.

CPM

Theo

r. C

omput.

Sci

. SW

AT

Alg

ori

thm

ica

Inf.

Pro

cess

.Le

tt

CP

SPI

RE/C

RIW

G

Revistas / Actas con mayor tasa de citas por publicación según WoS

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Investigadores por Institución

Investigadores por Institución

3%

21%

1%

30%1%

17%

6%

1%3%

14%

3%

EMPRESA

PUC

PUCV

UCHILE

UCN

UDEC

UFRO

UMAG

USACH

UTFSM

UVALPO

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Publicaciones por Institución

Publicaciones por Institución

1% 10%0%

59%

0%

9%

1%2%1%

15%2%

EMPRESA

PUC

PUCV

UCHILE

UCN

UDEC

UFRO

UMAG

USACH

UTFSM

UVALPO

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autoría

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Co-Autores por componentes

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Distribución de Grados

Distribución de grados

0

50

100

150

200

250

300

350

400

450

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Grado

mero

de n

od

os

y = 256,69x−2,004

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Distribución de Pesos

Distribución de pesos

0

100

200

300

400

500

600

0..1

1..2

2..3

3..4

4..5

5..6

6..7

7..8

8..9

9..10

10..11

11..12

12..13

13..14

14..15

15..16

16..17

Rango

Fre

cuen

cia

y = 487,44x−2,1123

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Indicadores Topológicos

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Componente Gigante

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Rankings

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

PageRank

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Contenidos

✓ Descripción General y Objetivos

✓ Métricas e Indicadores Analizados

✓ Fuentes de Información e Integración

✓ Análisis de Datos

• Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Conclusiones y Trabajo Futuro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Conclusiones

• Estado del arte

• Interpretación de métricas

• Caracterización de la red

• Co-Autoría de Primer Grado

• Herramientas disponibles

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Trabajo Futuro

• Incorporar áreas de trabajo por investigador

• Disponibilidad de datos vía XML

• Definir nuevas perspectivas de análisis

• Definir mecanismos de comparación de comunidades a nivel macro

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

¿Preguntas?

Un Análisis de la Comunidad Científica Nacional en Ciencias de la Computación

Jaime A. Terán Moya

Prof. Patrocinante: Sra. Andrea Rodríguez T.

Agosto, 2007

¡Gracias!