caso18

4
Caso 18 : Uso del método Biplot en análisis multivariante (ANÁLISIS MULTIVARIANTE POR TÉCNICAS BIPLOT) Caso práctico Fisher (Ann. Eugen.(1936), 179-184) hizo un estudio que se ha hecho un clásico en análisis multivariante.Tomó 150 muestras de lirios del campo y a todos les medió la longitud y la anchura del sépalo y la longitud y anchura del pétalo, con el fin de intentar clasificar los lirios en grupos homogénenos y ver si coincidian con los grupos taxonómicos establecidos por la Botanica. Los resultados están recogidos en el archivo caso18.xls que tiene la forma: El objetivo de este ejercicio es realizar un análisis de tipo biplot para ver simultáneamente qué relaciones existen entre los casos y entre las variables. Fíjese que la novedad consiste en representar a la vez en un gráfico las puntuaciones de los casos y de las variables. TEORÍA Las técnicas biplot pretenden superponer en un mismo gráfico los casos y las variables (“bi” hace referencia a que se representan los dos aspectos a la vez: casos y variables”). Para ello recurre a la descomposición de la variabilidad en componentes principales por el procedimiento matemático de descomposición de una matriz en valores singulares. Esto permite representar los casos y las variables conjuntamente en un mismo gráfico. Procedimiento paso a paso 1.- Abrir el archivo con los datos: caso18.xls Abra el archivo, seleccione la matriz con los datos, incluidas las etiquetas, y cópiela al portapapeles. Se importarán a Simfit en su momento mediante la opción Paste. Caso 18: técnicas Biplot 123

description

caso

Transcript of caso18

  • Caso 18 : Uso del mtodo Biplot en anlisis multivariante(ANLISIS MULTIVARIANTE POR TCNICAS BIPLOT)

    Caso prcticoFisher (Ann. Eugen.(1936), 179-184) hizo un estudio que se ha hecho un clsico en

    anlisis multivariante.Tom 150 muestras de lirios del campo y a todos les medi la longitud yla anchura del spalo y la longitud y anchura del ptalo, con el fin de intentar clasificar loslirios en grupos homognenos y ver si coincidian con los grupos taxonmicos establecidospor la Botanica. Los resultados estn recogidos en el archivo caso18.xls que tiene la forma:

    El objetivo de este ejercicio es realizar un anlisis de tipo biplot para versimultneamente qu relaciones existen entre los casos y entre las variables. Fjese que lanovedad consiste en representar a la vez en un grfico las puntuaciones de los casos y delas variables.

    TEORALas tcnicas biplot pretenden superponer en un mismo grfico los casos y las

    variables (bi hace referencia a que se representan los dos aspectos a la vez: casos yvariables). Para ello recurre a la descomposicin de la variabilidad en componentesprincipales por el procedimiento matemtico de descomposicin de una matriz en valoressingulares. Esto permite representar los casos y las variables conjuntamente en un mismogrfico.

    Procedimiento paso a paso1.- Abrir el archivo con los datos: caso18.xls Abra el archivo, seleccione la matriz con los datos, incluidas las etiquetas, y cpiela al

    portapapeles. Se importarn a Simfit en su momento mediante la opcin Paste.

    Caso 18: tcnicas Biplot 123

  • 2.- Anlisis multivariante por tcnicas biplot En la barra de opciones del men principal despliegue la opcin Statistics y dentro de

    ella seleccione Multivariate statistics y despus Multivariate 2D and 3D biplots.

    Primero deberemos importar los datos de nuestro fichero, para ello seleccionamosNew data > New data > OK > File/Clipboard > Paste (para pegar los datos quetenemos en el portapapeles) > OK > Open.

    Una vez cargados los datos procedemos al anlisis seleccionando Analyse thecurrent data set, y obtendremos el siguiente menu:

    En este caso podemos analizar los datos sin transformar ya que todos ellos estn enla misma escala y son muy semejantes. Elijamos directamente la opcin Calculate:Full SVD details para ver como se ha realizado la descomposicin en valoressingulares. Aparecer el siguiente men:

    Empecemos seleccionando Display singular values. Aparecer la siguiente tablaque explica la fraccin de variabilidad explicada de cada componente y la fraccinacumulada:

    124 Caso 18: tcnicas Biplot

  • en este caso las 2 primeras componentes explican el 99.84 % de la variabilidad (verltima columna), es decir casi la totalidad, luego esas 2 primeras componentes nosservirn perfectamente para hacer una representacin 2D de nuestro problema.

    De vuelta al men anterior podemos seleccionar Plot percentage variance,obtendremos la representacin grfica del porcentaje de varianza explicada por cadacomponente en formato acumulativo:

    Pulsando Cancel y OK abandonamos para volver al men general.

    De vuelta al men general procederemos ya a crear la representacin Biplotseleccionando 2D Biplot: using data matrix, apareciendo el siguiente men condiferentes opciones para graficar el biplot:

    Caso 18: tcnicas Biplot 125

  • Elegiremos la primera opcin de Biplot with labels: rows and columns, obteniendo:

    Utilizando las opciones change podemos cambiar el aspecto de la grfica, porejemplo dejando los casos con signos + y las variables con flechas:

    Comente ahora los resultados obtenidos.

    126 Caso 18: tcnicas Biplot