Estadística aplicada clases

59
ESTADÍSTICA APLICADA AL DEPORTE Liliana Jiménez Hernández Estadística, Mg. en Epidemiología Correo: [email protected]

Transcript of Estadística aplicada clases

Curso de verano: Estadstica aplicada

ESTADSTICA APLICADA AL DEPORTE

Liliana Jimnez HernndezEstadstica, Mg. en EpidemiologaCorreo: [email protected]

Gua de CursoDescripcin:rea curricular: Ciencias biolgicas, naturales y exactasCrditos: 4Trabajo presencial (h): 96Trabajo independiente (h): 96Duracin total (h): 192

Objetivo General:Aplicar los mtodos para recoger, organizar, resumir y analizar datos de caractersticas antropomtricas, funcionales y motoras, as como sacar conclusiones vlidas y tomar decisiones razonables basadas en tales anlisis.

Estrategias metodolgicasEjercicios en claseTalleresExcelTrabajo

Tema 1Definiciones bsicas

Definicin importantesEstadstica Es la ciencia que desarrolla y aplica mtodos eficientes de recoleccin, procesamiento, anlisis e interpretacin de datos. Surge como herramienta para reducir los efectos de incertidumbre inherentes a los procesos en donde predominan los efectos del azar.

Conteo de Poblaciones, Riquezas y Recursos Naturales. Antes de Cristo XVII.Cuantificacin de probabilidades de xito en los juegos de Azar. Siglo XVIII.Optimizacin de la Produccin Agrcola. Siglo XIX.Herramienta de apoyo en el desarrollo cientfico y tecnolgico en todas las reas del conocimiento.

Tipos de estadstica1. ESTADISTICA DESCRIPTIVA: Mtodos para organizar, resumir y presentar datos de manera informativa. Su fin es nicamente exploratorio y se limita a describir lo observado en una poblacin o muestra.El estudio de la estadstica se divide en dos categoras:

2. ESTADISTICA INFERENCIAL: Proceso inductivo que permite inferir a toda la poblacin caractersticas observadas en un muestra

TEORIA DE LA PROBABILIDADDeduccin de Leyes

Estadstica y su problema Bsico

Poblacin (N)Muestra (n)

Muestreo AleatorioParmetro

Estimador

Inferencia

POBLACIN: Conjunto de Elementos de inters en una investigacin.1. El numero de elementos pueden ser finitos o infinitos2.No debe asociarse exclusivamente con poblacin humana

MUESTRA: Subconjuntos de elementos obtenidos desde la poblacin de inters

UNIDAD MUESTRAL: Elemento sobre el cual se accede a los elementos de la muestra

Tipos de variables y escalas de medicin Se consideran generalmente cuatro escalas de medicin:1. Escala Nominal: No puede establecer un orden jerrquico entre las opciones de respuesta Color de Ojos ( Verde, Azul, Gris, Negro, Caf).2. Escala Ordinal: Existe un ordenamiento natural de las opciones de respuestaCalificacin de un servicio (Excelente, Bueno, Regular, Malo)

Escala de Intervalo: El valor 0 es un valor arbitrario, no implica la no presencia de una caractersticaTemperatura = 0 C No hay temperatura?Escala de Razn: El valor 0 refleja ausencia de la caracterstica.Altura = 0 mtsV. CualitativasV. Cuantitativas

Discretos: Conjunto numerable. Entre dos valores consecutivos no toma puntos medios.Numero de estudiantes en el saln (1,2,3,4,)

4. Continuos: Conjunto numrico continuoTalla (168 169, 168,2, 168,5, 168,7, )

1. Calidad de un programa de entrenamiento.

Opciones de respuesta:Muy maloMaloRegularBueno Muy BuenoCualitativaOrdinal

2. Deporte que puede elegir para ingresar a la END

Opciones de respuesta:FtbolBaloncestoNatacinPesasVoleibolCualitativaNominal

3. Tiempo en recorrer 300 metrosTengo opciones de respuesta?Cual es la escala de medicin?

CuantitativaContinuo

4. Numero de personas matriculadas en primer semestre en Profesional en Deporte

Tengo opciones de respuesta?Cual es la escala de medicin?

CuantitativaDiscreto

Clasifique las siguientes variables segn el tipo de variable y el nivel de medicin:Numero de goles marcados en un partidoLongitud en cms de miembros superioresPeso (kg.) de los deportistasLateralidad del futbolistaTiempo en recorrer 200 mts.Nivel de stress de una competenciaEstilos de natacin Tipos de saque en Voleibol

Responda: Cual es la diferencia entre Censo y muestreo?

La investigacin y el modelo estadsticoConcepto EquivocadoDatosEstadsticaInformacin

Cual fue la Poblacin?Que variables se midieron?Escala de Medicin?Instrumento de Medicin?Tipo de Muestreo?

Decisiones

Cual es la validez de la Informacin???

Validez de la investigacin

Grado de valor que se confiere a la Informacin

a. Validez externa La medicin puede extrapolarse... ?

Depende en gran medida de la conformacin de la Muestra

Grado en que la medicin puede generalizarse a otras situaciones no medidas Mecanismos de generacin de datos

Ejemplo 1:

La Escuela Nacional del Deporte ha diseado un estudio para valorar el estado de nutricin en los nios de la ciudad de Cali y el nivel de actividad fsica que desarrollan diariamente, para ello ha venido visitando diferentes instituciones educativas valorando estas dos condiciones en sus nios.

Asuma que la validez interna de los datos est garantizada. Cual es su opinin al respecto?Es claro, el problema es de representatividad. Que es representatividad?De que depende la representatividad?

El tamao de la muestra, crece proporcionalmente con el tamao de la poblacin, cuando se quiere realizar una estimacin de la poblacin?En ocasiones se piensa que una muestra debe contener el 10% o hasta el 30% de la poblacin, lo cual es FALSO

Paradoja del tamao de muestra

Olla para la sopa a diario

Olla para la sopa con invitados

Cuchara para catar la sopaa diario

Cuchara para catar la sopacon invitadosEl tamao de muestra no es proporcional al tamao de la poblacinParadoja del tamao de muestra

Grado en que la medicin refleja la situacin que se pretende medir La Medicin est bien tomada... ? El instrumento de Medicin es Adecuado... ? La Medicin es Confiable, Repetible... ?b. Validez del Constructo

b. Validez del Constructo

Ejemplo 1: Un entrenador fsico se encuentra interesado en medir el nivel de flexibilidad de un grupo de deportistas. Para ello hace uso de 5 ejercicios diferentes, a cada uno de los deportistas le pide que seleccione 2 de los test para ser evaluado. Ejemplo 2: Se intenta medir la distancia entre dos objetos a travs de un instrumento cuyo diseo consta de un resorte sobre el cual se han marcado unidades de distancia (cms).Los datos que surjan de estos instrumentos de medicin son confiables?

1. Concepcin de la Idea de Investigacin2. Planteamiento del Problema3. Construccin de un Marco Terico4. Definir el Tipo de Investigacin5. Establecer Hiptesis6. Determinar la poblacin objeto de estudio y la estrategia de muestreo7. Planeacin y Recoleccin de Datos8. Anlisis de Datos9. Presentar Resultados

La estadstica juega un papel esencial en este proceso

ESTADISTICA

CONCEPTO IDEAL

Tema 2:Tablas de distribucin de frecuencia y representacin grfica de los datos

Distribucin de frecuenciasLa distribucin de frecuencia es un mtodo utilizado para organizar y resumir datos. Bajo este mtodo los datos que componen una serie se clasifican y ordenan, indicndose el nmero de veces que se repite.

Permiten manejar gran cantidad de informacin en espacios pequeos de dos formas:

Tablas de Frecuencias: Generan mayor informacin, pero requieren de mayor esfuerzo del lectorGrficos de Representacin: Se sacrifica informacin con el animo de que esta llegue de forma efectiva al lector.

Variables CualitativasSuponga que un estudio quiere valorar la realidad actual respecto al consumo de cigarrillos en jvenes con edades comprendidas entre los 15 y 20 aos. Para ello ha tomado una muestra aleatoria de 40 jvenes a los cuales les indaga acerca de su consumo de cigarrillos, los resultados son lo siguientes:

{Si;Si;Si;NO;NO;NO;Si;Si;NO;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;Si;NO;Si;Si;Si;NO;NO;NO;Si;NO;Si;NO;NO;NO;Si;Si;NO;Si;NO}

Datos brutos o series simples

Se establece cuales son las categoras de la variableSe cuenta cuantas veces esta cada categoraLa suma de estas frecuencias debe coincidir con el tamao de la muestra o poblacin Se calcula la frecuencia relativa o porcentaje (hi=fi/n)

xifihiFuma2665No fuma1435Total40100

Tablas para datos cualitativosInterpretacin

Elaboracin de una tabla de distribucin de frecuenciasn = Tamao de la muestra y N = Tamao de la poblacinxi= Identificacin de cada valor observado fi = Frecuencias absolutas: Numero de veces que se repitehi = Frecuencia relativa: Valor porcentual hi=fi/nFi = Frecuencia absoluta acumulada. Hi = Frecuencia relativa acumulada

Grficos para variables cualitativas Grficos de Pastel (Pocas categoras de respuesta con alguna de ellas dominante)

Grficos de Barra (El nmero de categoras no importa)

Ejercicios:Tablas y grficos para datos cualitativosGenero de los estudiantes de Estadstica Aplicada:

Femenino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Femenino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Masculino, Femenino, Femenino, Femenino, Masculino, Masculino, Masculino, Masculino, Masculino.

Ejercicio 2:Deporte seleccionado al ingresar a la END:

Natacin, Natacin, Natacin, Natacin, Natacin, Natacin, Atletismo, Atletismo, Atletismo, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Futbol, Voleibol, Voleibol, Voleibol, Voleibol, Baloncesto, Baloncesto, Baloncesto, Baloncesto, Baloncesto, Baloncesto, Baloncesto,

Ejercicio 3:Encuesta realizada a deportistas en competencia para determinar el nivel de stress obteniendo los siguientes resultados (1-5):

3, 3, 5, 2, 4, 5, 3, 3, 4, 4, 2, 5, 3, 4, 3, 3, 3, 2, 3, 4

Tabla de frecuencia para variables CuantitativasEjemplo: Numero de abdominales de un grupo de mujeres de la tercera edadSerie simple: {15, 16, 19, 18, 16, 17, 15, 18, 18, 17, 20, 16, 17, 18, 17, 19, 20, 21, 16, 17}XiValor observadoConteoni(Frecuencia Absoluta)15/ /216/ / / /417/ / / / /518/ / / / 419/ /220/ /221/1Total20

Elaboracin de tabla de datos cuantitativos discretosSe ordenan los datos de menor a mayorSe establece cuales son las categoras de la variableSe cuenta cuantas veces esta cada categora (fi). La suma de estas frecuencias debe ser n.Se calcula Fi, sumando los fi de la categora actual y las anteriores.Se calcula la frecuencia relativa o porcentaje (hi=fi/n)Se calcula Hi, sumando los hi de la categora actual y las anteriores.

Tabla para datos cuantitativos discretosTABLA DE FRECUENCIA DEL NUMERO DE ABDOMINALES DEL GRUPO EVALUADOXiValor observadofi(Frecuencia Absoluta)hi(Frecuencia Relativa)Fi(Frecuencia Absoluta Acumulada)Hi(Frecuencia Relativa Acumulada)1520.120.11640.260.31750.25110.551840.2150.751920.1170.852020.1190.952110.05201.00Total201.0

Interpretacin

Diagrama de Barras En el Eje horizontal se representan los valores que asume la variable y en el eje horizontal su frecuencia absoluta o relativa

Puede ser la frecuencia absoluta o relativa (%)Por ser una variable discreta las barras no deben juntarseGrficos para variables cuantitativas de datos discretos

Que hacer cuando la variable es continua o cuando el rango de variacin de la variable discreta es moderadamente amplio?Solucin Realizar AgrupacionesEjemplo: Tiempos de atencin (en minutos) de pacientes en el servicio medico de la END

13.1, 7.1, 14.8, 19.0, 10.2, 18.0, 19.8, 15.0, 17.3, 10.8, 22.3, 14.5, 17.1, 14.9, 12.0, 14.0, 18.4, 10.2, 15.8, 16.5, 15.0, 17.6, 4.2, 13.4, 21.2, 14.7, 13.8, 21.0, 14.3, 11.1, 18.9, 8.3, 16.6, 11.2, 20.2, 14.4, 13.5, 18.2, 12.4, 17.0, 26.7, 15.5, 22.0, 12.9, 17.9, 7.4, 18.0, 19.8, 16.0, 21.2.

37

Tablas de distribucin de frecuencias para datos agrupadosTabla de frecuencia de tiempos de atencin de pacientes en el servicio medico de la ENDIntervalos de ClaseXini(Frecuencia Absoluta)hi(Frecuencia Relativa)Ni(Frecuencia Absoluta Acumulada)Hi(Frecuencia Relativa Acumulada)4.2 7.946.07540.0840.087.95 11.699.82550.1090.1811.7 15.4413.575160.32250.5015.45 19.1917.325160.32410.8219.2 22.9421.07580.16490.9822.95 26.6924.82510.02501.00501.00

Como se elabora:Para establecer las categoras se aplican las siguientes formulas (Regla de Sturges):

R= Rango= Valor mximo Valor mnimoNC= Numero de categoras= 1+(3,33*log(n))A= Amplitud de las categoras= R/NCPrueba= (A*NC)+Vmin

Ejemplo:A un grupo de nios que pertenecen a un club deportivo de baloncesto, se les aplico el test de 600 metros con el propsito de establecer la resistencia de ellas. Se obtuvieron los siguientes resultados:

Construya una tabla de distribucin de frecuencia y grfica de estos datos

2,32,32,42,42,52,63,13,23,23,23,33,33,43,43,53,53,53,63,64,14,24,45,15,1

Pasos:Ordeno los datos de menor a mayorBusco el valor mnimo, mximo y nmero de datosAplico las formulasRealizo la prueba para determinar si la amplitud hallada sirve (el resultado debe superar el valor mximo) o debo aumentarlaConstruyo la tabla

Valor mximo= 5,1Valor mnimo= 2,3Nmero de datos= 24

Rango= Vmax Vmin= 5,1 - 2,3= 2,8NC= 1+ (3,33*log(24)= 5,6 ~ 6A= R/NC= 2,8/6 = 0,467 ~ 0,5

Prueba= (0,5*6)+2,3 =5,32,32,32,42,42,52,63,13,23,23,23,33,33,43,43,53,53,53,63,64,14,24,45,15,1

Como es superior a 5,1 puedo construir la tabla con:Nmero de categoras = 6Amplitud = 0,5

NLmite inferiorLmite superiorFrecuencia123,233,33,743,84,254,34,764,85,25,3

2,32,32,42,42,52,63,13,23,23,23,33,33,43,43,53,53,53,63,64,14,24,45,15,1

NC= 6 A= 0,52,3Valor mnimo2,8Valor anterior+A2,7Li+1-0,1

NLmite inferiorLmite superiorFrecuenciaPorcentaje12,32,722,83,2416,733,33,7937,543,84,228,354,34,714,264,85,228,35,3100

2,32,32,42,42,52,63,13,23,23,23,33,33,43,43,53,53,53,63,64,14,24,45,15,1

6[2,3-2,7]={2,3 2,3 2,4 2,4 2,5 2,6} =624Suma de toda la columna. Debe coincidir con n25hi= fi/n= 6/24*100=25

NLmite inferiorLmite superiorFrecuencia (F)Porcentaje (H)Frecuencia acumulada (F)Porcentaje acumulado (H)12,32,762562522,83,2416,71041,733,33,7937,51979,243,84,228,32187,554,34,714,22291,764,85,228,3241005,324100

Interpretaciones:

Grficos para datos cuantitativos agrupadosHistograma de Frecuencias (Variable agrupada)Las clases se indican en el eje horizontal y su frecuencias (relativas o absolutas) sobre el eje vertical

La barras se juntan por continuidad de la variable

Polgono de frecuencias (Es la unin de los puntos medios del histograma)

Ojiva (Frecuencias absolutas o relativas acumuladas en una variable continua)

Otros grficos tilesCartogramas: Datos asociados a una ubicacin geogrfica

20022007Fuente: Anlisis Espacial de los Homicidios en la Ciudad de Cali. Cisalva. Trabajo de Grado en Estadstica

Mediciones Indexadas en el Tiempo (Datos Longitudinales)

Tasas de Homicidio en la Ciudad de CaliGrafico de Linea:Evolucin de la caracterstica en el tiempo Lneas (Aplicado cuando tengo datos medidos en el tiempo)

TEMA 3:Estadsticos descriptivos: Medidas de tendencia central, posicin y dispersin.

Medidas de tendencia centralCalculo numrico capaz de resumir en un valor rasgos importantes en el comportamiento de un conjunto de datos, tal como su centramiento. De tal manera que con base en ellos sea posible ejecutar acciones o tomar decisiones

CualitativasCuantitativasNominalOrdinalDiscreta y continuaModaModaModaMedianaMedianaPromedio (media)

Medidas de tendencia central

Moda: Dato de mayor frecuencia en los resultados observadosMediana: Dato que supera al 50% de los datosMedia: Valor central del conjunto de datosMedia =Suma de todos los datosNmero de datosMediana =n + 1 2

Datos: 2, 4, 7, 7, 10 Ejemplo

Moda: Dato de mayor frecuencia en los resultados observados = 7

Media: Valor central del conjunto de datosMedia =Suma de todos los datosNmero de datos305== 6

Mediana: Dato que supera al 50% de los datosMediana =n + 1 2=5 + 1 2=6 2= 3Dato 3 = 7Mediana = 7

INDICADORES DE POSICIN

Permiten hacerse una idea acerca de la forma de la distribucin una variable y su dispersin. En ocasiones sirven como criterio de seleccin.Estatura para la edadPeso para la edadPeso para la talla IMCCircunferencia de brazoPliegue subescapularPliegue del trcepsPermetro del bceps Permetro ceflico Las medidas de posicin nutricionales usadas en Deporte:

Medidas de Posicin

Cuartiles: Dividen la distribucin en cuatro partes porcentualmente iguales, Q1 (25%), Q2 (50%), Q3 (75%)Percentiles: Dividen la distribucin en 100 partes porcentualmente iguales, P1, P2, P3,., P100Deciles: Dividen la distribucin en 10 partes porcentualmente iguales, d1, d2, d3,..d9, d10.

Rango Intercuartilico: Se define como la diferencia entre el 3er y 1er cuartilR IQ = Q3 Q1Contiene al 50% de las Observaciones

>85Sobrepeso>97Obesidad