Conceptos y Definiciones

11
Probabilidad y Estadística Ing. Miroslava G.Reyes Prada Página 1 1. CONCEPTOS Y DEFINICIONES 1. 1 Historia de la Estadística Se sabe que 2000 a 2500 años antes de Cristo, los chinos y los egipcios efectuaron censos que eran simples inventarios elementales. Adolph Quetelet (1796-1874) se consideraba como el padre de la Estadística moderna por sus valiosas contribuciones a la práctica y metodología estadística. Sus trabajos cubrieron campos tales como censos, desarrollo de la uniformidad y comparabilidad de estadística entre naciones y organizó la primera conferencia internacional de Estadística. Se considera fundador de la estadística a Godofredo de Achenwal, profesor y economista alemán (1719-1772), quien siendo profesor de la Universidad de Leipzig, escribió sobre el descubrimiento de una nueva ciencia que llamó Estadística y que definió como el conocimiento profundo de la situación respectiva y comparativa de cada estado. Achenwall y sus seguidores estructuraron los métodos estadísticos que se orientaron a investigar, medir y comparar las riquezas de las naciones. Karl Friederich Gauss estudió la curva normal o campana de Gauss, demostrando su valor práctico. Francis Galton y Charles Darwin desarrollaron métodos estadísticos como la regresión y correlación que aplicaron en el estudio de la herencia. Karl Pearson desarrollo la distribución CHI CUADRADO que se considera la más importante de su investigación. William S. Gosset, dedujo la distribución T. 1.2 Definición de estadística La estadística se trata de la teoría y aplicación de métodos para coleccionar datos, organizarlos, analizarlos y hacer deducciones a partir de ellos. También se puede decir que la estadística es una agrupación de datos ordenados en forma sistemática en cuadros y/o gráficos. Es el conjunto de métodos que permite recolectar, organizar, resumir y analizar datos para sacar conclusiones y tomar decisiones. La palabra estadística viene del nombre griego Statero, que significa balanza, del latín Satatus, que significa situación o estado, y del alemán Staat, que significa estado.

Transcript of Conceptos y Definiciones

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 1

    1. CONCEPTOS Y DEFINICIONES

    1. 1 Historia de la Estadstica

    Se sabe que 2000 a 2500 aos antes de Cristo, los chinos y los egipcios efectuaron

    censos que eran simples inventarios elementales.

    Adolph Quetelet (1796-1874) se consideraba como el padre de la Estadstica moderna

    por sus valiosas contribuciones a la prctica y metodologa estadstica. Sus trabajos

    cubrieron campos tales como censos, desarrollo de la uniformidad y comparabilidad de

    estadstica entre naciones y organiz la primera conferencia internacional de Estadstica.

    Se considera fundador de la estadstica a Godofredo de Achenwal, profesor y

    economista alemn (1719-1772), quien siendo profesor de la Universidad de Leipzig,

    escribi sobre el descubrimiento de una nueva ciencia que llam Estadstica y que

    defini como el conocimiento profundo de la situacin respectiva y comparativa de cada

    estado.

    Achenwall y sus seguidores estructuraron los mtodos estadsticos que se orientaron a

    investigar, medir y comparar las riquezas de las naciones.

    Karl Friederich Gauss estudi la curva normal o campana de Gauss, demostrando su

    valor prctico.

    Francis Galton y Charles Darwin desarrollaron mtodos estadsticos como la regresin y

    correlacin que aplicaron en el estudio de la herencia.

    Karl Pearson desarrollo la distribucin CHI CUADRADO que se considera la ms

    importante de su investigacin.

    William S. Gosset, dedujo la distribucin T.

    1.2 Definicin de estadstica

    La estadstica se trata de la teora y aplicacin de mtodos para coleccionar datos,

    organizarlos, analizarlos y hacer deducciones a partir de ellos.

    Tambin se puede decir que la estadstica es una agrupacin de datos ordenados en

    forma sistemtica en cuadros y/o grficos. Es el conjunto de mtodos que permite

    recolectar, organizar, resumir y analizar datos para sacar conclusiones y tomar

    decisiones.

    La palabra estadstica viene del nombre griego Statero, que significa balanza, del latn

    Satatus, que significa situacin o estado, y del alemn Staat, que significa estado.

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 2

    1.2.1 Estadstica Descriptiva o Deductiva

    Es el mtodo para obtener, de un conjunto de datos, conclusiones sobre los mismos y

    que no sobrepasan el conjunto de conocimientos que proporcionan esos datos. Su

    estudio incluye las tcnicas para recolectar, analizar e interpretar los datos.

    1.2.2 Estadstica Inferencial o Inductiva o Simplemente Inferencial Estadstica

    Es el mtodo y conjunto de tcnicas que se utilizan para obtener conclusiones que

    sobrepasan los lmites de los conocimientos aportados por los datos. En otras palabras

    busca obtener informacin sobre un colectivo mediante un metdico procedimiento de

    los datos de una nueva muestra tomada de l.

    Ejercicio. Ubicar en estadstica descriptiva o estadstica inferencial los siguientes

    aspectos:

    a. Promedios de estaturas de los alumnos de 6 grado de un colegio.

    b. Determinar la probabilidad de que muestras de observaciones sean solo el resultado

    de variaciones al azar.

    c. Encontrar una diferencia consistente entre dos mtodos especficos de enseanza.

    d. Determinar la vida media de lmparas producidas por determinados fabricantes.

    1.3 Poblacin o Universo Colectivo (M)

    Es el conjunto de todos los elementos, medidas, individuos u objetos que tiene una

    caracterstica comn. Ejemplo: Estudiantes de Ingeniera civil de la Universidad

    Francisco de Paula Santander.

    1.4 Muestra (m)

    Pequea parte del grupo, que es representativo de la poblacin. Conjunto de medidas o

    recuento de una parte de los elementos pertenecientes a la poblacin.

    Ejemplo. Estudiantes de Ingeniera Civil que tienen entre 18 a 20 aos.

    Ejemplo. En la construccin de un edificio existen 300 empleados de los cuales 5 son

    Ingenieros Civiles, 10 Ingenieros Elctricos, 10 Calculistas, 20 Tecnlogos en Obras

    Civiles, 5 secretarias, 10 almacenistas y 240 empleados.

    La poblacin es el total de los empleados de la construccin del edificio que son 300.

    Una muestra de esa poblacin 5 Ingenieros Civiles o los 10 ingenieros elctricos o 5

    calculistas o 10 tecnlogos, etc.

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 3

    Nota: Los datos obtenidos de una poblacin pueden contener toda la informacin que

    se desee de ella. De lo que se trata es de extraerle esa informacin a la muestra, es

    decir a los datos mustrales sacarle toda la informacin de la poblacin.

    La muestra debe obtener toda la informacin deseada para tener la posibilidad de

    extraerla, esto slo se puede lograr con una buena seleccin de la muestra y un trabajo

    muy cuidadosos y de alta calidad en la recogida de los datos.

    Es bueno sealar que en un momento una poblacin puede ser muestra en una

    investigacin y una muestra puede ser poblacin, esto est dado por el objetivo del

    investigacin, por ejemplo en el caso de determinar la estatura media de los estudiantes

    universitarios en Cuba una muestra poda ser escoger algunas universidades del pas y

    realizar el trabajo, si por el contrario se quiere saber la estatura promedio de los

    estudiantes de una universidad en especifico en Cuba, entonces el conjunto formado

    por todos los estudiantes de esta universidad sera la poblacin y la muestra estara

    dada por los grupos, carreras o aos seleccionado para realzar el experimento.

    para que una muestra sea representativa de la poblacin, sta deber contener

    aproximadamente entre el 5 % y el 10 % de los datos de la poblacin cuando sta es

    finita, adems los elementos de la muestra deben ser escogidos al azar (a la suerte) y se

    deben observar todas las caractersticas que se observan en la poblacin.

    1.5 Parmetros

    Son todas aquellas medidas que describen numricamente las caractersticas de una

    poblacin. Se les conoce tambin como valor verdadero, ya que una caracterstica

    poblacional tendr solo un parmetro (varianza, media, etc).

    1.6 Datos

    Son medidas, valores o caractersticas susceptibles de ser observados y contados.

    Se le llama Datos a las agrupaciones de cualquier nmero de observaciones

    relacionadas. Para que se considere un dato estadstico debe tener dos caractersticas:

    a) Que sean comparables entre s.

    b) Que tengan alguna relacin.

    La recoleccin de informacin o recopilacin de datos estadsticos se divide en:

    1.6.1 Datos Internos

    Son aquellos datos que no necesitan de observaciones adicionales al experimento; es

    decir, no es necesario buscar caractersticas que proporcionen informacin adicional

    acerca del experimento. Ejemplo: Las calificaciones de un grupo, un experimento

    qumico, etctera.

    1.6.2 Datos Externos

    Estos datos pueden ser de dos tipos:

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 4

    1.6.2.1 Datos Bibliogrficos

    Son aquellos ya conocidos y que podemos encontrar fcilmente utilizando bibliografa,

    registros, actas, etctera, como los datos histricos, censos y otros.

    b) Datos Originales: son aquellos que podemos obtener mediante mtodos de

    recoleccin, como las encuestas, plebiscitos, referndum, y nos proporcionan datos

    reales y certeros.

    Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser

    determinados de acuerdo a cuatro elementos que son: Tiempo, lugar, cantidad y

    cualidad.

    Presentacin de Datos: despus de la organizacin de los datos, la informacin se

    resume en Tablas Estadsticas con base en arreglos formados de renglones y columnas,

    adecuados segn cronologa, geografa, anlisis cuantitativo o cualitativo.

    Los principales elementos de una tabla estadstica son: Ttulo, unidades, encabezado,

    cuerpo o contenido, nota de pie y referencias; la informacin contenida en una tabla

    estadstica tambin se puede presentar mediante graficas, siendo las ms comunes las de

    lneas, barras, pictogrficas, cronogramas, circulares o de pastel, histograma y polgono

    de frecuencias.

    1.7 Variables o caractersticas o caracteres

    Son ciertos rasgos, cualidades que poseen los elementos de una poblacin o muestra.

    Las variables se clasifican en: Cualitativas y Cuantitativas.

    Se le llama Variable a la cualidad o cantidad medible de cualquier suceso o accin que

    presente o experimente un cambio, la podemos representar mediante un smbolo (X, Y,

    Z, , , , ) y al cual se le puede asignar un valor cualquiera de un conjunto determinado de datos.

    Le llamamos Variable Aleatoria a aquella variable cuyos cambios no pueden ser

    determinados antes de que estos se presenten; es decir, estn destinados a la suerte.

    Tambin se le conoce como Variable Probabilista, Cabalstica, de Azar o a la Suerte.

    1.7.1 Tipos de Variables

    Para su estudio, las variables aleatorias se han clasificado segn la naturaleza de los

    valores que toman en:

    1. Variables Numricas:

    a) Variables Numricas Discretas

    b) Variable Numrica Continua

    2. Variables Categricas:

    a) Variables Categricas Nominales

    b) Variables Categricas Ordinales

    1.7.1.1 Variables Numricas o Cuantitativas

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 5

    Son aquellas que se identifican o se les puede asignar un valor numrico o que

    corresponden a aspectos que son medibles.

    Ejemplo: Tiempo de uso, precio, tamao, velocidades, nmero de hijos de una familia,

    nmero de carros que circulan por determinada calle, alturas, pesos, tallas, temperaturas,

    tiempo de vida de una persona, cantidad de azcar para endulzar un caf, medida de

    sombreros, etctera.

    Las variables numricas se dividen en:

    1.7.1.1.1 Variables Numricas Discretas

    Son aquellas que solamente toman valores enteros con rango finito.

    Ejemplo: Nmero de hijos en cada familia de una colonia de la ciudad, talla de calzado

    de cada alumno de un grupo escolar, la cantidad de alumnos por grupo, etc.

    1.7.1.1.2 Variable contina

    Es cuando tericamente puede tomar cualquier valor entre dos valores dados.

    Ejemplo: El volumen de agua de un tanque.

    La medida de la cantidad de pintura para un saln.

    La duracin de una pelcula.

    1.7.1.2 Variables Categricas o Cualitativas

    Son aquellas a las que no se les puede asignar o identificar con un valor numrico, sino

    con un aspecto, cualidad o caracterstica que las distinga y que no se pueden medir sino

    solo observar, a ese aspecto, cualidad o caracterstica se le llama categora.

    Son las que se expresan mediante palabras y dan origen a los atributos (sexo, profesin,

    estado civil, etc).

    Ejemplos: Marca, tipo de sangre, deporte preferido, el estado en general de cualquier

    cosa, idioma, nacionalidad, colores, cabello o piel, himnos nacionales, sexo, estado de

    nimo, clima, etctera.

    En las variables categricas, un elemento no puede estar en dos o ms categoras a la

    vez, lo cual las hace excluyentes y adems no puede haber elementos de la poblacin

    que no pertenezcan a alguna categora, lo cual las hace exhaustivas.

    Las variables categricas se dividen en:

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 6

    1.7.2 Variables Categricas Nominales

    Son aquellas a las que no se les puede asignar un orden, es decir que slo permite

    clasificacin en categoras por mencin de sta.

    Ejemplo: La nacionalidad de una persona, idioma, sexo, himnos nacionales.

    1.7.3 Variables Categricas Ordinales

    Son aquellas que adems de clasificar a los elementos en distintas categoras les

    podemos asignar un orden o que podemos ordenar de acuerdo a cierta caracterstica.

    Ejemplo: El estado de salud de una persona; que podemos ordenarla segn la urgencia

    del caso, el color de algn objeto segn la tonalidad desde muy clara a ms oscuro; que

    podemos ordenarlo de acuerdo a la intensidad del color, el grado militar, puesto en la

    empresa, da de la mam, meses del ao, etctera.

    Ejercicios. Frente a cada variable escriba una C si es continua y una D si es discreta.

    1. El volumen de agua de una piscina.

    2. Longitud de 1000 cerrojos producidos por una fbrica.

    3. Nmero de acciones vendidas de un edificio.

    4. Periodo de duracin de los transistores producidos por una compaa.

    5. El nmero de alumnos de cada semestre de carrera de Administracin de

    Empresas.

    1.8 Proporciones.

    Una proporcin es la igualdad de dos razones por cociente.

    Es una razn en la cual los elementos del numerador estn incluidos en el denominador.

    Se utiliza como estimacin de la probabilidad de un evento. El rango es de 0 a 1 (o de 0

    a 100%).

    Ejemplo. En el ao 2005 se declararon 1295 casos de legionelosis en Espaa (datos del

    Instituto Nacional de Estadstica). Ejemplos de proporcin:

    Casos de legionelosis en Andaluca en relacin al total de casos en Espaa: 83/1295=

    0,064. El 6,4% de los casos de legionelosis en Espaa se declararon en Andaluca.

    Casos de legionelosis en Canarias en relacin al total de casos en Espaa: 11/1295=

    0,0085. El 0,85% de los casos de legionelosis en Espaa se declararon en Canarias.

    1.9 Razones

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 7

    Una razn es una relacin entre dos cantidades que permite compararlos; esta

    comparacin se puede efectuar por la diferencia o por cociente. Sean a y b dos nmeros,

    con ellos podemos establecer las siguientes razones.

    a-b En este caso se dice que la razn es aritmtica.

    a/b La razn es geomtrica o por cociente.

    Ejemplo. En el ao 2005 se declararon 83 casos de legionelosis en Andaluca, 11 en

    Canarias y 34 en Asturias (datos del Instituto Nacional de Estadstica). Ejemplos de

    razn:

    Razn casos de legionelosis en Andaluca/casos de legionelosis en Canarias: 83/11=

    7,55. Por cada caso de legionelosis declarado en Canarias hay 7,55 casos declarados en

    Andaluca.

    Razn casos de legionelosis en Andaluca/casos de legionelosis en Asturias: 83/34=

    2,44. Por cada caso de legionelosis declarado en Asturias hay 2,44 casos declarados en

    Andaluca.

    1.9 Unidad de Investigacin

    Es el elemento de la poblacin que origina la informacin y puede ser una persona, un

    hogar, una industria, etc. La unidad debe ser clara en su definicin, fcilmente

    identificable y mesurable.

    1.9.1 Recoleccin de la informacin

    Que puede ser por observacin, por encuesta o simplemente obtenida de publicaciones

    y/o fuentes confiables que han efectuado la investigacin estadstica.

    1.9.2 Procesamiento de informacin

    Que consiste en ordenar la informacin, filtrarla eliminado posibles errores y analizar la

    informacin mediante los mtodos y normas de la estadstica.

    1.9.3 Publicacin

    Es la etapa final de entrega de la informacin despus de revisado, ya sea para uso

    propio o ajeno. Los datos se deben presentar en forma adecuada.

    1.10 Experimento estadstico

    Es en general, el estudio de una situacin creada, en donde la poblacin es inexistente o

    mejor dicho hipottica; el objeto del experimento es establecer, por mtodos

    estadsticos, algunas caractersticas de la poblacin si esta existiera.

    Fuentes de Informacin: Primarias y

    Secundarias Definicin

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 8

    1.10.1Fuentes Primarias

    Son aquellas en las que la informacin se encuentra en su origen, y por lo tanto debe ser

    elaborada por primera vez y de forma especfica.

    1.10.2Fuentes Secundarias

    Son aquellas que presentan informacin ya elaborada, o existente, que fue generada

    anteriormente con otra finalidad que no tiene porqu coincidir con la nuestra. Podemos

    distinguir entre Estadsticas y Metodolgicas.

    1.11 Estratificacin:

    El criterio a seguir en la formacin de los estratos ser formarlos de tal manera que haya

    la mxima homogeneidad en relacin a la variable a estudio dentro de cada estrato y la

    mxima heterogeneidad entre los estratos.

    1.12 Experimento

    Se le llama Experimento a toda accin o prueba que se realiza con el fin de observar su

    resultado. Existen dos tipos de experimentos, que son:

    1.12.1 Experimento Determinista

    Son aqullos en los que se puede predecir con certeza su resultado antes de que ste se

    presente.

    Ejemplo: Al lanzar en un cuarto un libro al aire con el fin de determinar si flota, se

    queda unido al techo o cae al suelo, sabemos con certeza que el libro caer al suelo, lo

    cual lo hace un experimento determinista.

    1.12.2 Experimento Aleatorio, Probabilista, casual o de azar

    Hablar de aleatorio, probabilista, casual o azar es hablar de algo que est determinado a

    la suerte. As, decimos que un Experimento Aleatorio ocurre cuando no es posible

    asegurar el resultado que se va a presentar.

    Ejemplo: Al lanzar una moneda al aire no sabemos si el resultado va a ser guila o sello,

    lanzar un dado, etctera.

    1.13 Muestreo

    Se llama Muestreo al estudio que se hace de una poblacin por medio de muestras

    representativas, debidamente elegidas de manera que posea todas las caractersticas de

    una poblacin y de tamao determinado segn la precisin que de ella se quiere obtener

    en las decisiones y conclusiones estadsticas posteriores.

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 9

    1.14 Valores Estadsticos

    Se le llama valores estadsticos, estadsticos mustrales o simplemente estadsticos a los

    valores o cantidades desconocidas que son obtenidas de, o que hacen referencia a las

    caractersticas de una muestra.

    1.15Aplicaciones de la Estadstica.

    Las primeras aplicaciones de la estadstica fueron asuntos del gobierno, luego las

    utilizaron en compaas de seguros y los empresarios de juegos de azar, a los anteriores

    siguieron los comerciantes, los industriales, los educadores, etc.

    Biologa: Agricultura, Gentica, Medicina, Biometra (Estudio de la vida por medio de

    la estadstica).

    Tcnicas de Estado: Transporte, Salud Pblica, Educacin, Vivienda, Hacienda Pblica,

    Planificacin y administracin.

    Sociologa: Opinin Pblica, Hechos Humanos y Desempleo.

    Sicologa: Aplicacin de test, sicometra.

    Economa: Contabilidad, Mercadeo, Recursos Financieros.

    Fsica y Qumica: Mecnica.

    Realice la siguiente Actividad.

    1. Utilice los conceptos analizados para completar las siguientes frases:

    a. Por medio de una investigacin se recolectan los _____________________

    b. Para aprender a procesar datos y extraer conclusiones, se debe estudiar

    ____________________________________________________________

    c. La estadstica que analiza los datos y los describe es _________________

    d. Para aprender a hacer inferencia estadstica se debe estudiar __________

    ____________________________________________________________

    e. El lenguaje que se aprende en estadstica _____________________ las

    descripciones, correlaciones e inferencias que hacen los investigadores.

    f. El grupo de elementos que tienen una caracterstica comn forman una

    ________________ , _____________________ ____________________

    g. Los hechos o caractersticas que toman diferentes valores se llaman

    ___________________.

    h. Si una variable toma cualquier valor, son ______________________

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 10

    i. Si la variable en cambio no toma valores intermedios, es _______________

    j. Si los datos recolectados nos muestran o hacen descripciones, esas variables son de

    tipo ____________________________

    k. Si los datos recolectados pertenecen a la cantidad de padres de familia del Colegio

    Santa Cecilia, la variable es ____________________ y ________________________

    2. Investiga tres conceptos diferentes de Estadstica y antalas.

    3. Lee cuidadosamente y responde los siguientes cuestionamientos, rellenando el crculo

    de la opcin que consideres correcta.

    3.1. Rama de las matemticas en donde a travs de un conjunto de metodologas se

    puede observar el comportamiento de un experimento o fenmeno y da una conclusin

    acertada.

    a. Estadstica

    b. Estadstica diferencial

    c. Estadstica inferencial

    d. Estadstica aplicada

    3.2. Cules son las dos clasificaciones de la estadstica?

    a. Inferencial y aplicada

    b. Aplicada diferencial

    c. Descriptiva e inferencial

    d. Descriptiva y diferencial.

    Conjunto de datos cuya finalidad es suministrar informacin acerca de una poblacin en

    donde todos los elementos deben tener todas las caractersticas de la poblacin.

    a. Poblacin

    b. Muestra

    c. Estadstica

    d. Datos

    3.4. Tipo de variable al que se le puede asignar un valor numrico:

    a. Numricas o cuantitativas

    b. Categricas o cualitativas

    c. Numrica contina

    d. Cabalstica

    3.5 As se le llama al estudio que se hace de una poblacin por medios de muestras

    representativas que posea todas las caractersticas de una poblacin:

    a. Muestra

    b. Muestreo

    c. Experimento

    d. Organizar

  • Probabilidad y Estadstica

    Ing. Miroslava G.Reyes Prada Pgina 11

    4. Busque en la web o en la prensa una noticia informativa donde se involucre a la

    estadstica, anxela, analice y determine:

    a) La poblacin de estudio.

    b) La muestra elegida.

    c) Las variables involucradas.

    5. A continuacin se le proporciona una serie de variables estadsticas, clasifique cada

    una como nominal, ordinal, discreta o continua segn corresponda.

    a) Peso.

    b) Promedio escolar.

    c) Estado civil.

    d) Semestre que cursa.

    e) Mes de nacimiento.

    f) Nmero de hermanos por alumno.

    g) Deporte favorito.

    h) Tiempo invertido al da en el chat.

    6. Elabora dos ejemplos en donde se desglose la Estadstica descriptiva y la Estadstica

    inferencial

    Webgrafia

    http://sameens.dia.uned.es/Trabajos7/Trabajos_Publicos/Trab_3/Escribano_Duenas_3/r

    azon.htm

    http://calcsc.blogspot.com/2012/01/taller-generalidades-de-la-

    estadistica.html#!/2012/01/taller-generalidades-de-la-estadistica.html

    http://www.hacienda.go.cr/cifh/sidovih/cursos/material_de_apoyo-F-C-

    CIFH/1MaterialdeapoyocursosCIFH/4Estad%C3%ADsticaBasica/Probabilidadyestadist

    ica.pdf