Naturaleza de la estadística1

14
Propósito del estudio de la estadística. Es conocido por investigadores, científicos, profesionistas y estudiantes principalmente, aunque un sector de la población también lo considera: “El lenguaje de las ciencias es las matemáticas” Gauss C. F. Una de las áreas de las matemáticas sobre las que en ocasiones los investigadores basan parte de los resultados obtenidos en su observación es la estadística, en la que en este curso nos adentraremos. Para algunos ha significado su herramienta con la cual le dan el valor del rigor científico, sin considerar que gran parte de esta área esta basada en una indescartable realidad: los errores teóricos y los que el investigador pueda cometer al tomar una mala muestra para sus observaciones. La naturaleza de la estadística esta basada en la toma de observación, sin embargo la elección de los elementos que van a representar su análisis no tienen, en la mayoría de veces, una metodología basado sobre la teoría generada en la propia estadística, la mayoría de ocasiones la elección de los elementos que intervienen en el estudio estadístico es muy subjetivo, ya que depende de la “experiencia generada por el investigados”, la cual en algunas ocasiones puede arrojar resultados confiables, pero no en todos. Por ello algunos investigadores tratan de descartar su uso y utilizar otro tipo de experimentos que eviten el uso de estadística. Sin embargo, pese a su naturaleza en ocasiones puede ser la herramienta con que se comunicaran los investigadores de diversa índole, utilizando en diversas áreas tales como la sociología, la mercadotecnia, la psicología, la biología, etc... La historia de la estadística La representación de información ha tenido desde siempre un factor importante en la forma de la vida social del hombre, así podemos analizar que el hombre primitivo utilizaba símbolos para representar la información que obtenía, era clásico representar mediante símbolos la información del número de objetos que tenía o de los miembros de los primeros grupos sociales. Es conocido por todos los hallazgos realizados por la antropología, en la que se encontraba vestigios de símbolos utilizados para representar su vida social mediante símbolos [1,2]. Se considera que hacia el año 3000 a.C los babilónicos usaban tabillas de arcilla en las cuales recopilaban datos tales como la producción agrícola y actividades mercantiles, como el trueque. Se conoce que el rey de Asiria, Sargón fundó una biblioteca en Nívine que luego fue ampliada y organizada bajo el reinado de Assurbanipal, la documentación era colectada precisamente en tablas de arcilla con su escritura cuneiforme, además de que la única información que se guardaba en ella era datos históricos, religiosos, datos de medicina, astronomía e importantes datos estadísticos. ESTADISTICAS I MCE DAVID GARCIA CASTAÑEDA

Transcript of Naturaleza de la estadística1

Propósito del estudio de la estadística.

Es conocido por investigadores, científicos, profesionistas y estudiantes principalmente, aunque

un sector de la población también lo considera: “El lenguaje de las ciencias es las

matemáticas” Gauss C. F.

Una de las áreas de las matemáticas sobre las que en ocasiones los investigadores basan parte

de los resultados obtenidos en su observación es la estadística, en la que en este curso nos

adentraremos. Para algunos ha significado su herramienta con la cual le dan el valor del rigor

científico, sin considerar que gran parte de esta área esta basada en una indescartable realidad:

los errores teóricos y los que el investigador pueda cometer al tomar una mala muestra para sus

observaciones.

La naturaleza de la estadística esta basada en la toma de observación, sin embargo la elección

de los elementos que van a representar su análisis no tienen, en la mayoría de veces, una

metodología basado sobre la teoría generada en la propia estadística, la mayoría de ocasiones la

elección de los elementos que intervienen en el estudio estadístico es muy subjetivo, ya que

depende de la “experiencia generada por el investigados”, la cual en algunas ocasiones puede

arrojar resultados confiables, pero no en todos. Por ello algunos investigadores tratan de

descartar su uso y utilizar otro tipo de experimentos que eviten el uso de estadística.

Sin embargo, pese a su naturaleza en ocasiones puede ser la herramienta con que se

comunicaran los investigadores de diversa índole, utilizando en diversas áreas tales como la

sociología, la mercadotecnia, la psicología, la biología, etc...

La historia de la estadística

La representación de información ha tenido desde siempre un factor importante en la forma de

la vida social del hombre, así podemos analizar que el hombre primitivo utilizaba símbolos

para representar la información que obtenía, era clásico representar mediante símbolos la

información del número de objetos que tenía o de los miembros de los primeros grupos

sociales. Es conocido por todos los hallazgos realizados por la antropología, en la que se

encontraba vestigios de símbolos utilizados para representar su vida social mediante símbolos

[1,2].

Se considera que hacia el año 3000 a.C los babilónicos usaban tabillas de arcilla en las

cuales recopilaban datos tales como la producción agrícola y actividades mercantiles, como el

trueque. Se conoce que el rey de Asiria, Sargón fundó una biblioteca en Nívine que luego fue

ampliada y organizada bajo el reinado de Assurbanipal, la documentación era colectada

precisamente en tablas de arcilla con su escritura cuneiforme, además de que la única

información que se guardaba en ella era datos históricos, religiosos, datos de medicina,

astronomía e importantes datos estadísticos.

ESTADISTICAS I

MCE DAVID GARCIA CASTAÑEDA

Otra de las civilizaciones antiguas que dieron indicios del manejo del datos poblacional fueron

los egipcios, quienes hacia el siglo XXI a.C , antes de la construcción de pirámides ya

contaban con información a manera de censo sobre la renta del país y de la misma población a

manera de censos, existen documentos que indican que los egipcios guardaban un cierto respeto

a las cuentas por lo que tenían inclusive una diosa [3].

Así mismo también se puede observar en sus libros bíblicos trabajos de estadística como lo

son los libros de Números y Crónicas, el libro de los números forma parte del libro del

Pentateuco, en el primer libro se encuentran dos censos sobre poblaciones de Israel, en el se

muestra un censo realizado por Moisés después de la salida de Egipto, una traducción dice:

“Censo de las tribus: El día primero del segundo año después de la salida de Egipto, habló

Jehová a Moisés en el desierto de Sinaí en el tabernáculo de la reunión, diciendo: Haz un censo

general de toda la asamblea de los hijos de Israel, por familias y por linajes, describiendo por

cabezas los nombres de todos los varones aptos para el servicio de armas en Israel...” ; en libro

Crónicas se narra una especie conteo sobre los bienes materiales de las tribus judías. [4]

La civilización China muestra registros sobre el uso de estadística, realizada en los censos,

aproximadamente en el año 2000 a.C [5]. Confucio, en uno de sus clásicos "Shu-King" escrito

hacia el año 550 a.C., nos narra cómo el Rey Yao entre el año 2238 (algunos documentos

mantienen diferencias sobre la parte histórica a 3000 a.C) mandó hacer una estadística agrícola,

industrial y comercial [6] .

Otra de las civilizaciones antiguas que llevaban a cabo censos, se encuentra la civilización

Griega, hacia 594 a.C. utilizada para cobrar impuestos [7]. Apolonio de Perga, matemático

griego, nacido en Perga, Panfilia (hoy Murtina en Turquía) llamado el “Gran Geómetra”, que

vivió durante los últimos años del siglo III y principios del siglo II a.C., conocido por sus

aportaciones a la geometría, principalmente sobre las cónicas[8], escribió además sobre

cálculos aritméticos y estadísticos [9].

Los romanos tendrían un lugar importante dentro de la historia de la estadística, ya que es

precisamente la herencia del uso que se le dio ha técnicas del estado lo que en un futuro daría

nombre a la estadística. El primer gobierno romano recopilo a través de censos datos sobre la

población que dominaban o gobernaban, la información registrada generalmente era los

nacimientos, las defunciones, los censos poblacionales, cosecha, impuestos, entre otras.

Precisamente es a partir de este tipo de concepción el porque se les ha dado el origen al nombre

de estadística, primitivamente del vocablo “estado”. Su origen ligado al estado no fue exclusivo

solo a la sociedad romana es por ello que su origen etimológico esta ligado a este tipo de

actividad [10]. La tradición de los censos se hizo primordial dentro del gobierno romano,

Servio Tulio (578–534 a.C), el sexto monarca de Roma giró instrucciones para que se

realizaran censos cada 5 años, con la finalidad de planificar los impuestos, alistamiento militar,

entre otros [10, 11]. Los censos se convirtieron en una forma tradicional de asegurar

información sobre sus poblaciones, recordemos que existieron momentos en los que se puede

ver al pueblo romano como uno de los pueblos con mayor tradición, para el siglo IV a III a.C.

Claudio Apio, llamado el ciego ejerce el cargo de censor desde 312 al 307 a.C. [12].

Recordemos que en el nuevo testamento, de la colección de los libros bíblicos de las religiones

cristianas [13] se menciona que José y su esposa la Virgen María viajaban a Belén con la

finalidad de censarse cuando nació Jesús, siendo la época del emperador romano Augusto

[14]. (Un motor de búsqueda sobre libros bíblicos muestra que en varias ocasiones se

mencionaban los censos, en alrededor de 60 frases, lo que hace pensar que el pueblo Judío, los

llevaba a cabo [15]).

En la época medieval el uso de los censos tuvieron gran importancia, sobre todo para la

monarquía que apoyaba a la iglesia católica. Dentro de los principales reyes que ayudaron a

realizar un estudio minucia de los bienes de la iglesia entre los años 758 a 762 se encuentran

Pepino el Breve y su hijo, sucesor en el trono, Carlomagno [16,17].

El origen de los catastros mantiene una estrecha relación con los censos, como se puede

apreciar en el libro de Domesday, considerada esta aportación del Rey Guillermo I de

Inglaterra en en 1066 d.C después de haber vencido a los sajones en la Batalla de Hastings,

tuvo tal éxito el censo reportado en el libro que hasta le mínimo detalle fue encuestado

terminándose en el año 1086 [18], aunque sin embargo puede apreciarse que existen ya indicios

de la fortaleza de los censos, por ejemplo el jurisconsulto romano Marcelo mencionaba: "El

senado estableció que el censo y los documentos públicos tienen más fuerza que los testigos"

[19].

Dos años después de que Guillermo triunfara en la batalla Batalla de Hastings, aparece el

primer estudio estadístico sobre la población titulado Observations on the London Bills of

Mortality la cual contenía datos de defunción de la población de Londres [20].

Felipe II, rey de España, e hizo levantar un censo en el Nuevo Mundo de sus dominios, en el

año de 1576.

En varias ocasiones como actualmente se observa el uso de censos puede ser la victoria de

algunos y el fracaso de otros, en otros mas vemos casos en los que los censos que por un lado

pudieron favorecer a unos por otro los desfavorecería a los mismos. En América Latina, en la

época de los monarcas Borbones Carlos III y Carlos IV, movidos por un impulso de control

burocrático y administrativo, procedieron al levantamiento de censos de población en los

virreinatos principalmente en Brasil y Paraguay [21], aunque los censos en este sentido les

favorecieron, no siempre fue así, por ejemplo el mismo Carlos III, alrededor de 1776 debido a

su posición despótica en Nápoles, tuvo que pactar con la iglesia la elaboración de un censo de

sus bienes porque ésta se valió de una erupción del Vesubio, volcán de Italia, para demostrar

que la medida no era del agrado de Dios.

A mediados del siglo XVII se iniciaba a gestar el termino con el que hoy conocemos a la

“estadística”, la nación germana hacia acto de presencia, con Kollegen Hermann Conring [22] a

quien se le atribuye el intentar describir los hechos del estado. Él mejora y perfecciona la

sistematización de la información contenida en datos. Sin embargo, es su seguidor Godofredo

Achenwall [23] quien le da el nombre de “estadística”, cuyo origen etimológico deriva de la

palabra estado en alemán. Aunque la acepción de este término ya se había formulado, pero si

una formalización, en Italia, de status, que significa situación, posición o estado. Compatible

además con su acepción en griego statera cuyo significado conduce a algunas actividades de

medida realizado por el estado como lo es balanza o medida.

A continuación se muestra una tabla que describe de manera cronológica algunos hechos de la

estadística a lo glargo de su historia, aunque se omiten algunos datos, intenta servir de

referencia a los hechos mas importantes dentro de la estadística

Desarrollo Cronológico de la estadística

Época Contribuidor Contribución

Grecia antigua Filósofos Ideas sobre el análisis no cualitativo

Siglo XVII Graunt, Petty

Pascal, Berno

Estudio de la estadística vital

Estudio probabilistico acerca del cambio del juego

Siglo XVII D´Moire, Laplace, Gauss

Curva normal, regresión aplicada sobre estudios de astronomía

Siglo XIX Quetelet

Galton

Astrónomo que primero aplicó el análisis estadístico a biología humana.

Estudia la variación genética en humanos (usando regresión y correlación lineal)

Siglo XX

Pearsons

Gossett (Student)

Fisher

Estudio de la selección natural usando correlación, formando primero departamentos académicos de estadística, Journal de Biométrica, ayudados de el análisis de Chi Cuadrada

Estudio de procesos, alerta la comunidad estadística acerca de problemas con pequeñas muestras, presentando la prueba t´student

Evolución biologica presentada- presentación de ANOVA , resalta la importancia del diseño experimental.

Siglo XX Wilcoxon

Kruskal Wallis

Spearman

Bioquímico estudió pesticidas, equivalente no parámetrico de dos pruebas.

Economista que presentó el equivalente no parámetrico de ANOVA

Psicólogo que presenta el equivalente no parámetrico del coeficiente de

Kendall

Tukey

Dunnett

Keuls

correlación

Estadista que presenta otro equivalente no parámetrico del coeficiente de correlación.

Estadista que presenta el procedimiento de la comparación múltiple.

Bioquímico que estudia los pesticidas, presenta un procedimiento de comparación múltiple para grupos control.

Agrónomo que presenta una procedimiento de comparación múltiple

Prueba muchas ventajas sobre cálculos a mano y en calculadora, estimula el fondo de la investigación mediante nuevas técnicas.

La estadística tuvo que emigrar a nuevas formas de pensamiento, el cambio de las matemáticas,

a través de los métodos descriptivos e inferenciales favoreciendo las tareas de los gobiernos, a

quienes favoreció por momentos a lo largo de la historia, una vez que resultó imprescindible

en áreas como la sociología, también se gestó la posibilidad de aplicaciones en otras áreas a

raíz con la asociación con el área biológica (con los trabajos de Mendel y de su primo Galton ),

cobrando así gran importancia en otras áreas como la física (con los trabajos de personajes

Maxwell, Boltzmann, Fermi, Dirac, Bose, Einstein, Schödinger, entre otros), área en la que al

querer explicar la termodinámica de las partículas y la necesidad de hacer uso la mecánica

cuántica formó lo que ahora se conoce como mecánica estadística (estadística de Bose-Einstein

y la estadística de Fermi-Dirac, la primera para partículas de espín entero como los fotones

entre otros y las segunda para las partículas de espín fraccionarios como los electrones).

La estadística que trataremos será una estadística formal que no esta ligada a un área particular,

así como en este momento no se puede decir que las matemáticas son exclusivas de una sola

área, la visión sobre la que se sostienen es en una interacción con el resto de las demás áreas

cobrando importancia en su justa dimensión en el momento de su marco práctico.

Iniciaremos con la concepción de los conceptos propios de la estadística descriptiva, nos

internaremos en la probabilidad, como el ingrediente primordial en las distribuciones

estadísticas mas significativas, analizaremos la estadística parámetrica, haremos uso de la

estadística no parámetrica y por último ejemplificaremos con el uso de esta importante rama de

las matemáticas.

DOS RAMAS DE LA ESTADÍSTICA

INTRODUCCIÓN

La estadística tiene por objeto el desarrollo de técnicas para el conocimiento numérico de un

conjunto de datos empíricos (recogidos mediante experimentos o encuestas).

Caracteres y variables: Caracteres son los aspectos que deseamos estudiar. Cada carácter

puede tomar distintos valores o modalidades. Una variable estadística recorre todos los valores

de un cierto carácter.

Clasificación de las variables estadísticas:

Cualitativas: No toman valores numéricos

Cuantitativas discretas: Toman valores numéricos aislados

Cuantitativas continuas: Pueden tomar todos los valores de un intervalo.

Población: Es el conjunto de todos los elementos cuyo conocimiento nos interesa y serán

objeto de nuestro estudio.

Muestra: Es un subconjunto, extraído de la población, cuyo estudio sirve para inferir

características de toda la población.

Individuo: Es cada uno de los elementos que forman la población o la muestra.

ESTADÍSTICA DESCRIPTIVA TABLAS DE FRECUENCIAS

Las tablas de frecuencias sirven para ordenar y organizar los datos estadísticos. Con ellas, una

masa amorfa de datos pasa a ser una colección ordenada y perfectamente inteligible.

Con los datos se construye la tabla de frecuencias:

- En la primera columna, la variable xi, con todos sus posibles valores

- En la segunda columna, la correspondiente frecuencia, fi: número de veces

que aparece cada valor.

FRECUENCIAS RELATIVAS

Cuando se desea comparar varias distribuciones similares con distinto número de elementos, se

debe recurrir a las frecuencias relativas. Estas vienen dadas en “tanto por uno” (fr) o en

“tantos por ciento” (%). Si N es el número de individuos:

RAMAS DE LA ESTADÍSTICA

La estadística descriptiva:

Trata de “describir” y analizar algunos caracteres de los individuos de un grupo dado, sin extraer conclusiones para un grupo mayor.

Para este estudio, se siguen estos pasos:

- Selección de caracteres que interese estudiar.

- Análisis de cada carácter: diseño de la encuesta o del experimento y recogida de

datos.

- Clasificación y organización de los resultados en tablas de frecuencias.

- Elaboración de gráficos, si conviene, para divulgarlos a un público amplio (no experto).

- Obtención de parámetros: valores numéricos que resumen la información obtenida

La estadística inferencial: Trabaja

con muestras y pretende, a partir de ellas, “inferir”

características de toda la población. Es decir, se pretende tomar como generales

propiedades que solo se han verificado para casos particulares. En ese proceso hay que

operar con mucha cautela: ¿Cómo se elige la muestra?, ¿Qué grado de confianza se puede

tener en el resultado obtenido?

FRECUENCIAS ACUMULADAS

En una distribución de frecuencias, se llama frecuencia acumulada, Fi, correspondiente al

valor i-ésimo, xi, a la suma de la frecuencia de ese valor con todas las anteriores: Fi = f1 + f2 +

.... + fi .

TABLAS CON DATOS AGRUPADOS

Cuando en una distribución estadística el número de valores que toma la variable es muy

grande, conviene elaborar una tabla de frecuencias agrupándolos en intervalos. Para ello:

- Se localizan los valores extremos, a y b, y se halla su diferencia, r = b–a

- Se decide el número de intervalos que se quiere formar, teniendo en cuenta la cantidad de

datos que se poseen. El número de intervalos no debe ser inferior a 6 ni superior a

15.

- Se toma un intervalo, r’, de longitud algo mayor que el recorrido r y que sea múltiplo del

número de intervalos, con objeto de que estos tengan una longitud entera.

- Se forman los intervalos de modo que el extremo inferior del primero sea algo menor que a y

el extremo superior del último sea algo superior a b.

El punto medio de cada intervalo se llama marca de clase. Es el valor que representa a todo el

intervalo para el cálculo de algunos parámetros.

Cuando se elabora una tabla con datos agrupados, se pierde algo de información (pues en ella

se ignora cada valor concreto, que se difumina dentro de un intervalo). A cambio, se gana en

claridad y eficacia.

GRÁFICOS ESTADÍSTICOS

GRAFICOS PARA VARIABLES CUALITATIVAS

Diagrama de barras:

- En el eje de las X : Se representan los valores de la variable

- En el eje de las Y : Se representan los valores de la frecuencia: f, fr ó %

- Se levanta para cada valor de la X una barra que representa la frecuencia de dicho valor.

Si unimos mediante una poligonal los puntos más altos de cada barra obtenemos el polígono de

frecuencias.

Diagrama de sectores: Se dibuja un círculo y los porcentajes correspondientes a cada valor

(Para dibujar los sectores conviene hacerlo a partir del % acumulado, pues facilita el trabajo)

GRAFICOS PARA VARIABLES CUANTITATIVAS DISCRETAS

Diagrama de barras y polígono de frecuencias: Como en las cualitativas

Diagrama de barras acumuladas: Como en los diagramas de barras pero en el eje OY se

toman los valores de las frecuencias acumuladas (Fi, Fri o % acum).

Si unimos mediante una poligonal los puntos más altos de cada barra obtenemos el polígono de

frecuencias acumuladas.

Diagrama de sectores: Como en las cualitativas

GRAFICOS PARA VARIABLES CUANTITATIVAS CONTINUAS

SI TODOS LOS INTERVALOS TIENEN LA MISMA AMPLITUD

Histograma:

- En el eje de las X : Se representan los valores de la variable

- En el eje de las Y : Se representan los valores de la frecuencia: f, fr ó %

- Se levanta para cada valor del intervalo de la X un rectángulo de altura la frecuencia

de dicho intervalo.

Si unimos mediante una poligonal los puntos medios más altos de cada uno de dichos

rectángulos obtenemos el polígono de frecuencias.

Diagrama de barras acumuladas:

- En el eje de las X : Se representan los valores de la variable

- En el eje de las Y : Se representan los valores de la frecuencia acumulada: F, Fr ó %a

- Se levanta para cada valor del intervalo de la X un rectángulo de altura la frecuencia

acumulada de dicho valor.

Si unimos mediante una poligonal las diagonales de dichos rectángulos obtenemos el polígono

de frecuencias acumuladas.

Diagrama de sectores: Como en las cualitativas

SI LOS INTERVALOS NO SON TODOS DE LA MISMA AMPLITUD

En los histogramas, en el eje de las Y, en vez de representar la frecuencia se representa la

densidad de frecuencia : di = fi/ai siendo ai la amplitud de dicho intervalo, para que así la

frecuencia coincida con el área del rectángulo.

Los histogramas acumulados y los diagramas de sectores iguales.

PARÁMETROS DE CENTRALIZACIÓN Y DISPERSIÓN

Las definiciones siguientes sirven tanto para datos aislados como para datos agrupados en

intervalos:

- Si los datos son aislados: los xi son los valores que toma la variable

- Si los datos están agrupados en intervalos: los xi son las marcas de clase.

MODA

Mo = El xi que tenga mayor frecuencia

MEDIA

VARIANZA

DESVIACIÓN TÍPICA

COEFICIENTE DE VARIACIÓN

MEDIDAS DE POSICIÓN PARA DATOS AISLADOS

MEDIANA

Si los individuos de una población están colocados en orden creciente según la variable que

estudiamos, el que ocupa el valor central se llama individuo mediano, y su valor, la mediana:

Me

La mediana, Me, está situada de modo que antes de ella está el 50% de la población y, detrás,

el otro 50%

Si el número de individuos es par, la mediana es el valor medio de los dos centrales.

CUARTILES

Si un lugar de partir la totalidad de los individuos en dos mitades, lo hacemos en cuatro partes

iguales (todas ellas con el mismo número de individuos), los dos nuevos puntos de partición se

llaman cuartiles.

Cuartil inferir: Q1, es un valor de la variable que deja por debajo de él al 25 % de la

población, y por encima, al 75%

Cuartil superior: Q3, deja debajo el 75% y encima el 25%

En realidad existiría uno cuartil, Q2, que coincide con la mediana.

También se suelen llamar, primer cuartil, segundo cuartil = mediana y tercer cuartil.

CENTILES O PERCENTILES

Si partimos la población en 100 partes y señalamos el lugar que deja debajo k de ellas, el valor

de la variable correspondiente a es lugar se designa por pk y se denomina centil k o percentil k.

La mediana es Me = p50 y los cuartiles Q1 = p25, Q75

Si en vez de dividir en 100 partes dividimos sólo en 10, obtenemos los deciles:

D2 = p20

OBTENCIÓN PERCENTILES EN TABLAS DE FRECUENCIAS

Para hallar el percentil pk en una tabla de frecuencias, se obtienen los porcentajes acumulados.

El percentil pk es el valor para el cual la frecuencia acumulada correspondiente supera el k%.

En el caso de que una de ellas coincida con k%, se toma como pk el valor intermedio entre ese

valor de x y el siguiente.

MEDIDAS DE POSICIÓN PARA DATOS AGRUPADOS EN INTERVALOS

INTRODUCCIÓN

En las tablas de frecuencias con datos agrupados en intervalos se ha perdido el valor

concreto de cada individuo. ¿Cómo saber, pues, dónde está la mediana o el percentil 20?

Teniendo en cuenta el convenio: En una tabla de frecuencias con datos agrupados en

intervalos, suponemos que los datos de cada intervalo se reparten uniformemente en él.

Según esto, los valores de las frecuencias acumuladas deben asignarse a los extremos

superiores de los intervalos, pues es al final de cada intervalo cuando se han contabilizado

todos los individuos.

CÁLCULO

Procedemos como si los datos no estuviesen agrupados para hallar el intervalo correspondiente,

y teniendo en cuenta el polígono de porcentajes acumuladas en dicho intervalo:

Aplicando semejanza de triángulos, obtendremos “x”.

DIAGRAMAS DE CAJA Se construyen del siguiente modo:

- La caja abarca el intervalo Q1, Q3 (llamado recorrido intercuartílico) y en ella se señala

expresamente el valor de la Mediana, Me.

- Los bigotes se trazan hasta abarcar la totalidad de los individuos, con la condición de que cada

lado no se alargue más de una vez y media la longitud de la caja.

- Si uno (o más) de los individuos quedara por debajo o por encima de esta longitud, el

correspondiente bigote se dibujará con esa limitación y se añadiría, mediante asterisco, el

individuo en el lugar que le corresponde.

ESTADÍSTICA INFERENCIAL

¿POR QUÉ SE RECURRE A LAS MUESTRAS?

En la práctica, es muy frecuente tener que recurrir a una muestra para inferir datos de la

población por alguno o varios de los siguientes motivos:

1 – La población es excesivamente numerosa.

2 – La población es muy difícil, o imposible, de controlar.

3 – El proceso de medición es destructivo o demasiado caro.

4 – Se desea conocer rápidamente ciertos datos de la población y se tardaría demasiado en

consultar a todos.

TAMAÑO DE LA MUESTRA

Respecto del tamaño, es claro que si la muestra es demasiado pequeña, no podremos extraer

de ella ninguna conclusión que valga la pena. Sin embargo, con muestras aparentemente muy

pequeñas se consiguen estimaciones sorprendentemente buenas en la realidad.

LA MUESTRA HA DE ELEGIRSE AL AZAR

Al sustituir el estudio de la población por el de la muestra, se cometen errores. Pero con ellos

contamos de antemano y pueden controlarse.

Sin embargo, si la muestra está mal elegida (no es representativa), se producen errores

adicionales imprevistos e incontrolados (sesgos).

El proceso mediante el cual se confecciona la muestra se llama muestreo. ¿Cómo debe ser el

muestreo para que nos proporcione una muestra representativa, no sesgada? La muestra ha de

ser elegida al azar, es decir, el muestreo ha de ser aleatorio.

Se dice que un muestreo es aleatorio cuando los individuos de la muestra se eligen al azar, de

modo que todos los individuos de la población tienen la misma probabilidad de ser elegidos.

El muestreo aleatorio es el único que garantiza la fiabilidad de las conclusiones que se

obtengan.

CONCLUSIONES QUE SE OBTIENEN DE UNA MUESTRA

Las valoraciones numéricas se dan mediante intervalos, acompañados de una probabilidad

(nivel de confianza).

Cuanto más amplio es el intervalo, mayor es el nivel de confianza que tendremos. Y, al

contrario, si se quiere afinar mucho en las previsiones reduciendo el intervalo, perderemos

confianza en los resultados.

El tamaño de la muestra también influye. Aumentándolo podremos:

- Mejorar el nivel de confianza manteniendo la amplitud del intervalo.

- Reducir la amplitud del intervalo manteniendo el nivel de confianza.

Referencias

[1] Human Prehistory: An Exhibition, http://users.hol.gr/~dilos/prehis.htm <Fecha de última

consulta: martes, 13 de agosto de 2002>

[2] Historical

Archaeology, http://www.anthro.mankato.msus.edu/archaeology/archaeology/historical_archaeology.ht

ml < Fecha de última consulta: martes, 13 de agosto de 2002>

[3] The History of Ancient

Egypt, http://www.anthro.mankato.msus.edu/prehistory/egypt/hieroglyphics/heiroglyphics.html< Fecha

de última consulta: martes, 13 de agosto de 2002>

[4]El pentateuco, uno de los libros del antiguo testamento,

http://www.corazones.org/diccionario/pentateuco.htm

< Fecha de última consulta: martes, 13 de agosto de 2002>

[5] The history of culture Chinese http://courses.unc.edu/clar047/sg3Ak-Ur3.html <Fecha de consulta:

13 de agosto de 2002>

[6] The books of Shang. http://www.sacred-texts.com/cfu/sbe03/shu04.htm

The Shû King. http://www.sacred-texts.com/cfu/sbe03/shu01.htm

< Fecha de consulta: 13 de agosto de 2002>

[7] Ancient Greek Civilizations

http://www.anthro.mankato.msus.edu/prehistory/aegean/timeline.html

<Fecha de consulta: 13 de agosto de 2002>

[8] Historia de Apolonio de Perga http://www-gap.dcs.st-

and.ac.uk/~history/Mathematicians/Apollonius.html

<Última fecha de consulta: 19 de agosto de 2002>

[9] Historia de Apolonio de

Perga http://personal.redestb.es/javfuetub/biografias/Apolonio.htm

<Última fecha de consulta:19 de agosto de 2002>

[10]

antehistoria http://www.artehistoria.com/frames.htm?http://www.artehistoria.com/historia/pers

onajes/4414.htm

[11] Historia del emperador Servio

Tulio http://www25.brinkster.com/sobreroma/trabajos.asp?ID=38&T=1 <fecha de última

consulta: 22 de agosto de 2002>

[12] Historia del emperador Claudio

Apio http://www.artehistoria.com/frames.htm?http://www.artehistoria.com/historia/contextos/7

73.htm

[13] Nuevo testamento, libros bíblicos. Lucas 2, 1-

14, http://www.ewtn.com/spanish/Maria/Textos_biblicos.htm#Lucas%202,%201-14

[14] Edicto de Augusto http://www.xarxamuseus.com/arqueohispania/articulos/edicto2.jpg

Imperio Romano http://www.fut.es/~fqi_ct03/augus_xx.htm <Documentos consultados el

día 22 de agosto de 2002>

[15] Frases bíblicas con la palabra censo, La Santa Biblia, http://www.ziplink.net/cgi-

bin/cgiwrap/kerygma/b.pl <22 de agosto de 2002>

[16] La historia de los protagonistas, referencia sobre la obra de Carlomagno http://www.ed-

dolmen.com/historia/cd4.htm

[17] Enciclopedia católica, Pepino el

Breve, http://www.enciclopediacatolica.com/p/pipinobreve.htm <23 de agosto de 2002>

[18] The Domesday Book http://www.rpglibrary.org/utils/meddemog/ <26 de agosto 2002>

[19] Los origenes de los

catastros http://www.catastro.gub.uy/Historia/Origenes_de_los_catastros_occi/origenes_de_los

_catastros_occi.htm

<fecha de consulta: 26 de agosto de 2002>

[20] Burilas in London Bills of Mortality http://www.ncl.ac.uk/~nhistory/bills.htm <fecha de

consulta: 26 de agosto de 2002>

[] Estudios bibliométricos antiguos http://www.ub.es/geocrit/sn-37.htm

[21] Reynado de los bornones, http://www.nova.es/~jlb/mad_e103.htm <28 de agosto de 2002>

[22] Virtuelle Bibliothek Rechtsgeschichte http://home.t-

online.de/home/heiko.droste/Conring.htm <29 de agosto de 2002>

[23] Glosario de estadística, FACEV – Faculta de Ciencias Económicas de Victoria, Paulo

Cézar Ribeiro da Silva http://www.ai.com.br/pessoal/indices/2A1.HTM <29 de agosto de

2002>