Ejercicio Clase Tema 6 (2015-2016)
description
Transcript of Ejercicio Clase Tema 6 (2015-2016)
La entidad financiera VICHO dispone de una base de datos con gran cantidad de información relacionada con sus clientes. De todos los clientes de la empresa se ha procedido a la extracción de una muestra aleatoria de tamaño 12 a partir de la cual se pretende llevar a cabo una serie de análisis. Se sabe que dentro de los planes de la entidad se encuentra la introducción en el mercado de un nuevo producto financiero, VICHITO, (un plan de pensiones asociado a un fondo de inversión). Antes de su lanzamiento definitivo se ha llevado a cabo un estudio de mercado consistente en preguntar a los 12 individuos que componen la muestra por su intención de adquirir ese producto financiero, entre otros aspectos. La tabla siguiente contiene información sobre los 12 clientes que componen la muestra.
Identificacióndel cliente
Edad (años)
Saldo (miles de
euros)Posee Seguro
Intención de adquirir
el plan de pensiones
123456789
101112
15-34más de
5135-5015-3435-50
más de 51
35-5015-34
más de 51
15-3435-50
más de 51
678801290958128561092
NoSíSíNoSíNoNoSíSíNoNoSí
NoNoSíSíSíSíNoNoSíNoSíSí
Con la información que se suministra:1. Realice la tabulación simple, el cálculo de los descriptivos de la muestra e indique con qué tipo de
escala básica se ha medido cada variable.2. ¿Entre qué valores oscila, para un nivel de confianza del 95%, el saldo medio de los clientes de la
entidad?, ¿y el porcentaje de clientes dispuestos a adoptar el nuevo producto financiero?3. Un estudio de rentabilidad y de gestión de cartera efectuado sobre el nuevo producto financiero revela
la conveniencia de lanzarlo al mercado únicamente si un porcentaje del 35% de la población (clientes de la entidad) está dispuesto a adoptarlo. Teniendo en cuenta esa información, ¿qué decisión debería tomar la empresa en cuanto al lanzamiento de ese producto? Haga los cálculos para un nivel de confianza del 95%.
Respuesta. En las tabla 1, 2, 3 y 4 se presentan, respectivamente, las distribuciones de frecuencias de cada una de las variables del estudio: la edad, el saldo, la posesión de seguro y la intención de adquirir el plan de pensiones. En esto consiste la tabulación simple.
La tabla 1 nos muestra en la columna frecuencia el número de individuos que han respondido a cada categoría de la variable edad. De los 12 individuos encuestados 4 tienen una edad entre 15 y 34 años, otros 4 están en el intervalo de 35 a 50 y finalmente, los 4 restantes tienen más de 51 años. El resultado es que hay el mismo número de casos en cada categoría de respuesta de la variable y, por lo tanto, en la columna siguiente el porcentaje de casos en cada categoría con respecto al total de la muestra es el mismo el 33,3%.
De la misma manera que se ha comentado el contenido de la tabla 1, el analista interpretará los resultados de las tablas 2, 3 y 4. Así, por ejemplo, si atendemos a la tabla 4 podemos decir que en la muestra el porcentaje de individuos que manifiestan intención de adquirir el plan de pensiones es el 58,3%, es decir, 7 individuos de un total de 12.
El siguiente paso es calcular los estadísticos descriptivos de cada una de las variables. El cálculo de los estadísticos descriptivos está sujeto al tipo de escala básico con el que se ha medido la variable. En el ejemplo que nos ocupa, la edad está medida por tramos en una escala ordinal, la posesión de seguro y la intención de adquirir el plan de pensiones son variables dicotómicas, sólo toman los valores 0 ó 1, está medidas, pues, en
escalas nominales. Finalmente el saldo está medido en una escala continua, de proporciones o ratios. Los resultados del cálculo de descriptivos aparecen en la tabla 5.
La moda y las frecuencias relativas las proporcionan las tablas de distribución de frecuencias, pero la media y la desviación típica de la variable saldo han de calcularse de la forma que se indica a continuación:
8333,4712
9592908580781221086212
11
i
n
in
Xin
XiX
S2=∑i=1
n ( Xi−X̄ )2
(n−1)=
2∗(6−47 , 8333 )2+( 8−47 , 8333)2+⋯+(95−47 , 8333 )2
11=1669 ,605
S=√S2=√1669 ,605=40 ,8608
Por otra parte, tenemos el caso particular de las variables dicotómicas, aquellas que sólo toman los valores 0 y 1. En esta base de datos tenemos dos variables de este tipo la posesión de seguro y la intención de adquirir el plan de pensiones, para ellas aun siendo variables no métricas si tiene sentido el cálculo de la media, que no es otra
TABLA 2SALDO
Frecuencia Porcentaje Porcentaje acumulado
6,00 2 16,7 16,78,00 1 8,3 25,010,00 1 8,3 33,312,00 2 16,7 50,078,00 1 8,3 58,380,00 1 8,3 66,785,00 1 8,3 75,090,00 1 8,3 83,392,00 1 8,3 91,795,00 1 8,3 100,0Total 12 100,0
Tabla 3POSESIÓN DE SEGUROFrecuenci
a Porcentaje Porcentajeacumulado
no 6 50,0 50,0si 6 50,0 100,0Total 12 100,0
Tabla 4INTENCIÓN DE ADQUIRIRI EL PLAN DE PENSIONES
Frecuencia Porcentaje Porcentaje acumulado
no 5 41,7 41,7si 7 58,3 100,0Total 12 100,0
TABLA 5 Medidas de resumenTipo de escala básica Medidas de tendencia central Medidas de dispersión
No métricasEscalas nominales y ordinales
EDAD, SEGURO, INTENCIÓN
ModaEDAD: los tres valores.SEGURO: Si (50%) y No (50%)INTENCIÓN: Si (58,3%)
Frecuencia de cada valorVéanse Tablas 1, 3 y 4
MétricasEscalas de intervalos y de razón
SALDOMedia: 47,8333 Desviación típica: 39,1212
DicotómicasSEGURO e INTENCIÓN
Proporción (media)SEGURO: 0,5INTENCIÓN: 0,583
Desviación típicaSEGURO: 0,5INTENCIÓN: 0,492
cosa que la proporción, y de la desviación típica. A continuación, a modo de ejemplo, realizamos los cálculos para la variable intención de adquirir el plan (para la posesión de seguro se haría de la misma forma).
El valor de la proporción de individuos de la muestra que tienen intención de adquirir el plan de seguros aparece en la tabla de frecuencias de la variable y es 58,3%. De todos modos aplicaremos las fórmulas al caso:
417,0583,011583,0127 p qp ; ; 492,0243,0243,0417,0583,02 qp SqpS ;
Sin embargo, en una investigación de mercados el interés principal es extrapolar los resultados de la muestra a la población para poder tomar decisiones. Esto supone aplicar la inferencia estadística, concretamente calcular los intervalos de confianza, tal y como nos piden en el punto 2 del enunciado, para las variables saldo y proporción de clientes que tienen intención de adquirir el plan de pensiones.
Para el saldo, comenzamos por calcular el error estándar de la distribución de muestreo:
S X̄=√S2
n=√1669 , 605
12=11 , 7955
Con este dato, el intervalo de confianza para la media del Saldo es:
( X±t(n−1) S X̄ )=( 47 , 8333±2,2∗11 ,7955)=(47 ,8333±25 ,95)=(21 , 8833 , 73 , 7833)
Empleamos el valor de las tablas de la distribución t porque el tamaño de la muestra es inferior a 30 y no conocemos el valor de la desviación típica de la variable en la población. Como se desea para el intervalo una confianza del 95%, el valor de t11 es 2,2. El resultado obtenido significa que la verdadera media del saldo de todos los clientes de la entidad bancaria tiene un 95% de probabilidades de situarse entre 21,8833 y 73,7833 miles de euros.
Realizamos los cálculos para el porcentaje de individuos en la muestra que tienen intención de adquirir el plan de pensiones. El valor de esta proporción aparece en la tabla de frecuencias de la variable y es 58,3%. De todos modos aplicaremos las fórmulas al caso:
142,012243,0
12417,0583,0 n
qpn
SSp
El intervalo de confianza para la proporción de individuos que tienen intención de adquirir el plan de pensiones es:
( p±t (n−1)Sp )=(0 , 583±2,2∗0 ,142)=(0 ,583±0 ,3124 )=(0 ,2706 , 0 , 8954 )
El resultado obtenido significa que la verdadera proporción de todos los clientes de la entidad bancaria que tienen intención de adquirir el plan de pensiones tiene un 95% de probabilidades de situarse entre el 27,06% y el 89,54%. Otra vez, y ahora con mayor claridad que en el caso del saldo, se aprecia la poca precisión de los resultados. Realmente el rango de valores que comprende el intervalo es tan amplio que no ayuda mucho en la toma de decisiones. La muestra es demasiado pequeña.
Para dar respuesta a la pregunta tres planteamos el siguiente contraste de hipótesis.
H0 : Π ≤ 0.35HA : Π >0.35
t= p−Π√Π (1−Π )/n
= 0,583−0,35√0,35∗0.65/12
=1,6922
Es un contraste unilateral, pues la hipótesis alternativa solo tiene una dirección.El valor crítico es el de una distribución t de Student con 11 grados de libertad, que para el nivel de confianza exigido en el test de una cola toma un valor de 1,79. La región crítica abarca el intervalo (1.79, ∞). Como el valor del estadístico calculado (1,6922) no cae dentro de la región crítica, la conclusión es que no podemos rechazar la hipótesis nula. No hay seguridad de que más del 35% de los clientes esté dispuesto a adoptar el nuevo producto, luego la decisión sería no lanzar el nuevo plan de pensiones.
Valores críticos para un nivel de confianza del 95%
a) Función normal tipificadaTest de una cola: N(0,1) =1’64.Test de dos colas: N(0,1) =1’96.
b) Función t de StudentTest de una cola: t5 =2’01; t7 =1’89; t8 = 1’86; t9 = 1’83; t10 = 1’81; t11 = 1’79; t99 = 1’64.Test de dos colas: t5 = 2’57; t7 = 2’36; t8 = 2’31; t9 = 2’26; t10 = 2’23; t11= 2’20; t99= 1’96.