INSTITUTO POLITÉCNICO NACIONAL -...
Transcript of INSTITUTO POLITÉCNICO NACIONAL -...
INSTITUTO POLITÉCNICO NACIONAL
ESCUELA SUPERIOR DE INGENIERIA MECÁNICA Y ELÉCTRICA UNIDAD ZACATENCO
“MENSAJES SUBLIMINALES EN FORMATO WAV”
TESIS PARA OBTENER EL GRADO DE INGENIERO EN COMUNICACIONES Y ELECTRÓNICA PRESENTA
PÉREZ DÍAZ NOÉ ANDRÉS RODRÍGUEZ CLEMENTE CHRISTOPHER ARMANDO
ASESORES DE TESIS M. en C. JIMÉNEZ HERNÁNDEZ MARIO
Dr. LIZANA PAULIN PABLO ROBERTO
MEXICO, D.F. 2010
AGRADECIMIENTOS
A mis padres y hermana… por haberme brindado su apoyo en todos los aspectos
porque sin ellos esto no hubiera sido posible.
A mi asesor M. en C. Jiménez Hernández Mario… por su conocimiento, paciencia,
consejos, sugerencias y comentarios que me brindo durante la realización de este proyecto de
tesis y sobre todo su amistad.
A mi asesor Dr. Lizana Paulin Pablo Roberto… por su conocimiento y orientación en
clase.
A mis profesores que me impartieron clases en ESIME……porque sus conocimientos
y enseñanzas que me proporcionaron dentro y fuera del aula de clases me ayudaron a
complementar mi formación académica y profesional.
A mis amigos y amigas que convivieron conmigo en ESIME Jessica, Kika, Ricardo,
Roy, Kike, Carvente, Bernardo, Wero, Wiki, Xinoz, Marduk, Chuxo… porque me brindaron
parte de su conocimiento, y por los momentos agradables y no tan agradables que pasamos
durante la carrera. .
A mi compañero de Tesis Christopher…. Por su amistad, conocimiento y sobre todo
por las risas.
A mis amigos Mario, Miguel, Javier, Parra, Gerardo, Ameyalli, Zaida, Sergio,… por su
apoyo y amistad a lo largo de mi vida.
A Jessica… por su apoyo, comprensión, amor y sobre todo por compartir nuestras
vidas.
Noé A. Pérez Díaz
i
Resumen
RESUMEN
El presente trabajo de tesis tratará sobre los mensajes subliminales auditivos en
formato WAV. Se colocaran dos pelotas del mismo color y tamaño frente a la persona que
realizará el experimento, la persona se dispondrá a escuchar durante un lapso de 5 minutos el
mensaje subliminal enmascarado con música ambiental y posteriormente escogerá una de las
dos pelotas. De esta manera verificaremos si el mensaje subliminal tuvo éxito o no.
Cabe mencionar que se crearán dos canciones, una canción contendrá el mensaje
“IZQUIERDA” y la otra el mensaje “DERECHA”. El experimento se realizará a personas de
sexo indistinto de 15 a 50 años. El rango de edades fue determinado de esta manera ya que con
el paso de los años el oído tiende a perder sensibilidad, pudiendo producir posibles datos
erróneos.
ii
Índice
ÍNDICE GENERAL
Resumen. i
Índice general. ii
Índice de figuras. iv
Índice de tablas. v
Antecedentes 1
Introducción. 3
Objetivo General. 5
Objetivos Especificos. 5
Hipotesis. 5
Justificación. 5
1. Mensajes Subliminales 6
1.1. Funcionalidad. 7
1.2. Uso de los Mensajes Subliminales 9
1.3 Tecnicas de Estimulación de un Mensaje Subliminal 10
2. Formatos de Audio Digital. 13
2.1. Conversión Analogico Digital. 13
2.2. Formatos de Audios Digital 21
2.3 Archivo formato WAV 30
3. Software. 35
3.1 Antecedentes Teoricos Matlab 35
3.2 Introduccion al Programa Sublim 39
3.3 Creacion de Mensajes Subliminales con SUBlim 42
3.4 Codigo SUBlim 45
4. Prubeas y Resulatdos. 59
4.1 Prueba 1 Determinacion del Umbral del Mensaje 59
4.2 Prueba 2 Mensaje Subliminal Izquierda/Derecha 62
4.3 Conclusiones 65
iii
Índice
4.4 Trabajo a futuro. 65
Bibliografía. 67
iv
Índice
INDICE DE FIGURAS
1.1. Ejemplo de Enmascaramiento. 11
1.2 Ejemplo de estimulación Empobrecida Directa 11
1.3 Ejemplo de Mensaje Empotrado 12
2.1 Umbral de Audición 13
2.2 El Fonógrafo 15
2.3 Tocadiscos 16
2.4 Proceso de Grabacion Analógico y Digital 17
2.5 Codificacion de una señal de Audio 19
2.6 Cuantificacion codificada en 4 Bits Mediante PCM uniforme 20
2.7 Proceso de conversión Analógico Digital 21
3.1 Comando Plot 36
3.2 Ventana de Variables para la función waveread 38
3.3 Ventana SUBlim 41
3.4 SUBlim – Cargar Archivo 42
3.5 SUBlim – Mensaje de Errir para diferentes frecuencias de muestreo 43
3.6 SUBlim – Amplitud del Mensaje 7.9% conforme al Original 44
3.7 SUBlim – Gurdando el Archivo WAV 44
3.8 Diseno del entorno grafico SUBlim 45
3.9 Entiquetas de los elementos gráficos 46
3.10 Diagrama de Flujo del Software SUBlim 58
4.1 Caracteristicas audifos American Audio Hp 5000 59
4.2 Gráfica de presonas para la delimitación del Umbral 62
4.3 Gráfica Pruebas Mensaje “Derecha” 63
4.4 Gráfica Pruebas Mensaje “Izquierda” 64
4.5 Gráfica efectividad total 65
v
Índice
INDICE DE TABLAS
2.1 Tabla caracteristica de los formatos de audio más usados 22
2.2 Caracteristicas del Archivo WAV 23
2.3 Caracteristica de Real Audio 25
2.4 Caracteristica del Archivo MP3 26
2.5 Comparativa entre WAV, MP3 y RA 26
2.6 Caracteristica del Archivo WMA 27
2.7 Caracteristica del Archivo AIFF 28
2.8 Estructura del Archivo AIFF 28
2.9 Caracteristicas del archivo AAC 29
2.10 Cabecera WAV 31
2.11 Descripcion de la cabecera WAV 31
2.12 Secuencia de Bytes 33
3.1 Operaciones Basicas 35
3.2 Funciones para graficar en 2D 36
3.3 Comandos para procesar Señales 39
4.1 Archivos WAV para la delimitación del umbral 60
4.2 Resulatados de la muestra de Umbral 60
4.3 Número de Personas por porcentaje del Mensaje 61
4.4 Estadísticas (Mensaje derecha) 63
4.5 Estadísticas (Mensaje Izquierda) 64
4.6 Estadísticas del experimento 2 64
1
Antecedentes
ANTECEDENTES
La primera mención registrada acerca de la percepción subliminal fue en los escritos de
Demócrito aproximadamente 400 a.C. Dichos escritos sostenían que mucho de lo perceptible
no es percibido por nosotros. Platón hablo de esto en su escrito Timeo.
Uno de los más grandes filósofos de la antigüedad, “Aristóteles”, explico de una
manera más detallada en qué consistían los umbrales subliminales, esto en su "Perva
Naturalia" hace casi dos mil años. Aristóteles fue el primero en sugerir que los estímulos no
percibidos de manera consciente podrían afectar a los seres humanos en los sueños.
Aquí un fragmento de lo que Aristóteles explicó de su teoría del sueño. "Si los
impulsos que tienen lugar durante el día no son demasiado fuertes y poderosos pasan
inadvertidos debido a impulsos altamente despiertos. Pero mientras dormimos tiene lugar lo
contrario, entonces los pequeños impulsos parecen grandes. Esto aclara lo que pasa en el
sueño. Cuando sólo hay ecos débiles en sus oídos los hombres creen que se trata de algo
relampagueante y extraordinario".
Aristóteles anticipó lo que a principios del siglo XX se conocería como el efecto
Poetzle. Durante la última parte del siglo XIX y principios del XX, Sigmund Freud un médico
y neurólogo austriaco, creador del psicoanálisis investigó nuevos conceptos y teorías sobre la
mente. Freud presentó su idea de que todos tenemos una mente oculta “inconsciente”.
Freud dijo que los sueños tienen tres características principales:
• Protegen el dormir al convertir el material potencialmente perturbador en imágenes
propias del soñar.
• Representan la realización del deseo.
2
Antecedentes
• Los estímulos del sueño son transformados de manera simbólica antes de surgir en el
sueño, sobre todo aquellos estímulos que amenazan al individuo.
En 1917 el Doctor O. Poetzle hizo uno de los primeros descubrimientos
científicamente importantes basados en la idea de Freud sobre la percepción subliminal. El
Doctor Poetzle demostró la estrecha relación entre el estímulo subliminal y la sugestión pos-
hipnótica. Su descubrimiento llamado el Efecto Poetzle indica que la percepción subliminal
evoca sueños y acciones días o semanas después de la percepción original.
El científico formuló su Ley de exclusión alrededor de la observación de que los seres
humanos excluyen de sus sueños los datos o eventos percibidos de manera consciente. Poetzle
concluyó diciendo que el contenido de los sueños estaba compuesto en esencia de información
percibida subliminalmente.
Los discípulos de Poetzle teorizaron que los ojos hacen cerca de cien mil fijaciones
diariamente. De las cuales sólo una pequeña parte de estas fijaciones se experimenta de modo
consciente. De alguna manera el contenido percibido subliminalmente es aislado y
transformado para su reproducción posterior en los sueños.
El estudio de la percepción subliminal volvió a llamar la atención de la población en el
año de 1957. Supuestamente llevando a cabo un experimento en un cine de New Jersey.
3
Introducción
INTRODUCCIÓN
Mediante esta tesis se podrá verificar si los mensajes subliminales auditivos influyen
de alguna manera en la toma de decisiones del ser humano. Para la creación del mensaje
subliminal se desarrollo un software con ayuda de Matlab en el cual contiene el mensaje
“Derecha” enmascarado con sonidos ambientales.
La utilización de los estímulos subliminales hoy en día es innegable, se utilizan para la
mercadotecnia, superación personal o mensajes políticos, pero ¿Realmente producen algún
efecto? ¿Podemos ser manipulados por este tipo de estimulación subliminal?
En la actualidad existen distintas técnicas para crear un mensaje subliminal, a
continuación se mencionan algunas de ellas:
Enmascaramiento
A esta técnica se le llama enmascaramiento ya que son necesarios dos fragmentos de
audio para su creación, un fragmento de audio es el enmascarado el cual contiene el mensaje
subliminal, en el caso de esta Tesis es “Derecha” este fragmento debe ser reducido en
amplitud de tal manera que la persona no lo capte de manera consciente. El otro fragmento es
el enmascarador el cual disfraza al mensaje subliminal, este fragmento puede ser de sonidos de
la naturaleza de tal manera que sean relajantes. Esta técnica será la utilizada para el
experimento.
Estimulación empobrecida directa
Consiste en la exposición directa de un estímulo o mensaje por debajo del umbral de
conciencia (subliminal) y la ejecución posterior de una tarea específica.
4
Introducción
Empotramiento
Este método consiste en insertar el mensaje, este puede ser una palabra o una figura en
un contexto más complejo, puede ser una fotografía de manera que no pueda percibirse de
manera consciente. Por lo que el mensaje se esconde en el material que se presenta a las
personas. Esta técnica es muy empleada en el campo de la publicidad.
Estimulación Dicótica
Esta técnica consiste en la presentación simultánea de los estímulos (auditivos o
visuales) subliminal y supraliminal por canales (auditivos o visuales) diferentes.
5
Introducción
OBJETIVO GENERAL Establecer los parámetros (Amplitud, tiempo, mensaje) para el desarrollo de un mensaje subliminal auditivo eficaz.
OBJETIVOS ESPECÍFICOS
• Desarrollar e implementar un software orientado a crear un mensaje subliminal.
• Mediante el mensaje subliminal estimular a la persona a realizar una actividad en específico, en el caso de esta tesis, inducir a la persona a escoger la pelota del lado correcto, ya sea izquierda o derecha, según el mensaje que haya sido implantado.
• Verificar la efectividad del mensaje subliminal creado.
HIPÓTESIS
Mediante la creación de mensajes subliminales auditivos es posible introducir mensajes
audibles al subconsciente sin ser percatados por el consciente, afectando las decisiones que se
tomen.
JUSTIFICACIÓN
El uso de mensajes subliminales cada día toma más fuerza, induciendo a la población a
realizar acciones mediante el subconsciente, como claro ejemplo a esto tenemos el
consumismo, induciéndonos a comprar productos de marcas especificas. La pretensión de esta
tesis es dar a conocer los parámetros de un mensaje subliminal, así como la efectividad de
estos en el ser humano.
6
Capítulo 1 MENSAJES SUBLIMINALES
1. MENSAJES SUBLIMINALES
Como indica la palabra subliminal, que etimológicamente significa sub-bajo, limen-
umbral (limite), es decir, debajo del umbral, tratándose de un mensaje destinado a llegar al
oyente justo por debajo del umbral de conciencia.
Nuestra mente consta de "el consciente" y de "el subconsciente". El consciente maneja
la lógica y el lenguaje, y cuando capta algún estímulo la persona puede aceptarlo o rechazarlo.
El inconsciente recibe información que más tarde utiliza sin necesidad de "pensar". Al
aprender algo estamos realizando un acto consciente, pero más tarde se vuelve inconsciente.
Un ejemplo es el acto de conducir, una vez que aprendes no tienes que recordar cada paso para
llevarlo a cabo (mover el volante, apretar el acelerador o el freno...).
Se denominan mensajes subliminales aquellos que, aunque no son captados
conscientemente, se supone inciden en nuestros pensamientos, emociones o conductas. Puede
ser por ejemplo en nuestro caso inaudible para la mente consciente pero audible para la mente
inconsciente [11]. Este tipo de mensaje ha sido utilizado en diversos ámbitos con fines
publicitarios, políticos, cinematográficos e incluso terapéuticos. La gran utilización de este
tipo de mensajes es incuestionable pero, ¿realmente son efectivos?
Un claro ejemplo es colocar a una persona frente a un gran letrero de un centro
comercial del cual dice “compre”. Ella puede utilizar el pensamiento racional y resistir aquella
sugerencia porque esta frente al letrero, y lo está leyendo conscientemente, teniendo la opción
de seguirlo o no. En el caso del mensaje subliminal el mensaje penetra directamente al
subconsciente, en este caso se piensa en impulso de comprar o de hacer lo que el mensaje
ordena, viene desde nuestro interior, pensando en que el deseo de comprar es voluntario y no
inducido [12].
Cuando recibimos un mensaje o algún estimulo de el exterior, nuestro cerebro lo
analiza a través de la inteligencia, juzgando sobre su contenido. Si es aceptado por nuestro
consciente, actuamos de manera análogo a una computadora, primero decodificamos el
mensaje (tratamos de entenderlo), para después archivarlo en nuestra memoria y utilizarlo más
7
Capítulo 1 MENSAJES SUBLIMINALES
adelante cuando sea requerido (Memoria). En cambio un mensaje subliminal, ataca
traicioneramente al receptor, pues esquiva las barreras de la sección inteligente, entrando de
manera oculta en la cual no nos percatamos. Un claro ejemplo es escuchar un fragmento
hablado, nuestro cerebro procesa la información que es escuchada conscientemente, si en dado
momento se propone “el cielo es de color verde”, es probable que esta información sea
detenida y rechazada antes de ingresar a la memoria, debido a que sabemos que el cielo no es
de color verde. En caso contrario si la información llega por debajo de lo audible, el
mecanismo de defensa queda desarmado y toda la información se inscribirá en el
subconsciente [13].
1.1 Funcionalidad
El uso de los mensajes subliminales fue popularizado en un libro en el año de 1957,
titulado The Hidden Persuaders (Los persuasores ocultos), de Vance Packard. Este libro
detallaba un estudio llevado a cabo en el cine Fort Lee un barrio de New Jersey esto en
Estados Unidos, en el cual se proyectaba la película Picnic. Supuestamente un sociólogo
llamado James Vicary había llevado a cabo el experimento donde inserto con ayuda de un
proyector estroboscópico diapositivas que incitaban el consumo de productos en específico
como lo eran las palomitas y el refresco. Supuestamente durante una semana, se registró un
aumento en las ventas, de la bebida un 18.1%, y en las palomitas un 57.5% [14].
A partir de ese momento fue que se desató una gran curiosidad y controversia por este
tema, “Los mensajes Subliminales”. Quedaron muchas dudas si en realidad dicho experimento
se había llevado a cabo y si de verdad era posible que dichos mensajes entraran directamente
al subconsciente siendo capaces de manipular o incitar a las personas a consumir productos en
específico.
Los mensajes subliminales fueron puestos a prueba una vez más en el mundial de
México 86’ durante el partido de España contra Dinamarca, en el cual España venció 5 – 1 a
Dinamarca. El Partido Social Obrero Español (PSOE) utilizó sus siglas “PSOE” como
mensaje subliminal durante el gol de Butragueño, la cadena televisiva encargada de difundir
8
Capítulo 1 MENSAJES SUBLIMINALES
dicho mensaje fue la TVE (Televisión Española). Esta técnica asocia un mensaje o símbolo en
este caso “PSOE”a un sentimiento, evidentemente alegría o euforia de los televidentes.
Un artículo del Journal of Counseling Psychology, volumen 29, de 1992, informa sobre
un estudio llevado a cabo por el doctor Kenneth Parker, psicólogo de Queens College en
Nueva York. El proyecto de investigación del doctor Parker fue designado para comprobar si
los mensajes subliminales podían ayudar a mejorar el rendimiento académico de los
estudiantes. Sesenta estudiantes fueron expuestos a mensajes subliminales visuales, usando un
aparato llamado tachistoscope que irradiaba una luz intermitente. Tres veces por semana, antes
de clases, los estudiantes miraban a través del ocular del aparato óptico y veían una luz
relampagueante y brillante, sólo eso. En la fracción de cuatro milisegundos que duraba la luz,
estaba escrita una sola frase. La clase estaba dividida en tres grupos y cada uno recibía un
mensaje diferente. Dos de los mensajes estaban designados a incrementar el rendimiento
académico y el tercero era de control. Este proceso podría aplicarse también con el
enmascaramiento en un fragmento de audio [15].
En algunos supermercados de la Unión Americana utilizan mensajes subliminales en
la música de fondo pare evitar el robo de mercancía. Hoy en día se han encontrado numerosos
mensajes ocultos en diversos productos de consumo, así como películas, canciones, cajetillas
de cigarros y bebidas alcohólicas. Esto puede ser para intentar aumentar la venta del producto
o simple diversión de los publicistas.
La percepción del inconsciente ha sido y sigue siendo ampliamente estudiada por
sociólogos, psicólogos y publicistas. Actualmente se estudia como los mensajes subliminales
pueden ayudar a diagnosticar miedos y fobias.
9
Capítulo 1 MENSAJES SUBLIMINALES
1.2 Usos de los mensajes subliminales
Existen varios tipos de percepción subliminal, ya sean visuales o auditivas, la cual se
logra de tres formas:
• Presentando estímulos visuales durante pocos instantes.
• Presentando mensajes auditivos, hablados rápidamente en volumen bajo.
• Incluyendo u ocultando los mensajes o palabras en material gráfico.
Los mensajes subliminales se utilizan actualmente para publicidad o uso comercial y
los terapéuticos los cuales se mencionan a continuación [16].
Comerciales
Se utilizan generalmente para aumentar las ventas de algún producto, generalmente son
insertados en programas de Televisión, Radio y medios impresos como revistas y periódicos.
La técnica que se ocupa generalmente para insertar los mensajes de publicidad en
medios impresos es el de empotramiento, siendo esta una manera de introducir el mensaje de
consumo en un entorno más complejo. Esta técnica se ocupa en la publicidad grafica.
Terapéuticos
Muchas de las adicciones, fobias o hábitos están arraigadas en el subconsciente, un
ejemplo de esto es un miedo que tiene sus inicios en un evento de la niñez, aunque ya se haya
olvidado, ese evento sigue presente en el subconsciente obligando a la persona a tener miedo
cuando se presenta alguna situación que evoca a ese evento de la niñez.
Este tipo de problemas es posible tratarlos mediante el uso de mensajes subliminales.
La técnica usada para crear estos mensajes es el de enmascaramiento ya que por ejemplo si lo
que se quiere es dejar de fumar, el mensaje oculto tendrá que decir “no fumes” enmascarando
el mensaje con otro sonido, puede ser el sonido de la lluvia o el mar.
10
Capítulo 1 MENSAJES SUBLIMINALES
A lo largo de los años se descubrió que los mensajes podían ser implantados en el
audio. Existen diferentes técnicas para lograrlo, como lo es el enmascaramiento.
La Universidad de Stanford ha demostrado que la música es una de las vías que mayor
efecto ejerce en la mente de las personas, ya que los nervios auditivos son los que predominan
en el cuerpo humano. Algunos médicos lo utilizan como terapia.
1.3 Técnicas de Estimulación de un mensaje Subliminal
En los experimentos subliminales se emplean diversas técnicas de estimulación al
subconsciente [1].
Enmascaramiento
Se le llama enmascaramiento ya que se necesitan dos fragmentos de audio, un
fragmento es el audio enmascarado el cual puede ser “compra” con fines de vender cierto
producto, también puede ser “no robes” tal y como fue utilizado en Estado Unidos y Canadá
en 50 tiendas departamentales, esto para reducir el hurto en las tiendas y el robo entre los
empleados, este experimento tuvo un resultado según la revista Times la cual se titulaba
“Voces Secretas” un decremento de los hurtos de un 37%. El segundo fragmento es el llamado
enmascarador ya que este es el que disfraza al mensaje subliminal, este puede ser una pieza
musical, sonidos de animales, el sonido de la lluvia, una cascada, el mar entre otros.
FIG. 1.1 Ejemplo de enmascaramiento.
Señal enmascaradora, esta señal suele ser la
melodía que la persona percibe de manera
consciente.
Señal enmascarada, esta señal es el mensaje
oculto y debe estar reducida en amplitud para
que la persona no la perciba de manera
consciente.
Señal resultante, en el se encuentran la melodía y
el mensaje (reducido en amplitud).
11
Capítulo 1 MENSAJES SUBLIMINALES
Estimulación empobrecida directa
Consiste en la exposición directa de un estímulo por debajo del umbral de conciencia y
la ejecución posterior de una tarea específica. El umbral de consciencia es la cantidad mínima
de señal (auditiva o visual) que ha de estar presente para ser registrada por nuestra mente. Un
claro ejemplo de esto es el ya mencionado suceso del mundial de México 86’ durante el
partido de España contra Dinamarca [17].
FIG. 1.2 Ejemplo de Estimulación empobrecida Directa
Empotramiento
Este método consiste en insertar el mensaje, puede ser una palabra o una figura en el
contexto de un material visual más complejo como puede ser una fotografía de manera que no
pueda percibirse a nivel supraliminal. Por lo que el mensaje se esconde en el material que se
presenta a las personas. Esta técnica es muy empleada en el campo de la publicidad como
podemos ver a continuación en las siguientes figuras.
12
Capítulo 1 MENSAJES SUBLIMINALES
FIG 1.3 Ejemplo de mensaje empotrado.
Estimulación Dicótica
Esta técnica consiste en la presentación simultánea de los estímulos (auditivos o
visuales) subliminal y supraliminal por canales (auditivos o visuales) diferentes. Este tipo de
mensajes se presentan comúnmente en comerciales de televisión y cine ya que es por estos
medios en los que podemos ver y escuchar el mensaje.
13
Capítulo 2 FORMATOS DE AUDIO DIGITAL
2. FORMATOS DE AUDIO DIGITAL.
Un formato de archivo de audio es un contenedor multimedia que guarda una
grabación de audio (música, voces, etc.). Lo que hace a un archivo distinto del otro son sus
propiedades; cómo se almacenan los datos, sus capacidades de reproducción y cómo puede
utilizarse el archivo en un sistema de administración de archivos. Existen diferentes tipos de
formato según la compresión del audio.
2.1 Conversión Analógico-Digital
Antes de pasar al proceso de conversión Analógico-Digital tendríamos que definir lo
que es el sonido. El sonido lo podemos definir como la sensación producida en el oído por la
vibración de las partículas que se desplazan a través de un medio elástico que las propaga,
causadas por el movimiento vibratorio de un cuerpo sonoro. No todas las ondas sonoras son
percibidas por el oído humano, en promedio el oído es sensible únicamente a ondas de
frecuencia entre los 20 a 20 000 Hz (esto es debido a que varía según cada persona,
modificándose con la edad o al exponerse sonidos muy fuertes), y un nivel de intensidad de
sonido que va desde los 0 dB a los 140 dB (Los decibeles utilizan una escala logarítmica,
debido a que la sensibilidad del oído es muy semejante a una escala logarítmica). A esta
respuesta de frecuencia del oído humano se le conoce como audiofrecuencia [2].
FIG 2.1 Umbral de Audición
14
Capítulo 2 FORMATOS DE AUDIO DIGITAL
A toda esta gama de frecuencias audibles es posible subdividirlo en función de los
tonos:
1. Tonos graves (frecuencias bajas, desde los 16Hz a los 256Hz).
2. Tonos medios (frecuencias medias, desde los 256Hz a los 2 Khz).
3. Tonos agudos (frecuencias altas, desde los 2 Khz hasta poco mas de los 16 Khz).
Cabe mencionar que por encima de las audiofrecuencias, se encuentran los ultrasonidos
(sonidos superiores a los 20Khz), y por debajo los infrasonidos (sonidos inferiores a los
20Hz). La gama de frecuencias principal del habla se encuentre entre los 125 Hz hasta los 8
Khz. Ahora bien, la sensibilidad del sistema auditivo no es independiente de la frecuencia por
el contrario, dos sonidos de igual intensidad sonora pueden provocar distintas sensaciones de
intensidad dependiendo de su contenido espectral.
Como se puede observar en la grafica anterior en la parte superior de la gráfica se
encuentra el umbral de dolor, el cual es la máxima presión sonora que el oído puede soportar,
después se encuentra el límite de riesgo de daños, este umbral de presión sonora, no debe
sobrepasarse por cierto tiempo (8 horas diarias por día).
En la parte inferior de la gráfica se encuentra el umbral de audibilidad, siendo el valor
mínimo de presión sonora, para que sea perceptible por el humano
Remontándonos un poco en la historia el fonógrafo fue desarrollado como un sistema
de grabación mecánica-analógica en el cual las ondas sonoras se transforman en vibraciones
mecánicas mediante un transductor acústico-mecánico y estas vibraciones movían una aguja
que labraba un surco sobre un cilindro de metal o cera en el que quedaba impreso el sonido,
para reproducirse se invertía el proceso. Siendo el primer aparato capaz de reproducir sonido,
para después grabar sonido y poder reproducirlo.
15
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Para grabar un sonido se colocaba una lámina de estaño en el cilindro y se hablaba por
un pequeño embudo situado sobre el cilindro, con una aguja unida a la membrana elástica,
mientras se hacía girar el cilindro con una manivela. Para poder escuchar la grabación la aguja
se movía según el surco del papel de estaño que se había creado, la membrana vibraba y luego
se amplificaba la vibración de la membrana mediante una trompeta metálica, de esta manera
era posible escuchar lo que se había grabado, claro la calidad del sonido no era muy buena,
pero nunca antes el ser humano podía haber oído su propia voz de ese modo y almacenarla en
un simple papel metálico [3].
FIG 2.2 El Fonógrafo
Después del fonógrafo surgieron múltiples inventos para grabar y conservar sonidos,
con estos se buscaba mayor fidelidad pero conservaban su principio analógico. Los discos de
pasta, vinilo o acetato tenían surcos que registraban y reproducían la frecuencia de las ondas,
se basaba en la grabación mecánica analógica. El proceso de reproducción del disco es
principalmente convertir el movimiento que sufre la aguja al seguir las pistas grabadas en
dicho disco, en una señal eléctrica que depende de las variaciones del surco. Los discos de
Vinilo se crean mediante 4 velocidades y en diámetros de 7, 10 y 12 pulgadas.
• 16 o 16 2/3 Revoluciones por minuto
• 33 o 33 1/3 Revoluciones por minuto
• 45 Revoluciones por minuto
• 78 o 78 4/5 Revoluciones por minuto
16
Capítulo 2 FORMATOS DE AUDIO DIGITAL
La velocidad de 16 RPM. Era usada para cuentos, audio biblias y todo aquel audio en
el cual no contenía música, debido a que la velocidad era muy lenta como para poder
reproducir una canción con una buena calidad, en cambio era perfecta para una lectura lenta y
pausada. Los discos de vinilo se reproducían mediante aparatos llamados Tocadiscos, sucesor
al fonógrafo, funcionando de igual forma, sustituyendo el cilindro por un disco de Vinilo.
FIG. 2.3 Tocadiscos
Hoy en día el audio digital se ha convertido en la opción fundamental de grabación,
manipulación y almacenamiento de sonido. De aquí la importancia, de cuál es el camino del
audio digital y sus formatos. Los seres humanos no generamos o recibimos información digital
directamente. Todos los procesos de grabación y reproducción de audio tiene en sus extremos
la parte analógica. Esta parte es la que nosotros procesamos y entendemos como sonido.
Las funciones Analógicas son funciones de variables continuas, las cuales tratan de
imitar (son la analogía de) las señales originales. Al momento de graficar un sonido grabado
analógicamente deberá de aproximarse a la misma forma que el sonido original, la diferencia
será que la gráfica indicara variaciones de voltaje, en lugar de variaciones de presión de aire,
esto es posible gracias a los transductores (micrófono y altavoces).
El micrófono se encarga de convertir la variación de la presión de aire, en una señal de
voltaje que varía en el tiempo, para luego ser grabado sobre una cinta magnética o en los
surcos de un disco de vinilo. En la siguiente figura se puede observar los dos procesos de
grabación (analógico y digital).
17
Capítulo 2 FORMATOS DE AUDIO DIGITAL
FIG. 2.4 Proceso de grabación Analógico y Digital.
La conversión Analógico a Digital (ADC por sus siglas en ingles) se lleva a cabo en
cuatro niveles.
El primero, comprende de filtro conocido como antialiasing, el cual define una
frecuencia límite. Todos los sonidos por debajo de esa frecuencia, que normalmente es el
máximo audible por los humanos (20KHz), quedan registradas. Los sonidos que excedan el
tope de frecuencia son descartados para evitar errores o demasiada información.
El aliasing es el efecto que causa que las señales continuas, se tornen indistinguibles en
el momento en el cual pasan a ser muestreadas. Cuando esto sucede la señal original no puede
ser reconstruida de manera idéntica a partir de la señal digital, el aliasing produce una
superposición de las replicaciones periódicas del espectro de la señal y es debido a el muestreo
incorrecto de la señal analógica.
Para poder evitar el Aliasing es necesario asegurase de que la señal analógica a
muestrear, con una frecuencias Fs, no existan componentes sinusoidales mayores a Fs/2, que
exactamente es lo que hace un filtro antialiasing, filtra las componentes sinusoidales mayores
18
Capítulo 2 FORMATOS DE AUDIO DIGITAL
a Fs/2, y a si podremos reproducir posteriormente la señal a partir de las muestras tomadas A
esta condición se le llama “criterio de Nyquist”, el cual nos dice que la frecuencia de
muestreo Fs debe ser al menos dos veces mayor que el ancho de banda de la señal,
indicándonos que la frecuencia de muestreo mínima que debemos utilizar siempre debe de ser
mayor a dos veces la frecuencia máxima.
Este teorema demuestra que la información completa de la señal analógica original que
cumple el criterio anteriormente mencionado, esta descrita por la serie total de las muestras
que resultan del muestreo. De tal forma podemos demostrar que si la frecuencia más alta que
está contenida en una señal analógica Xa(t) es Fmax = B y la señal se muestrea a una tasa de
Fs > 2Fmax = 2B entonces Xa(t) se puede recuperar totalmente a partir de una función de
interpolación
El segundo, conocido como muestreo (sampling) es la toma de muestras o voltajes por
unidad de tiempo (segundos) de la señal analógica. Una onda tiene crestas y valles, el
muestreo lo que hace es tomar los puntos más significativos de su comportamiento. La
frecuencia de muestreo es la cantidad de tomas que se hacen de la señal por segundo. El
principio de Nyquist establece que un buen muestreo debe considerar frecuencias del doble del
límite de audición, siendo en el caso de los humanos 20 mil por segundo (20kHz), por ende la
frecuencia de muestreo ideal para no perder información de la señal analógica debe ser al
menos de 40KHz.
La tercera etapa, es la de cuantificación. En esta se asignan valores numéricos a cada
registro de la muestra. Haciendo que un rango continuo de amplitudes solo tomen un valor
aproximado a la amplitud, arrojándonos una serie de amplitudes discretas.
19
Capítulo 2 FORMATOS DE AUDIO DIGITAL
FIG. 2.5 Codificación de una señal de Audio
En la figura 2.5 se puede observar un claro ejemplo de cuantificación, tomando en
cuenta que los puntos de color rojo indican el valor real de amplitud de la señal, mientras que
los puntos de color verde, indican el valor asignado mediante niveles a los cuales la amplitud
se tendrá que ajustar al momento de cuantificar.
Existen diferentes métodos para establecer los niveles a los cuales las muestras se van a
ajustar, el más empleado en la cuantificación de señales de audio es mediante la modulación
por pulsos codificados, conocida como PCM, la cual transforma una señal analógica en una
secuencia de bits, siendo empleados dos sistemas de PCM, el uniforme y no-uniforme[4].
• PCM uniforme: La principal característica, es la asignación de niveles de forma
uniforme y distribuida, El número de niveles de salida, será determinado por el número
de bits que dispongamos.
• PCM no-uniforme: De forma contraria a PCM uniforme, en este caso los niveles son
asignados de forma uniforme, disponiendo de mayor número de niveles para las
amplitudes de señales más probables, reduciendo el error de cuantificación. Se utiliza
para las señales de voz en telefonía, en donde las amplitudes más pequeñas son más
probables.
20
Capítulo 2 FORMATOS DE AUDIO DIGITAL
FIG. 2.6 Cuantificación codificada en 4 Bits
Mediante PCM uniforme.
La última etapa es la de codificación. Los dígitos binarios no se registran tal y como
salen de la cuantificación, sino que se establece una regla o procedimiento para la grabación y
reproducción, comprimiendo los datos para optimizar el espacio disponible en el medio donde
se almacenará, y relacionando la lectura de los datos con sincronía de reproducción.
Los métodos de codificación suelen ser divididos en unipolar y polar, la codificación
unipolar, solamente usa una polaridad, esto quiere decir, que toma un “1” cuando la señal
toma una polaridad ya sea positiva o negativa, y “0” cuando existe una ausencia de voltaje;
mientras que la codificación polar utiliza dos niveles de voltaje, positivo y negativo.
• NRZ (No retorno a cero): En este caso el nivel de la señal siempre es positivo o
negativo, el voltaje positivo significa que el bit es un “0”, mientras que un voltaje
negativo nos indica que el bit es un “1”.
• RZ (Retorno a cero): En este caso se utilizan 3 valores, negativo, positivo y cero; los
bits son representados mediante transiciones de voltaje, ya sea de positivo a cero o de
negativo a cero. En el primer caso se representa por un bit “1”, mientras que en las
transición de negativo a cero es representado por un bit “0”.
21
Capítulo 2 FORMATOS DE AUDIO DIGITAL
• Manchester: Muy similar a RZ, con la diferencia de las transiciones de positivo a
negativo, y viceversa, en el primer caso es representado por “0”, la transición de
negativo a positivo es representada por “1”.
Con el archivo de audio almacenado en algún medio (este puede ser un disco compacto
o una computadora). Los dispositivos de reproducción pueden invertir el proceso y convertir
de digital a analógico para convertirse en ondas y variaciones de voltaje que llegan a los
altavoces o audífonos, de esta manera se hace vibrar una membrana que estimula las
moléculas de aire alrededor, las cuales son captadas por los oídos e interpretadas por el
cerebro[5].
FIG. 2.7 Proceso de conversión Analógico Digital
2.2 Formatos de audio Digital
Actualmente existen diversos formatos de conversión digital debido a las múltiples
plataformas de reproducción, en la siguiente tabla se muestran los formatos más utilizados
actualmente así como sus características, para posteriormente profundizar en cada uno de ellos
[6].
22
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Tabla 2.1 Tabla característica de los formatos de audio más usados.
Formato Desarrolladores Extensión Aplicación
WAV (Waveform
Audio File).
Microsoft e IBM .wav Estándar de grabación para música de CD.
WMA (Windows
Media Audio).
Microsoft .wma Es la versión de Windows para comprimir
Audio.
AIFF (Audio
Interchange File
Format).
Apple .aif Almacena la información en segmentos.
RA (Real Audio). Real Networks .ra Es utilizado en Internet por su capacidad de
reproducción en tiempo real.
MP3 (Audio Layer
3).
Moving Picture Experts
Group (MPGE).
.mp3 Intercambio de ficheros musicales, en Internet.
AAC (Advanced
Audio Code).
AT&T, Sony .aac Fue diseñado con el fin de desplazar al MP3,
mucho más estable y de mejor calidad, utilizado
en iTunes.
Formato WAV
El formato WAV (Waveform Audio File) fue desarrollado por Microsoft e IBM y
apareció por primera vez para el ambiente Windows en el año de 1995. Los archivos de audio
guardados en el formato de sonido de Microsoft tienen una extensión” .wav”. Este es un
formato de audio sin compresión, aunque puede ser grabado con una frecuencia que va desde
11025 a 44100. A pesar de que el formato WAV, es capaz de soportar casi cualquier codec de
audio, se utiliza principalmente con el formato PCM , para que este pueda tener una calidad
de un CD de audio es necesario que el sonido se grabe a 44100 Hz y a 16 bits teniendo 65536
niveles (2^16=65536), de esta forma será grabado el mensaje y la canción en la cual se
montará el mensaje [18].
23
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Al grabar con 44100 Hz a 16 bits, cabe señalar que por cada minuto que se grabe se
consumirán aproximadamente 10 Mb de espacio en disco; Por otro lado una de sus grandes
limitaciones al tener una cabecera del fichero de una longitud de 32 bit, limita como máximo a
un tamaño de fichero de 4 Gb, que aproximadamente se traducen a 6.6 horas de música con
una calidad de CD de audio (44100 Hz a 16 bits).
Tabla 2.2 Características del archivo Wav.
Frecuencia de Muestreo 11 025 Hz, 22 050 Hz, 44 100 Hz
Bits de Muestreo 4 bits, 8 bits, 16 bits
Canales Estero, Mono
Desarrollado Microsoft y IMB
Extensión .wav
Software de reproducción Cool Edit Pro, WinDac, Mplayer.
Formato RA
El formato RA fue desarrollado por Real Networks, para poder ser reproducido en
tiempo real, esto significa que mientras el archivo es bajado, es posible escuchar el sonido, de
tal manera que cuando el archivo se termine de bajar, este ya habrá sido reproducido. Es capaz
de reproducir sonido desde Internet, sin la necesidad de almacenar el archivo en el disco duro,
la reproducción se realiza mediante paquetes, que el servidor envía al usuario, cada paquete es
reproducido, mientras se va descargando otro, que lo sustituye en una carpeta temporal, a todo
este proceso se le llama Buffering,
Su principal desventaja se debe que al ser reproducido mientras se descarga, si se sufre
de una desconexión, la reproducción del audio se interrumpirá. De igual forma sucede cuando
la velocidad de descarga es muy lenta. Para lograr reproducir este tipo de archivos es necesario
tener instalado el Software Real Audio Player, con los requerimientos mínimos del sistema
como son [19]:
24
Capítulo 2 FORMATOS DE AUDIO DIGITAL
• Pc Superior a 486/66 hz
• 16 MB de Ram
• 8 MB libres en disco duro
• Tarjeta de sonido compatible con Windows 95/nt
• Conexión con Internet, con modem de 28 Kbps
La tecnología RealAudio es capaz de adaptarse automáticamente a la velocidad de
recepción del usuario final, dependiendo de su velocidad de conexión, procesador y memoria,
esto quiere decir que si el usuario puede recibir paquetes de alta calidad de audio sin
interrupciones, el servidor se los dará, de lo contrario, el servidor reducirá el rango de
muestreo (esto quiere decir una calidad menor), así podrá descargar el archivo más rápido.
Tabla 2.3 Características de Real Audio.
Frecuencia de Muestreo Variable dependiendo la conexión
Bits de Muestreo Variable dependiendo la conexión
Canales Mono
Desarrollado Real Networks
Extensión .ra, .rm,
Software de reproducción Real Audio Player
Formato MP3
Este formato es uno de los más populares hoy en día gracias a su capacidad de
compresión, su tamaño de compresión es de 11 a 1, en comparación a un archivo de formato
WAV, por lo que si un CD de música sin comprimir contiene unas 13 canciones, en un CD
con MP3 tendríamos 143. Fue creado por un grupo denominado Moving Picture Expert
Group, dedicado a diseñar y programar normas de compresión de audio y video, lanzando al
MP3 en el año de 1995 [7].
25
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Su gran auge se debió a la existencia de Internet, los usuarios necesitaban compartir
archivos de audio en la red. Este formato de audio es muy popular en Internet debido a la
compresión y su calidad aceptable.
Su Algoritmo se basa en el rango de frecuencia el cual el oído puede escuchar, ya que
las frecuencias que quedan fuera de la audición son descartadas del archivo (mayores a 20
KHz y menores a 20 Hz), se debe de tener en cuenta que a mayor calidad que se desee, es un
mayor tamaño del archivo, esto es variable, seleccionando la frecuencia de muestreo (48000,
44100, 32000, 24000, 22050, 16000, 11025, 8000) KHz[20].
Tabla. 2.4 Características del archivo MP3.
Frecuencia de
Muestreo
48000 Hz, 44100 Hz, 32000 Hz, 24000 Hz,
22050 Hz, 16000 Hz, 11025 Hz, 8000 Hz.
Bits de Muestreo 4 bits, 8 bits, 16 bits.
Canales Estero, Mono.
Desarrollado Moving Picture Expert Group (MPEG).
Extensión mp3
Software de
reproducción
Mpg123, WinAmp, Sonique, iTunes.
Standard ISO/IEC 11172-3, ISO/IEC 13818-3.
A continuación se mostrará una tabla en la cual se compara la calidad de sonido así
como el tamaño que ocupa en disco duro en promedio durante un minuto, tomando en cuenta
que se realizaron con frecuencias de muestreo de 44100 Hz a 16bits, de los 3 formatos antes
mencionados [21].
Tabla 2.5 Comparativa entre WAV, MP3 y RA. Formato Empresa Calidad de Sonido Tamaño/Min
WAV Microsoft Optimo y flexible 5.3 Mb
MP3 Moving Picture Expert Group Excelente, depende del WAV originario. 440 KB
RA Real Networks Monofónico, Suficiente para sus fines. 850 KB
26
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Formato WMA
Este formato es propio de Windows su acrónimo es Windows Media Audio. Esta es la
versión de Windows para comprimir audio, muy parecido al MP3, usando como estrategia el
uso del reproductor Windows Media Player, el cual está incluido en el sistema operativo
Windows.
A diferencia del MP3, WMA tiene una infraestructura para proteger el
Copyright(derechos de autor), de esta forma se torna más difícil el trafico peer to peer (P2P)
de música. Las redes P2P permiten el intercambio directo de información, entre los
ordenadores interconectados. El hecho de que sirvan para compartir e intercambiar
información de forma directa entre dos o más usuarios, ha propiciado que hayan sido y estén
siendo utilizadas para intercambiar archivos cuyo contenido está sujeto a las leyes de
copyright [8].
Tabla 2.6 Características del archivo WMA.
Frecuencia de Muestreo 44100 Hz 48 000 Hz
Bits de Muestreo 8 bits, 16 bits
Canales Estero, Mono
Desarrollado Microsoft
Extensión .wma
Software de reproducción Windows Media Player
Formato AIFF
Este formato fue desarrollado por Apple Computer, este formato es utilizado
principalmente en computadoras Macintosh. Es un formato de audio sin compresión, fue
diseñado para vender datos de sonidos para las computadoras personales, para las
computadoras Apple Macintosh, los datos en este formato no están comprimidos, empleando
una modulación PCM, al igual que el formato WAV. Por ser un formato con casi ninguna
pérdida, ocupa alrededor de 10 MB por minuto de audio, con una frecuencia de muestreo de
44 100 Hz a 16 Bits [22].
27
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Tabla 2.7 Características del archivo AIFF.
Frecuencia de Muestreo 44100 Hz
Bits de Muestreo 8 bits, 16 bits
Canales Estero, Mono
Desarrollado Apple
Extensión .aiff, .aif, .aifc
Software de reproducción iTunes,WinAmp, Cubase.
El fichero AIFF se divide en diferentes partes llamadas chunks, siendo los siguientes:
Tabla 2.8 Estructura del Archivo AIFF. Common Chunk Información sobre el sonido (tamaño de cada muestra)
Sound Data Chunk Marcos de la muestra que conforman las muestras de sonido.
Form Chunk Formato AIFF o AIFF-C. Contiene los demás chunks del fichero
Format Version Chunk Versión sobre la especificación AIFF-C de acuerdo a la estructuración del
archivo (sólo AIFF-C).
Marker Chunk Marcadores para apuntar las sucesivas posiciones de los datos de sonido.
Comments Chunk Comentarios sobre los marcadores en el fichero.
Sound Accelerator
Chunk Información orientada al permiso de aceleración de descompresiones.
Instrument Chunk Define los parámetros básicos que un instrumento puede usar para hacer un
play-back.
MIDI Data Chunk Información MIDI
Audio Recording Chunk Información perteneciente al dispositivo de grabación empleado.
Application Specific
Chunk Información específica a ciertas aplicaciones
Name Chunk Nombre del sonido
Author Chunk Autor(es) o creador(es) de la grabación
Copyright Chunk Información copyright
Annotation Chunk Posibles comentarios
28
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Formato AAC
En teoría almacena más que el MP3 en menos espacio, este es el formato de audio que
utiliza Apple para los archivos de audio que reproducen los populares Ipod mediante el
software de iTunes Esta basado en el Algoritmo de compresión con pérdida, similar al MP3 en
el cual se eliminan datos de audio para obtener el mayor grado de compresión posible, aunque
este tiene un rendimiento superior al MP3, se produce una mejor calidad de archivos, además
de requerir menos recursos del sistema para codificar y descodificar el archivo [23].
AAC utiliza una variable de la frecuencia de bits (VBR), el cual adapta el número de
bits utilizados por segundo para codificar los datos de audio, en función de la transmisión de
audio; Además de permitir sonidos polifónicos con un máximo de 48 canales independientes,
lo cual lo convierte en un codec apropiado para sonido envolvente (Surround).
Tabla 2.9 Características del archivo AAC.
Frecuencia de Muestreo 24 000 Hz, 22 050 Hz, 16 000 Hz
Bits de Muestreo Bits Arbitrarios (Variables)
Canales Estero, Mono
Desarrollado AT&T bell Laboratories, Sony
Extensión .m4a, .m4b, .m4p, .mp4, .aac
Software de reproducción iTunes y iPod
Estándar ISO/IEC 13818-17, ISO/EIC 14496-3
2.3 Archivo formato WAV
Es el formato estándar para almacenar archivos de audio, no contiene ninguna
compresión de los datos, fue desarrollado y es propiedad de Microsoft e IBM, admite archivos
mono y estéreo, con esto es posible almacenar con una resolución de 8 y 16 bits a frecuencias
de muestreo de 11.025, 22.050, 44.1 y 48 Khz. Wav es compatible con todos los programas y
aplicaciones multimedia. Como anteriormente se mencionó con una grabación de 8 bits de
resolución, el sonido que es salvado en una escala que va de 0 a 255, pero en cambio con una
grabación de 16 bits ese sonido queda guardado con un valor entre 0 y 65 536 niveles, esto es
muy notable al oído del ser humano pudiendo diferenciar entre los 2 niveles de grabación [9].
29
Capítulo 2 FORMATOS DE AUDIO DIGITAL
La calidad del sonido es dependiente a las características del formato que se tenga en el
WAV, ya sea mono o estéreo, la resolución y la velocidad de muestreo. Para poder tener una
calidad de un disco compacto se necesita que el sonido se grabe a 44100 Hz y a 16 bits, por
cada minuto de grabación de sonido aproximadamente se estará consumiendo unos 10 Mb de
espacio.
El formato WAV consta de un conjunto de especificaciones RIFF de Microsoft para
formatos multimedia. Los formatos RIFF se caracterizan por una cabecera además de ser
agregada una secuencia de bloque de datos. En este sentido el formato WAV divide el fichero
en dos bloques, el primer bloque es el que representa el formato de los datos además de la
muestra y un segundo bloque con los datos de sonido, en la siguiente figura se puede observar
gráficamente la cabecera WAV así como la descripción de cada campo [24].
Tabla 2.10 Cabecera WAV. Nombre del
Campo
Tamaño del Campo (Bytes)
ChunkID 4 El formato WAV consta de 2 partes (sub-
chunks): “Fmt” y “datos”. ChunkSize 4
Format 4
Subchunk1 ID 4
Sub-chunk “Fmt”
Describe la información del sonido en los
datos sub-chunk.
Subchunk1 Size 4
AudioFormat 2
NumChannels 2
SampleRate 4
ByteRate 4
BlockAlign 2
BitsPerSample 2
Subchunk2 ID 4
Sub-chunk “Datos”
Indica el tamaño del sonido y contiene a los
datos reales de sonido.
Subchunk2
Size
4
Data Subchunk2Size
30
Capítulo 2 FORMATOS DE AUDIO DIGITAL
En la Tabla 2.11 se muestra la descripción detallada en donde se puede observar el
tamaño del campo de bits con un código Hexadecimal así como las 2 partes que conforman al
archivo WAV [25].
Tabla 2.11 Descripción de la cabecera WAV. ChunkID Contiene las letras RIFF en codigo ASCII (52 49 46 46 en Hexadecimal).
ChunkSize 36 + SubChunk2Size
Format Contiene las letras WAVE en codigo ASCII (57 41 56 45 en Hexadecimal).
El formato WAVE consiste en 2 SubChunks: “Fmt” y “Datos”
“Fmt” describe el formato de datos de sonido.
SubChunk1ID Contiene las letras fmt (66 6d 74 20 en Hexadecimal).
SubChunk1Size 16 para PCM (procedimiento con el cual se modulo la señal).
AudioFormat PCM = 1 (Valores diferentes a “1” indican otro tipo de compresión).
NumChannels Mono = 1 , Stereo = 2
SampleRate 8000, 44100, etc
ByteRate SampleRate * NumChannels * BitsPerSample / 8
BlockAlign NumChannels * BitsPerSample / 8
BitsPerSample 8 bits = 8, 16 bits = 16, etc.
ExtraParamSize Si esta modulado en PCM no existirá este campo
ExtraParams Este campo esta designado para colocar acotaciones
“Datos” contiene el tamaño del los datos así como el sonido
SubChunk2ID Contiene las letras data (64 61 74 61 en Hexadecimal)
SubChunk2Size NumSamples * NumChannels * BitsPerSample / 8
Data Datos del sonido.
Para poder entender mejor este formato, a continuación se analizará la siguiente
secuencia de Bytes relativa a un fichero wav con el uso de programas de sonido como
Windows Media, podemos reproducir estos archivos y escucharlos por medio de un altavoz.
52 49 46 46 24 08 00 00 57 41 56 45 66 6D 74 20 10 00 00 00 01 00 02
00 22 56 00 00 88 58 01 00 04 00 10 00 64 61 74 61 00 08 00 00 00 00 00 00
24 17 1E F3 3C 13 3C 14 16 F9 18 F9 34 E7 23 A6 3C F2 24 F2 11 CE 1A 0D
31
Capítulo 2 FORMATOS DE AUDIO DIGITAL
Ahora analizaremos la secuencia de Bytes parte por parte para poder tener un mejor
panorama de cómo están constituidos los archivos WAV, tomaremos partes de la secuencia
explicando cada una de ellas.
Tabla 2.12 Secuencia de Bytes Chunk Descriptor
52 49 46 46 ChunkID = R I F F
24 08 00 00
ChunkSize = 2084
Mediante el uso de la formula:
36 + SubChunk2Size
57 41 56 45 W A V E
Fmt SubChunk
66 6d 74 20 f m t £
10 00 00 00 SunChunk1Size = 16
Debido a que es una modulación PCM obtiene el valor de 16.
01 00 AudioFormat = 1
Por ser una modulación PCM obtiene el valor de “1”.
02 00 NumChannels = 2
El sonido se encuentra en un canal Stereo.
22 56 00 00 SampleRate = 22050
Toma el valor de 22050 debido a su frecuencia de muestreo.
88 58 01 00
ByteRate = 88200
Se calcula mediante la fórmula:
SampleRate * NumChannels * BitsPerSample / 8
( 22050 * 2 * 16 ) / 8 = 88200
04 00
BlockAlign = 4
Se calcula mediante la fórmula:
NumChannels * BitsPerSample / 8
( 2 * 16 ) / 8 = 4
10 00 BitsPerSample = 16
Se obtiene debido a que las muestras son de 16 bits.
32
Capítulo 2 FORMATOS DE AUDIO DIGITAL
(Continuación) Tabla 2.12 Secuencia de Bytes Data SubChunk
64 61 74 61 d a t a
00 08 00 00
SubChunk2Size = 2048
Se obtiene mediante la fórmula:
NumSamples * NumChannels * BitsPerSample / 8
( 512 * 2 * 16 ) / 8 = 2048
00 00 Muestra 1, muestras del canal izquierdo.
00 00 Muestra 1, muestras del canal derecho.
24 17 Muestra 2, muestras del canal izquierdo.
1e f3 Muestra 2, muestras del canal derecho.
3c 13 Muestra 3, muestras del canal izquierdo.
3c 14 Muestra 3, muestras del canal derecho.
35
Capítulo 3 SOFTWARE
3. SOFTWARE
Mediante el programa que se realizo en Matlab es posible introducir mensajes
subliminales a cualquier pieza musical, para esta tesis se decidió montar el mensaje sobre una
pista de audio, en formato WAV.
La pieza musical que se ocupa en el experimento principal no tiene ningún sonido de
voz, es una pieza de relajación, en la cual podemos percibir el sonido del bosque, la razón por
la que se eligió dicho sonido es que el consciente no estará procesando información de voz (lo
que provoca que este checando que tipo de información es la que deja pasar y que no), por lo
tanto será más fácil llegar al subconsciente con el mensaje que se coloco en la pieza.
3.1 Antecedentes Teóricos Matlab
Operaciones Básicas
Matlab es capaz de realizar cálculos simples como si se estuviera trabajando con una
calculadora.
Tabla 3.1 Operaciones Básicas Operación Símbolo Ejemplo
Suma + 5+3
Resta - 456-4
Multiplicación * 3.2*6
División / 40/7
Potencia ^ 5^4
36
Capítulo 3 SOFTWARE
Graficas en 2D
La función Plot es el comando más utilizado para graficar datos en dos dimensiones,
como se muestra en el ejemplo:
t = linspace (0,2*pi,300); %Genera 300 puntos de 0<t<2π
x = sin (t); %Crea un vector x, con el seno evaluado en los puntos t
Plot (t,x) %Grafica la función x, con los puntos t
FIG 3.1 Comando Plot.
En la tabla 3.2 se muestran algunas funciones para el uso de gráficas 2D.
Tabla 3.2 Funciones para graficar en 2D.
Comando Función.
Bar Gráfica de barra.
Fill Dibujo de polígono en 2D relleno.
Hist Histograma.
Image Imagen.
Loglog Gráfica con ambos ejes en escala logarítmica
Plot Gráfica simple.
Polar Gráfica en coordenadas Polares.
37
Capítulo 3 SOFTWARE
(Continuación) Tabla 3.2 Funciones para graficar en 2D.
Semilogx Gráfica con eje x en escala logarítmica.
Semilogy Gráfica con eje y en escala logarítmica.
Stairs Gráfica de escalera.
Stem Gráfica de secuencia discreta.
Axis Modifica las propiedades de los ejes.
Clf Borra la ventana Figure.
Close Cierra la ventana Figure.
Figure Crea o selecciona la ventana Figure.
Grid Coloca una rejilla.
Gtext Coloca testo con el Mouse.
Hold Mantiene la gráfica actual.
Subplot Crea sub gráficas dentro de la ventana Figure.
Text Coloca texto en un lugar dado.
Title Coloca el título.
Xlabel Coloca etiqueta del eje x.
Ylabel Coloca etiqueta del eje y.
Zoom Magnifica o Disminuye los ejes.
Procesamiento de Señales de Audio
Cargar una señal de Audio
Para cargar un archivo de formato WAV, se utiliza la siguiente instrucción. Donde x es
la variable en donde Matlab guardará las muestras de la señal, fs es la frecuencia de muestreo
y bits indica el número de bits utilizados en cada muestra para codificar la señal.
[x,fs,bits]= wavread (‘NombreDelArchivo.wav’);
38
Capítulo 3 SOFTWARE
En la Figura 3.2 se puede observar como Matlab guarda las variables (x, fs, bits), en la
columna Name, seguido de su valor, en este ejemplo se cargo un archivo WAV, con una
frecuencia de muestreo de 11 025 y 8 bits.
FIG. 3.2 Ventana de Variables para la función wavread.
Para poder escuchar el vector que ha creado matlab, al momento de cargar el archivo
de música, en este caso en la variable x, se utiliza la siguiente instrucción, tomando en cuenta
que el argumento fs, es la frecuencia de muestreo con la cual se reproducirá el archivo, la cual
deberá ser igual a la frecuencia de muestreo con la que se grabó el archivo, así se evitara la
distorsión al momento de reproducir.
soundsc (x,fs);
La variable x no es más que una tabla con datos de las muestras tomadas de la señal
analógica original. Por lo cual podemos trabajar con ella como cualquier otro vector y utilizar
todas las funciones y operación que hasta ahora se han visto; Podemos sumar señales de voz,
recortarlas, o como es el caso de esta tesis multiplicarlas para luego grabar el resultado,
aplicando el siguiente comando:
wavwrite (x2,fs,bits,’NombreDelNuevoArchivo.wav’)
En donde x2 es la variable que guarda las muestras de sonido ya procesadas, fs es la
frecuencia de muestreo y bits indica el número de bits utilizados en cada muestra para
codificar la señal. En la tabla 3.3 se muestran algunos comandos para procesar señales [10].
39
Capítulo 3 SOFTWARE
Tabla 3.3 Comandos para procesar Señales. Y = conv
(x,h)
La convolución de x con h.
X = fft (x) La transformada discreta de Fourier del vector x.
Fftshift Util para visualizar la transformada de Fourier con el componente de DC a la mitad del espectro.
B = fir1
(n,w)
Diseña un filtro digital pasa bajas FIR de orden n con frecuencia de corte w y regresa los
coeficientes al vector b.
Freqz
Muestra la respuesta en frecuencia de un filtro digital.
X = ifft (x) La trasformada discreta inversa de Fourier del vector X.
3.2 Introducción al Programa Sublim.
Para la creación de mensajes subliminales fue necesario crear un programa el cual
enmascara un mensaje subliminal previamente, grabado, sobre una pieza musical (para esta
tesis la pieza musical es el sonido de la naturaleza, mientras que el mensaje, es “izquierda”, y
otro con la frase “Derecha”); fue creado mediante Matlab, por su simplicidad en los
comandos, y el uso de gráficos en el programa.
Las principales características que el programa puede realizar son:
• Enmascara un mensaje en una pieza musical: La función del programa es la creación
de mensajes subliminales, mediante el método de enmascaramiento, para luego ser
guardados en formato WAV.
• Solo trabaja con archivos WAV: Como ya se mencionó en capítulos anteriores, debido
a su alta calidad de audio.
• Muestra la frecuencia de muestreo así como los bits de cada archivo wav: El usuario es
capaz de visualizar a que frecuencia de muestreo y cuantos bits, contiene la muestra de
sonido.
40
Capítulo 3 SOFTWARE
• Enmascara las señales, solo si estas son de la misma frecuencia de muestreo así como
mismos bits: Esto es debido a que si se graban a diferentes frecuencias de muestreo o
diferentes bits, el archivo sufre distorsiones de audio, como método de efectividad del
mensaje se decidió que solo cargara archivos de características iguales.
• Variación de la amplitud del mensaje: El usuario puede variar la amplitud del mensaje,
seleccionando así el porcentaje deseado, mediante una barra de amplitud.
• Gráfica de cada archivo WAV (amplitud con respecto al tiempo): el usuario será capaz
de observar cómo se comporta la señal de audio con respecto al tiempo, así como
también podrá observar cuando varía la amplitud al ser modificada mediante la barra
de amplitud.
• Reproducción de los Archivos WAV: El programa será capaz de reproducir cualquier
archivo WAV cargado, desde cualquier dirección de almacenamiento.
• Repite el mensaje tomando en cuenta la longitud del archivo de audio: El programa
repite (concatena) el mensaje de forma automática, de forma que el mensaje se repite
el número de veces necesario para igualar el tiempo del archivo de audio.
FIG 3.3 Ventana SUBlim.
41
Capítulo 3 SOFTWARE
Como se puede observar en la FIG 3.3 el programa cuenta con 4 recuadros, en el
primero se carga la pieza musical, el segundo es utilizado para cargar el mensaje, como se
puede observar cada uno cuanta con los botones Cargar, Reproducir y Stop, además de contar
con los indicadores de la frecuencia de muestreo así como Bits por muestra, los cuales varían
dependiendo de cada archivo WAV que se cargue en el programa. En el segundo recuadro, se
implementó una barra de desplazamiento, la cual varía la amplitud del mensaje, en forma
porcentual, desde 0% hasta 100%.
En el tercer cuadro aparcera la gráfica, del mensaje con el porcentaje de amplitud
aplicado, de tal forma que si la barra se encuentra de lado izquierdo (0%) no aparecerá nada,
de forma contraria si se encuentra en 100% la gráfica será similar al segundo recuadro.
Por último el cuarto recuadro en el cual aparece un botón con la etiqueta ‘Crear
Canción con mensaje’, una vez que se halla cargado la canción así como el mensaje. y Se
seleccionará la amplitud con la cual se quiera enmascarar. Se podrá crear el mensaje con dicho
botón, una vez que se presione, aparecerá la gráfica del archivo enmascarado y se podrá
escuchar con el botón reproducir, si el usuario está conforme con el mensaje se podrá grabar
en formato WAV, en cualquier directorio de nuestro disco duro o memoria extraíble.
3.3 Creación de Mensajes Subliminales con SUBlim.
Para esta tesis se crearon 2 tipos de mensajes subliminales, el primero contiene la frase
‘izquierda’, el segundo la frase ‘derecha’, los cuales servirán para realizar los experimentos,
con 40 personas (20 hombres y 20 mujeres), dichos mensajes se crearon mediante el programa
descrito en el Capitulo 2.2 de la siguiente manera:
1. Se seleccionaron los archivos en formato WAV, (Mensaje y Canción), Ambos con una
frecuencia de muestreo de 44100 y 16 bits por muestra.
42
Capítulo 3 SOFTWARE
2. Una vez que se tengan los archivos, utilizaremos SUBlim, para la creación de los
archivos, presionando el botón cargar seleccionamos el archivo WAV, con la melodía
(En esta caso canción.wav).
FIG. 3.4 SUBlim – Cargar Archivo.
De igual forma cargamos el Mensaje mediante el botón cargar del segundo recuadro
(Mensaje.wav para esta tesis), cabe señal que es necesario tener la misma frecuencia de
muestreo así como los mismos bits por muestra, para que el enmascaramiento del mensaje, sea
correcto. En caso de no haber cargado los archivos wav con frecuencias de muestreo o bits por
muestra iguales, nos saldrá un recuadro de error.
43
Capítulo 3 SOFTWARE
FIG 3.5 SUBlim – Mensaje de Error, para
diferentes frecuencias de muestreo.
3. Una vez que se tengan los archivos WAV en el programa de forma correcta, es posible
variar la amplitud del mensaje, mediante la barra de desplazamiento situada en la parte
inferior del segundo recuadro. Observándose el tamaño de la amplitud deseada en el
tercer recuadro.
FIG 3.6 SUBlim – Amplitud del Mensaje 7.9% conforme al original.
44
Capítulo 3 SOFTWARE
4. Después de haber cargado los archivos, ya es posible enmascarar el mensaje pulsando
el botón “Crear canción con Mensaje”, una vez pulsado se creará el mensaje, de tal
forma que se podrá escuchar, mediante el botón Reproducir, si el usuario está
conforme con lo que se obtuvo, deberá guardar el archivo WAV, presionando Grabar.
El programa pedirá el nombre del archivo con el cual quedara grabado y el lugar donde
se guardará.
FIG. 3.7 SUBlim – Guardando el Archivo WAV.
5. El archivo se guardara con formato WAV, para poder ser reproducido en cualquier
reproductor de audio.
3.4 Código SUBlim
El programa fue creado en matlab, con ayuda de la interfaz GUI (Graphical User
Interface). Para así incluir gráficos tales como botones, barras de desplazamiento y gráficas.
Para poder diseñar la interfaz GUI, se necesita introducir en la ventana de comandos lo
siguiente:
>> guide
45
Capítulo 3 SOFTWARE
Una vez dentro de la interfaz GUI, podemos realizar nuestro entorno gráfico, a
continuación se muestra el entorno gráfico del programa SUBlim.
FIG. 3.8 Diseño del entorno gráfico SUBlim.
Cuando se haya terminado de diseñar habrá que guardar el archivo, Matlab creará un
archivo de terminación *.fig, este contendrá todo nuestro diseño gráfico del programa que se
está desarrollando.
El siguiente paso, para el diseño del programa es la creación del código, el cual les dará
funcionamiento a nuestros botones. Para esto debemos darles nombres a los botones; área de
grafica, barra de desplazamiento, para lograrlo basta con dar doble clic sobre los botones,
inmediatamente aparecerá un cuadro con todas las características de dicho elemento.
Buscamos el campo ‘Tag’, remplazamos el campo por el nombre que le queramos asignar.
46
Capítulo 3 SOFTWARE
FIG. 3.9 Etiquetas de los elementos gráficos
Una vez que fueron etiquetados los elementos, se tendrá que desarrollar el código para
realizar el enmascaramiento del mensaje así como el código de funcionamiento de cada botón,
esto se logra con “M-file Editor”, para acceder a él es necesario ir al menú ‘view’ (‘ver’) y
posteriormente “M-file Editor”, se abrirá una ventana en la cual podremos escribir el código
para el funcionamiento del programa.
A continuación se muestra el código para el funcionamiento del programa SUBlim, el cual
es explicado paso a paso:
• Cabecera:
Se describe el nombre del programa y sus desarrolladores en forma de comentario.
% ------------------------------------------------------------------------
% PROGRAMA SUBLIM V2.0.0
% PROYECTO DE TESIS = MENSAJES SUBLIMINALES
% INGENIERIA EN COMUNICACIONES Y ELECTRONICA
% PEREZ DIAZ NOE
% RODRIGUEZ CLEMENTE CHRISTOPHER
47
Capítulo 3 SOFTWARE
%
% ------------------------------------------------------------------------
• Código de Inicialización:
El código es ocupado para la inicialización del modo gráfico (GUI), así como la ventana en la
cual se encuentran los botones.
function varargout = SUMlim2(varargin)
gui_Singleton = 1;
gui_State = struct('gui_Name', mfilename, ...
'gui_Singleton', gui_Singleton, ...
'gui_OpeningFcn', @SUMlim2_OpeningFcn, ...
'gui_OutputFcn', @SUMlim2_OutputFcn, ...
'gui_LayoutFcn', [] , ...
'gui_Callback', []);
if nargin && ischar(varargin{1})
gui_State.gui_Callback = str2func(varargin{1});
end
if nargout
[varargout{1:nargout}] = gui_mainfcn(gui_State, varargin{:});
else
gui_mainfcn(gui_State, varargin{:});
end
• Función de Ventana:
Permite crear una función en la cual, se puedan colocar botones, barras de desplazamiento,
gráficas, etc.
function SUMlim2_OpeningFcn(hObject, eventdata, handles, varargin)
handles.output = hObject;
guidata(hObject, handles);
48
Capítulo 3 SOFTWARE
• Función de Retorno de comando de línea:
Retorna todos los valores utilizados en el programa.
function varargout = SUMlim2_OutputFcn(hObject, eventdata, handles)
varargout{1} = handles.output;
• Cuadro de Canción:
Contiene el código para poder hacer funcionales los botones y cuadro de gráficas que se
encuentran en el primer cuadro (Cargar canción).
• Botón Cargar:
Se carga el archivo en formato WAV (Canción), con la condición que al no haberse
cargado ningún archivo muestre un cuadro de error con la etiqueta “Error, no se seleccionó
archivo”.
function Cargar1_Callback(hObject, eventdata, handles)
[FileName, PathName] = uigetfile ('*.wav','Cargar Archivo Wav');
if FileName == 0
errordlg('Error, no se seleccionó archivo');
return;
end
El archivo WAV seleccionado, es cargado por Matlab en forma de vectores (x1),
cargado también la frecuencia de muestreo (fs1) y los bits de muestreo (bits1), para poder ser
mostrados en las casillas de frecuencia y Bits del programa. set(handles.Archivo1,'String',FileName);
[handles.x1,handles.fs1,handles.bits1]= wavread([PathName FileName]);
set(handles.Bit1,'String',handles.bits1)
set(handles.Frec1,'String',handles.fs1)
49
Capítulo 3 SOFTWARE
Se utilizan los siguientes comandos, los cuales ajustan el eje x (Segundos), de acuerdo
con la duración de la canción, mediante el número de muestras y la frecuencia de muestreo.
Ts1=1/handles.fs1;
[nsamples,c]=size([PathName FileName]);
tscale=0:Ts1:(nsamples-1)*Ts1;
handles.x1 = 0.99*handles.x1/max(abs(handles.x1));
samp_len = length(handles.x1)/handles.fs1;
handles.delta_tR = 1/handles.fs1;
handles.tR = 0:handles.delta_tR:(samp_len-handles.delta_tR);
plot(handles.Graf1,handles.tR,handles.x1)
axis([0 handles.tR(length(handles.x1)-1) -1 1 ]);
handles.Tiemp1 = handles.tR(length(handles.x1)-1);
guidata(hObject,handles)
• Botón Play:
La función habilita el uso del botón ‘Play’ mediante el comando ‘sound’, para el primer
cuadro.
function Play1_Callback(hObject, eventdata, handles)
sound(handles.x1,handles.fs1)
guidata(hObject,handles)
• Botón Pausa:
La función habilita el uso del botón ‘Pausa’, el cual detiene el sonido que se encuentre en
reproducción en el cuadro de Canción.
50
Capítulo 3 SOFTWARE
function Pausa1_Callback(hObject, eventdata, handles)
clear playsnd;
• Cuadro de Mensaje:
Contiene el código para poder hacer funcionales los botones y cuadro de gráficas que se
encuentran en el segundo cuadro (Cargar Mensaje).
• Botón Cargar:
Carga el archivo en formato WAV (Mensaje), con la condición que al no haberse
cargado ningún archivo muestre un cuadro de error con la etiqueta “Error, no se seleccionó
archivo”.
function Cargar2_Callback(hObject, eventdata, handles)
[FileName PathName] = uigetfile ('*.wav','Archivo');
if FileName == 0
errordlg('Error, no se seleccionó archivo');
return;
end
El archivo WAV seleccionado, es cargado por Matlab en forma de vectores (x1),
cargado también la frecuencia de muestreo (fs1) y los bits de muestreo (bits1), para poder ser
mostrados en las casillas de frecuencia y bits del programa. set(handles.Archivo2,'String',FileName)
[handles.x2,handles.fs2,handles.bits2]= wavread([PathName FileName]);
if handles.fs1 ~= handles.fs2
errordlg('Error!!, Los archivos deben tener la misma frecuencia de muestreo');
return;
end
51
Capítulo 3 SOFTWARE
if handles.bits1 ~= handles.bits2
errordlg('Error!!, Los archivos deben tener los mismos bits de muestreo');
return;
end
set(handles.Bit2,'String',handles.bits2)
set(handles.Frec2,'String',handles.fs2)
Se utilizan los siguientes comandos, los cuales ajustan el eje x (Segundos), de acuerdo
con la duración de la canción, mediante el número de muestras y la frecuencia de muestreo.
Ts2=1/handles.fs2;
[nsamples,c]=size([PathName FileName]);
tscale=0:Ts2:(nsamples-1)*Ts2;
handles.x2 = 0.99*handles.x2/max(abs(handles.x2));
samp_len = length(handles.x2)/handles.fs2;
delta_t = 1/handles.fs2;
t = 0:delta_t:(samp_len-delta_t);
plot(handles.Graf2,t,handles.x2)
axis([0 t(length(handles.x2)-1) -1 1 ]);
handles.Tiemp2 = t(length(handles.x2)-1);
Para que el mensaje se pueda repetir n veces de tal forma que encaje de manera exacta
con el tiempo de la canción, primero se calculan el número de veces que la canción puede
contener el mensaje. Una vez que se tiene dicho dato, mediante una función ‘for’ se
concatenará el mensaje, hasta que sea igual a la longitud de la canción, esto ocasionará que
tengan las mismas dimensiones y así se podrán sumar punto a punto, creando el mensaje
subliminal.
52
Capítulo 3 SOFTWARE
Tiemp3 = handles.Tiemp1/handles.Tiemp2;
Tiemp3R = floor(Tiemp3);
handles.MensajeN = handles.x2;
for a=2:Tiemp3R
a = a+1;
handles.MensajeN = [handles.MensajeN;handles.x2];
end
guidata(hObject,handles)
• Botón Play:
La función habilita el uso del botón ‘Play’ mediante el comando ‘sound’, para el primer,
segundo cuadro.
function Play2_Callback(hObject, eventdata, handles)
sound(handles.x2,handles.fs2)
guidata(hObject,handles)
• Botón Pausa:
La función habilita el uso del botón Pausa, el cual detiene el sonido que se esté
reproduciendo en el cuadro de mensaje.
function Pausa2_Callback(hObject, eventdata, handles)
clear playsnd;
• Barra de amplitud:
53
Capítulo 3 SOFTWARE
Mediante esta función, se obtiene el valor de porcentaje dependiendo del desplazamiento
de la barra, el cual se aplicara al mensaje que fue cargado en el segundo cuadro, de igual
forma que en el primer cuadro, se añade el código para que automáticamente acoté el tiempo
en segundos en el eje x.
function SliderAmp_Callback(hObject, eventdata, handles)
a1=.01*get(handles.SliderAmp,'Value');
set(handles.Amp,'String',num2str(get(handles.SliderAmp,'Value')));
if handles.x2 == 0
errordlg('Error!!, No se selecciono Archivo');
return;
end
handles.Resultado = a1*handles.MensajeN;
Ts2=1/handles.fs2;
[nsamples,c]=size([handles.Resultado]);
tscale=0:Ts2:(nsamples-1)*Ts2;
handles.x3 = 0.99*handles.Resultado/max(abs(handles.Resultado));
samp_len = length(handles.Resultado)/handles.fs2;
delta_t = 1/handles.fs2;
t = 0:delta_t:(samp_len-delta_t);
plot(handles.Graf3,t,handles.Resultado,'r','LineWidth',0.5);
axis([0 t(length(handles.x3)-1) -1 1 ]);
guidata(hObject,handles)
• Barra de amplitud:
Mediante esta función se crean las propiedades de la barra de desplazamiento (color y
tamaño).
54
Capítulo 3 SOFTWARE
function SliderAmp_CreateFcn(hObject, eventdata, handles)
if isequal(get(hObject,'BackgroundColor'), get(0,'defaultUicontrolBackgroundColor'))
set(hObject,'BackgroundColor',[.9 .9 .9]);
end
• Cuadro de Mensaje:
Contiene el código para poder hacer funcionales los botones y cuadro de gráficas que se
encuentran en el cuarto cuadro (Crear Mensaje).
• Botón crear:
Al momento de ser presionado el botón crear, sumará el mensaje y la canción, muestra a
muestra, además se mostrará una barra de espera la cual finalizará al momento que se creé el
archivo satisfactoriamente.
function Crear_Callback(hObject, eventdata, handles)
h = waitbar(0,'Creando mensaje Subliminal...','CreateCancelBtn','setappdata(gcbf,''canceling'',1)');
setappdata(h,'canceling',0)
for i=1:1,
if getappdata(h,'canceling')
break
end
Tamano,c]=size(handles.Resultado);
wavwrite(handles.x1,handles.fs2,'Mensaje.wav');
[Mensaje] = wavread('Mensaje.wav',Tamano);
handles.Mensaje = [handles.Resultado+Mensaje];
waitbar(i/1,h)
end
delete (h);
set(handles.Bit3,'String',handles.bits2)
55
Capítulo 3 SOFTWARE
set(handles.Frec3,'String',handles.fs2)
plot(handles.Graf4,handles.Mensaje,'r','LineWidth',0.5)
guidata(hObject,handles)
• Botón Play:
La función habilita el uso del botón ‘play’ mediante el comando ‘sound’, para el cuarto
cuadro, una vez que el mensaje subliminal se haya creado.
function Play3_Callback(hObject, eventdata, handles)
sound(handles.Mensaje,handles.fs2);
guidata(hObject,handles)
• Botón Pausa:
La función habilita el uso del botón Pausa, el cual detiene el sonido del mensaje subliminal
ya creado.
function Pausa3_Callback(hObject, eventdata, handles)
clear playsnd
• Botón Grabar:
La Función grabar habilita el uso del botón Grabar canción, la cual desplegará un cuadro
en el que seleccionaremos en qué lugar de nuestro disco se quiera guardar la canción con el
mensaje.
function Grabar_Callback(hObject, eventdata, handles)
[FileName PathName] = uiputfile('*.wav','Guardar archivo como');
if isequal([FileName PathName],[0,0])
else
wavwrite(handles.Mensaje,handles.fs2,FileName);
return
end
guidata(hObject,handles);
56
Capítulo 3 SOFTWARE
FIG. 3.10 Diagrama de flujo del software Sublim.
INICIO
Cargar Canción
Cargar Mensaje
Si el Mensaje tiene la misma
frecuencia y Bits
ERROR: Vuelve a introducir otro mensaje con Bits y
Frecuencia igual a la canción
Selecciona el porcentaje de Amplitud de el Mensaje
Guardar Canción El Mensaje Subliminal se ha
Creado
59
Capítulo 4 CONCLUSIONES
4. PRUEBAS Y RESULTADOS
En este capítulo se muestran las pruebas realizadas para poder concluir si en realidad
funcionan los mensajes subliminales. Mediante el programa que se mostró en el capítulo
anterior se crearon los dos mensajes. Tomando en cuenta que en todo caso se utilizó una
frecuencia de muestreo de 44 100 Hz a 16 Bits.
Para poder realizar las pruebas, se le pidió a un grupo de personas de 15 a 50 años de
edad (debido al umbral de frecuencias audibles el cual es mejor a estas edades), que
escucharan la melodía correspondiente al experimento que se iba a realizar. Todas las pruebas
se realizaron mediante el reproductor Windows Media Player, instalado en una computadora
portátil, a un mismo volumen de sonido, y con los mismos audífonos (American audio Hp
500).
Bocina 57 mm. de diámetro
Impedancia 64 Ohms
Sensibilidad 108 dBs ( error 3 dBs )
Frecuencia de respuesta 50 Hz a 30 Khz.
Plug Estándar 1/4’’ Estero
Largo del Cordón 3 Metros
Figura 4.1 Características audífonos “American Audio Hp 500”.
4.1 Prueba 1. Determinación del umbral del mensaje.
Para poder aplicar un mensaje subliminal en una canción es necesario que este no sea
detectado por la mente consciente, por lo cual tenemos que delimitar en un grupo de personas
hasta que nivel son capaces de detectar otro sonido diferente a la melodía que se está
reproduciendo.
Para poder establecer los parámetros, se les realizó una pequeña prueba a 20 personas, 10
mujeres y 10 hombres. La cual consistió en que escucharan el archivo de audio (música
relajante) con un mensaje implantado, el cual decía “mensaje” mediante el programa que se
60
Capítulo 4 CONCLUSIONES
desarrollo en Matlab. Para esto se crearon 6 canciones con la palabra “mensaje” con diferentes
porcentajes desde el 6% hasta el 11%, (la amplitud del mensaje se puede variar en el segundo
cuadro del programa con ayuda de la barra de desplazamiento, la cual en la parte superior se
puede observar de forma numérica que tanto se está disminuyendo la amplitud con respecto a
la canción del primer cuadro), a continuación los archivos resultantes.
Tabla 4.1 Archivos WAV para la delimitación del umbral.
Nombre del archivo Porcentaje de el
mensaje.
dBs con respecto a
la Canción.
Mensaje_Umb_6.wav 6 % - 24 dB
Mensaje_Umb_7.wav 7 % - 23 dB
Mensaje_Umb_8.wav 8 % - 22 dB
Mensaje_Umb_9.wav 9 % - 21 dB
Mensaje_Umb_10.wav 10 % - 20 dB
Mensaje_Umb_11.wav 11 % - 19 dB
La finalidad de grabar un fragmento de audio con la palabra “mensaje” fue para que las
personas no supieran de qué se trataba nuestro siguiente experimento. Se le pidió a la persona
escuchar el archivo “Mensaje_Umb_6.wav”, (el cual el porcentaje del mensaje era del 6%),
después el archivo “Mensaje_Umb_7.wav”, de tal forma que se estuviera aumentando el
porcentaje del mensaje, hasta que la persona pudiera captar algún sonido diferente al de la
melodía. Los resultados se muestran en la siguiente tabla:
Tabla 4.2 Resultados de la muestra de Umbral. Persona Genero Porcentaje del Mensaje dB
1 Hombre 9% -21dB
2 Hombre 9% -21dB
3 Hombre 8% -22dB
4 Hombre 8% -22dB
5 Hombre 7% -23dB
6 Hombre 9% -21dB
7 Hombre 9% -21dB
8 Hombre 7% -23dB
61
Capítulo 4 CONCLUSIONES
(Continuación)Tabla 4.2 Resultados de la muestra de Umbral. 9 Hombre 8% -22dB
10 Hombre 8% -22dB
11 Mujer 10% -20dB
12 Mujer 7% -23dB
13 Mujer 10% -20dB
14 Mujer 9% -21dB
15 Mujer 9% -21dB
16 Mujer 8% -22dB
17 Mujer 8% -22dB
18 Mujer 9% -21dB
19 Mujer 7% -23dB
20 Mujer 8% -22dB
De los resultados anteriores podemos decir que las personas a las que se les sometió a esta
prueba para determinar el ‘umbral de audición del mensaje’ son de entre 7% y 10 %.
Tabla 4.3 Número de Personas por porcentaje del Mensaje.
Porcentaje
del Mensaje
Hombres Mujeres
Total Personas que lograron
escuchar algo diferente a la melodía.
Personas que lograron escuchar
algo diferente a la melodía.
6 % 0 0 0
7 % 2 2 4
8 % 4 3 7
9 % 4 3 7
10 % 0 2 2
62
Capítulo 4 CONCLUSIONES
FIG. 4.2 Gráfica de personas para la delimitación del Umbral.
El resultado en decibeles es la relación que existe entre el punto máximo del primer
archivo de audio (música de relajación) y el punto máximo del segundo archivo de audio
(mensaje). Cabe recordar que el segundo archivo se encuentra reducido en amplitud. Se tomó
como referencia de 0 dB al punto máximo del primer archivo.
Con la recopilación y el análisis de los datos anteriormente mostrados se decidió crear el
mensaje con un 6% de amplitud ya que de esta forma sería muy poco probable que alguna
persona percibiera el mensaje de manera consciente.
4.2 Prueba 2 Mensaje Subliminal Izquierda/Derecha.
Una vez que se delimitó el nivel del umbral con el experimento 1, con ayuda del programa
SUBlim, y a una amplitud de 6% del mensaje se crearon 2 archivos en formato WAV, con los
mensajes “izquierda” y “derecha” el cual se repiten (concatenan) durante toda la melodía. El
mensaje tiene una duración de 5 min. y un tamaño de 26.5 Mb cada uno).
Mensaje al 6% y 11% 0%
Mensaje al 7%20%
Mensaje al 8%35%
Mensaje al 9%35%
Mensaje al 10%10%
Delimitacion del Umbral
Mensaje al 6% y 11 %
Mensaje al 7%
Mensaje al 8%
Mensaje al 9%
Mensaje al 10%
63
Capítulo 4 CONCLUSIONES
Se tomaron muestras de 30 personas para el mensaje “IZQUIERDA” (15 hombres y 15
mujeres), de igual forma se tomaron muestras de 30 personas diferentes para el mensaje
“DERECHA” (15 hombres y 15 mujeres), el cual fue un total de 60 personas diferentes, para
comprobar la efectividad de los mensajes subliminales.
La melodía fue escuchada por cada una de las personas, aconsejándoles que se relajaran y
de ser posible cerraran los ojos (para que el mensaje fuera mejor captado por el
subconsciente), después de haber terminado de escuchar el mensaje, se les pidió seleccionaran
una esfera de unicel, posteriormente fue registrado en una bitácora la esfera seleccionada ya
sea izquierda o derecha, a continuación se muestran los datos estadísticos de dichas pruebas:
Tabla 4.4 Estadísticas (Mensaje Derecha).
Mensaje Derecha
Derecha Izquierda Total Correcto Incorrecto
Hombre 8 7 15 53.33333 46.66667
Mujeres 9 6 15 60 40
Total 19 11 30 Efectividad 56.6667
FIG. 4.3 Gráfica Prueba Mensaje “Derecha”
56,6667
43,3333
Correcto
Incorrecto
64
Capítulo 4 CONCLUSIONES
Tabla 4.5 Estadísticas (Mensaje Izquierda).
Mensaje Izquierda
Derecha Izquierda Total Correcto Incorrecto
Hombre 7 8 15 53.33333 46.66667
Mujeres 5 10 15 66.66667 33.33333
Total 12 18 30 Efectividad 60
FIG. 4.4 Gráfica Prueba Mensaje “Izquierda”.
Con lo cual podemos observar que en los experimentos realizados, los mensajes
subliminales logran ser efectivos (en 6 de cada 10 personas los mensajes influyeron en su
decisión al seleccionar una esfera de unicel), como se puede observar en la siguiente tabla:
Tabla 4.6 Estadísticas del Experimento 2.
Hombres 30 Personas
Mujeres 30 Personas
Total de personas 60 Personas
Efectividad total 58.33335 %
60%
40%
Correcto
Incorrecto
65
Capítulo 4 CONCLUSIONES
FIG. 4.5 Gráfica Efectividad Total
4.3 Conclusiones
Después de realizar las pruebas, recopilar los resultados y analizarlos podemos decir que
los mensajes creados tuvieron el efecto esperado ya que en aproximadamente 6 de cada 10
personas que realizaron la prueba escogieron la pelota correcta de acuerdo al mensaje que
contenía la canción. Sin duda un factor importante fue la disponibilidad de la persona ya que
al realizar las pruebas pudimos notar que las personas que se distraían con facilidad fallaban
en la prueba. Este factor pudo haber influido de cierta manera en los resultados, ya que al no
estar totalmente relajados tal vez el mensaje no pudo hacer su trabajo satisfactoriamente. Otra
cuestión que notamos es que algunas personas posiblemente sean más perceptivas o sensibles
que otras teniendo un mejor efecto en este tipo de personas.
4.4 Trabajo Futuro
Como ya se mencionó el programa Sublim fue desarrollado en Matlab. Una de las mejoras
que se le pudiesen hacer a este proyecto seria desarrollarlo en algún otro lenguaje de
programación de alto nivel para así poder crear los mensajes con más rapidez y sin necesidad
de tener instalado el compilador, en nuestro caso Matlab.
58,33335
41,66665
Correcto
Incorrecto
66
Capítulo 4 CONCLUSIONES
Una mejora importante seria desarrollar el software sublim con inter-compatibilidad entre
los distintos formatos de audio digital por ejemplo el popular mp3 ya que no ocupa tanto
espacio y sería bueno con fines prácticos. Cabe recordar que por cuestiones de calidad
nosotros preferimos los archivos de formato wav.
Los mensajes subliminales tienen distintos usos, como ya vimos el proposito del software
sublim fue manipular la decisión de una persona al escoger una pelota en especifico. Un
proyecto muy viable a mediano y largo plazo seria someter a personas con problemas de
alcoholismo o tabaquismo a mensajes subliminales y registrar que avances o mejoras pudieran
tener esas personas con este tipo de problemas que afectan a gran parte de la sociedad
Mexicana.
Asímismo todo el sistema podría estar integrado en el mismo robot considerando el uso de
un microcontrolador, de un disco duro y una tarjeta de memoria en donde se grabe toda la
información obtenida por el robot lo cual lo haría más autónomo. En caso de que al
programarse una trayectoria de trabajo en modo automático se detecte la presencia de un
objeto dentro de la distancia máxima que recorrerá el móvil, se podría desarrollar alguna
función de software que detuviera el móvil antes de llegar a la zona muerta del transductor,
evitando así una posible colisión que pueda dañarlo.
67
Bibliografía
BIBLIOGRAFIA
[1] Subliminal ad-ventures in erotic art, Issue 72 By Wilson Bryan Key
[2] WATKINSON, J. El arte del audio digital. IORTV, Madrid, 1993
[3] FRIES, Bruce y FRIES, Marty. Audio digital práctico. Ed. Anaya Multimedia. 2005.
[4] Valle, Mauricio. Teoría de cuantificación, conversión analógico-digital y digital-analógica
[5] Johnston, James D. (1988). "Transform Coding of Audio Signals Using Perceptual Noise Criteria". Selected Areas in Communications
[6] WATKINSON, John. Introducción al audio digital. 2003.
[7] Jack Ewing (March 5, 2007). "How MP3 Was Born". BusinessWeek.com.
[8] Publicación: La revolución Audio Digital». SONY. Publicado por Sony España
[9] Schroeder, M.R.; Atal, B.S.; Hall, J.L. (December 1979). "Optimizing Digital Speech Coders by Exploiting Masking Properties of the Human Ear". The Journal of the Acoustical Society of America
[10] MATLAB PARA INGENIEROS, MOORE, HOLLY
[11] http://www.wisegeek.com/what-are-subliminal-messages.htm
[12] http://usuarios.lycos.es/mensajessubliminales/paginas/mensajessubliminales.htm
[13] http://www.neoteo.com/mensajes-subliminales-afectan-mas-de-lo-que-14870.neo
[14] http://www.santuario.com.ar/paginas/subli_latin.html
[15] http://www.actuallynotes.com/Actually%20Notes%20La%20Pubicidad%20 Subliminal.htm
[16] http://boletininformativo.blogia.com/2007/030935-confirman-impacto-cerebral-de-mensajes-subliminales.php
[17] http://www.tendencias21.net/Los-mensajes-subliminales-son-procesados-de-manera-consciente-por-el-cerebro_a1236.html
[18] http://www.lightlink.com/tjweber/StripWav/WAVE.html
[19] http://www.sciencedaily.com/releases/2009/01/090114110927.htm
[20] http://mp3licensing.com/patents/index.html
[21] http://www.tunequest.org/a-big-list-of-mp3-patents/20070226/
[22] http://www.patatabrava.com/apunts/documents/pdp_lect.doc
[23] http://www.sciencedaily.com/releases/2008/08/080827163810.htm
[24] http://www.sciencedaily.com/releases/2007/03/070308121938.htm
[25] http://netghost.narod.ru/gff/graphics/summary/micriff.htm