Microprocesadores y Tecnologìas

6
UNIVERSIDAD CONTINENTAL DE CIENCIAS E INGENIERÍAS E.A.P. INGENIERÍA INFORMÁTICA VI SEMESTRE II06MA MICROPROCESADORES Profesor: Ing. Miguel Tupac Yupanqui Alanya Por: SAFORAS CONTRERAS, Danny Henderson HUANCAYO – PERÚ 2008

description

Recopilación sobre la Teoria y arquitectura y tecnología de microprocesadores

Transcript of Microprocesadores y Tecnologìas

Page 1: Microprocesadores y Tecnologìas

UNIVERSIDAD CONTINENTAL DE CIENCIAS E INGENIERÍAS

E.A.P. INGENIERÍA INFORMÁTICA

VI SEMESTRE

II06MA

MICROPROCESADORES

Profesor:

Ing. Miguel Tupac Yupanqui Alanya

Por:

SAFORAS CONTRERAS, Danny Henderson

HUANCAYO – PERÚ2008

Page 2: Microprocesadores y Tecnologìas

I. ADMINISTRACIÓN DE ENERGÍA

APM - ACPITodas las técnicas de gestión de energía (powermanagement) requieren un hardware y una rutina de la BIOS apropiados. La mayoría de los ordenadores portátiles y muchos ordenadores de sobremesa y servidores cumplen estos requisitos.

En el hardware más antiguo se utiliza con frecuencia el estándar APM (Advanced Power Management). Debido a que APM consiste básicamente en un conjunto de funciones implementadas en la BIOS, existen diferencias en el soporte de APM en las distintas clases de hardware.

ACPI es todavía más complejo y la calidad de su soporte depende incluso en mayor medida del hardware utilizado.

FUNCIONES PARA EL AHORRO DE ENERGÍA:

Stand-by (en reposo)Sólo se desactiva la pantalla y en algunos dispositivos se reduce también el rendimiento del procesador. No todas las implementaciones APM ofrecen esta función. En ACPI este estado se corresponde con S1.

Suspend (to memory)Para este modo toda la información sobre el estado del sistema se guarda en la memoria y, aparte de esta, todo el resto del sistema se para. Es un estado en el cual el ordenador gasta muy poca energía. El atractivo especial de realizar esto con Linux es el no tener que parar el ordenador nunca; hay otros sistemas operativos que se vuelven inestables después de cierto tiempo. En la mayoría de los portátiles actuales basta con cerrar la tapa para suspender y abrirla después para seguir trabajando. En ACPI este estado se corresponde con S3. El soporte de este estado depende enormemente del hardware utilizado.

Hibernation (suspend to disk)En este modo, el ordenador vuelca todo el contenido de la memoria al disco duro y el sistema se para después. El ordenador tarda de 30 a 90 segundos de salir de este periodo de hibernación. Tras este periodo se restablece por completo el estado anterior al suspend. Algunos fabricantes ofrecen ciertos modos híbridos (por ejemplo RediSafe en IBM Thinkpads). En ACPI el estado de hibernación se corresponde con S4.

Control de bateríaJunto a la información del estado de la batería también es importante tener algo previsto en caso de que disminuyan las reservas de energía. ACPI o APM desempeñan aquí esta función de control.

Apagado automáticoDespués de un shutdown el ordenador se para completamente sin necesidad de pulsar el botón de apagar. Esto es importante en caso de que se realice un apagado automático poco antes de que se agote la batería.

Apagado de los componentes del sistemaEl componente esencial a la hora de ahorrar energía es el disco duro. Dependiendo de la fiabilidad del sistema, este se puede poner a dormir durante más o menos tiempo. El riesgo de una pérdida de datos se incrementa con la duración del período de reposo de los discos. Se puede desactivar otros componentes via ACPI (al menos en teoría) o de forma duradera en el setup de la BIOS.

Control del rendimiento del procesadorPowerNow! de AMD y SpeedStep de Intel son dos conceptos diseñados para disminuir el consumo de energía en todo el sistema. Con este fin se reduce la energía utilizada por el componente que normalmente más consume: el procesador. La menor producción de calor constituye un agradable efecto secundario, ya que los ventiladores regulables pueden trabajar de forma más silenciosa. Las funciones CPU Frequency

Page 3: Microprocesadores y Tecnologìas

Scaling del kernel de Linux se encargan de regular estos procesos. En este contexto se distingue entre tres niveles de rendimiento del procesador:

performanceMáximo nivel de rendimiento del procesador; se recomienda utilizarlo cuando se trabaja con el sistema conectado a la red del suministro eléctrico.

powersaveMínimo nivel de rendimiento del procesador para el uso del portátil con baterías.

dynamicAjuste automático del rendimiento del procesador a la carga actual del procesador. Esta es la opción más recomendable en la operación con o sin baterías para ahorrar energía, evitar ruidos y lograr un rendimiento óptimo. El cambio de frecuencia o estado es tan suave que el usuario ni siquiera lo nota en un entorno operativo normal.

II. EJECUCIÓN SUPERESCALAR

Un microprocesador superescalar que lleva a cabo operaciones en base a una pluralidad de instrucciones en cada una de sus etapas de búsqueda, decodificación, ejecución y reescritura. Para soportar tales operaciones, el microprocesador superescalar incluye un equipo de envío que incluye una cache de instrucciones para la búsqueda de bloques de instrucciones que incluyen una pluralidad de instrucciones y un decodificador de instrucciones que decodifica y envía las instrucciones a unas unidades funcionales para su ejecución. El decodificador de instrucciones aplica criterios de envío a las instrucciones seleccionadas de cada uno de los bloques de instrucciones y envía las instrucciones seleccionadas que satisfagan los criterios de envío. Los criterios de envío incluyen el requisito de que las instrucciones se envíen especulativamente por orden, de que haya operados de soporte para la ejecución de las instrucciones, o que haya valores etiquetados sustituidos se encuentren disponibles mas tarde, y que se encuentren disponibles las unidades funcionales requeridas para la ejecución de las instrucciones. El funcionamiento del decodificador de instrucciones y de la cache de instrucciones se coordina mediante un protocolo predefinido que asegura que las instrucciones son enviadas en orden consecutivo ascendente y que los bloques de instrucciones son buscados de manera eficiente para que el decodificador de instrucciones las decodifique y envié.

III. TECNOLOGÍA MMX

MMX es una tecnología diseñada para acelerar las comunicaciones multimedia y aplicaciones. Esta aceleración y simplificación se realiza a través de un conjunto de instrucciones multimedia que se construyen en microprocesadores que les permita manejar las operaciones comunes de multimedia como DSP, o Procesamiento Digital de Señales.

La primera iniciativa de mejora en este sentido, recibió el nombre de MMX (Extensión Multimedia), y salió con el Procesador MMX en 1997. El procesador tenía "instrucciones MMX" y "registro MMx" incorporados Las ediciones anteriores del Pentium -como los otros procesadores de 32 bits- tenía dos tipos de registro:

• Uno para los números enteros de 32 bits • Otro para los números decimales de 80 bits

Con la tecnología MMX fuimos testigos de la introducción de un registro de enteros de 64 bits que trabajaban conjuntamente con las instrucciones MMX. La idea era que los programas multimedia explotarán las posibilidades de las instrucciones MMX (los programas evidentemente deberían estar escritos para MMX para poder utilizar el nuevo sistema).MMX es una extensión del conjunto de instrucciones existentes (IA32). Hay 57 nuevas instrucciones que los procesadores compatibles con MMX comprenden, y que necesitan nuevos programas para ser explotados.

Page 4: Microprocesadores y Tecnologìas

IV. STREAMING SIMD EXTENSIONS

1. SSE (STREAMING SIMD EXTENSIONS)

Después del éxito de AMD con 3DNow!, Intel no se podía quedar atrás. Su respuesta fue la SSE (siglas de Streaming SIMD Extensions: extensiones SIMD de flujo), que constituyeron otra manera de mejorar el rendimiento de 3D. Las SSE se introdujeron con el Pentium III (aproximadamente en 1999). En principio las extensiones SSE son bastantes más potentes que la de 3DNow! realizándose los siguientes cambios en la CPU:

• 8 nuevos registros de 128 bits, que pueden contener cuatro números de 32 bits a la vez

• 70 instrucciones multimedia: • 50 nuevas instrucciones SIMD que posibilitan los cálculos avanzados

en varios números de coma flotante con una sola instrucción. • 12 instrucciones para nuevos medios, diseñadas por ejemplo para

codificar y decodificar secuencias de vídeo MPEG-2 (en DVD) • 8 nuevos instrucciones de memoria streaming para mejorar las

interacción entre la memoria caché L2 y la memoria RAM.

La tecnología SSE también se convirtió en un éxito rápidamente. Salieron al mercado programas como Photoshop en nuevas versiones optimizadas APRA SSE, y los resultados fueron convincentes. Muchos programas que hacen uso intensivo del procesador y que funcionan con sonido, imágenes y vídeo, y en todos los ámbitos de multimedia, funcionan mucho mejor cuando utilizan SSE. AMD, aplicó esta tecnología a los procesadores Athlon XP y Duron. Esto fue muy positivo para los desarrolladores de software, ya que todo el software puede seguir desarrollándose para un único conjunto de instrucciones común para AMD e Intel.

2. SSE2 (STREAMING SIMD EXTENSIONS 2)

Con el Pentium 4, (2002-02) las extensiones SSE se extendieron para utilizar técnicas aún más potentes. SSE2 contiene 144 instrucciones nuevas, incluyendo operaciones SIMD de números enteros y cálculos de doble precisión de coma flotante de 128 bits. SSE2 puede reducir el número de instrucciones que debe ejecutar la CPU para realizar una determinada tarea, de forma que puede incrementar el rendimiento del procesador. Intel menciona:

• Vídeo • Reconocimiento de voz• Procesado de imágenes/fotos • Encriptación• Programas financieros científicos

Sin embargo, como ya ocurría con MMX , 3DNow y SSE, es necesario reescribir los programas antes de poder sacar partido a las nuevas instrucciones.

V. 3DNOW - ENHANCED 3 DNOW

3D NOW!

En 1998, AMD introdujo un conjunto de instrucciones de CPU que mejoraron el proceso de 3D y que denominó 3DNow!. Eran 21 nuevas instrucciones SIMD (Single Instruction Multiple Datos: datos múltiples de Instrucciones sencillas). Las nuevas instrucciones podían:

• procesar varios pedazos de datos con una sola instrucción.• Mejoraron sobre todo el procesamiento de los números de coma flotante de

32 bits tan utilizados en los juegos 3D.

Page 5: Microprocesadores y Tecnologìas

ENHANCED 3D NOW!

Para sacar el máximo rendimiento a los programas y tarjetas 3D, Athlon incorpora una versión mejorada de su extensión 3D Now!, llamada Enhanced 3D Now!. La Primera versión incluida en los micros K6-2 y K6-III, utilizaba 21 nuevas instrucciones que aceleran las operaciones en punto flotante. Además, gracias a la tecnología SIMD, pueden procesarse datos al mismo tiempo.Enhanced 3D Now! Añade 24 instrucciones más. 19 de ellas son casi una copia de las instrucciones de control de caché y flujo de datos utilizadas por la extensión 3D del Pentium III, llamada katmai, KNI o SSE. De esas 19 instrucciones, 12 se utilizan para mejorar el cálculo de numeros enteros y los elementos multimedia y 7 para optimizar el movimiento masivo de datos. Los cinco restantes aceleran funciones relacionadas con MP3, sonido Dolby Digital, MPEG-2, modems ADSL y otras operaciones complejas.

VI. EJECUCIÓN DINÁMICA

Utilizada por primera vez en el procesador Pentium Pro, la Ejecución Dinámica es una innovadora combinación de tres técnicas de procesamiento diseñada para ayudar al procesador a manipular los datos más eficientemente. La ejecución dinámica permite al procesador alterar y predecir el orden de las instrucciones. La Ejecución Dinámica Consiste de:

Predicción de Ramificaciones Múltiples:

Predice el flujo del programa a través de varias ramificaciones: mediante un algoritmo de predicción de ramificaciones múltiples, el procesador puede anticipar los saltos en el flujo de las instrucciones. Éste predice dónde pueden encontrarse las siguientes instrucciones en la memoria con una increíble precisión del 90% o mayor. Esto es posible porque mientras el procesador está buscando y trayendo instrucciones, también busca las instrucciones que están más adelante en el programa. Esta técnica acelera el flujo de trabajo enviado al procesador.

Análisis del Flujo de Datos:

Analiza y ordena las instrucciones a ejecutar en una sucesión óptima, independiente del orden original en el programa: mediante el análisis del flujo de datos, el procesador observa las instrucciones de software decodificadas y decide si están listas para ser procesadas o si dependen de otras instrucciones. Entonces el procesador determina la sucesión óptima para el procesamiento y ejecuta las instrucciones en la forma más eficiente.

Ejecución Especulativa:

Aumenta la velocidad de ejecución observando adelante del contador del programa y ejecutando las instrucciones que posiblemente van a necesitarse. Cuando el procesador ejecuta las instrucciones (hasta cinco a la vez), lo hace mediante la “ejecución especulativa”. Esto aprovecha la capacidad de procesamiento superescalar del procesador Pentium II tanto como es posible para aumentar el desempeño del software. Como las instrucciones del software que se procesan con base en predicción de ramificaciones, los resultados se guardan como “resultados especulativos”. Una vez que su estado final puede determinarse, las instrucciones se regresan a su orden propio y formalmente se les asigna un estado de máquina.

VII. ARQUITECTURA DE BUS DUAL INDEPENDIENTE

Los buses conforman la Arquitectura de Bus Dual Independiente:

El Bus Del Caché L2.El Bus De Sistema.

Page 6: Microprocesadores y Tecnologìas

Cada uno tiene un ancho de 8 bytes, es decir 64 bits. De esta forma, se puede decir que se doblan los canales disponibles para el movimiento de información. El primero de los buses, el bus del caché L2 está integrado en el mismo SEC, y su velocidad no se halla limitada a la velocidad del reloj de la tarjeta madre, más bien, el caché L2 del Pentium II trabaja a la mitad de frecuencia con la que lo hace el mismo procesador. Al tener una frecuencia de operación superior a la de la tarjeta madre, su rendimiento se incrementan notablemente. Esta velocidad extra le permite al Pentium II obtener la información que requiere procesar del caché L2 tan pronto como la necesite, por su parte, el caché L2 puede manejar una velocidad menor para comunicarse con la memoria principal. Este es quien sabe uno de los puntos más interesantes e importantes que le dan al Pentium II la ventaja extra en cuanto a procesamiento de información se refiere respecto a sus competidores: los Pentium MMX.

Fuentes:

http://www.cez.com.pe/Linux/*

http://www.salonhogar.com/ciencias/tecnologia/*

http://www.angelfire.com/co/Lbit/Pcs/microp.html