Google y sus servidores
-
Upload
luz-dary-saenz-quiroga -
Category
Documents
-
view
92 -
download
1
Transcript of Google y sus servidores
GOOGLE Y SUS
SERVIDORESJOHANA LUZ DARY SAENZ
QUIROGA
1001TUNJA-2014
GOOGLEEs la plataforma, en donde la
infraestructura tecnológica que soporta sus páginas web, como se señalan es los anuncios de prensa
que da la compañía
Características:En arquitectura son:
Enorme capacidad de procesamiento
Uso del clusters ejecutando Linux y su correspondiente balance de carga
Presencia de datos en diferentes puntos
geograficos,permitiendo una respuesta
rápida para las solicitudes de los usuarios
que están alrededor del mundo
Topología:Aun si conocer su cantidad exacta se estima que GOOGLE tiene
mas de 2.000.000 de
servidores
Principales centros:
MountainView(California),
Virginia,
Memphis Atlanta
Dublín.
Hay otras instalaciones en construcción en:
The Dalles
Saint-Ghislain
Dato informativo:En el año 2009 GOOGLE
inauguró otra instalación
la cual es vital para el medio ambiente ya que
en año 2005 esta compañía había
generado una dirección mas
efectiva a mas de 8.000
millones de webs.
CLUSTERS:
Cada cluster de Google tiene miles de
servidores, por lo que cuando alguien se
conecta a un cluster, se distribuye la carga de nuevo mediante el hardware del cluster
para enviar la consulta al servidor web
que esté menos ocupado en ese momento y así dar una rápida respuesta.
Racks:
Los racks de Google están hechos a medida y
pueden contener entre 40 y 80 servidores.
Cada rack tiene una conexión Ethernet
(conexión por cables para el intercambio de
mensajes en un área local) a un router local que
a su vez se conecta al router central utilizando
una conexión de 1 Gigabit.
Tipo de servidores:Google ordena los resultados de la
búsqueda utilizando su propio algoritmo PageRank. A cada página web se le asigna un número en función del número de enlaces de otras
páginas que la apuntan, el valor de esas páginas y
otros criterios no públicos. La infraestructura de servidores de Google está dividida en varias categorías, cada una con un propósito diferente, de la siguiente manera:
Los distribuidores de carga aceptan la petición del cliente y la reenvían a uno de los servidores web de Google a través de servidores proxy Squid
Los servidores proxy Squid aceptan la petición y devuelven el resultado desde la caché local si es posible y si no reenvían la petición al servidor web.
Los servidores Web coordinan la ejecución de las consultas enviadas por los usuarios y
formatean el resultado utilizando el lenguaje HTML.
La ejecución consiste en enviar peticiones a servidores de índices, fusionar los resultados, calcular su rango utilizado PageRank, elaborar un resumen para cada resultado, preguntar por posibles sugerencias a los servidores de ortografía y finalmente obtener una lista de anuncios del servidor de publicidad.
Los servidores de recolección de datos
están dedicados permanentemente a
navegar por Internet al estilo araña. Van
actualizando el índice y las bases de
datos de documentos con las páginas
web que van encontrando y aplican los
algoritmos de google para calcular el
rango de cada página.
Los servidores de
índices contienen un conjunto de trozos
de índice. Devuelven una lista de id's de
documentos, llamados "docid", de forma
que los documentos a los que identifican
contienen la
palabra que el usuario está
buscando.
Estos servidores necesitan
menos espacio en disco, pero en cambio
soportan un carga de procesador
bastante elevada.
CUIDA TU INTEGRIDAD EN LA INTERNET Y NO TENDRAS
P`ROBLEMAS EN TU BIENESTAR.
Los servidores de documentos sirven para
almacenar los documentos. Cada documento se almacena
en docenas de servidores de documentos. Cuando
alguien realiza una búsqueda, el servidor de documentos devuelve un
resumen de la página basado en las palabras
buscadas por el usuario. También puede devolver el documento entero
directamente si se lo
solicitan. Estos servidores requieren
bastante espacio de disco.
Los servidores de anuncios (ad servers)
gestionan la
publicidad de los servicios AdWords
y AdSense
Utiliza de buena manera la /el internet . Que tu buena conducta se demuestre es
este servicio.
HARDWARE
ORIGINAL
Sun Ultra II con
procesador de
200MHz dual y 256
MB de RAM. Esta
era la máquina principal
del sistema original.
Dos servidores Pentium II duales
a 300 MHz donados
por Intel que incluían 512
MB de RAM y 9 discos de 9 GB entre los dos
servidores. Era en estos
servidores donde se
ejecutaba la parte principal
de la búsqueda.
F50 IBM RS/6000 donado
por IBM que incluía cuatro
procesadores, 512 MB de memoria y ocho discos duros de 9
GB.Dos armarios adicionales
incluían tres discos duros de 9 GB y
seis de 4 GB respectivame
nte que estaban
conectados al servidor
Sun Ultra II.
Un armario
de expansió
n de discos de IBM
con otros ocho discos
duros de 9 GB
donados por IBM.
Armario de disco duros casero
que contenía 10 discos duros de 9 GB SCSI.
ACTUAL
Más de 15.000 servidores con
velocidades comprendidas entre el Intel
Celeron de 533 MHz y
el Pentium III a 1,4 GHz dual (a fecha de 2003).
Según Paul Strassman
Google tendría en 2005 unos
200.000 servidores7 mie
ntras que algunas fuentes indican que el número de servidores
podría haber alcanzado los 450.000 en
2006.2
Uno o más
discos duros de
80 GB por servidor
(en 2003)
Entre 2 y 4 GB de
memoria por
máquina.
OPERACIÓN:
A. La mayoría de operaciones son de solo lectura.
B. Cuando se necesita una actualización de datos, las
consultas se envían a otros servidores, para simplificar los problemas de consistencia.
C. Las consultas se dividen en subconsultas y cada una de ellas se envía por diferentes canales en paralelo, reduciendo así el tiempo de latencia.
D. Para reducir los efectos de un posible fallo de hardware, los datos almacenados en los servidores se duplican utilizando tecnología RAID. El software también está diseñado para gestionar los fallos.
E. Por lo tanto, cuando un servidor se cae, los datos
todavía están disponibles en otros servidores.
SERVIDORES:
los servidores utilizan una placa Gigabyte modelo GA-9IVDP con 8Gb
de RAM y dos procesadores (Intel o AMD). Además utilizan dos discos SATA de marca Hitachi. La fuente de alimentación es
Magnetick, de la cual salen unos cables hacia una batería (no hay fuentes redundantes). Todo está encajado en un soporte metálico especialmente preparada para alojar todos estos componentes.
No cuenta con tapadera, ventiladores, y las piezas están sujetas con
cinta de velcro, para facilitar el cambio de componentes, en caso de
que se estropeen. La placa base no está disponible para su venta al
público, debido a que Google tiene un acuerdo de exclusividad Y la
inclusión de una batería de 12V en cada servidor.
SU ATRACCION:
La atracción de Google por el ahorro energético y la optimización data de los
inicios de Google, pues ya preveían la cantidad inmensa de energía que necesitarían para alimentar todos los servidores en los siguientes años con la
expansión del buscador.
FUENTE DE ALIMENTACION:
Esta especialmente creada por laempresa
Magneteck, que suministra 12V a laplaca y
no 12V+5V como las convencionales.En la
pegatina de la fuente de alimentaciónse
puede observar “Google Part Number”,que asegura la exclusividad con Google.
LO QUE NO USA:
Google no usa servidores en su datacenter, sino que usa contenedores con 1.160 servidores en su interior. No es la única empresa que utiliza
contenedores con servidores dentro, ya lo hace Sun o Rackable Systems con su Ice Cube Modular datacenter, pero sí fue el primero.
UTILIZAN:
Utilizan un
contenedor de
tamaño 1AAA y lo
equipan con su
puerta de
entrada, su salida
de emergencia, su
sistema de
refrigeración y todas las estanterías para meter todos los servidores como el de la imagen. Una vez montado el contenedor, es muy fácil
trasladarlos de un lado a otro del planeta y montar un datacenter de Google en cualquier sitio.
Utilizan un contenedor de tamaño 1AAA y lo equipan con su puerta de entrada, su salida de emergencia, su sistema de refrigeración y todas las estanterías para meter todos los servidores como el de la imagen. Una vez montado el contenedor, es muy f
GRACIAS