Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos...

22
Mapas del Sitio Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master

Transcript of Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos...

Page 1: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Mapas del Sitio

Yinet Esmeralda GarzonLorena Cardoso

Heiddy Juliet MejiaCristian Rengifo

Carlos CastellanosFranklin Duban Marin

Especialización Tecnológica Web Master

Page 2: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

¿Qué es un SITEMAPS

?

Caracteres de Escape de Entidad

Cual es la ubicación

del archivo de

sitemaps

La forma mas acertada para

que el buscador google

reconozca un

Sistemap.

Se pueden unir en un site maps

varios sitemaps

Formato para la

creación de un

SISTEMAPS

Etiquetas Utilizadas

En La Construcción De Un

Sitemaps.

Otras Formas de Crear un Sitemaps

Como se validan los sitemaps

Creación de un sitemap.

Page 3: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Un sitemap es un fichero que es enviado a los buscadores de Internet para ofrecerles información acerca de las páginas que componen un sitio web.

Un sitemap incluye todas las URLs accesibles del sitio y, según el formato utilizado, ofrece una información más amplia acerca de éstas, como puede ser la fecha de última modificación, la frecuencia de actualización o la prioridad que le damos en el conjunto de las páginas de nuestra web.

¿Qué es un Sitemap?

Page 4: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1" xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1"> <url> <loc>http://www.example.com/foo.html</loc> <image:image> <image:loc>http://example.com/imagen.jpg</image:loc> </image:image> <video:video> <video:content_loc>http://www.example.com/video123.flv</video:content_loc> <video:player_loc allow_embed="yes" autoplay="ap=1"> http://www.example.com/reproductordevideo.swf?video=123</video:player_loc> <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>Barbacoas en verano</video:title> <video:description>Consiga que los filetes queden perfectamente hechos siempre</video:description> </video:video> </url> </urlset> EtiquetasEl siguiente ejemplo muestra un Sitemap que contiene únicamente una URL y usa todas las etiquetas opcionales. Las etiquetas opcionales están en cursiva.  <?xml version="1.0" encoding="UTF-8"?>< urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" >   <url >      <loc>http://www.example.com/</loc>       <lastmod>2005-01-01</lastmod>       <changefreq>monthly</changefreq>       <priority>0.8</priority>     </url></urlset>

Ejemplo

Page 5: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Este documento describe el esquema XML para el protocolo Sitemap.

El formato del protocolo Sitemap consta de etiquetas XML. Todos los valores de datos de un Sitemap deben incluircaracteres de escape de entidad. El propio archivo debe estar codificado en UTF-8.

Formatos utilizados

Page 6: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

El Sitemap debe:

Comenzar con una etiqueta de apertura <urlset> y terminar con una de cierre </urlset>.

Especificar el espacio de nombres (protocolo estándar) en la etiqueta urlset.

Incluir una entrada <url> para cada dirección URL como una etiqueta XML principal.

Incluir una entrada secundaria <loc> para cada etiqueta principal <url>.

Las demás etiquetas son opcionales. La compatibilidad de estas etiquetas opcionales puede variar en función del motor de búsqueda. Consulte la documentación específica de cada uno de ellos para obtener información detallada.

Además, todas las direcciones URL de un Sitemap deben proceder de un único host, como www.example.com o store.example.com. Para obtener más detalles, consulteUbicación de archivos de Sitemap

Otros formatos son:

Sitemap XML ROR Sitemap TXT HTML

Page 7: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

ATRIBUTO   DESCRIPCION<urlset> obligator

io

Encapsula el archivo y hace referencia al protocolo estándar actual.

<url> obligatorio

Etiqueta principal de cada entrada de URL. Las demás etiquetas son secundarias de esa.

<loc> obligatorio

URL de la página. Esta URL debe comenzar con el protocolo (por ej., http) y acabar con una barra diagonal, si su servidor web así lo requiere. Este valor debe contener menos de 2.048 caracteres.

<lastmod> opcional Fecha de la última modificación del archivo. Esta fecha debe encontrarse en formato Fecha y hora de W3C. Este formato le permite omitir la parte referente a la hora, si así lo desea, y utilizar AAAA-MM-DD.Tenga en cuenta que esta etiqueta es independiente de la cabecera “If-Modified-Since (304)” que puede mostrar el servidor y que los motores de búsqueda pueden utilizar la información de ambas fuentes de forma diferente.

<changefreq> opcional Frecuencia con la que puede cambiar esta página. Este valor proporciona información general a los motores de búsqueda y es posible que no se corresponda exactamente con la frecuencia de rastreo de la página. Valores aceptados: always

hourly

daily

weekly

monthly

yearly

never

El valor "always" (siempre) debe utilizarse para describir documentos que cambian cada vez que se obtiene acceso a ellos. El valor "never" (nunca) debe utilizarse para describir direcciones URL archivadas.Tenga en cuenta que el valor de esta etiqueta se considera una sugerencia y no una orden. A pesar de que los rastreadores de motores de búsqueda puedan tener en cuenta esta información a la hora de tomar decisiones, pueden rastrear páginas marcadas "hourly" (cada hora) con menor frecuencia de lo que indica la marca, así como rastrear páginas marcadas "yearly" (cada año) con más asiduidad. Asimismo, pueden rastrear periódicamente páginas marcadas "never" (nunca) para poder manejar los cambios inesperados que se produzcan en ellas.

<priority> opcional La prioridad de esta dirección URL es relativa con respecto a las demás URL de su sitio. Los valores válidos abarcan desde 0,0 a 1,0. Este valor no afecta a la comparación de sus páginas con respecto a las de otros sitios; únicamente permite informar a los motores de búsqueda de las páginas que considera más importantes para los rastreadores.La prioridad predeterminada de una página es 0,5.Tenga en cuenta que la prioridad que asigne a la página no suele influir en la posición de sus URL en las páginas de resultados de los motores de búsqueda. Los motores de búsqueda pueden utilizar esta información para elegir entre varias URL del mismo sitio, de modo que puede emplear esta etiqueta para incrementar las probabilidades de que sus páginas más importantes se incluyan en un índice de búsqueda.Asimismo, tenga en cuenta que la asignación de alta prioridad a todas las URL de su sitio probablemente no le servirá de ayuda, dado que la prioridad es relativa y sólo se utiliza para elegir entre las distintas URL de su sitio.

Cuadro etiquetas

Page 8: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Uso de caracteres no alfanuméricos en las URL de los sitemaps ;Como requisito, su archivo de Sitemap debe tener codificación UTF-8; habitualmente puede establecerlo así al guardar el archivo. Al igual que sucede con todos los archivos XML, los valores de datos (incluidas las URL) deben utilizar códigos de escape de entidad para los caracteres de la tabla que aparece a continuación.

Caracteres de Escape de Entidad

Carácter Código con caracteres de escape

Símbolo de unión (&) &amp;

Comillas simples ' &apos;

Comillas " &quot;

Mayor que > &gt;

Menor que < &lt;

A continuación se muestra un ejemplo de una URL que utiliza un carácter no ASCII(ü)y un carácter que requiere una codificación de escape de entidad(&): http://www.example.es/ümlat.html&q=name

A continuación se encuentra la misma URL, con codificación ISO-8859-1 (para su alojamiento en un servidor que utiliza esa codificación) y la URL con caracteres de escape: http://www.example.com/%FCmlat.html&q=name

Page 9: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

La ubicación de un archivo sitemaps es algo bastante importante ya que nos va a decir el tipo de urls que podemos incluir. Lo más sencillo de entender es que si nosotros colocamos el archivo sitemap en una url como esta: http://www.dominio.com/carpeta/ no podríamos incluir urls como la siguiente: http://www.dominio.com/prueba.html

Otro factor importante a tener en cuenta

es que todas las url del archivo sitemaps tienen que tener el mismo protocolo, es decir, si hemos incluido url del tipo de http://.... no podemos poner urls del tipo de https://.....

Además las urls que incluimos tienen que

estar en el mismo host donde se encuentra el archivo sitemaps.

Ubicación de un archivo sitemaps

Page 10: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Crea dos sitemaps: uno para los usuarios y otro para los motores de

búsqueda

• Sitemap HTML

Un mapa del sitio es una página normal y corriente de nuestro sitio web en el que se muestra su estructura, y que normalmente consiste en una lista jerárquica de las páginas que lo conforman. Puede que los usuarios visiten esta página si no pueden encontrar alguna página determinada de nuestro sitio web, aunque puede que los motores de búsqueda también visiten esta página para una mejor indexación de las páginas del mismo. Esta página se crea principalmente para los usuarios.

Se pueden unir en un site maps varios sitemaps

Page 11: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Sitemap XML

Un archivo Sitemap XML, el cual puede enviarse a través de las Herramientas para webmasters de Google, facilita que Google encuentre las páginas de tu sitio web. Usar un archivo sitemap es además una forma de decirle a Google, aunque no de garantizar, qué versión de una URL prefieres como la principal (p. ej. http://brandonsbaseballcards.com/ o http://www.brandonsbaseballcards.com/; Por otra parte, Google ayudó a crear la secuencia de comandos del generador de sitemaps, de código abierto, que a su vez te ayuda a crear tu archivo sitemap.

Herramientas para Webmasters de Google: https://www.google.es/webmasters/tools

Page 12: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

El formato XML de un archivo de índice de sitemap es muy parecido al formato XML de un archivo de sitemap. El archivo de índice de sitemap utiliza las siguientes etiquetas XML:

<sitemapindex>: la etiqueta principal que delimita al archivo.<sitemap>: la etiqueta principal de cada sitemap que figura en el archivo (dependiente de <sitemapindex>).<loc>: la ubicación del sitemap (dependiente de <sitemap>).<lastmod>: la fecha de la última modificación del sitemap (opcional).

ARCHIVO DE INDICE DE SITEMAPS

Page 13: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Índice de sitemap en XML de muestra

El siguiente ejemplo muestra un índice de sitemap en formato XML. El índice de sitemap tiene dos sitemaps:

<?xml version="1.0" encoding="UTF-8"?> <sitemapindex xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"> <sitemap> <loc>http://www.example.com/sitemap1.xml.gz</loc> <lastmod>2004-10-01T18:23:17+00:00</lastmod> </sitemap> <sitemap> <loc>http://www.example.com/sitemap2.xml.gz</loc> <lastmod>2005-01-01</lastmod> </sitemap> </sitemapindex>

Una vez que haya creado su archivo de índice de sitemaps, guárdelo y envíelo a Google. Si ha subido y guardado todos sus sitemaps, no será necesario que envíe cada uno de ellos de forma individual. Lo único que debe hacer es enviar el archivo de índice de sitemaps. Puede enviar un máximo de 500 archivos de índice de sitemap de cada uno de los sitios de su cuenta.

Page 14: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

La respuesta es sí y el procedimiento es muy similar al que usamos en Google.

Primero que nada, tenemos que tener una cuenta de Yahoo. Si no la tenemos, nos registramos gratuitamente y listo; luego, ingresamos a Yahoo! Search y allí hacemos click en Submit Your Site for Free.

En esa nueva página hay dos acciones que podemos realizar; la primera, Submit a Website or Webpage, agregará nuestro sitio al buscador lo que nos garantizará ser indexados. La segunda, Submit Site Feed es la más interesante, enviar un sitemap:

Enter the full URL of the site feed you would like to submit:

Please include the http:// prefix (for example, http://www.yahoo.com).

Podemos utilizar diferentes formatos para indicar la URL del sitemap pero, en Blogger sólo tenemos dos alternativas y cualquiera de ellas es válida:

http://nombreBlog.blogspot.com/rss.xml

o bien:

http://nombreBlog.blogspot.com/atom.xml

Luego, hacemos click en el botón Authentication que nos abrirá una ventana donde deberemos determinar el método de autentificación y, nuevamente, sólo hay una alternativa posible, agregar una etiqueta META, algo que por suerte, Yahoo comenzó a implementar este año. Así que, copiamos la etiqueta que será algo similar a esto:

<META content='123456789abcdef' name='y_key'/>

Y la pegamos justo después de </TITLE> recordando que la etiqueta META no tiene una etiqueta de cierre así que, para que Blogger la acepte, debemos agregarle la barra de cierre final.

Una vez que lo hacemos, guardamos la plantilla y click en el botón Ready to Authenticate. Nuestro sitio aparecerá como pendiente de autentificación y ahora, sólo restará esperar.

Otras forma de crear un sitemaps.

Page 15: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

sitemap en MSN, se puede obtener ingresando en MSN Webmasters Tools. Necesitamos tener una Windows Live ID y si no, nos registramos gratuitamente.

En la página, agregamos la URL de nuestro sitio y la URL de los feeds, como en todos los otros casos:

Web address: http://nombreBlog.blogspot.com

Sitemap address: http://nombreBlog.blogspot.com/rss.xml

Y establecemos como método de verificación, agregar un etiqueta META que colocamos en la plantilla junto con las otras. Por último, click en SUBMIT y todo listo.

De allí en adelante, podemos cambiar ese sitemap simplemente enviándolo directamente:

Page 16: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Como se ve, si el buscador posee un sistema de sitemaps y no encontramos una dirección que nos facilite su ingreso, podemos agregar el nuesto a cualquiera de ellos siguiendo siempre el mismo tipos de código:

http://urlBuscador/ping?sitemap=http://nombreBlog.blogspot.com/rss.xml

Page 17: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Para realizar la validación de un sitemap se pueden utilizar dos métodos:

1. La utilización de unos esquemas XML que definen los elementos y atributos que puede contener en el archivo sitemap. Los vínculos desde donde se pueden descargar estos esquemas son:Para Sitemaps: http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsdPara archivos de índice de Sitemap: http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd

2. Mediante la utilización de herramientas que permiten validar la estructura del sitemap. Se puede encontrar una lista de herramientas en las siguientes ubicaciones:

http://www.w3.org/XML/Schema#Toolshttp://www.xml.com/pub/a/2000/12/13/schematools.htmlhttp://www.validome.org/http://www.xml-sitemaps.com/validate-xml-sitemap.html

VALIDACIÓN DE UN SITEMAP

Page 18: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Para poder validar un archivo de Sitemap o su archivo de índice de Sitemap en función de un esquema, el archivo XML necesita de cabeceras adicionales, como estas:

Sitemap:<?xml version='1.0' encoding='UTF-8'?><urlset xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"         

xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/sitemap.xsd"   

xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   <url>   

...   </url></urlset>

o Archivo de índice de Sitemap:<?xml version='1.0' encoding='UTF-8'?><sitemapindex xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"         

xsi:schemaLocation="http://www.sitemaps.org/schemas/sitemap/0.9 http://www.sitemaps.org/schemas/sitemap/0.9/siteindex.xsd"         xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">   

<sitemap>      ...   </sitemap></sitemapindex>

Page 19: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Aunque Google acepta sitemaps web en diferentes formatos, se recomienda utilizar aquellos que empleen el protocolo de sitemaps. De este modo, el mismo archivo se puede enviar a otros motores de búsqueda, como Bing y Yahoo!, que son miembros de sitemaps.org.

A continuación, se muestra un ejemplo de un sitemap básico con una única entrada para una URL que incluye una imagen y un vídeo (para comodidad del usuario, solo se muestra un subconjunto de la información de vídeo disponible).

<?xml version="1.0" encoding="UTF-8"?> <urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9" xmlns:image="http://www.sitemaps.org/schemas/sitemap-image/1.1" xmlns:video="http://www.sitemaps.org/schemas/sitemap-video/1.1"> <url> <loc>http://www.example.com/foo.html</loc> <image:image> <image:loc>http://example.com/imagen.jpg</image:loc> </image:image> <video:video> <video:content_loc>http://www.example.com/video123.flv</video:content_loc> <video:player_loc allow_embed="yes" autoplay="ap=1"> http://www.example.com/reproductordevideo.swf?video=123</video:player_loc> <video:thumbnail_loc>http://www.example.com/thumbs/123.jpg</video:thumbnail_loc> <video:title>Barbacoas en verano</video:title> <video:description>Consiga que los filetes queden perfectamente hechos siempre</video:description> </video:video> </url> </urlset> Puede crear su sitemap de forma manual, pero también se encuentran disponibles algunas herramientas externas que pueden servir de ayuda para crearlos. Además de este formato estándar, Google también admite los formatos que se indican a continuación como sitemaps.

La forma mas acertada para que el buscador google reconozca un Sitemap.

Page 20: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

GRACIAS

Page 21: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Como ya comentamos anteriormente, un SiteMap es un archivo XML cuya construcción debe seguir una serie de pautas especificadas en el protocolo de sitemaps, y por tanto requiere conocimiento de código. Teniendo en cuenta que estos archivos nos ayudan en la indexación, no podemos permitir que el desconocimiento de programación nos evite poseer nuestro propio SiteMap.

Por tanto, vamos a construir un SiteMap para nuestra Web utilizando generadores automáticos, que realizan el trabajo de modo eficaz, rápido y sencillo. En la red contamos con varias posibilidades como son:

- SiteMap generator de Google, en línea, tan sólo requiere la inserción de la url de tu sitio y presionando la tecla Start Site Craw, nos devuelve una página que contiene el SiteMap para descargar y guardar. 

- XML-Sitemaps, que funcionan en línea, insertas la url de tu sitio y presionas en Generate SiteMap.

- GSiteCrawler, una aplicación que funciona exactamente igual, pero en modo local. La instalamos, abrimos y seguimos los pasos. Comenzamos en la etiqueta Add New Proyect y vamos rellenando hasta generar el archivo

Como crear un sitemap

Page 22: Yinet Esmeralda Garzon Lorena Cardoso Heiddy Juliet Mejia Cristian Rengifo Carlos Castellanos Franklin Duban Marin Especialización Tecnológica Web Master.

Independientemente del modo de creación, guardamos el archivo XML generado en la raíz local de nuestro sitio, y lo subimos a nuestro servidor como otro archivo cualquiera. 

Abrimos las herramientas de webmaster de Google, opción Panel y añadimos la URL de nuestro Website (la página principal), nos devuelve un mensaje indicando que se ha añadido el sitio y te indica el Estado del Índice, reflejando las páginas indexadas (si las tuviéramos), y te advierte que no se ha encontrado ningún siteMap, el cual tendremos que subir ahora. Esta página te indica también los errores de rastreo que existen. 

Vamos a nuestro servidor web y abrimos el archivo sitemap.xml que hemos generado anteriormente (nuestro SiteMap), lo abrimos en red para conseguir su URL y la copiamos. Después volvemos a herramientas de webmaster, pestaña SiteMap y rellenamos en el campo vacío el resto de la dirección del SiteMap (automáticamente sale la primera parte de la dirección). Presionamos en enviar Sitemap. Si todo es correcto te devuelve un mensaje indicando que se ha añadido un SiteMap y que los informes pueden tardar horas en actualizarse. 

Al cabo de un tiempo (depende de Google), esta página nos proporciona información sobre el funcionamiento del rastreo e indexación de las páginas incluidas en el SiteMap por parte de Google.