Gestión de errores e Indexación en sitios enormes - Eshow 2014

54
Gestión de Errores e Indexación en sitios e

description

Gestión de errores e Indexación en sitios enormes - Eshow 2014

Transcript of Gestión de errores e Indexación en sitios enormes - Eshow 2014

Page 1: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Gestión de Errores e Indexación en sitios enormes

Page 2: Gestión de errores e Indexación en sitios enormes - Eshow 2014

¿Quíen soy?Pedro MartínezResponsable Departamento SEO en Unidad Editorial

Page 3: Gestión de errores e Indexación en sitios enormes - Eshow 2014

¿Más de 1000?

Page 4: Gestión de errores e Indexación en sitios enormes - Eshow 2014
Page 5: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Detectando errores

WMT3 Métodos

Google Analytics

Logs de servidor

Page 6: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Google Webmasters Tools

Page 7: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Errores en diferentes plataformas

- Errores mostrados para diferentes dispositivos y tipos- Tener en cuenta para webs con web movil en dinamic serving o version mobile- Errores en Google News específicos de la plataforma

Google Webmasters Tools

Page 8: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Errores especificos de plataforma - Errores de servidor- Errores 404 Leves- Errores de acceso- Errores 404 (not found)- Otros

Google Webmasters Tools

Page 9: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Códigos de estado HTTP

Page 10: Gestión de errores e Indexación en sitios enormes - Eshow 2014

1xx: Respuestas informativas

2xx: Peticiones correctas

3xx: Redirecciones

4xx: Errores del cliente

5xx: Errores de servidor

Codigos de estado http

Page 11: Gestión de errores e Indexación en sitios enormes - Eshow 2014

3xx: Redirecciones

301: Movido permanentemente302: Movido temporalmente303: Vea Otra (desde HTTP/1.1)307: Movido temporalmente (desde HTTP/1.1)

Codigos de estado http

Page 12: Gestión de errores e Indexación en sitios enormes - Eshow 2014

4xx: Errores del cliente

403 : Prohibido

404 : No encontrado408 : Tiempo de espera agotado410 : Ya no disponible

503 : Servicio no disponible

Codigos de estado http

Page 13: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Webmasters toolshttps://developers.google.com/webmaster-tools/

•De forma directa desde WMT•Desde la API•Desde “Errors crawl feed”

3 métodos

Page 14: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Descargar Errores

• Descarga CSV desde Webmasters tools• Hasta 1000 por tipo

• Descarga la API de Webmasters tools• Hasta 100.000 por tipo

• Crawl Errors Feed• En teoría todos

Page 15: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Da de alta tus directorios en WMT

Page 16: Gestión de errores e Indexación en sitios enormes - Eshow 2014

API WMThttps://developers.google.com/webmaster-tools/

Page 17: Gestión de errores e Indexación en sitios enormes - Eshow 2014

API WMThttps://developers.google.com/webmaster-tools/

Ejemplos de conexión en varios lenguajes - Python

https://developers.google.com/webmaster-tools/v3/quickstart/quickstart-python?hl=es

- PHP

https://github.com/eyecatchup/php-webmaster-tools-downloads

Page 18: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Crawl Errors Feed

http://searchengineland.com/google-webmaster-tools-crawl-errors-how-to-get-detailed-data-from-the-api-115153

<atom:entry> <atom:id>id</atom:id> <wt:crawl-type>web-crawl</wt:crawl-type> <wt:issue-type>http-error</wt:issue-type> <wt:url>http://example.com/dir/</wt:url> <wt:detail>4xx Error</wt:detail> <wt:linked-from>http://example.com</wt:linked-from> <wt:date-detected>2008-11-17T01:06:10.000 </wt:date-detected></atom:entry>

Page 19: Gestión de errores e Indexación en sitios enormes - Eshow 2014

API WMThttps://developers.google.com/webmaster-tools/

CSVAPI

MYSQL

Excel

Page 20: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Errores en excel

Page 21: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Errores en excelTabla dinamica

Page 22: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Errores en excel

• Segmenta todos los errores

• Visualízalos en una línea de tiempo

• Comprueba tendencias

• Busca patrones

Page 23: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Buscando errorescon Google

Analytics

Page 24: Gestión de errores e Indexación en sitios enormes - Eshow 2014

¡Taguea tus errores!

Google Analytics

Page 25: Gestión de errores e Indexación en sitios enormes - Eshow 2014

A tener en cuenta:

Google Analytics

Nuestra pagina muestra la 404 conservando la URL o no

Si redirige: Añadimos el tag a nuestra pagina personalizada

Si NO redirige: Podemos hacerlo desde Tag Manager o Añadiendo un evento

http://www.lunametrics.com/blog/2014/08/19/404-errors-google-analytics-google-tag-manager/

Page 26: Gestión de errores e Indexación en sitios enormes - Eshow 2014

• ¡OJO !Solo se registran errores de usuarios no de crawerls

• Si creamos un objetivo para nuestros errores podemos ver como han llegado a el nuestros usuarios

Google Analytics

Page 27: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Analizar logsdel servidor

Adelántate a Google

Page 28: Gestión de errores e Indexación en sitios enormes - Eshow 2014

• Busca un buen visualizador

• Siempre puedes exportar a excel

• Busca un buen PC…

Analisis de Logs

Page 29: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Kibana

Page 30: Gestión de errores e Indexación en sitios enormes - Eshow 2014

• Kibana

• Splunk

Herramientas de analisis de Logs

http://www.visualisingdata.com/index.php/resources/

Recursos

Page 31: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Dashboards personalizados

- Una gestión visual de los códigos de estado leidos directamente de los logs te permitirá tener una visual en el tiempo de la salud de tu site

Page 32: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Dashboards personalizados

- Agrupa y diferencia las respuesta de servidor frente al resto de códigos

Page 33: Gestión de errores e Indexación en sitios enormes - Eshow 2014
Page 34: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Se original pero no olvides la funcionalidad

Page 35: Gestión de errores e Indexación en sitios enormes - Eshow 2014
Page 36: Gestión de errores e Indexación en sitios enormes - Eshow 2014

• Un enlace a la home o buscador

• Un enlace al sitemap de la página

• Proporciona una salida rápida

• Un toque distintivo

Ideas para nuestra página de error

Page 37: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Convierte el problema en una oportunidad

No culpes al usuario de tus errores

¡Importante!

Page 38: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Comprobar si esas paginas existen o si se debe a un problema de acceso

Verificar si queremos que Google indexe ese contenido

Corrigiendo errores 404

Page 39: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Si nunca mas van a estar accesibles y Google no debe rastrearlas

Eliminamos la URL o

carpeta desde WMT

Bloqueamos el acceso desde el robots.txt

Marcamos el error como solucionado

en WMT

Corrigiendo errores 404

Page 40: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Screaming Frog es un software muy ligero que reside en tu PC y con el cual se puede realizar un crawl completo de un sitio web.

Screaming Frog es DIOS

Page 41: Gestión de errores e Indexación en sitios enormes - Eshow 2014

El numero de links internos que apuntan a la URI seleccionada en la ventana superior

Page 42: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Comprueba los errores de rastreo que GWT te notifica

1. Descarga desde Google Webmaster Tools el listado de 404;

2. Elimina eventuales duplicados;

3. Copia todas la URLs en file .txt;

4. Usa Screaming Frog en List Mode y rastrea URLs del file .txt;

5. Exporta los 404 que han quedado después del rastreo y

corrígelos.

Page 43: Gestión de errores e Indexación en sitios enormes - Eshow 2014

1.Salva las antiguas URLs en un fichero .csv o .txt

2.Cárgalo en Screaming Frog

3.Comprueba que todas hagan 301 correctamente

4.Exporta las URLs defectuosa y corrige los errores

En una migración

Page 44: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Screaming Frog

Page 45: Gestión de errores e Indexación en sitios enormes - Eshow 2014

DeepCrawl http://deepcrawl.co.uk/

Page 46: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Monitoriza tu web… …y a tu

competencia

Page 47: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Control de indexación

Page 48: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Indices de sitemaps por secciones

Page 49: Gestión de errores e Indexación en sitios enormes - Eshow 2014

GWT – Parámetros de URL¡¡¡¡¡¡Precaución!!!!!!

Page 50: Gestión de errores e Indexación en sitios enormes - Eshow 2014

GWT – Explorar como Google- Permite analizar la pagina como el bot de Google, detectar posibles errores - Posibilita enviar paginas o carpetas para su indexación

Page 51: Gestión de errores e Indexación en sitios enormes - Eshow 2014

http://cortefiel.com/es/tienda/hombre/cazadoras/

http://cortefiel.com/es/tienda/hombre/cazadoras/?option_value_talla=&price_order=asc&ov_color_sku=

<link rel="canonical" href="http://cortefiel.com/es/tienda/hombre/cazadoras/"/>

Link: <http://www.example.com/descargas/libro-blanco.pdf>; rel="canonical"

Ficheros HTML

Ficheros PDF o cualquier indexable por Google

Canonical

Añadir en las cabeceras

Page 52: Gestión de errores e Indexación en sitios enormes - Eshow 2014

¿rel="canonical" es una sugerencia o una directiva?

¿Puede ser el enlace absoluto o relativo?

¿El contenido de un conjunto de páginas debe ser similar al de la versión canónica?

¿Qué sucede si rel="canonical" conduce a una página que no existe?

¿Puede seguir Google una cadena de designaciones rel="canonical"?

¿Se puede utilizar rel="canonical" para sugerir una URL canónica de un dominio completamente distinto?

Que debes saber de “Canonical”

Page 53: Gestión de errores e Indexación en sitios enormes - Eshow 2014

GWT – URL bloqueadas, Robots.txt

Page 54: Gestión de errores e Indexación en sitios enormes - Eshow 2014

Gracias!!

Pedro MartínezTwitter: @PedroMG