TECNOLOGÍA DE LA TECNOLOGÍA DE LA COMUNICACIÓN ILic. en PeriodismoPeriodismo UniversitarioFCH-UNSL (Año 2015)
CLASE II“INVESTIGACIÓN EN INTERNET:
WWW Visible, Invisible y Semántica”.
CREATIVE COMMONS RECONOCIMIENTO-NOCOMERCIAL-COMPARTIRIGUAL 3.0 UNPORTED LICENSE
DEFINICIÓN Y CARACTERÍSTICAS•Es la porción de la Web que es vista y consecuentementeindexada por los buscadores comunes.
LA WWW VISIBLE O SUPERFICIAL
•Está compuesta por un conjunto de páginas estáticaspúblicamente accesibles.•Constituye una porción relativamente muy pequeña de toda laWeb (un 17% aproximadamente).•La información que se recupera debe ser cuidadosamenteevaluada y validada.
PORCIÓN VISIBLE DE LA WWW
Fuente: How much information? (2003) http://www2.sims.berkeley.edu/research/projects/how-much-info-2003/internet.htm
DEFINICIÓN:Se define como la “porción de la Web que no puede ser
indexada por los buscadores comunes”.
WWW INVISIBLE O PROFUNDA
~17%
Contiene la mejor calidad de información, pero también la más peligrosa, por lo que suele denominarse también “Web Oscura”
~17%
~83%
COMPONENTESSe divide en:
WEB INVISIBLE O PROFUNDA
-Web Opaca-Web Privada-Web Propietaria-Web Realmente Invisible
WEB OPACASe compone de contenidos que no son indexados por un
buscador por cuestiones de economía.
WEB INVISIBLE O PROFUNDA
Solo 2 páginas de Flickr
WEB OPACASolo algunos de sus resultados son devueltos por un
buscador por cuestiones de economía.
WEB INVISIBLE O PROFUNDA
Solo muestra 100 resultados
WEB OPACASe compone de contenidos que pueden no aparecer hasta
después de una actualización del rastreo de los buscadores(frecuencia de indización).
Las páginas creadas del
WEB INVISIBLE O PROFUNDA
Último rastreo: 30/07Próximo rastreo: 30/08
creadas del 31/07 al 29/08 no aparecerán como parte de los resultados!
WEB OPACASe compone de contenidos que pueden no aparecer porque tienen un
número bajo de Page Rank que el buscador no considera a la hora demostrar los resultados.
Solo se muestran las
WEB INVISIBLE O PROFUNDA
muestran las páginas con mayor Page Rank
WEB OPACALas páginas con bajo Page Rank tienen poco o nulo linkeo por medio de
otras páginas, entonces sus direcciones URL se encuentran “pococonectadas” o directamente “desconectadas”
WEB INVISIBLE O PROFUNDA
Quedan entonces fuera del rastreo!!!
WEB PRIVADASe compone de páginas protegidas por contraseñas…
WEB INVISIBLE O PROFUNDA
WEB PRIVADALas páginas contienen un archivo “robots.txt” que evita que
sean indexadas, o también…
WEB INVISIBLE O PROFUNDA
Archivo:“robots.txt”
WEB PRIVADA…o también las páginas contienen un campo “noindex” que evita que el
buscador indice la parte correspondiente al cuerpo de la página.
WEB INVISIBLE O PROFUNDA
Campo: “noindex”
WEB PROPIETARIAIncluye páginas en las que es necesario registrarse para
acceder al contenido.
WEB INVISIBLE O PROFUNDA
WEB REALMENTE INVISIBLEIncluye archivos de la Web en diversos formatos: .pdf, .js, .ppt,
etc.
.JS
WEB INVISIBLE O PROFUNDA
Muchos buscadores han evolucionado y nos permiten encontrar gran diversidad de tipos de archivos…
.JS
.RAR
.ZIP…
WEB REALMENTE INVISIBLEincluye páginas que se generan dinámicamente, esto es, en
tiempo de ejecución (por ej. al realizar una consulta en unabase de datos).
Página dinámica
WEB INVISIBLE O PROFUNDA
Página dinámica
Página estática
WEB REALMENTE INVISIBLEIncluye páginas que se generan en tiempo real (por ej. la
transmisión en vivo y en directo de un partido).
WEB INVISIBLE O PROFUNDA
Página generada en tiempo real
¿CÓMO ACCEDEMOS A ELLA?
WEB INVISIBLE O PROFUNDA
A través de buscadores especializados en bases dedatos que trabajan generalmente a través dedirectorios y motores de búsqueda
DIRECTORIO/ MOTOR DE BÚSQUEDA ESPECIALIZADO COMUNICACIÓN INVISIBLE (http://www.comunicacioninvisible.net/ci/)
BUSCADORES WEB INVISIBLE
Contiene Bases de datos de estudios fílmicos…
BUSCADORES WEB INVISIBLE
Para buscar se utiliza la Búsqueda Avanzada, o bien, por Categorías…
COMUNICACIÓN INVISIBLE.NET
Categorías…
BUSCADORES WEB INVISIBLE
COMUNICACIÓN INVISIBLE.NETBúsqueda por Palabra Clave
Las búsquedas en este caso requieren clarificar la información que deseamos buscar…
doblaje
Argentina
BUSCADORES WEB INVISIBLE
COMUNICACIÓN INVISIBLE.NETBúsqueda por Palabra Clave En caso de no encontrar
resultados podemos efectuar Búsquedas por categorías…
BUSCADORES WEB INVISIBLE
Para buscar se selecciona una categoría…
COMUNICACIÓN INVISIBLE.NETBúsqueda por Categorías
Y luego la sub categoría donde podía encontrarse
BUSCADORES WEB INVISIBLECOMUNICACIÓN INVISIBLE.NETBúsqueda por Categorías
podía encontrarse la información…
A partir de allí aparecen diversas bases de datos donde consultar…
BUSCADORES WEB INVISIBLE
COMUNICACIÓN INVISIBLE.NETBúsqueda por Categorías
El acceso a cada una de ellas constituye un
BUSCADORES WEB INVISIBLECOMUNICACIÓN INVISIBLE.NETBúsqueda por Categorías
proceso que puede llevar mucho tiempo ya sea que busquemos por palabra clave o categorías…
BUSCADORES WEB INVISIBLECOMUNICACIÓN INVISIBLE.NETBúsqueda por Categorías
Los directorios conducen a nuevos sitios con más información cuya exploración demanda tiempo…
DIRECTORIO/ MOTOR DE BÚSQUEDA GENERALSCIELO (http://www.scielo.org/php/index.php?lang=es)
BUSCADORES WEB INVISIBLE
Contiene Bases de datos de revistas científicas…
BUSCADORES WEB INVISIBLESCIELOBúsqueda por Categorías
BUSCADORES WEB INVISIBLESCIELOBúsqueda por Categorías
BUSCADORES WEB INVISIBLESCIELOBúsqueda por Categorías
BUSCADORES WEB INVISIBLESCIELOBúsqueda por palabra clave
Internet
MOTOR DE BÚSQUEDA GENERALISTA
WAYBACK MACHINE (http://archive.org/web/web.php)
BUSCADORES WEB INVISIBLE
Permite el acceso a versiones de sitios web que pueden o no estar en línea…
BUSCADORES WEB INVISIBLE
Para buscar se coloca la dirección web del
WAYBACK
MACHINE
dirección web del sitio y luego se selecciona el año, mes y día que se desea visualizar (siempre que esté disponible)…
BUSCADORES WEB INVISIBLEWAYBACK MACHINE
El resultado es el acceso a la versión en línea de esa información…
¿CÓMO TRABAJAN LOS BUSCADORES PROFUNDOS?
•Se utilizan para buscar información profunda en torno a una temática.
•Poseen una base de datos propia (elaborada por personas o robots)compuesta por sitios web confiables.
•Los resultados pueden estar desactualizados pero son confiables.
BUSCADORES WEB INVISIBLE
•Los resultados pueden estar desactualizados pero son confiables.
•Poseen opciones de búsqueda por categorías o palabra clave. En esteúltimo caso permiten especificar: título, autor, descripción, contenido ypalabras clave, entre otros.
•Permiten la configuración de las bases de datos donde buscar,
la tipología de archivos y el lugar y cantidad de resultados
que devuelven.
WWW SEMÁNTICA“Es una extensión de la Web existente que permite la realización de
búsquedas más inteligentes a través de buscadores inteligentes”.
Se encuentra en desarrollo, requiere de una reestructuración de laWeb para funcionar de manera potente y se proyectan muchosaños para que pueda funcionar en su totalidad…
PROPÓSITOSu objetivo es mejorar las búsquedas, de forma tal que las máquinas no solo sean capaces de utilizar la información, sino también interpretarla…
WWW SEMÁNTICA
“Quiero viajar a Lima, Perú, y sóloquiero gastar 3000 dólares”
ELEMENTOS PARA SU REALIZACIÓN:
WWW SEMÁNTICA
•OWL: conceptos u ontologías que puedan ser utilizadas por usuarios, sistemas ybases de datos.•RDF: o información descriptiva sobre los conceptos y ontologías y cómo seencuentran relacionados.•SPARQL: o lenguaje de consulta sobre las ontologías y su descripción que permita
Ejemplos:OWL: “Pintor”, “Pintura”, “Escuela”, “Lugar”RDF:Información de Pintura: soporte, técnica, proceso, tema, etc.Relación entre “Pintor” y “Pintura”: “Un pintor es el autor de unao más pinturas...”SPARQL: “Pinturas al óleo de Van Gogh”
•SPARQL: o lenguaje de consulta sobre las ontologías y su descripción que permitahacer búsquedas sobre los recursos de la Web
BUSCADORES DE LA WEB SEMÁNTICA
WOLFRAM ALFA Permite la búsqueda por conceptos y devuelve la información asociada al mismo.
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Búsqueda por conceptos
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Búsqueda por conceptos
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Búsqueda operador versus (permite hacer comparaciones entre conceptos)
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Búsqueda operador versus (permite hacer comparaciones entre conceptos)
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Otras búsquedas inteligentes…
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Otras búsquedas inteligentes…
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Otras búsquedas inteligentes…
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Otras búsquedas inteligentes…
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Otras búsquedas inteligentes…
BUSCADORES DE LA WEB SEMÁNTICAWOLFRAM ALFA Desde la sección Ejemplos se ofrece diversas formas de buscar…
FIN DE PRESENTACIÓNGracias por su atención…
Elaborado por Prof. Viviana M. [email protected]
Fac. de Cs. Humanas- UNSL
Top Related