jueves, 3 de marzo de 2016

Act P2P - Módulo 4 - Web superficial y web profunda

WEB SUPERFICIAL Y WEB PROFUNDA


WEB SUPERFICIAL O VISIBLE


  • Constituida por sitios cuya información puede ser indexada por robots de los buscadores convencionales y recuperada casi en su totalidad mediante una consulta en sus formularios de búsqueda.
  • Características:
    • La información no está contenida en bases de datos
    • Es de libre acceso
    • No requiere ningún tipo de registro
    • Generalmente contiene páginas Web estáticas, páginas o archivos con URL fija y accesibles desde otro enlace.


WEB PROFUNDA O INVISIBLE


  • Conformada por información disponible en Internet que no se recupera a través de los buscadores convencionales.
  • Características:
    • Generalmente es información almacenada y accesible mediante bases de datos
      • Los resultados de búsqueda en este espacio se generan al responder a una pregunta directa a páginas dinámicas, las que no tienen una URL fija, se construyen en el instante (temporales) y desaparecen una vez cerrada la consulta
  • Tipos:
    • Web opaca
      • Compuesta por archivos que podrían estar incluidos en los índices de los buscadores
      • No lo están, sea por limitaciones de la indización convencional (extensión, frecuencia, número máximo de resultados mostrados), o porque se trata de un documento que no tiene un link desde otro documento y así no se encuentra indizada
    • Web privada
      • También constituida por páginas Web que podrían estar indizadas en los buscadores
      • No están disponibles deliberadamente por decisión de los dueños de la información que contienen, quienes utilizan diversos mecanismos para su exclusión (contraseñas, archivos robot.txt, campo “noindex”) que impiden su indización
    • Web propietaria
      • Comprende páginas en las que se debe registrar (de forma gratuita o pagada) para acceder a su contenido 
    • Web realmente invisible
      • Conformada por páginas que no pueden ser indizadas debido a limitaciones técnicas de los buscadores
      • Se compone de páginas generadas de manera dinámica, es decir, que se crean a partir de datos introducidos por el usuario, o de información almacenada en bases de datos relacionales, no extraible sin una solicitud específica
  • Motores de búsqueda (ejemplos de recursos académicos)
    • The WWW Virtual Library
    • Infoplease, Deep Web, Academia.edu, Reefseek.com, Jurn, Science
    • TechXtra
  • Perspectiva
    • 'No indizable' es un término más preciso que 'invisible' para denominar esta Web no accesible por los motores convencionales
    • Sus fronteras retroceden progresivamente, es decir, es cada vez menos 'invisible'
    • Sus contenidos se van incorporando paulatinamente a los motores convencionales (ej. Google) conforme estos se convierten en herramientas de búsqueda más poderosas



No hay comentarios:

Publicar un comentario