viernes, 18 de diciembre de 2015






La caracterización de la Web Superficial y la Web Profunda



Cuando realizamos a una búsqueda en Internet, nos enfrentamos por un lado a la falta de organización en cuanto a la información obtenida y por otro al sesgo que cada motor de búsqueda hace limitando así resultados obtenidos. 

La mayoría de los buscadores acceden a la información que se encuentra en la web de forma superficial, recorren aquellas páginas estáticas recuperan información, la indizan y posteriormente la selecciona y la presenta acorde a un mapa establecido hecho con un criterio propio. Esto se lleva a cabo mediante los crawlers o software que utiliza los motores de recuperación comunes.  En la Web Superficial accedemos tan sólo a una parte de la información existente, es por la que navegan normalmente la gran mayoría de usuarios.



Existe otro tipo de web llamada la Web Profunda por la que discurre grandes cantidades de información, según muchos autores la información existente en esta supera en gran medida a la Web Superficial. Las páginas no rastreadas por los buscadores convencionales son aquellas denominadas paginas dinámicas, caracterizadas por contener grandes cantidades de información pero sin una URL fija ya que se generan en el momento en que se realiza la consulta -temporales- y desaparecen en cuanto la consulta acaba, provienen de formularios, otras son bases de datos, webs privadas, webs propietarias en las que hace falta registrarse para acceder entre otras. Encontrar y fondear esta Web Profunda requiere disponer de otros tipos de buscadores dotados de crawlers o software capaces de indexar información de páginas dinámicas, para ello utilizan algoritmos capaces de asociar campos semánticos (conceptos, relaciones, propiedades, taxonomias) y establecer reglas de inferencias en torno a un dominio de interés. Ejemplos donde encontrar información de esta Web Profunda de forma organizada y rigurosa son:


En algunos de estos sitios es posible encontrar información estructurada clasificada por términos y áreas del conocimiento es el caso de Info Place o Techxtra sobre ingeniería, matemáticas o informática. Otras como Deep Web,  debemos de precavernos y andar con cautela por esta Agora de información. Para que tengáis un ejemplo os dejo un vídeo que puede dar una idea de lo que podemos encontrar tanto en la variedad como en la cantidad de información, es como considerarla como la otra cara de la moneda.



"Una semana en la DEEP WEB, esto es lo que te vas a encontrar"



https://www.youtube.com/watch?v=crkPLzuysKE








Pech May, F., Martinez Rebolar, A., Estrada Esquivel H., et al. "Crawler de Recursos Multimedia para la Web Superficial y Oculta". Aportes al conocimiento en ingeniería, nº 13, 2015; pags. 39-50.  ISSN-e 2145-4086, ISSN 2145-4086,

Beltran Orenes, Pilar. "La documentación informativa y la recuperación de la información escrita. Nuevas competencias para el ciberestacio". Departamento de Ciencias de la Comunicación y la Lengua Española. Universidad Rey Juan Carloshttp://journals.sfu.ca/indexcomunicacion/index.php/indexcomunicacion/index