artículo web invisible
DESCRIPTION
Web invisible, Internet invisible.TRANSCRIPT
-
Web invisible
Para tener una idea de la magnitud de la denominada Internet oculta, Internet invisible o web
invisible, as como la problemtica implicada Lamarca seala que:
Hay estimaciones que calculan en 500 veces ms grande que el total de la informacin
indizada por los buscadores, la informacin que permanece invisible en la World Wide
Web, lo que se ha denominado el inmenso ocano de la Internet profunda.
Aunque los buscadores generalistas no suelen indizar archivos no textuales, s existen
una serie de buscadores especializados que indizan imgenes, vdeo, audio, archivos pdf,
archivos comprimidos o ejecutables. Sin embargo, muchsimos datos quedan fuera de
los buscadores tradicionales, ya sean estos generalistas o especializados, puesto que
indizar cierto tipo de informaciones contenidas en enormes bases de datos numricas o
textuales, exige gastar muchos recursos y resulta muy costoso para los buscadores
almacenar en sus bases de datos este tipo de formatos. Por otro lado, los buscadores
tampoco indizan muchos de los datos que se generan de forma dinmica en tiempo real,
puesto que se convierten en obsoletos en un brevsimo lapso de tiempo y no merece
gastar recursos en informaciones tan fugaces; y a esto se une que muchas de estas bases
de datos dinmicas han de rastrearse desde su propia ubicacin o sitio web, y con sus
propias herramientas de bsqueda personalizadas, puesto que precisan de pasarelas o
contraseas especiales para acceder a ellas. Si a esto unimos las pginas sin conexin o
enlaces aparentes, vemos que una enorme masa de informacin no es accesible desde
los principales buscadores existentes en la World Wide Web. A toda esta gran masa de
informacin es a la que se ha denominado Internet oculta (Lamarca Lapuente, 2013).
De acuerdo a Codina:
Los cambios en la Web Invisible, cuyas fronteras no dejan de retroceder, y el desarrollo
de la web semntica marcar buena parte del futuro de los sistemas de bsqueda en
lnea de los prximos aos. La Web Invisible es cada vez menos invisible porque, poco a
poco, y de una forma u otra, sus contenidos se van incorporando a los motores de
bsqueda. La web semntica es la ms ambiciosa e importante apuesta tecnolgica y
cientfica del W3 Consortium y afectar en gran medida a los desarrollos futuros en
sistemas de representacin y acceso a la informacin.
Segn el estudio How much Information? 2003, realizado por Peter Lyman y Hal R.
Varian de la School of Information Management and Systems de la Universidad de
California, Berkeley, la cantidad de informacin de la Web navegable o visible es de 147
terabytes, mientras que la Web invisible es de 91.850 terabytes. (Codina Bonilla, 2003).
En la figura siguiente se muestra claramente que la Web indizable es sumamente pequea en el
conjunto de la Web y que la regin indizable, esto es, de la que efectivamente pueden extraer
informacin los buscadores, es muy pequea y se corresponde en gran parte con la zona pblica
esttica. La figura tambin muestra que, en la actualidad, las pginas con informacin semntica
son muy pocas, por lo que la Web Semntica, queda todava lejos (Tomado de
http://www.hipertexto.info/documentos/web_invisib.htm).
-
Fuente: Ricardo Baeza Yates. http://www.dcc.uchile.cl/~rbaeza/inf/webfaces.gif
Referencias
Codina Bonilla, L. (2003). Internet invisible y web semntica: el futuro de los sistemas de
informacin en lnea? Tradumtica, (2). Recuperado a partir de
http://ddd.uab.cat/record/4872/
Lamarca Lapuente, M. J. L. (2013, diciembre 8). La Web invisible [tesis]. Recuperado 20 de
junio de 2015, a partir de http://www.hipertexto.info/documentos/web_invisib.htm