artículo web invisible

2
Web invisible Para tener una idea de la magnitud de la denominada Internet oculta, Internet invisible o web invisible, así como la problemática implicada Lamarca señala que: Hay estimaciones que calculan en 500 veces más grande que el total de la información indizada por los buscadores, la información que permanece invisible en la World Wide Web, lo que se ha denominado el inmenso océano de la Internet profunda. Aunque los buscadores generalistas no suelen indizar archivos no textuales, sí existen una serie de buscadores especializados que indizan imágenes, vídeo, audio, archivos pdf, archivos comprimidos o ejecutables. Sin embargo, muchísimos datos quedan fuera de los buscadores tradicionales, ya sean estos generalistas o especializados, puesto que indizar cierto tipo de informaciones contenidas en enormes bases de datos numéricas o textuales, exige gastar muchos recursos y resulta muy costoso para los buscadores almacenar en sus bases de datos este tipo de formatos. Por otro lado, los buscadores tampoco indizan muchos de los datos que se generan de forma dinámica en tiempo real, puesto que se convierten en obsoletos en un brevísimo lapso de tiempo y no merece gastar recursos en informaciones tan fugaces; y a esto se une que muchas de estas bases de datos dinámicas han de rastrearse desde su propia ubicación o sitio web, y con sus propias herramientas de búsqueda personalizadas, puesto que precisan de pasarelas o contraseñas especiales para acceder a ellas. Si a esto unimos las páginas sin conexión o enlaces aparentes, vemos que una enorme masa de información no es accesible desde los principales buscadores existentes en la World Wide Web. A toda esta gran masa de información es a la que se ha denominado Internet oculta (Lamarca Lapuente, 2013). De acuerdo a Codina: Los cambios en la Web Invisible, cuyas fronteras no dejan de retroceder, y el desarrollo de la web semántica marcará buena parte del futuro de los sistemas de búsqueda en línea de los próximos años. La Web Invisible es cada vez menos invisible porque, poco a poco, y de una forma u otra, sus contenidos se van incorporando a los motores de búsqueda. La web semántica es la más ambiciosa e importante apuesta tecnológica y científica del W3 Consortium y afectará en gran medida a los desarrollos futuros en sistemas de representación y acceso a la información. Según el estudio How much Information? 2003, realizado por Peter Lyman y Hal R. Varian de la School of Information Management and Systems de la Universidad de California, Berkeley, la cantidad de información de la Web navegable o visible es de 147 terabytes, mientras que la Web invisible es de 91.850 terabytes. (Codina Bonilla, 2003). En la figura siguiente se muestra claramente que la Web indizable es sumamente pequeña en el conjunto de la Web y que la región indizable, esto es, de la que efectivamente pueden extraer información los buscadores, es muy pequeña y se corresponde en gran parte con la zona pública estática. La figura también muestra que, en la actualidad, las páginas con información semántica son muy pocas, por lo que la Web Semántica, queda todavía lejos (Tomado de http://www.hipertexto.info/documentos/web_invisib.htm).

Upload: victorpando

Post on 14-Sep-2015

213 views

Category:

Documents


0 download

DESCRIPTION

Web invisible, Internet invisible.

TRANSCRIPT

  • Web invisible

    Para tener una idea de la magnitud de la denominada Internet oculta, Internet invisible o web

    invisible, as como la problemtica implicada Lamarca seala que:

    Hay estimaciones que calculan en 500 veces ms grande que el total de la informacin

    indizada por los buscadores, la informacin que permanece invisible en la World Wide

    Web, lo que se ha denominado el inmenso ocano de la Internet profunda.

    Aunque los buscadores generalistas no suelen indizar archivos no textuales, s existen

    una serie de buscadores especializados que indizan imgenes, vdeo, audio, archivos pdf,

    archivos comprimidos o ejecutables. Sin embargo, muchsimos datos quedan fuera de

    los buscadores tradicionales, ya sean estos generalistas o especializados, puesto que

    indizar cierto tipo de informaciones contenidas en enormes bases de datos numricas o

    textuales, exige gastar muchos recursos y resulta muy costoso para los buscadores

    almacenar en sus bases de datos este tipo de formatos. Por otro lado, los buscadores

    tampoco indizan muchos de los datos que se generan de forma dinmica en tiempo real,

    puesto que se convierten en obsoletos en un brevsimo lapso de tiempo y no merece

    gastar recursos en informaciones tan fugaces; y a esto se une que muchas de estas bases

    de datos dinmicas han de rastrearse desde su propia ubicacin o sitio web, y con sus

    propias herramientas de bsqueda personalizadas, puesto que precisan de pasarelas o

    contraseas especiales para acceder a ellas. Si a esto unimos las pginas sin conexin o

    enlaces aparentes, vemos que una enorme masa de informacin no es accesible desde

    los principales buscadores existentes en la World Wide Web. A toda esta gran masa de

    informacin es a la que se ha denominado Internet oculta (Lamarca Lapuente, 2013).

    De acuerdo a Codina:

    Los cambios en la Web Invisible, cuyas fronteras no dejan de retroceder, y el desarrollo

    de la web semntica marcar buena parte del futuro de los sistemas de bsqueda en

    lnea de los prximos aos. La Web Invisible es cada vez menos invisible porque, poco a

    poco, y de una forma u otra, sus contenidos se van incorporando a los motores de

    bsqueda. La web semntica es la ms ambiciosa e importante apuesta tecnolgica y

    cientfica del W3 Consortium y afectar en gran medida a los desarrollos futuros en

    sistemas de representacin y acceso a la informacin.

    Segn el estudio How much Information? 2003, realizado por Peter Lyman y Hal R.

    Varian de la School of Information Management and Systems de la Universidad de

    California, Berkeley, la cantidad de informacin de la Web navegable o visible es de 147

    terabytes, mientras que la Web invisible es de 91.850 terabytes. (Codina Bonilla, 2003).

    En la figura siguiente se muestra claramente que la Web indizable es sumamente pequea en el

    conjunto de la Web y que la regin indizable, esto es, de la que efectivamente pueden extraer

    informacin los buscadores, es muy pequea y se corresponde en gran parte con la zona pblica

    esttica. La figura tambin muestra que, en la actualidad, las pginas con informacin semntica

    son muy pocas, por lo que la Web Semntica, queda todava lejos (Tomado de

    http://www.hipertexto.info/documentos/web_invisib.htm).

  • Fuente: Ricardo Baeza Yates. http://www.dcc.uchile.cl/~rbaeza/inf/webfaces.gif

    Referencias

    Codina Bonilla, L. (2003). Internet invisible y web semntica: el futuro de los sistemas de

    informacin en lnea? Tradumtica, (2). Recuperado a partir de

    http://ddd.uab.cat/record/4872/

    Lamarca Lapuente, M. J. L. (2013, diciembre 8). La Web invisible [tesis]. Recuperado 20 de

    junio de 2015, a partir de http://www.hipertexto.info/documentos/web_invisib.htm