motores de busuqueda 8.1

13
Motores de busqueda Paula Andrea Romero Castro I.E.D Técnico Comercial José De San Martin Cundinamarca Área: informática Tabio 2015

Upload: paula-romero

Post on 16-Aug-2015

218 views

Category:

Documents


1 download

TRANSCRIPT

Motores de busquedaPaula Andrea Romero CastroI.E.D Tcnico Comercial Jos De San MartinCundinamarca rea: inorm!tica Tabio "#$%Motores de b&squedaPaula Andrea Romero CastroManual 'ara a'licar normas Icontec 'ara los traba(os de )radoIsacc Sala*arProesor de inorm!ticaI.E.D Tcnico Comercial Jos De San Martin Cundinamarca rea: inorm!tica Tabio"#$%+,u es un motor de b&squeda-.osmotoresdeb&squedasona'licacionesmu/com'le(asqueseactuali*anconstantemente.0o 1o/ a describirlos de una orma sencilla. As2 que 'ido discul'as 'or adelantadoa aquellos que sean 'ro)ramadores o desarrolladores 'uesto que /o no lo so/.3!sicamenteunmotor deb&squedaesunsot4areo'ro)ramaquelocali*acontenidos en Internet de una orma r!'ida / mu/ eiciente 'ara lue)o5 en unci6ndetus'eticionesdeb&squeda5 'resentartelosresultadosque7aalmacenado're1iamente en su base de datos. Para ello 're1iamente el motor de b&squeda 7acreado su 'ro'iabase de datos 'ara 'oder 'resentarte los dierentes resultadosen unci6n de tus 'eticiones de b&squeda..a cla1e est! en c6mo constru/en su base de datos / cate)ori*an des'us losresultados que 1an a mostrar a sus usuarios. E(em'los de buscadores conocido /que 7a/as utili*ado son: 8oo)le5 3in) / 0a7oo.+C6mo unciona un motor de b&squeda-Se 'uede decir5 sim'liicando muc7o que un motor de b&squeda consta de cuatro'artes:9n intera* 'ara el usuario 'ara 7acer 'eticiones de b&squeda9n robot o s'ider que busca la inormaci6n en Internet9n al)oritmo que conecta las 'eticiones de los usuarios con la base de datos0 una base de datos donde se 7an inde:ado los contenidosEl cora*6n de todo motor de b&squeda es sin duda el al)oritmo que diri)e al roboto s'ider / des'us cate)ori*a la inormaci6n que se mostrar! tras las 'eticionesde los usuarios.Estosal)oritmossonrealmentecom'le(os/solosus'ro'iosdesarrolladoressaben c6mo uncionan. Sin embar)o5 el al)oritmo no 1ale de nada si el buscadorno cum'le con otras dos unciones:Reco)er la inormaci6n usando tcnicas de 4eb cra4lin)Almacenar e inde:ar la inormaci6n.os motores de b&squeda crean listados de '!)inas 4eb utili*ando sus s'iders orobots a tra1s de tcnicas de 4eb cra4lin) / des'us or)ani*an la inormaci6nencontrada5 creando indices de los contenidos.;eamosestoconm!sdetenimiento queloque7aceesentrar enuna'!)ina 4eb reco)er al)unos datos5 identiicar los enlaces en esta '!)ina 4eb /inalmente se)uir estos enlaces como 7ar2a un usuario 'ara re'etir el 'roceso una/ otra 1e*. De esta orma el robot 1a saltando de un lin? a otro / na1e)ando 'ordistintas '!)inas de las que 1a reco'ilando datos con las que alimentar su base dedatos. Esta es la manera en la que unbuscador encuentra la inormaci6n. Esta esla mitad del 'roceso. Des'us lle)a el momento de inde:ar la inormaci6n.@r)ani*ando la inormaci6n mediante la inde:aci6n9na1e*queel robot os'ider5tambinconocidocomo4ebcra4ler=dea72 elnombre lin? cra4lin)>5 encuentra la inormaci6n5 se crea un indice =inde: en in)ls>con la inormaci6n esencial de la '!)ina 4eb que se almacena en la base de datos/ que &nicamente ser! mostrado a los usuarios cuando estos 7a)an su 'etici6n enel intera*deb&squedasdel motor deb&squeda. Dequesemuestreonoloinormaci6n inde:ada ba(o una 'etici6n delusuario de'ende en &ltima instanciadel al)oritmo del buscador.Por as2 decirlo el al)oritmo:Aace de intermediario entre la base de datos / las 'eticiones del usuario.0 es quien decide qu inormaci6n se 1a mostrar 'ara una 'etici6n del usuario.Dequeel al)oritmoseame(or o'eor de'ender!tambinlacalidaddelosresultados mostrados 'or el buscador. De a72 que sea la 'arte m!s im'ortante deun buscador. En relaci6n a la calidad de los resultados mostrados 'or un buscadorde'ender! 'or su'uesto el ti'o de 'etici6n que se 7a)a / 'or su'uesto ele)ir elmotor de b&squeda m!s a'ro'iado 'ara cada ocasi6n.Bo es lo mismo utili*ar 3in) 'ara buscar un 7otelque Tri'ad1isor. .os dos nosdar!n resultados 'ero se)uro ser!n m!s 'recisos los de este &ltimo.Es 'osible que todos estos conce'tos te 7a/an conundido m!s acerca de c6mounciona un motor de b&squeda. Por eso5 si mi e:'licaci6n no 7a estado a la alturaque es 'osible5 consulta este 12deo sobre c6mo unciona el buscador de )oo)le.Es un 12deo mu/ ameno / que te aclarar! muc7o m!s las cosasAistoria de los motores de b&squeda Aunque 'arece que ue a/er5 lo cierto es que Internet5 tal / como lo conocemos 7o/5 /a lle1a m!s de dos dcadas entre nosotros. Aan sido m!s de "# intensos aCos en los que la Red de redes 7a surido todo ti'o de transormaciones5 con el in de ada'tarse a las cambiantes necesidades de los internautas. 0 entre ellas5 destacan aquellas que 7an 7ec7o e1olucionar un elemento indis'ensable 'ara los usuarios5 / que 7a condicionado enormemente las acciones de inbound mar?etin):los motores de b&squeda. Desde InboundC/cle5 ec7amos la 1ista atr!s 'ara re'asar c6mo 7a sido este 'roceso. 0 'ara ello5 iniciamos el 'rimero de una serie de tres 'osts dedicados a este tema. En el de 7o/5 nos ocu'aremos de los 'rimeros motores5 desde su irru'ci6n en el mercado 7asta la a'arici6n de una com'aC2a caliorniana llamada a re1olucionar el sector: 8oo)le5 que tu1o lu)ar en $DDE. Pero 'on)!monos en situaci6n antes de em'e*ar. De 7ec7o5 se)uro que a&n recuerdas las 'rimeras '!)inas 4eb a las que accediste: di2ciles de car)ar5 con una &nica ti'o)ra2a F'or lo )eneral5 la Times Be4 RomanF / re'letas de iconos que )iraban sobre s2 mismos sin orden ni concierto. 9na a'ariencia que 'oco o nada tiene que 1er con la de los 'ortales m!s actuales. 0 lo mismo se 'odr2a decir de los motores de b&squeda que dominaron Internet durante los aCos no1enta.+C6mo eran los 'rimeros buscadores en Internet-7is'a1ista lo)oPor aquellas ec7as5 se trataba de 7erramientas muc7o menos 'otentes que las actuales. Al)o que5 'or otro lado5 tam'oco re'resentaba un )ran 'roblema5 'uesto l/cos lo)oque el 1olumen de inormaci6n e:istente en la Red tambin estaba a aCos lu* del actual. En aquel escenario5 un 'equeCo )ru'o de buscadores se re'art2an el 'astel. As25 irmas como Alta1ista5 E:cite5 Ais'a1ista5 ./cos o 0a7ooG se con1irtieron en las 7erramientas m!s 'o'ulares en la era 'reH8oo)le alta1ista lo)o /a7oo lo)oe:cite lo)oAunque con 'equeCas dierencias entre ellos5 todos estos motores ten2an un ras)oen com&n5 /a que reali*aban sus b&squedas tomando como reerencia un &nico criterio: el conte:to. +,u im'licaba esta caracter2stica- Para dar una e:'licaci6n lo m!s sencilla 'osible5 'odr2a decirse que los buscadores rastreaban la Red / clasiicaban las '!)inas en unci6n de las 1eces que conten2an las 'alabras cla1e introducidas.Es decir: si al)uien lle1aba a cabo una b&squeda5 los motores intentaban determinar en qu '!)inas de Internet a'arec2a m!s 1eces ese trmino. Por lo tanto5 lo que 'rimaba era la densidad de 'alabras cla1e que conten2a cada '!)ina.A7ora bien5 +'or qu se)u2an este criterio- En este sentido5 no 7a/ que 'erder de 1ista que e:iste una correlaci6n entre las 1eces que a'arece un trmino en una 4eb / la im'ortancia que adquiere en este site el tema que nos interesa. .o 1eremos me(or con un e(em'lo: si una 4eb contiene 1arias 1eces la 'alabra ca'itel5 es 'orque 'robablemente est! 1inculada a temas como la arquitectura o elarte.Asimismo5 7a/ que tener 'resente que orecer los resultados de b&squeda en unci6n del conte:to su'one se)uir el criterio m!s sencillo / !cil de automati*ar5 'or lo que no es e:traCo que todos los buscadores estu1ieran cortados 'or el mismo 'atr6n.En cualquier caso5 esta circunstancia )eneraba un )ran 'roblema5 /a que el criterio 'ara determinar qu contenidos online eran los m!s rele1antes no se adecuaba a la realidad5 creando as2 una cierta distorsi6n. De 7ec7o5 no era di2cil 'ercatarse de que muc7as em'resas de 'resti)io no a'arec2an en los resultados de b&squeda en Internet. 0 1ice1ersa: con recuencia5 em'resas modestas o 'oco conocidas conse)u2an que su 4eb se colara entre los 'rimeros resultados de b&squeda. 9n lo)ro que quedaba al alcance de cualquiera =siem're / cuando su'iera rodearse de un buen equi'o de inorm!ticos5 claro>. Sin embar)o5 este no era el &nico tal6n de Aquiles del Internet de los no1enta: 'or aquel entonces5 el mercado estaba co'ado 'or un reducido n&mero de buscadores de los que nadie sab2a sacar rendimiento econ6mico.Este c&mulo de circunstancias dibu(aron 7asta el inicio del si)lo ::i un escenario ca6tico que no tardar2a en desmoronarse tras la lle)ada de un nue1o e ines'eradoin1itado: 8oo)le.El nacimiento de las a)encias de SE@Durante la dcada de los no1enta5 Internet se con1irti6 en un )ran cam'o de 'ruebas 'ara las em'resas tecnol6)icas5 que 1ieron en la Red un il6n que 1al2a la'ena e:'lotar. Es en estas ec7as cuando a'arecen / se consolidan los 'rimeros buscadores. Como 7emos comentado antes5 en sus 'rimeros aCos estos motores actuaban si)uiendo un &nico criterio de b&squeda: el conte:to. .a mec!nica era sim'le: cuantas m!s 1eces a'areciera una 'alabra en una 4eb5 m!s 'osibilidades ten2a este site de 'osicionarse entre los 'rimeros resultados de una b&squeda relacionada con este trmino. .as em'resas dedicadas a la creaci6n de '!)inas 4eb ueron las 'rimeros en 'ercatarse de esta circunstancia< / en 7acer de este mecanismo una nue1a / lucrati1a orma de ne)ocio. A 'artir de entonces5 no s6lo diseCar2an 'ortales 'ara sus clientes5 sino que tambin les orecer2an la 'osibilidad de 'osicionarlos en los 'rinci'ales buscadores. Este 'roceso5 conocidocomo o'timi*aci6n5 no tardar2a en 'onerse de moda.Este mtodo de traba(o 'r!cticamente carec2a de secretos: teniendo en cuenta tanto el criterio que utili*aban los buscadores5 se modiicaba la estructura de estos'ortales 'ara alterar los resultados que orec2an los motores de b&squeda de manera natural. Estas 'rimeras com'aC2as es'eciali*adas en me(orar la 1isibilidadde una 4eb en Internet mu/ 'ronto ser2an conocidas como a)encias de SE@ =si)las de searc7en)ineo'timi*ation5 o 'osicionamiento en buscadores>.SE@ 'ara em'resas: a'lica el SE@ en tu estrate)ia de mar?etin) onlineAs2 era su metodolo)2a de traba(oPara 'oder o'timi*ar cualquier 4eb5 estas em'resas necesitaban que sus clientes les 'ro'orcionaran dos inormaciones undamentales: cu!les eran las 'alabras que consideraban m!s im'ortantes 'ara su ne)ocio / con qu 'alabras cla1e les )ustar2a a'arecer en los resultados de las b&squedas.9na 1e* obtenidos estos datos5 las a)encias de SE@ modiicaban las '!)inas 4ebde sus clientes 'ara que se situaran entre los 'rimeros resultados orecidos 'or losmotores de b&squeda. 0 conorme stas )anaban 1isibilidad en 0a7ooG o ./cos5 tambin lo 7ac2an el 'adre de la criatura: las lorecientes a)encias de 'osicionamiento5 que no tardaron en 7acerse con un 'rometedor / (u)oso mercado. Tan rentable resultaba este ne)ocio que muc7as irmas no dudaron en a'arcar el diseCo de 4ebs 'ara centrarse en e:clusi1a en las estrate)ias de SE@ / se)uir de cerca c6mo e1olucionaban los motores de b&squeda. Sin embar)o5 estas a)encias tambin se enrentaban a al)unas restricciones restricciones a la 7ora de o'timi*ar un site. Entre stas5 destacan las si)uientes: .a necesidad de noincluir demasiadas 1eces una 'alabra en una 4eb5 /a que se corr2a el ries)o de que los contenidos de la 4eb de(aran de tener sentido o de ser com'rensibles 'ara el usuario.Conser1ar un orden l6)ico en la estructura de la '!)ina 4eb.De 7ec7o5 cuando las '!)inas estaban demasiado o'timi*adas5 lle)aban 7asta el 'unto de tener una a'ariencia e:traCa. De a72 que muc7as 1eces uera el 'ro'io cliente quien se 1e2a en dis/unti1a de ele)ir entre un buen 'osicionamiento en los motores de b&squeda u orecer contenidos de calidad.9na situaci6n que 7o/ 'uede 'arecer in1eros2mil5 'ero que 7asta la consolidaci6n de 8oo)le orm6 'arte del d2a a d2a de las a)encias de SE@. 9n nue1o ne)ocio que 'arec2a te(er la Red a su anto(o5 'ero cu/o 'oder se e1a'or6 con el cambio desi)lo< / de las re)las del (ue)o.PARA ,9E SIR;E 9B M@T@R DE 39S,9EDA.os Motores de b&squeda5 son sistemas de b&squeda 'or 'alabras cla1eI son bases de datos que incor'oran autom!ticamente '!)inas Jeb mediante KrobotsK de b&squeda en la red.Ao/ en d2a Internet se 7a con1ertido en una 7erramienta5 'ara la b&squeda de inormaci6n5 r!'ida5 'ara ello 7an sur)ido los buscadores que son un motor de b&squeda que acilita encontrar inormaci6n r!'ida de cualquier tema de inters5 en cualquier !rea / de cualquier 'arte del mundo.Para iniciar una b&squeda 'or Internet5 es im'ortante conocer 1arios sitios en la Jeb que acilitan esta 'r!ctica5 como 'or e(em'lo 8oo)le5 Alta1ista5 0a7oo5 MSB .atino5 entre otros.Para iniciar una b&squeda5 sencillamente solo se debe di)itar en el cam'o de re)istro del buscador5 el tema que se desea / una 1e* se 'resenten en 'antalla todos 8oo)lesearc7 ima)e b/ (c'(r rom Lotolia.comEl )i)ante de Internet 8oo)le ocu'a actualmente una cuota de mercado del MN5N 'or ciento =abril de "#$#> en la '!)ina de inicio blanca b!sica de 8oo)le de Estados 9nidos5 / el bot6n K;o/ a tener suerteK5 que 7an sido un 'ilar desde la ormaci6n de la com'aC2a en $DDE. Junto con su 'redominante motor de b&squeda5 8oo)le se 7a e:'andido a ser1icios de 'ublicidad =AdJords / AdSense>5 correo electr6nico =8mail>5 com'artici6n de medios =0ouTube5 Picasa / 8oo)le ;ideo> / ser1icios )eo)r!icos =8oo)le Ma's>5 as2 como muc7as otras a'licaciones 4eb. 7tt':OO444.)oo)le.com3in)searc7 ima)e b/ (c'(r rom Lotolia.comEl motor de b&squeda 3in) de Microsot5 ocu'a el $P5PQ de las b&squedas en Internet =abril de "#$#>5 / es el se)undo buscador m!s 'o'ular de Estados 9nidos..os usuarios 'ueden buscar '!)inas 4eb5 medios5 resultados comerciales / lu)ares5 as2 como reali*ar b&squedas m!s es'eciali*adas de materiales de reerencia. 3in) mostrar! una Kima)en del d2aK en el ondo5 aunque Microsot 7a diseCado la unci6n de b&squeda 'ara 'oder utili*arse de inmediato5 incluso antes de que el resto de la '!)ina se 7a/a car)ado. 7tt':OO444.bin).com0a7ooG0a7ooG ocu'a actualmente el $$5EQ del total de b&squedas en la 4eb en los Estados 9nidos =abril de "#$#>. @'erando como un 'ortal 4eb de noticias5 tendencias de Internet / otros ser1icios5 el motor de b&squeda 0a7ooG se estableci6 ori)inalmente en $DDN / 7o/ se eri)e como la tercer 7erramienta de b&squeda m!s 'o'ular de Estados 9nidos. 0a7ooG 7a am'liado su lista de 'roductos inclu/endo en su sitio el ser1icio de com'artici6n de otos Llic?r5 la 7erramienta de traducci6n K3abel Lis7K5 / una barra de 7erramientas descar)able 'ara los na1e)adores de Internet. 7tt':OO444./a7oo.comAs?El cuarto motor de b&squeda m!s 'o'ular en los Estados 9nidos5 As?5 ue lan*adoori)inalmente como As? Jee1es en $DDM. En "##%5 la com'aC2a 'as6 a llamarse As?.com. Alentando a los usuarios a 7acer 're)untas directas5 As? utili*a una '!)ina de inicio b!sica5 con nada m!s que una K're)unta del d2aK 'ara ameni*ar lab&squeda5 / es el motor de b&squeda m!s 'o'ular es'eciali*ado e:clusi1amente en su unci6n de b&squeda. As? no tiene ser1icios adicionales5 tales como correo electr6nico o com'artici6n de medios. 7tt':OO444.as?.comA@. Searc7En el quinto lu)ar en las 'reerencias del motores de b&squeda de Estados 9nidos5 A@. toda12a ocu'a el "5N 'or ciento del total de b&squedas reali*adas en l2nea5 desde de abril de "#$#. Lormado en $DE% como ,uantum Com'uter Ser1ices5 la notiicaci6n la de correo de la com'aC2a KTienes correoG =0ouR1e )ot mailG>K 7a estado en uso desde $DED5 / en $DD$ la com'aC2a ue renombrada como America @nline5 Inc. antes de lan*ar el motor de b&squeda en $DD%. El motor de b&squeda de la com'aC2a incor'ora a7ora la tecnolo)2a de 8oo)le5 aunque toda12a unciona como un ser1icio inde'endiente. 7tt':OO444.aol.comlos resultados5