robot

Download robot

If you can't read please download the document

Upload: ariane-irazusta

Post on 21-Mar-2016

224 views

Category:

Documents


2 download

DESCRIPTION

googlebot, crawler

TRANSCRIPT

IZENA: Ariane Irazusta Aguirrezabala

Irakurketa-galderakMateos Snchez, M.; Garca_figuerola, C. (2009). Recuperacin de informacin en la web. Gijn: TreaLehenengo artikulu osoa irakurri eta gero erantzun galdera hauek.

Erantzun batzuetarako komeni da Interneten bilaketa batzuk egitea.

Bukatzean Interneten Issun igo. Gero zuen blogean ekarpena egin eta esteka txertatu.

Zein dira aipatzen diren bi arazo nagusienak informazioa bilatzerakoan?

BI arazo nagusienak hauek dira: bata, bilatzaile bat erabiltzerakoan, zehaztearen ezintasunak, emaitzak gustokoak ez izatea ekartzen du. Hori dela eta, erabiltzaileak zehaztasun prozesu batera jo behar du, eta honek esfortzu bat eskatzen dio, beraz, ez da oso erosoa. Bigarrenik, ematen den emaitza askotan mila weborri izaten dira, eta bertatik zein aukeratu edo zein etorriko zaizun ondo ikustea nekagarria eta zaila izaten da.

Bilatzaileen Crawler-rak Robot ere deitzen dira. Azaldu zure hitzetan zer egiten duten. Bilatu Interneten nola izena duen Googlen Robotak.

Crawlerak, web-ei eskatzen die informazioa gero berak aukeratutako hori indizadoreetara bidaltzeko. Bitartekari papera egiten du, lehen pausoa izango litzatekeen hori. Bestalde, googleen robota, Googlebot deitzen da, eta honek, normalean page rankari egiten dio kasu weborriak bisitatzeko garain. Geroz eta altuagoa izan page rank zenbakia, geroz eta maizago bisitatuko du weborri hori. Gainera, interneten dauden fichero guztietara ere jotzen du, pdf edo doc, edo ps izan.

Zer esan nahi du bsqueda sintctica?

Bilatzailean jarritako hitzak zein weborritan dauden erakusten digu. Honen arazo, kontextuan ez duela erreparatzen da eta askotan gure hitzek duten zentzua ez da weborri horietan isladatzen. Beraz, benetako bilaketa egoki bat egin nahi bada, erabiltzailearen esfortzua beharrezkoa da, eta honek baremoak murriztu beharko ditu.

Googlen algoritmoa Page Rank da. Zein da bere eginkizun nagusia ?

Page rankek, weborri baten garrantzia definitzen du. Weborriak botoak jasotzen dituzte, eta googlelen algoritmo honek kantitatea ikusteaz gain, nondik datozen boto horiek zehazten du. Honela, benetako garrantzia eta deigarritasuna aztertu dezake, emaitzak ematerako garaian orden egoki bat jarraitzeko balioko diona.

Googlen bilaketa bat egiten duzunean zer gertatzen da? Azaldu zer gertatzen den Googlen barruan

Store-serverrek hartuko du bilatzailean jarri den informazioa. Hau konprimitua izango da eta repository batean ipiniko da. Hala, web bakoitzari docID bat jarriko zaio, indizazio prozesuan beharrezkoa izango da eta. Indizazio prozesu honetan, indexer eta sorterrek egingo dute lan. Lehenik, indexerrek, repositoryoan ipinitakoa hartu, deskonprimitu eta hitzak lokalizatuko ditu, hauei hits deitzen zaie. Hits-ak barrels bat sortuko dute, denon bateratzea izango dena. Indexer aldi berean, anchorsfileak aztertuko ditu. Resolverrek, url guztiak hartu, anchors fileak irakurri eta hauei docID bat eman ostean, beraien Page rankean fijatuko da. Bestalde, lehenoko sorterrera bueltatuko gara. Honek, hits eta barrelsak hartu eta docID wordID bihurtuko ditu. Hala ba, offsets batzuk sorturik, azken pausu batera eramango gaitu. Dumplexicon, sorterrek egindakoa eta indexerrek egindakoa hartuko du, lexicon berri bat sortuz, eta searchek erabakia hartuko du lexicon berri hori eta Page rank delakoa begiratuz. Azkenean emaitzak ateratzen dira.

Informazio-Konpetentziak ikasgaiaIkus-Entzunezko Komunikazioa Gradua