Ero sivun ”Hakukone” versioiden välillä

[katsottu versio][katsottu versio]
Poistettu sisältö Lisätty sisältö
p Botti lisäsi luokkaan Seulonnan keskeiset artikkelit
parista lähteestä historiaa ja jaottelua; karsintaa; ei enää täysin lähteetön
Rivi 1:
{{Uudelleenkirjoitettava}}{{Korjattava/päivitys}}{{Lähteetön}}
 
'''Hakukone''' ({{K-en|Search engine}}) on [[Web]]-pohjainen ohjelma, joka etsii jatkuvasti [[Internet]]istä (varsinkin Webistä) uusia sivuja eritellen ja liittäen ne hakemistoonsa erityisten hakusanojen mukaan. Näitä hyväksi käyttäen hakukone tulostaa käyttäjän syöttämiä hakusanoja lähimpänä olevat sivut. Analysointi tapahtuu käytännössä eri hakukoneissa erilaisilla menetelmillä.
== Hakukoneiden historiaa ==
 
== Historiaa ==
[[Infoseek]] oli ensimmäinen tunnettu [[Internet]]-hakukone.{{lähde}} Se löytyi Netscape-selaimesta "Net search" -painikkeen takaa.{{selvennä}} Sen jälkeen tunnetuimmaksi hakukoneeksi nousi [[Digital Equipment Corporation|Digitalin]] [[Altavista]]. Nykyään [[Google (hakukone)|Google]] on ollut jo usean vuoden ajan suosituin hakukone.
 
Aivan Internetin alkuaikoina 1990-luvulla hakukoneita ei vielä tarvittu, sillä sisältöä Internetissä oli vielä vähän. Tietolähteiden linkkejä kerättiin portaaleihin eli linkkikokoelmiin, joista tunnetuin oli ihmisten ylläpitämä linkkihakemisto [[Yahoo]].<ref name="mutanen">{{Verkkoviite | Osoite = http://www.tiede.fi/artikkeli/jutut/uusimmat/hakukone_hyvan_pahan_tiedon_puu | Nimeke =Hakukone - hyvän & pahan tiedon puu | Tekijä = Annikka Mutanen | Ajankohta = 11.3.2014 | Julkaisija = Tiede-lehti | Viitattu = 21.5.2015 }}</ref>
Googlen suosioon vaikutti se, että se tarjosi Altavistaa paremmin olennaisia hakutuloksia{{kenen mukaan}} ja sen etusivu oli yksinkertainen, eikä siinä ollut aluksi lainkaan mainoksia. Ennen Googlea hakukoneiden etusivut muistuttivat [[Portaali (Internet)|portaaleja]]. Niillä oli uutisia ja mainoksia ja sivu latautui hitaasti tuon ajan yhteyksillä. Hakukoneet myös kilpailivat toistensa kanssa löydettyjen sivujen määrässä, siten että ”paras” oli se haku, jolla löytyi eniten tuloksia.{{lähde}} Tämän vuoksi oletusasetuksena oli listata kaikki sivut, joilta löytyi mikä tahansa annettu hakutermi. Esimerkiksi haku ''Helsinki ravintola'' löysi sivut, joilla oli sana ''Helsinki'' tai sana ''ravintola''.
 
Internetin kasvaessa linkkikirjastot eivät enää riittäneet sisällön hallitsemiseen. Keksittiin hakukoneet, jotka antoivat hakutuloksina listan sivuille, joilla haetut sanat esiintyivät. 1990-luvun tehokkain ja suosituin hakukone oli [[AltaVista]]. Se osasi myös karsia osumia, jotka osuivat samalle sivustolle. Tällainen yksinkertainen haku palautti hakutuloksinaan kuitenkin sellaisiakin sivuja, joille mainostajat ja pornon levittäjät olivat vain lisäilleet sanoja näkyäkseen suosituilla sanoilla tehdyissä hauissa.<ref name="mutanen" />
Nykyisin hakukoneet pyrkivät löytämään oleellisimmat sivut kaikkien sivujen joukosta. Kehittyneet hakukoneet painottavat hakutuloksia järjestäessään merkittävästi kohteisiin viittaavien linkkien määrää ja laatua. Googlen keskeisimmät kilpailijat hakutulosten laadussa ovat Microsoftin [[Bing]] (aiemmin ''Live Search'') ja [[Ask.com]]. Nämä kolme ovat myös suosituimmat hakukoneet länsimaissa. Microsoftin markkinaosuutta kasvattaa merkittävästi, että myös [[Yahoo!]] käyttää Bingin hakumoottoria.
 
Kun Internet jatkoi kasvuaan, hakutulosten määrä kasvoi, ja hakukoneiden täytyi opetella erottamaan parhaat osumat huonoista. [[Google]] syntyi 1998 ja nousi suosituimmaksi hakukoneeksi. Sen peruskäyttöliittymä oli kilpailijoita kevyempi ja yksinkertaisempi. Se myös mittasi sivujen merkittävyyttä sen perusteella, mitä enemmän sivuun on linkattu muilta osumasivuilta. Tällaiset sivut se nosti hakutulostensa kärkeen.<ref name="mutanen" />
Pelkän tekstihaun lisäksi hakukoneissa on nykyisin kuvien haku. Google tarjoaa myös haun [[Usenet]]-uutisryhmistä aina keskusteluryhmien perustamisesta lähtien Dejanewsiltä ostamallaan aineistolla. Usenet-hakuja on useampikin, mutta ne ovat keskittyneet lähinnä uutisryhmien binääritiedostojen hakuun. Ajoittain on haettu muutakin Internetin aineistoa. Lycosilla oli Lycos FTP Search ja Lycos MP3 Search, jotka löysivät [[FTP]]-palvelimille tallennettuja tiedostoja ja [[mp3]]-musiikkia.{{lähde}}
 
== HakukoneidenToiminta ongelmianykyisin ==
 
Nykyisin hakukoneetmuutkin pyrkivätkehittyneet löytämäänhakukoneet oleellisimmatkuin sivut kaikkien sivujen joukosta. Kehittyneet hakukoneetGoogle painottavat hakutuloksia järjestäessään merkittävästi kohteisiin viittaavien linkkien määrää ja laatua. Googlen keskeisimmät kilpailijat hakutulosten laadussa ovat Microsoftin [[Bing]] (aiemmin ''Live Search'') ja [[Ask.com]]. Nämä kolme ovat myös suosituimmat hakukoneet länsimaissa. Microsoftin markkinaosuutta kasvattaa merkittävästi, että myös [[Yahoo!]] käyttää Bingin hakumoottoria.
Aiemmin tyypillinen hakukoneiden ongelma oli, että ne eivät osanneet taivuttaa sanoja eri kielillä. Nykyään Google tunnistaa useimpien suomenkielisten sanojen taivutusmuodot. Ominaisuus löytyy myös [[Webinfo]]sta.{{lähde}}
 
Pelkän tekstihaun lisäksi hakukoneissa on nykyisin kuvien haku. Google tarjoaa myös haun [[Usenet]]-uutisryhmistä aina keskusteluryhmien perustamisesta lähtien Dejanewsiltä ostamallaan aineistolla. Usenet-hakuja on useampikin, mutta ne ovat keskittyneet lähinnä uutisryhmien binääritiedostojen hakuun. Ajoittain on haettu muutakin Internetin aineistoa. Lycosilla oli Lycos FTP Search ja Lycos MP3 Search, jotka löysivät [[FTP]]-palvelimille tallennettuja tiedostoja ja [[mp3]]-musiikkia.{{lähde}}
== Hakukoneet ja hakemistot ==
 
== Jaottelu ==
Ennen tehtiin ero hakukoneiden (etsii sanayhdistelmillä koko Internetistä) ja hakemistojen (käsin valikoituja aiheenmukaisesti luokiteltuja linkkejä) välillä, mutta nykyään hakukoneissakin on yleensä oma hakemisto.{{lähde}} Toisaalta hakukoneet käyttävät hyväkseen myös hakemistojen tietoja, kuten esimerkiksi [[DMOZ]] -hakemistoa. Hakemistot ja hakukoneet täydentävätkin toisiaan erilaisina tapoina hakea tietoa.
 
Hakukoneet voidaan jakaa yleisiin hakukoneisiin, metahakukoneisiin ja aihehakemistoihin. Yleiset hakukoneet perustuvat tietokantoihin. Ne ovat ohjelmia, jotka etsivät verkosta jatkuvasti uusia sivuja, analysoivat ne ja liittävät ne hakemistoonsa. Tällaisia ovat esimerkiksi Google, AltaVista, [[AllTheWeb]] ja [[HotBot]]. Metahakukoneet lähettävät haun monelle hakukoneelle samanaikaisesti ja keräävät niiden vastauksista linkkilistan. Metahakukoneet antavat paljon tuloksia, mutta ne voivat olla epätarkkoja. Metahakukoneita ovat esimerkiksi [[MetaCrawler]] ja [[WebCrawler]]. Aihehakemistot hakevat omista tietokannoistaan ja esittävät hakutulokset eräänlaisena indeksoituna linkkikirjastona, jossa linkit on luokiteltu. Ne antavat usein suppean hakutuloksen, mutta niiden tulokset voivat olla osuvampia kuin muiden hakukoneiden. Aihehakemistoja ovat esimerkiksi Yahoo ja WWW Virtual Library.<ref name="kielikompassi">{{Verkkoviite | Osoite = https://kielikompassi.jyu.fi/resurssikartta/netro/pankki/parametrit_digi_rak.shtml | Nimeke =Hakukoneet ja aihehakemistot | Tekijä = | Ajankohta = | Julkaisija = Jyväskylän yliopisto | Julkaisu = Kielikompassi | Viitattu = 21.5.2015 }}</ref>
Erilaisia tiettyyn aihealueeseen erikoistuneita hakukoneita ja hakemistoja on maailmalla tuhansia. Suomessa melko tunnettu hakemisto on ollut esimerkiksi [[Makupalat (internet-sivusto)|Makupalat]], joka on laaja [[Hämeenlinna]]n kaupunginkirjaston ylläpitämä suomenkielinen linkkikokoelma eli -hakemisto. Nykyään se on yhdistetty Kirjastot.fi-sivuston Linkkikirjasto-palveluun.
 
Erilaisia tiettyyn aihealueeseen erikoistuneita hakukoneita ja hakemistoja on maailmalla tuhansia. Suomessa melko tunnettu hakemisto on ollut esimerkiksi [[Makupalat (internet-sivusto)|Makupalat]], joka on laaja [[Hämeenlinna]]n kaupunginkirjaston ylläpitämä suomenkielinen linkkikokoelma eli -hakemisto. Nykyään se on yhdistetty Kirjastot.fi-sivuston Linkkikirjasto-palveluun.
Kysy kirjastonhoitajalta -palvelu poikkeaa useista muista palveluista haun toteutustavan perusteella. Palvelun kautta kysyttyihin kysymyksiin kirjastonhoitaja etsii vastauksen. Ihmisen tietämyksen käyttäminen tiedonhaussa antaa mahdollisuuden hakukoneille vaikeiden kysymysten esittämiseen.{{selvennä}}
 
== Hakukoneiden kattavuusKattavuus ==
 
Paraskaan hakukone ei kuitenkaan löydä kaikkia [[Web]]-sivuja. Rajoittavana tekijänä on esimerkiksi sivujen nopea muuttuminen. Hakukoneiden tietokannat eivät ole koskaan ajan tasalla, vaan ne käytännössä tarjoavat aina hieman vanhentuneita hakutuloksia. Tämän takia esimerkiksi tuoreimpien uutisten hakuun hakukoneet eivät sovellu,{{lähde}} vaan tällöin kannattaa käyttää jonkin uutispalvelun omaa sisäistä hakua – tai esimerkiksi uutisten hakemiseen erikoistuneita hakukoneita (esimerkiksi [[Google News]]). Lisäksi merkittävä osa Internetistä tulee todennäköisesti olemaan jatkossakin hakukoneiden ulottumattomissa.{{lähde}} Toisaalta kuka tahansa www-sivuston omistaja voi rajoittaa tai kokonaan estää hakukoneiden [[hakurobotti]]en pääsyn sivustonsa sisältöön esimerkiksi [[robots.txt]]-tiedostolla
 
== Katso myös ==
* [[Hakusanamainonta]]
* [[Metatieto]]
 
==Lähteet==
{{viitteet}}
 
== Aiheesta muualla ==