Het dilemma van de zoekmachine

Ik maak, net als ongetwijfeld iedere andere schrijver, veelvuldig gebruik van zoekmachines zoals Google voor mijn research naar feiten en achtergrondinformatie. Echter, mijn zoektocht op het web leverde vaker wel dan niet een groot aantal ‘hits’ op: 100.000+ ongeschikte of irrelevante resultaten, waardoor je door de bomen het bos niet meer ziet.

Herkenbaar, denk ik, voor veel schrijvers. Wat wij willen is tien of twintig treffers met precies de relevante informatie die we zoeken, niet tien miljoen hits waar deze informatie ergens in verscholen staat. Uit onderzoek blijkt dat ook: maar heel weinig mensen gaan verder dan de eerste vijftig treffers. Ik heb daarom wat foefjes verzameld die ik graag met jullie deel.

Als eerste punt dient de speurder naar informatie te weten dat de zoekrobots niet het hele internet afzoeken, maar in kopieën op hun eigen servers. Daarom kunnen de gevraagde webadressen ook zo snel worden gevonden. Daarom krijgen we geregeld doodlopende links gepresenteerd: de informatie op de feitelijke locatie is inmiddels verwijderd of verplaatst sinds de zoekmachine die had opgeslagen.

De meesten van ons weten wel dat als we een aantal woorden tussen aanhalingstekens plaatsen, dat de woorden tussen die ‘pikkies’ door Google als één zoekwoord worden gezien. Stel we zoeken een boek waarvan we alleen de titel weten, dan zal de titel tussen aanhalingstekens het aantal gevonden resultaten kleiner maken en het relevante resultaat hoger plaatsen, vooral als de titel uit gebruikelijke woorden bestaat.

Veel minder bekend is dat Google een aantal filters heeft. Ik gebruik veel [filetype:pdf] (zonder de haken – let op: geen spatie achter de dubbele punt), waarmee Google alleen terugkomt met pdf-documenten. Zoek bijvoorbeeld op [filetype:pdf “Writing Fiction for Dummies”] en voilà, we vinden snel dit boek als downloadbare pdf! In plaats van ‘pdf’ kun je ook nadere bestandsformaten invullen, zoals ‘doc’ en ‘jpg’.

Een tweede filter dat ik af en toe gebruik, is [site:]. Hiermee beperkt Google zich met zoeken op de aangegeven website. Dit is vooral bij omvangrijke websites, zoals die van de Europese Commissie, erg handig. Bijvoorbeeld [site:ec.europa.eu armoede mensenrechten] retourneerde 260 resultaten op 15 november 2012, terwijl zonder het site-filter het aantal hits 273,000 was.

Ten derde kan de tilde [~] handig zijn als je ook wil dat Google synoniemen voor je zoekwoord in zijn zoekresultaten meeneemt. Bijvoorbeeld [~huis] geeft ook resultaten alsof je ‘villa’ en ‘woning’ had ingetypt.

Dit overzicht is uiteraard niet volledig. Graag nodig ik jullie uit aanvullende tips hier te delen!

Comments

Erg handige tips Leonardo! Een paar van deze filters gebruik ik zelf, de tilde is nieuw voor mij en deze: [site:] ga ik zeker vaak gebruiken. Gebruik jij dit zelf ook op sites die wel een eigen zoekfunctie hebben en, krijg je dan andere resultaten? Je nodigt uit tot het geven van aanvullende tips: Een image naar 'Google zoek afbeeldingen' slepen. Vervolgens krijg je de img informatie die je zocht en ook web verwijzingen. Handig voor foto's en beschrijvende informatie van locaties, artiesten, bekende kunstwerken, ik noem maar iets. Interessant onderwerp, bedankt!

Geweldige tip, Mirandala! Die sleeptruc kende ik nog niet. Het Google site-filter gebruik ik niet OP de site. De ruimte voor de blog was te kort om iets over The Invisible Web (aka the Deep Web) te vertellen. Het komt erop neer dat databases, die op zich doorzoekbaar zijn, andere formats hebben waardoor de zoekmachine (inc. Google) a.h.w. tegen een muur dreunt. Als je meer wilt weten over The Invisible Web, zoek dan naar een pdf met deze term tussen aanhalingstekens. Dus als je op een grote site bent die een eigen zoekfunctie heeft, zal het doorgaans meer opleveren als je die zoekmogelijkheid gebruikt (al kan [site:] wel sneller zijn als er geen sprake is van onderliggende dBases.)

Ook handig voor schrijvers: Op zoek naar een definitie? Stel je wilt de definitie van schrijven weten. Type in Google define: schrijven (de definitie van schrijven wordt getoond) Of een woord uitsluiten? Een specifiek woord of jaartal uitsluiten kan een zoekopdracht nog nauwkeuriger maken. Stel je zoekt op de woorden 'internet marketing', dan kan door een - voor het woord advertising te plaatsen het woord worden uitgesloten. Type in Google dan: "internet marketing" -advertising