Wat wordt bedoeld met een zoekmachine: definitie, geschiedenis en interessante feiten. De beste internetzoekmachines

Wat is dit

DuckDuckGo is een redelijk bekende open source zoekmachine. Servers bevinden zich in de VS. Naast de eigen robot gebruikt de zoekmachine resultaten uit andere bronnen: Yahoo, Bing, Wikipedia.

Hoe beter

DuckDuckGo positioneert zichzelf als een zoekmachine die maximale privacy en vertrouwelijkheid biedt. Het systeem verzamelt geen gegevens over de gebruiker, houdt geen logs bij (geen zoekgeschiedenis) en het gebruik van cookies wordt zo beperkt mogelijk gehouden.

DuckDuckGo verzamelt of deelt geen persoonlijke informatie van gebruikers. Dit is ons privacybeleid.
Gabriel Weinberg, oprichter van DuckDuckGo

Waarom heb je dit nodig

Alle grote zoekmachines proberen te personaliseren op basis van gegevens over de persoon voor de monitor. Dit fenomeen wordt de ‘filterbubbel’ genoemd: de gebruiker ziet alleen die resultaten die consistent zijn met zijn voorkeuren of die het systeem als zodanig beschouwt.

DuckDuckGo creëert een objectief beeld dat niet afhankelijk is van uw eerdere gedrag op internet, en elimineert thematische advertenties van Google en Yandex op basis van uw vragen. Met DuckDuckGo is het eenvoudig om informatie in vreemde talen te zoeken: Google en Yandex geven standaard de voorkeur aan Russischtalige sites, zelfs als de zoekopdracht in een andere taal wordt ingevoerd.

Wat is dit

not Evil is een systeem dat het anonieme Tor-netwerk doorzoekt. Om het te gebruiken, moet je naar dit netwerk gaan, bijvoorbeeld door een gespecialiseerd netwerk met dezelfde naam te lanceren.

not Evil is niet de enige zoekmachine in zijn soort. Er is LOOK (de standaardzoekopdracht in de Tor-browser, toegankelijk via het reguliere internet) of TORCH (een van de oudste zoekmachines op het Tor-netwerk) en andere. We hebben gekozen voor not Evil vanwege de duidelijke hint van Google (kijk maar op de startpagina).

Hoe beter

Het zoekt waar Google, Yandex en andere zoekmachines over het algemeen gesloten zijn.

Waarom heb je dit nodig

Het Tor-netwerk bevat veel bronnen die niet op het gezagsgetrouwe internet te vinden zijn. En hun aantal zal toenemen naarmate de controle van de overheid over de inhoud van het internet groter wordt. Tor is een soort netwerk binnen het internet met eigen sociale netwerken, torrent-trackers, media, handelsplatformen, blogs, bibliotheken, enzovoort.

3. YaCy

Wat is dit

YaCy is een gedecentraliseerde zoekmachine die werkt volgens het principe van P2P-netwerken. Elke computer waarop de hoofdsoftwaremodule is geïnstalleerd, scant het internet onafhankelijk, dat wil zeggen, analoog aan een zoekrobot. De verkregen resultaten worden verzameld in een gemeenschappelijke database die door alle YaCy-deelnemers wordt gebruikt.

Hoe beter

Het is moeilijk te zeggen of dit beter of slechter is, omdat YaCy een heel andere benadering is van het organiseren van zoekopdrachten. De afwezigheid van een enkele server en eigenaarbedrijf maakt de resultaten volledig onafhankelijk van iemands voorkeuren. De autonomie van elk knooppunt elimineert censuur. YaCy kan zoeken op het deep web en niet-geïndexeerde openbare netwerken.

Waarom heb je dit nodig

Als u een voorstander bent van open source software en een vrij internet, en niet onderhevig bent aan de invloed van overheidsinstanties en grote bedrijven, dan is YaCy uw keuze. Het kan ook worden gebruikt om een zoekopdracht binnen een bedrijfs- of ander autonoom netwerk te organiseren. En ook al is YaCy in het dagelijks leven niet erg bruikbaar, het is qua zoekproces een waardig alternatief voor Google.

4. Pipl

Wat is dit

Pipl is een systeem dat is ontworpen om informatie over een specifieke persoon te zoeken.

Hoe beter

De auteurs van Pipl beweren dat hun gespecialiseerde algoritmen efficiënter zoeken dan ‘gewone’ zoekmachines. Prioritaire informatiebronnen zijn met name sociale netwerkprofielen, commentaren, ledenlijsten en verschillende databases die informatie over mensen publiceren, zoals rechterlijke beslissingen. Het leiderschap van Pipl op dit gebied wordt bevestigd door beoordelingen van Lifehacker.com, TechCrunch en andere publicaties.

Waarom heb je dit nodig

Als u informatie wilt vinden over een persoon die in de VS woont, dan zal Pipl veel effectiever zijn dan Google. De databases van Russische rechtbanken zijn blijkbaar niet toegankelijk voor de zoekmachine. Daarom kan hij niet zo goed omgaan met Russische burgers.

Wat is dit

FindSounds is een andere gespecialiseerde zoekmachine. Zoekt naar verschillende geluiden (huis, natuur, auto's, mensen, etc.) in open bronnen. De service ondersteunt geen zoekopdrachten in het Russisch, maar er is een indrukwekkende lijst met Russischtalige tags waarnaar u kunt zoeken.

Hoe beter

De uitvoer bevat alleen geluiden en niets extra's. In de zoekinstellingen kun je het gewenste formaat en de geluidskwaliteit instellen. Alle gevonden geluiden kunnen worden gedownload. Er wordt gezocht naar geluiden op patroon.

Waarom heb je dit nodig

Als je snel het geluid van een musketschot, de slagen van een zogende specht of de kreet van Homer Simpson wilt vinden, dan is deze service iets voor jou. En we hebben dit alleen gekozen uit de beschikbare Russisch-talige zoekopdrachten. In het Engels is het spectrum nog breder.

Maar serieus, een gespecialiseerde dienst vereist een gespecialiseerd publiek. Maar wat als het voor jou ook handig is?

Wat is dit

Wolfram|Alpha is een computationele zoekmachine. In plaats van links naar artikelen die trefwoorden bevatten, biedt het een kant-en-klaar antwoord op de vraag van de gebruiker. Als u bijvoorbeeld “vergelijk de populaties van New York en San Francisco” in het zoekformulier in het Engels invoert, zal Wolfram|Alpha onmiddellijk tabellen en grafieken weergeven met de vergelijking.

Hoe beter

Deze service is beter dan andere voor het vinden van feiten en het berekenen van gegevens. Wolfram|Alpha verzamelt en organiseert kennis die op internet beschikbaar is op verschillende gebieden, waaronder wetenschap, cultuur en entertainment. Als deze database een kant-en-klaar antwoord op een zoekopdracht bevat, geeft het systeem dit weer; zo niet, dan berekent het het resultaat en geeft het weer. In dit geval ziet de gebruiker alleen de noodzakelijke informatie en niets overbodigs.

Waarom heb je dit nodig

Bent u bijvoorbeeld student, analist, journalist of onderzoeker, dan kunt u Wolfram|Alpha gebruiken om gegevens over uw werk te vinden en te berekenen. De dienst begrijpt niet alle verzoeken, maar ontwikkelt zich voortdurend en wordt steeds slimmer.

Wat is dit

De Dogpile-metazoekmachine geeft een gecombineerde lijst met resultaten weer uit zoekresultaten van Google, Yahoo en andere populaire systemen.

Hoe beter

Ten eerste geeft Dogpile minder advertenties weer. Ten tweede gebruikt de dienst een speciaal algoritme om de beste resultaten van verschillende zoekmachines te vinden en te tonen. Volgens de Dogpile-ontwikkelaars genereren hun systemen de meest complete zoekresultaten op het hele internet.

Waarom heb je dit nodig

Als u geen informatie kunt vinden op Google of een andere standaardzoekmachine, zoek deze dan in meerdere zoekmachines tegelijk met behulp van Dogpile.

Wat is dit

BoardReader is een systeem voor het zoeken naar tekst in forums, vraag- en antwoorddiensten en andere communities.

Hoe beter

Met de service kunt u uw zoekveld verfijnen tot sociale platforms. Dankzij speciale filters kunt u snel berichten en gebruikersreacties vinden die aan uw criteria voldoen: taal, publicatiedatum en sitenaam.

Waarom heb je dit nodig

BoardReader kan nuttig zijn voor PR-specialisten en andere mediaspecialisten die geïnteresseerd zijn in de mening van een groot publiek over bepaalde kwesties.

Tot slot

Het leven van alternatieve zoekmachines is vaak vluchtig. Lifehacker vroeg de voormalige algemeen directeur van de Oekraïense tak van Yandex, Sergei Petrenko, naar de langetermijnvooruitzichten van dergelijke projecten.

Sergej Petrenko

Voormalig algemeen directeur van Yandex.Oekraïne.

Wat het lot van alternatieve zoekmachines betreft, is het eenvoudig: het zijn zeer nicheprojecten met een klein publiek, dus zonder duidelijke commerciële vooruitzichten of, omgekeerd, met volledige duidelijkheid over hun afwezigheid.

Als je naar de voorbeelden in het artikel kijkt, kun je zien dat dergelijke zoekmachines zich specialiseren in een smalle maar populaire niche, die misschien nog niet genoeg is gegroeid om op te vallen op de radars van Google of Yandex, of dat ze aan het testen zijn een originele hypothese in ranking, die nog niet toepasbaar is in regulier zoeken.

Als er bijvoorbeeld plotseling veel vraag blijkt te zijn naar een zoekopdracht op Tor, dat wil zeggen dat de resultaten daarvan nodig zijn voor ten minste een percentage van het publiek van Google, dan zullen gewone zoekmachines natuurlijk het probleem beginnen op te lossen: hoe vind ze en laat ze aan de gebruiker zien. Als uit het gedrag van het publiek blijkt dat voor een aanzienlijk deel van de gebruikers in een aanzienlijk aantal zoekopdrachten de resultaten relevanter lijken zonder rekening te houden met factoren die afhankelijk zijn van de gebruiker, dan zullen Yandex of Google dergelijke resultaten gaan produceren.

‘Beter zijn’ betekent in de context van dit artikel niet ‘beter zijn in alles’. Ja, in veel opzichten zijn onze helden ver verwijderd van Google en Yandex (zelfs ver van Bing). Maar elk van deze diensten biedt de gebruiker iets dat de giganten in de zoekindustrie niet kunnen bieden. Jij kent vast ook soortgelijke projecten. Deel het met ons - laten we bespreken.

De afgelopen jaren zijn de diensten van Google en Yandex stevig verankerd in ons leven. In dit opzicht vragen velen zich waarschijnlijk af wat een zoekmachine is? Simpel gezegd is het een softwaresysteem dat is ontworpen om informatie op het World Wide Web te zoeken. De resultaten worden meestal gepresenteerd in een lijstformaat, ook wel zoekmachineresultatenpagina's (SERP's) genoemd. De informatie kan een combinatie zijn van webpagina's, afbeeldingen en andere bestandstypen. Sommige zoekmachines bevatten ook informatie die beschikbaar is in databases of openbare telefoongidsen.

In tegenstelling tot webgidsen, die alleen door hun eigen editors worden ondersteund, bevatten zoekmachines ook realtime informatie door een algoritme op de webcrawler uit te voeren.

Geschiedenis van oorsprong

Zoekmachines zelf verschenen eerder dan het World Wide Web: in december 1990. De eerste dienst heette Archie en doorzocht de inhoud van FTP-bestanden met behulp van opdrachten.

Wat is een internetzoekmachine? Tot september 1993 werd het World Wide Web volledig handmatig geïndexeerd. Er was een lijst met webservers, bewerkt door Tim Berners-Lee, die werd gehost op de CERN-webserver. Omdat steeds meer servers online gingen, kon bovengenoemde dienst een dergelijke hoeveelheid informatie niet meer verwerken.

Een van de eerste zoekmachines gebaseerd op zoekopdrachten op internet was WebCrawler, die in 1994 werd uitgebracht. In tegenstelling tot zijn voorgangers konden gebruikers op elke webpagina naar elk woord zoeken. Dit algoritme is inmiddels de standaard geworden voor alle grote zoekmachines. Het was ook de eerste beslissing die algemeen bekend was bij het publiek. Eveneens in 1994 werd de Lycos-service gelanceerd, die later een groot commercieel project werd.

Kort daarna verschenen er veel zoekmachines en hun populariteit nam aanzienlijk toe. Deze omvatten Magellan, Excite, Infoseek, Inktomi, Northern Light en AltaVista. Yahoo! was een van de meest populaire manieren om interessante webpagina's te vinden, maar het zoekalgoritme werkte op zijn eigen webdirectory in plaats van op volledige tekstkopieën van de pagina's. Informatiezoekers kunnen ook door de directory bladeren in plaats van op trefwoord te zoeken.

Een nieuwe ontwikkelingsronde

Google omarmde het idee om zoekopdrachten te verkopen in 1998, te beginnen met een klein bedrijf genaamd goto.com. Deze stap had een aanzienlijke impact op de SEO-activiteiten, die in de loop van de tijd een van de meest winstgevende activiteiten op internet werden.

Rond 2000 werd de zoekmachine Google algemeen bekend. Het bedrijf heeft voor veel zoekopdrachten betere resultaten behaald dankzij een innovatie genaamd PageRank. Dit iteratieve algoritme rangschikt webpagina's op basis van hun verbindingen met andere sites en pagina's, gebaseerd op het uitgangspunt dat goede of wenselijke bronnen vaak door anderen worden genoemd. Google handhaafde ook een minimalistische interface voor zijn zoekmachine. Integendeel, veel concurrenten hebben een zoekmachine in het webportaal ingebouwd. Google is zelfs zo populair geworden dat er oplichtingsmachines zoals Mystery Seeker zijn ontstaan. Tegenwoordig zijn er veel regionale versies van deze service, met name de zoekmachine Google.ru, ontworpen voor Russisch sprekende gebruikers.

Hoe werken deze diensten?

Hoe worden rankings en resultaten weergegeven? Wat zijn zoekmachines vanuit het oogpunt van het actie-algoritme? Ze verkrijgen informatie door het web van site naar site te crawlen. De robot of spider controleert de standaardrobots.txt-bestandsnaam die eraan is geadresseerd voordat bepaalde informatie wordt verzonden voor indexering. Het richt zich op veel factoren, namelijk headers, pagina-inhoud, JavaScript, Cascading Style Sheets (CSS) en standaard HTML-opmaak van informatieve inhoud of metadata in HTML-metatags.

Indexeren betekent het associëren van woorden en andere identificeerbare tokens die op webpagina's worden gevonden, met hun domeinnamen en op HTML gebaseerde velden. Associaties worden gemaakt in een openbaar toegankelijke database die beschikbaar is voor zoekopdrachten op internet. Het verzoek van de gebruiker kan uit één woord bestaan. Met een index kunt u zo snel mogelijk informatie over een zoekopdracht vinden.

Sommige indexerings- en cachingtechnieken zijn bedrijfsgeheimen, terwijl webcrawlen een eenvoudig proces is waarbij alle websites op een systematische manier worden bezocht.

Tussen robotbezoeken door wordt een in het cachegeheugen opgeslagen versie van de pagina (een deel van of alle inhoud die nodig is om deze weer te geven), opgeslagen in het werkgeheugen van de zoekmachine, snel naar de aanvragende gebruiker verzonden. Als het bezoek te laat is, kan de zoekmachine eenvoudigweg als webproxy fungeren. In dit geval kan de pagina afwijken van de zoekindexen. De in de cache opgeslagen bron toont de versie waarvan de woorden zijn geïndexeerd, dus dit kan handig zijn als de daadwerkelijke pagina verloren is gegaan.

Architectuur op hoog niveau

Normaal gesproken voert een gebruiker een zoekopdracht in een zoekmachine in in de vorm van verschillende trefwoorden. De index bevat al de namen van sites die deze trefwoorden bevatten, en deze worden onmiddellijk weergegeven. De echte werklast bestaat uit het maken van webpagina's met een lijst met zoekresultaten. Elke pagina in de gehele lijst moet worden gerangschikt volgens de informatie in de indexen.

In dit geval vereist het bovenste resultaatelement het zoeken, reconstrueren en markeren van fragmenten die de context van de overeenkomende trefwoorden tonen. Dit is slechts een deel van de verwerking van elke webpagina in de zoekresultaten, en verdere pagina's (ernaast) vereisen het grootste deel van deze daaropvolgende verwerking.

Naast het eenvoudig zoeken naar trefwoorden, bieden zoekmachines hun eigen GUI- of opdrachtgestuurde operators en zoekparameters om de resultaten te verfijnen.

Ze bieden de gebruiker de nodige controles via een feedbackloop, filtering en weging, terwijl de gezochte gegevens worden verfijnd op basis van de eerste pagina's van de eerste zoekresultaten. Sinds 2007 maakt Google.com het bijvoorbeeld mogelijk om de resulterende lijst op datum te filteren door op 'Zoekhulpmiddelen weergeven' in de meest linkse kolom op de oorspronkelijke resultatenpagina te klikken en vervolgens het gewenste datumbereik te selecteren.

Verschillende verzoeken

De meeste zoekmachines ondersteunen het gebruik van de Booleaanse operatoren AND, OR en NOT om eindgebruikers te helpen hun zoekopdracht te verfijnen. Sommige operators zijn ontworpen voor letterlijke waarden, waardoor de gebruiker de zoektermen kan verfijnen en uitbreiden. De robot zoekt naar woorden of zinsdelen op dezelfde manier als naar ingevoerde commando's. Sommige zoekmachines bieden een geavanceerde zoekfunctie waarmee gebruikers de afstand tussen trefwoorden kunnen bepalen.

Er is ook conceptgebaseerd zoeken, waarbij onderzoek gebruik maakt van statistische analyses op pagina's die de woorden of zinsneden bevatten waarnaar u op zoek bent. Bovendien stellen zoekopdrachten in natuurlijke taal de gebruiker in staat een vraag in te voeren op dezelfde manier als hij een mens zou stellen (het meest typische voorbeeld is ask.com).

Het nut van een zoekmachine hangt af van de relevantie van de reeks resultaten die hij retourneert. Er kunnen miljoenen webpagina's zijn die een bepaald woord of een bepaalde zinsnede bevatten, maar sommige kunnen relevanter, populairder of gezaghebbender zijn dan andere. De meeste zoekmachines gebruiken rankingmethoden om de beste resultaten te garanderen.

Hoe een zoekmachine bepaalt welke pagina's het beste bij een zoekopdracht passen, en in welke volgorde de gevonden bronnen moeten worden weergegeven, verschilt sterk van robot tot robot. Deze methoden veranderen ook in de loop van de tijd naarmate het internetgebruik verandert en nieuwe technologieën zich ontwikkelen.

Wat is een zoekmachine: variëteiten

Er zijn twee hoofdtypen zoekmachines. De eerste is een systeem van vooraf gedefinieerde en hiërarchisch geordende trefwoorden waarmee mensen het massaal hebben geprogrammeerd. De tweede is een systeem dat een ‘omgekeerde index’ genereert door de gevonden teksten te analyseren.

De meeste zoekmachines zijn commerciële diensten die worden ondersteund door advertentie-inkomsten, en sommige bieden adverteerders daarom de mogelijkheid om tegen betaling een rangschikking te maken in de resultaten die ze weergeven. Services die geen geld accepteren voor rankings verdienen geld door contextuele advertenties weer te geven naast de sites die ze weergeven. Tegenwoordig is promotie in zoekmachines een van de meest winstgevende inkomsten op internet.

Welke diensten komen het meest voor?

Google is de populairste zoekmachine ter wereld met een marktaandeel van 80,52% in maart 2017.

Google - 80,52%
Bing-6,92%
Baidu - 5,94%
Yahoo! - 5,35%

Zoekmachines in Rusland en Oost-Azië

In Rusland en sommige landen in Oost-Azië is Google niet de meest populaire service. Onder Russische gebruikers is de Yandex-zoekmachine leider in populariteit (61,9%) vergeleken met Google (28,3%). In China is Baidu de populairste dienst. Het Zuid-Koreaanse zoekportaal Naver wordt gebruikt voor 70% van de online zoekopdrachten in het land. Ook Yahoo! in Japan en Taiwan is het het populairste hulpmiddel om de benodigde gegevens te vinden.

Andere bekende Russische zoekmachines zijn Mail en Rambler. Met het begin van de ontwikkeling van de Runet genoten ze een grote populariteit, maar nu hebben ze hun positie grotendeels verloren.

Zoekbeperkingen en criteria

Hoewel zoekmachines zijn geprogrammeerd om websites te rangschikken op basis van hun populariteit en relevantie, wijst empirisch onderzoek op verschillende politieke, economische en sociale criteria voor het selecteren van de informatie die zij verstrekken. Deze vooroordelen kunnen een direct gevolg zijn van economische (bedrijven die reclame maken voor een zoekmachine kunnen bijvoorbeeld ook populairder worden in organische zoekresultaten) en politieke processen (bijvoorbeeld het verwijderen van zoekresultaten vanwege lokale wetten). Google zal bijvoorbeeld bepaalde neonazisites in Frankrijk en Duitsland, waar het ontkennen van de Holocaust illegaal is, niet weergeven.

Christelijke, Islamitische en Joodse zoekmachines

De mondiale groei van het internet en de elektronische media in de moslimwereld in de afgelopen tien jaar heeft islamitische aanhangers in het Midden-Oosten en het Aziatische subcontinent ertoe aangezet te proberen hun eigen zoekmachines en gefilterde portalen te creëren waarmee gebruikers veilige zoekopdrachten kunnen uitvoeren.

Dergelijke diensten bevatten filters die websites verder classificeren als “halal” of “haram” op basis van moderne deskundige interpretatie van de “Wet van de islam”.

Het ImHalal-portaal verscheen online in september 2011 en Halalgoogling in juli 2013. Ze gebruiken haramfilters op basis van algoritmen van Google en Bing.

Andere op religie gerichte zoekmachines zijn onder meer Jewgle (de joodse versie van Google) en het op christenen gebaseerde SeekFind.org. Ze filteren sites uit die hun geloof ontkennen of aantasten.

De beste internetzoekmachines. Internetzoekmachine – Dit zijn speciale zoekprogramma's die op een hele reeks gespecialiseerde machines zijn geïnstalleerd. Simpel gezegd is het dezelfde website met een reeks programma's, alleen op een speciale zoekmachine (server). Met behulp van zoekmachines vindt u alle informatie die u nodig heeft. Er zijn veel zoekmachines.

1. Wat is een internetzoekmachine

2. Populaire zoekmachines in ons land

3. Populaire zoekmachines in het buitenland

4. Ongebruikelijke zoekmachines

5. Hoe u op de juiste manier naar informatie op internet kunt zoeken

Het meest beste blzzoeksystemen in ons land:

http://www.yandex.ru

http://www.google.com

http://www.aport.ru

http://www.rambler.ru/

http://go.mail.ru

http://www.webalta.ru/

De meest onbeminde en opdringerige zoekmachine aller tijden.

Populaire zoekmachines in het buitenland

http://www.altavista.com

http://www.alltheweb.com

http://www. bing.com

http://www.google.com
http://www.excite.com
http://www.lycos.com
http://www.mamma.com

http://www.yahoo.com

http://www.dmoz.com
http://www.hotbot.com
http://www.dogpile.com
http://www.netscape.com
http://www.msn.com
http://www.webcrawler.com
http://www.jayde.com
http://www.aol.com
http://www.euroseek.com
http://www.teoma.com
http://www.about.com
http://www.ixquick.com
http://www.lookle.com
http://www.metaeureka.com
http://www.searchspot.com
http://www.slider.com
http://www.allthesites.com
http://www.clickey.com
http://www.galaxy.com
http://brainysearch.com
http://www.orura.com

Elk land heeft zijn eigen populaire zoekmachines.

Ongebruikelijke zoekmachines

DuckDuckGo (https://duckduckgo.com/) - een hybride zoekmachine met een privacybeleid voor de gebruiker en zijn zoekopdrachten.

TinEye (http://tineye.com/) is een zoekmachine die gespecialiseerd is in het zoeken naar afbeeldingen op internet. Het heeft onlangs zijn relevantie verloren nadat Google dezelfde functie introduceerde bij het zoeken naar afbeeldingen.

Guenon (http://www.genon.ru/) is een zoekmachine die inhoud op zijn website verzamelt en creëert.

In bijna elke zoekmachine zijn er, naast het zoekvak koppelingen naar de meest populaire nieuwssites en sites over bepaalde onderwerpen.

Hoe u op de juiste manier naar informatie op internet kunt zoeken

Elke zoekmachine heeft zijn eigen algoritmen (regels) voor het zoeken naar informatie.

Om via een zoekmachine bepaalde informatie op internet te vinden, moet u het zoekveld invoeren verzoek. Als u één woord invoert, krijgt u met dit verzoek duizenden links naar sites waar dit woord wordt genoemd.

Daarom is het noodzakelijk om een zo specifiek mogelijke zoekopdracht in te voeren, bestaande uit twee, drie of meer zinnen.

Laten we eens kijken naar een voorbeeld van een zoekopdracht in een zoekmachine Yandex.

Stel dat u informatie wilt vinden over het kopen van een computer. Als u één woord in het zoekvak typt “ Computer", dan krijg je 133 miljoen antwoorden

U moet een specifieker verzoek indienen. Beter is om aan te geven welke computer je wilt kopen en waar (in welke stad).

Dan geeft de zoekmachine je veel minder antwoorden op je vraag.

Het maakt de zoekmachine helemaal niet uit of u uw zoekopdracht in hoofdletters of kleine letters invoert.

Yandex maakt onderscheid tussen zelfstandige naamwoorden en bijvoeglijke naamwoorden, maar negeert de uitgangen volledig.

Hij is ook volkomen onverschillig tegenover naamvallen, meervouden en dergelijke.

Om de zoekopdracht nauwkeuriger te maken, moet u de zoekopdracht tussen aanhalingstekens plaatsen of een uitroepteken vóór het woord plaatsen.

Kijk nu naar dezelfde zoekopdracht, maar zonder de uitroeptekens.

Zie jij het verschil? Met uitroeptekens bedraagt het aantal reacties niet 2 miljoen, maar 186 duizend.

Als u voor een woord met een hoofdletter een uitroepteken plaatst, krijgt u antwoorden waarin dit woord met een hoofdletter voorkomt.

Als het woord in de nominatief staat en je informatie nodig hebt over precies dat woord en over de manier waarop je het hebt geschreven, zet dan twee uitroeptekens voor dit woord. Bijvoorbeeld: !!Bal .

De zoekopdracht geeft u antwoorden voor precies dit woord " Bal"Zoals je het schreef. Niet " bal", Niet " ballen", en met een hoofdletter.

Als je een zin schrijft met het woord ' op", dan zal Yandex negeren" op" Bijvoorbeeld: " op de plank" De zoekopdracht wordt alleen uitgevoerd met behulp van het woord " plank ».

Om er rekening mee te houden en het niet te negeren, is het noodzakelijk vóór het woord “ op» zet een plusteken – « +aan ».

Elke zoekmachine heeft zijn eigen zoekalgoritme, dus als u een specifieke zoekmachine gebruikt en wilt leren hoe u zoekopdrachten correct kunt opstellen, hoeft u alleen maar ' te typen zoekregels inGooglen " of " zoekregels in Yandex ", volg de link in het antwoord op uw verzoek en lees de nodige informatie.

Ieder moment in de tijd neemt een mens beslissingen. Resultaat: beweging voorwaarts, drukte op de plek of beweging in de informatieruimte, maar waar? Wat wordt bedoeld met een zoekmachine?

Goed zicht, gehoor, betrouwbare werking van alle zintuigen en een objectieve perceptie van de werkelijkheid bepalen grotendeels het juiste gebruik van opgebouwde ervaring en kennis en geven intuïtie een kans om zich te uiten. Maar het juiste antwoord is niet alleen het resultaat van de juiste vraag, maar ook van de correct verzamelde informatie om deze op te lossen (dit is het gebied van het criterium).

Wat wordt in het kort verstaan onder een zoekmachine? Zoekgeschiedenis op internet

In een tijd waarin computers en internet voorbehouden waren aan een select groepje, werd er veel vraag naar de logica van het gewone bibliotheekwezen. Waarom de oplossing van een probleem ingewikkeld maken als een catalogus van bestanden, gegevens, oplossingen, programma's en alles wat is gedaan en nuttig kan zijn voldoende is om door de informatieruimte te navigeren?

Moeten gebruikers geen monument oprichten? Laten we niet vergeten dat netwerken, catalogi, mogelijkheden voor communicatie en ‘primaire’ accumulatie aan het werk van computerfans te danken zijn:

informatiekapitaal;
de fundamenten van moderne ideeën (ze zijn in de vergetelheid geraakt, maar hun vluchtige verschijning vormde een langetermijnperspectief).

De kracht en mogelijkheden van computers verschoven snel van de computerwereld naar de informatieverwerkingssfeer. Het internet begon snel nieuwe gebieden te veroveren op het gebied van toepassingsgebieden en in de hoofden van mensen. Het eenvoudige bibliotheekwezen migreerde onmiddellijk naar de geavanceerde mechanismen van zoekmachines.

Talrijke legers van zoekers, robots, ‘spinnen’ en andere algoritmen begonnen alles wat op internet binnenkwam nauwkeurig te onderzoeken. Misschien waren zij het die duidelijk maakten wat een zoekmachine is, hoe zoeken werkt, wat internet is. Ze leerden informatie te indexeren en gingen begrijpen wat er gebruikt kon worden en hoe het gebruikt moest worden.

Het was een eeuwenoude ‘pre-informatiewereld’, antediluviaanse wapens, primitieve verzameltechnieken – net zoals vissen en jagen in een tijd waarin mensen net begonnen waren iets sociaals, sociaal significants te vertegenwoordigen, gescheiden van de natuur volgens het criterium van rationaliteit.

Indexering: we zijn geen slaven, maar we hebben nog steeds niets

Indexatie van de informatieruimte, de wijze van oriëntatie in de verzamelde informatie en het vermogen om op de juiste manier aan te passen wat beschikbaar is als gevolg van gedetecteerde veranderingen in de externe (internet)omgeving werden de basis om te overleven. Dit is gebruikelijk in de natuur en de internetruimte heeft al zijn eigen en absoluut echte leven gekregen.

Er is altijd iets in de geschiedenis geweest dat herinnerd kan worden, maar de vraag rijst altijd: was dat zo, is dat historische ‘wezen’ verbonden met echte mensen en gedenkwaardige herinneringen?

Misschien bleek de buurman in het trappenhuis de maker van Google te zijn of formuleerde hij de fundamentele principes van de welvaart van Yandex. Maar velen noemen 1945 als het punt waarop het idee van hypertekst begon, en Salton's Magic Automatic Text Retrieval wordt beschouwd als de vader van de moderne zoektechnologie.

Sindsdien is er veel water onder de brug doorgegaan, en de lijst van de eerste zoekmachines, de eerste eeuwenoude algoritmen en ideeën is zo groot dat het op zichzelf een goede zoektaak is om het verleden te systematiseren en te indexeren.

Het is niet ongegrond om te beweren dat de reden voor Google als fenomeen en als modern systeem niet alleen een echte persoon is, zijn vrienden en vriendinnen. Waarom is dit niet een heel ander punt in de informatieruimte dat met succes de gewenste resonantie of associatie veroorzaakte?

Het totale publieke bewustzijn is nog steeds dat donkere universum waarin het heel ver verwijderd is van zijn versie van de gloeilamp van Edison.

Jaar 1994: welke bot zei het trefwoord ‘moeder’?

In de moderne wereld is het moeilijk om in het verleden te geloven, maar rekening houdend met de nauwkeurigheid van datums en de deelname van echte persoonlijkheden, moet worden opgemerkt dat het verschijnen van trefwoorden nog geen semantische kern is.

Wat eind vorige eeuw met een zoekmachine werd bedoeld, was al volkomen duidelijk: het waren een tiental populaire zoekmachines met concurrerende rankings in de strijd om de klant. Sommigen hielden van Yahoo, anderen van Aport, anderen van Rambler, maar uiteindelijk bleven Google en Yandex bestaan.

Dit zijn allemaal woorden, meningen, voorkeuren en interessante feiten. De monsters van de zoekbranche werden echter gevormd, creëerden de fundamentele fundamenten, legden objectieve kennis en solide ervaring in begrip vast:

zoekmechanismen;
trefwoorden;
semantische kern.

Hypertext nam niet alleen een vlucht, maar werd ook de basis van internetprogrammering en maakte de weg vrij voor aanverwante serieuze technologieën.

Het belangrijkste: het maakt niet uit hoe we begrijpen wat er gebeurt. Het is belangrijk dat er een bewegingsrichting is en dat deze correct is. Wisselkoersschommelingen zijn normaal; zonder schommelingen zou er geen reden zijn om de criteria te optimaliseren. En de criteria in zowel de vraag als het antwoord zijn het allerbelangrijkste.

Het jaar 1989: de vergeten heropleving

Terugdraaien is een bijzonder historisch mechanisme en altijd een interessant feit. Mensen, vooral wetenschappers en gekwalificeerde specialisten, hebben de neiging de essentie van de dingen te vergeten en in dagdromen te vervallen. De wereld van oorlogen, gladiatoren en vreselijke veldslagen is leuk vergeleken met de competities die plaatsvinden in het publieke en private bewustzijn. Er is hier een koninkrijk van duisternis, maar we moeten vooruitgaan, en dat is onmogelijk zonder overwinning bij elke stap.

Het werkingsprincipe van de zoekmachine vormde de basis van het algoritme. Er zijn veel echte implementaties van de algoritmen. Er zijn er maar heel weinig overgebleven, maar dit is wat de hele internetgemeenschap onder elkaar verdeelde. De strijd om idealen op het gebied van zoeken was toen al belangrijk, maar zelfs een korte geschiedenis van de ontwikkeling van zoekmachines interesseerde consumenten niet langer.

De gebruiker heeft een antwoord nodig, niet de prestaties van wetenschappers en specialisten. De consument wil weten hoe hij een vraag correct moet formuleren, zodat hij een adequaat antwoord krijgt en er zeker van kan zijn dat het zoekmechanisme correct werkt en objectieve criteria hanteert.

Wat maakt het interessante feit uit dat OOP en clouds in 1989-1991 zijn uitgevonden? Absoluut niemand! Maar nog maar twaalf jaar geleden vond er een terugdraaiing plaats: nu is het onmogelijk zonder OOP- en cloudtechnologieën. Maar de terugdraaiing “bewoog niet” in de goede richting, dus er is geen specifiek antwoord op de vraag wat er met een zoekmachine wordt bedoeld. Er is niets nieuws verschenen, maar er is iets overbodigs.

Definitie van zoeken en zoekmachine

Toen er rekenmachines verschenen, dachten mensen dat ze de regels van optellen, vermenigvuldigen en delen zouden vergeten. De tijd verstreek en de angst verdween. Rekenmachines leven en mensen zijn niet vergeten hoe ze eenvoudige wiskundige bewerkingen in een kolom moeten uitvoeren.

In een tijd waarin Google en Yandex actief zijn en er een klein aantal gerenommeerde zoekmachines bestaan, is er een mening: zoeken is een computeralgoritme en een zoekmachine (de definitie van een woord en de betekenis ervan) is software en hardwarecomplex met een webinterface, die de mogelijkheid biedt om informatie op internet te zoeken.

Resultaten van zoekmachines

Het is niet moeilijk om je voor te stellen wat er met een zoekmachine wordt bedoeld. Er is een zoekreeks, de bezoeker schrijft een trefwoord, klikt op de knop “zoeken” en krijgt het resultaat. Maar zoekresultaten zijn niet het antwoord, en het trefwoord is niet de vraag.

In het gewone leven gebruikt iemand geen trefwoorden en krijgt hij nooit resultaten. Als een kind wil eten, zal hij dat aan mama of papa vertellen. Het hangt allemaal af van wat de baby precies wil: daadwerkelijk eten of geld krijgen voor een ijsje. De reactie van de ouder kan woordeloos zijn, maar actie zal volgen.

De werknemer zal geen contact opnemen met de werkgever via trefwoorden, anders is het resultaat een woordeloos ontslag.

Dit zijn allemaal feiten, maar een persoon en een computersysteem vormen een ander relatiegebied. Zolang er maar duidelijk is wat er met een zoekmachine wordt bedoeld: het zijn geen vragen, antwoorden, criteria, maar trefwoorden en de resultaten van de zoekmachine (zoekresultaten).

Het echte voordeel van het huidige moment

Passies voor SEO, de snelle groei van het aantal webstudio's, de ontwikkeling van advertenties, het opleggen van ideeën, tonnen spam en afval in de zoekresultaten - dit alles is natuurlijk en objectief normaal. Het is tijd om spam, hackers en negativiteit te bestrijden. Dit moet zorgvuldig gebeuren, maar het echte voordeel van de huidige situatie is slechts een nieuwe fase in de ontwikkeling van de zoeksector.

Trefwoorden - uitstekend. De semantische kern van de site is uitstekend. De computer kan teksten in verschillende talen vertalen en natuurlijke zinnen ontleden. De SQL-taal is de de facto taal geworden voor het ‘communiceren’ met databases. SQL heeft veel dialecten, en dit is een echte indicator. Kunstmatige taal is levensvatbaar geworden! Taal kan toegang bieden tot enorme hoeveelheden gesystematiseerde informatie.

Oracle en andere grote databaseleiders zijn al tientallen jaren bezig met het presenteren van informatie. Google - over mechanismen voor het verzamelen en indexeren van informatie. De Linux-familie hield stand, Windows bleef overeind en het aantal programmeertalen werd teruggebracht tot een voldoende niveau.

Kunstmatige intelligentie is de wereld van dromen binnengegaan, ontwikkelaars en consumenten zijn objectief de wereld van creatief informatiebeheer en het gebruik ervan binnengestormd.

Zoekresultaten: belangrijk en nutteloos

Het is niet zo moeilijk om zoekresultaten te systematiseren, maar ze zijn de afgelopen tien jaar niet veranderd. In wezen - waar. Als de zoekbalk een trefwoord bevat en geen vraag, over wat voor soort antwoord kunnen we dan praten? Alle moderne zoekmachines hebben criteria, ze worden met het nodige begrip behandeld, maar waarom zou je de consument beperken?

Belangrijk is de reactie van de gebruiker op welk deel van de zoekresultaten hij selecteert. Dit is zijn mening over de resultaten van de zoekmachine. Zoekmachines waarderen dit en houden er niet alleen rekening mee bij een specifiek verzoek, maar ook in het algemeen.

De trefwoordstream en de SERP-stream bevatten beide informatie-rommel. Dit is ook een reden om criteria te formuleren. De zoektaak kan niet worden beschouwd als de toepassing van een trefwoord en een algoritme op de verzamelde informatie, als een verfijning van de verzamelde informatie.

Over prospects: van zoektocht naar oplossing

De beste oplossing is om geen beslissingen te nemen. Of de ontwikkelaars van zoekmachines dit nu begrijpen of niet, het feit blijft: wat een zoekmachine is, weten de ontwikkelaars in de context van een reactie op een trefwoord, als index in de context van het ophalen van informatie uit reeds beschikbare en gesystematiseerde gegevens.

De consument zal zelf uit de zoekresultaten kiezen wat hij nodig acht en een beslissing nemen. De zoekmachine zal hier rekening mee houden en dit onthouden. Hoe iemand de ontvangen informatie zal gebruiken, is het volgende sleutelwoord.

Zo leert een zoekmachine beslissingen te nemen en leert een mens vragen formuleren. Voorlopig zijn dit trefwoorden en het resultaat van het antwoord zijn de zoekresultaten. Maar kwantiteit verandert altijd in kwaliteit.

Wat zijn internetzoekmachines? Een realiteit gebaseerd op voorwaartse beweging. Niet veel praktische problemen vereisen intelligentie van computersystemen. In de meeste gevallen is het voldoende dat ze correct gestelde vragen eenvoudigweg adequaat beantwoorden.

Om onze blog succesvol te kunnen onderhouden en ontwikkelen, moeten we eerst weten met welke algoritmen ze werken. Een duidelijk begrip van de antwoorden op deze vragen zal ons in staat stellen de problemen van websitepromotie in zoekmachines met succes op te lossen. Maar het gesprek over zoekmachineoptimalisatie van websites staat nog steeds voor de deur, maar voor nu een beetje theorie over zoekmachines.

Wat zijn internetzoekmachines?

Als we Wikipedia raadplegen, ontdekken we dit:

“Een zoekmachine is een software- en hardwarecomplex met een webinterface die de mogelijkheid biedt om informatie op internet te zoeken.”

En nu in een taal die wij begrijpen. Stel dat we dringend informatie nodig hebben over een bepaald onderwerp. Om het snel te kunnen vinden, zijn er zoekmachines gemaakt: sites waar we, door een zoekopdracht in het zoekformulier in te voeren, een lijst krijgen met sites waarop we met een hoge mate van waarschijnlijkheid zullen vinden wat we zoeken. zijn op zoek naar. Deze lijst wordt zoekresultaten genoemd. Het kan uit miljoenen pagina's bestaan met elk 10 sites. De hoofdtaak van een webmaster is om in ieder geval in de top tien te komen.

Houd er rekening mee dat wanneer u iets op internet zoekt, u dit meestal op de eerste pagina van de zoekresultaten vindt en zelden naar de tweede pagina gaat, laat staan naar de daaropvolgende pagina's. Dit betekent dat hoe hoger de site scoort, hoe meer bezoekers de pagina's zullen bezoeken. En veel verkeer (aantal bezoekers per dag) is onder meer een kans om het goed te doen.

Hoe vinden internetzoekmachines informatie op internet en op welke basis verdelen zij de plaatsen in de zoekresultaten?

In een paar woorden, internetzoekmachine- dit is een heel web waarin spinrobots voortdurend het netwerk scannen en alle teksten onthouden die op internet komen. Door de ontvangen gegevens te analyseren, selecteren zoekmachines documenten die het meest overeenkomen met de zoekopdracht, dat wil zeggen relevante documenten, waaruit zoekresultaten worden gevormd.

Het meest interessante is dat zoekmachines niet kunnen lezen. Hoe vinden ze dan informatie? Zoekmachinealgoritmen komen neer op een paar basisprincipes. Allereerst letten ze op de titel en beschrijving van het artikel, paragraafkoppen, semantische hoogtepunten in de tekst en de dichtheid van trefwoorden, die noodzakelijkerwijs moeten overeenkomen met het onderwerp van het artikel. Hoe nauwkeuriger deze match is, hoe hoger de site in de zoekresultaten verschijnt. Bovendien moet rekening worden gehouden met de hoeveelheid informatie en vele andere factoren. Bijvoorbeeld de autoriteit van een webbron, die afhangt van het aantal en de autoriteit van de sites die ernaar verwijzen. Hoe groter de autoriteit, hoe hoger de ranking.

Een reeks maatregelen gericht op het vergroten van de positie van de site in de zoekresultaten voor bepaalde zoekopdrachten wordt zoekmachineoptimalisatie genoemd. Dit is nu een hele wetenschap -. Maar daarover later meer.

Op dit moment zijn er veel zoekmachines in de wereld. Ik noem de meest populaire. In het westen zijn dit: Google, Bing en Yahoo. In RuNet - Yandex, Mail.ru, Rambler en Nigma. Kortom, gebruikers geven de voorkeur aan de wereldleider en het Yandex-systeem is het populairst geworden op het Russischtalige internet.

Een beetje geschiedenis. Google werd in 1997 opgericht door een inwoner van Moskou Sergej Brin en zijn Amerikaanse vriend Larry Pagina tijdens hun studie aan Stanford University.

Het bijzondere van Google was dat het de meest relevante zoekresultaten in een logische volgorde naar de eerste posities in de zoekresultaten bracht, terwijl andere zoekmachines de woorden in de zoekopdracht simpelweg vergeleken met de woorden op de webpagina.

Op 23 september van hetzelfde jaar werd het Yandex-systeem aangekondigd, dat sinds 2000 begon te bestaan als een afzonderlijk bedrijf "Yandex".

Ik zal je niet meer vervelen, ik hoop dat het nu wat duidelijker is, wat zijn internetzoekmachines. Het is de moeite waard om te zeggen dat de algoritmen van zoekmachines voortdurend evolueren. Elke dag worden zoekmachines steeds beter in het identificeren van de behoeften van gebruikers en het tonen van de meest relevante informatie in de zoekresultaten, op basis van vele factoren (regio, welke zoekopdrachten de gebruiker al heeft aangevraagd, welke sites hij heeft bezocht tijdens het zoekproces, waar hij vandaan ging, enz.).

Binnenkort zullen Google en Yandex beter dan wij weten wat we nodig hebben en waar we aan denken!