Paghahanap at pag-iimbak ng impormasyon sa Internet. Organisasyon ng paghahanap ng impormasyon. pag-set up ng advanced na form

Paghahanap ng impormasyon: mga pangunahing konsepto, uri at anyo ng organisasyon

Ang paghahanap ng impormasyon o pagkuha ng impormasyon ay kumakatawan sa isa sa mga pangunahing proseso ng impormasyon. Ang sangkatauhan ay nakikibahagi dito mula noong sinaunang panahon, bilang ebidensya ng, halimbawa, mga pagpipinta ng bato. Ang mga layunin, kakayahan at likas na katangian ng paghahanap ay palaging nakadepende sa pagkakaroon ng impormasyon, kahalagahan at accessibility nito, pati na rin ang paraan ng organisasyon nito. Ang kumbinasyon ng mga salik na ito ay tumutukoy sa pagbabalangkas ng karamihan sa mga gawain ng lipunan, ang mga indibidwal na grupo at indibidwal nito sa anumang panahon ng kanilang pag-iral, dahil sa lipunan ang mga transmitters at receiver ng anumang impormasyon ay mga indibidwal. Sa prosesong ito, maaari silang kumatawan sa kanilang sariling mga interes, pati na rin ang mga pangangailangan ng panlipunang micro (indibidwal na grupo ng mga tao) at macro na kapaligiran (lipunan sa kabuuan).

Katapusan ng XX - simula ng XXI siglo, ay nailalarawan sa pamamagitan ng malaking halaga ng patuloy na lumalagong magkakaibang impormasyon, naa-access at interesado sa pinakamalawak na layer ng lipunan. Bukod dito, pinapayagan ng mga teknolohiya sa Internet at software at hardware, na magagamit din sa karamihan ng mga tao, ang prosesong ito na maisagawa anumang oras, halos kahit saan, para sa anumang mga kahilingan.

Ang layunin ng anumang paghahanap ay ang pangangailangan, pangangailangan o pagnanais na makahanap ng iba't ibang uri ng impormasyon na makakatulong sa taong naghahanap upang makuha ang impormasyon, kaalaman, atbp. na kanyang kailangan. para sa: pagpapabuti ng iyong sariling propesyonal, kultura at anumang iba pang antas; paglikha ng bagong impormasyon at pagbuo ng bagong kaalaman; paggawa ng mga desisyon sa pamamahala, atbp.

Ang kahalagahan ng mga prosesong ito ay tumataas, lalo na ngayon na ang impormasyon ay nakakaapekto sa halos lahat ng aspeto ng lipunan.

Ayon sa mga eksperto, 30 o higit pang tao ang nagtatrabaho sa Internetmilyon-milyong mga gumagamit. Sa mga ito, sampu-sampung libo ang online. on-line » – interactive na pag-access anumang oras) at ang bilang ng mga naturang user ay patuloy (araw-araw) na lumalaki. Ang lahat ng ito ay nagpapahirap na ayusin ang isang mabilis na paghahanap at hanapin ang impormasyong kailangan ng napakaraming user. Kaugnay nito, lumilitaw ang isang hanay ng mga problema dahil sa iba't ibang mga posibilidad (uri) ng pagkuha ng impormasyon, iba't ibang paraan ng kanilang pagpapatupad sa mga sistema ng pagkuha ng impormasyon (IRS), iba't ibang antas ng kaalaman ng gumagamit tungkol sa mga kakayahan ng naturang mga sistema, lalo na sa larangan ng pagbuo ng mga query at pagproseso ng data na nakuha bilang resulta ng pagpapatupad ng mga kahilingang ito, atbp. Ang pagwawalang-bahala sa mga aspetong ito ay humahantong sa mga developer sa paglikha ng mga hindi epektibong sistema ng paghahanap (SEs), at mga gumagamit - sa pagkabigo sa mga kakayahan ng naturang mga system upang matugunan ang kanilang mga pangangailangan sa impormasyon, sa kawalan ng katiyakan sa kanilang sariling kaalaman at kakayahan sa pakikipagtulungan sa mga SE, atbp. Ang huli nakakatulong ang pangyayari sa paglitaw ng " sikolohikal na hadlang"(Topic 1) at iba pang negatibong pagpapakita, kung minsan ay nagiging sanhi ng pagtanggi ng mga user sa NIT o kawalan ng tiwala sa kanilang sariling mga kakayahan.

Iminumungkahi ng ilang mga eksperto na sa hinaharap ay malilikha ang mga sistema ng impormasyon na maaaring awtomatikong umangkop na isinasaalang-alang ang antas ng kaalaman at mga kahilingan ng mga partikular na gumagamit, nakikita ang mga kahilingan sa natural na wika at, gamit ang artipisyal na katalinuhan, magbigay sa kanila ng hindi lamang nauugnay, ngunit may kaugnayan din. impormasyon. Ang trabaho sa direksyon na ito ay patuloy na isinasagawa. Gayunpaman, tila para sa maraming higit pang mga dekada, ang katalinuhan at kaalaman ng mga partikular na gumagamit ng mga sistema ng impormasyon o kanilang mga tagapamagitan ay kinakailangan upang epektibong makamit ang kanilang mga layunin - ang paghahanap ng kinakailangang impormasyon.

Lumilikha ito ng pangangailangan para sa isang malawak na hanay ng mga gumagamit ng software na magkaroon ng isang medyo mahusay na utos ng paksang ito. Isaalang-alang natin ang terminological apparatus na may kaugnayan sa mga problema sa pagkuha ng impormasyon.

Mayroong iba't ibang interpretasyon ng terminong "pagkuha ng impormasyon" o "pagkuha ng impormasyon".

Ang katagang " pagkuha ng impormasyon"(Ingles" pagkuha ng impormasyon ") ay ipinakilala ng Amerikanong matematiko na si K. Mooers. Nabanggit niya na ang nag-uudyok na dahilan para sa naturang paghahanap ay kailangan ng impormasyon, na ipinahayag sa anyo ng isang kahilingan sa impormasyon. Kasabay nito, kasama sa K. Muers ang mga dokumento, impormasyon tungkol sa kanilang kakayahang magamit at (o) lokasyon, at makatotohanang impormasyon bilang mga bagay ng pagkuha ng impormasyon.

Dapat pansinin na ang mga kinatawan ng mga aklatan ang unang lumutas sa mga problema ng factual search. Gumawa sila ng mga tool sa pagkuha ng impormasyon , binansagan" sangguniang search engine» (mga katalogo, bibliographic index, atbp.). Ang terminong ito ay ginamit sa propesyonal na domestic press mula noong 1970s.

Sa "Library Encyclopedia" « pagkuha ng impormasyon » ay tinukoy bilang nasa impormasyon hanay ng mga dokumento, katumbas kahilingan sa impormasyon ng gumagamit .

Mula sa punto ng view ng paggamit ng teknolohiya ng computer sa ilalim ng " pagkuha ng impormasyon "nagpapahiwatig ng isang hanay ng mga lohikal at teknikal na operasyon na may sukdulang layunin ng paghahanap ng mga dokumento, impormasyon tungkol sa mga ito, katotohanan, data na nauugnay sa kahilingan ng mamimili .

Mayroong iba pang mga kahulugan. Sa anumang kaso, ang paghahanap ng impormasyon ay sanhi ng pangangailangang matugunan ang mga kahilingan ng impormasyon ng mga gumagamit na inaasahan, sa tulong ng software, upang mabilis na makuha ang data o impormasyong kailangan nila. Ito ay isang paraan ng naka-target na paghahanap at pagkuha ng mga nauugnay na dokumento at (o) mga katotohanan mula sa iba't ibang mapagkukunan ng impormasyon, halimbawa, mga data bank o storage device. Ang mga ito ay buhay at walang buhay na mga bagay na kumakatawan sa iba't ibang mga carrier ng impormasyon

Tinatawag ang mga sistemang nagtitiyak sa pagpapatupad ng naturang pagkuha ng impormasyon mga search engine(PS). Sa mga tradisyonal na teknolohiya, ang mga PS ay kumakatawan sa mga card index at mga katalogo, address at iba pang mga direktoryo, index, encyclopedia, reference apparatus para sa mga publikasyon at iba pang materyales.

Noong 1945, ang Amerikanong siyentipiko at inhinyero na si W. Bush, sa kanyang artikulong "Isang Posibleng Mekanismo ng Ating Pag-iisip," ay unang malawak na nagtaas ng tanong tungkol sa pangangailangang gawing mekanismo ang pagkuha ng impormasyon. Pagkatapos, simula noong 1960s, lumitaw ang mga awtomatikong search engine na gumagana sa impormasyon. Mula sa panahong ito, ang masinsinang gawain ay isinasagawa sa larangan ng pagbuo at pagpapatupad ng mga prinsipyo at pamamaraan ng pagkuha ng impormasyon.

« Mga search engine» maghanap sa mga dokumento ng database o iba pang mga array ng data na nababasa ng makina na naglalaman ng mga tinukoy na salita.

Ang Electronic PS na gumagamit ng conventional o intelligent terminals (PCs) ay nagbibigay-daan sa mga user na gumawa ng mga query sa paghahanap gamit ang mga pormal na elemento na naglalarawan sa nilalaman at gumagamit ng mga espesyal na lohikal na operator; magsagawa ng paghahanap sa mga dokumento ng database o iba pang hanay ng data na nababasa ng makina na naglalaman ng mga tinukoy na salita. Mayroong iba pang mga kahulugan. Sa anumang kaso, pinapayagan lamang ng mga search engine ang mga pamamaraan sa paghahanap at mga kaugnay na proseso.

Layunin ng gawain: pag-aaral ng mga prinsipyo ng pag-aayos ng paghahanap sa Internet at pagkuha ng mga praktikal na kasanayan sa pagbuo ng mga query sa paghahanap.

2.1 Mga simpleng diskarte sa paghahanapWeb-mga pahina

Ang mga simpleng diskarte sa paghahanap ay hindi kasama ang paggamit ng makapangyarihang mga kakayahan sa paghahanap ng Internet at batay sa kaalaman sa mga prinsipyo ng pagbuo ng mga simbolikong pangalan ng domain at intuwisyon.

Maghanap para sa komersyalWeb-mga site. Upang makuha ang address na iyong hinahanap, maaari kang magdagdag ng domain sa pangalan ng isang kumpanya, enterprise, organisasyon o isang simpleng pangngalan sa Ingles (keyword). com, ilagay ang www sa harap. Mga web page na mayroong top-level na domain sa kanilang address. com., kadalasang naglalaman ng impormasyon sa Ingles.

Halimbawa 1. Kunin natin ang pangalan ng kumpanyang SONY at magdagdag ng domain. com, at nasa unahan ang www. - kunin ang address ng SONY web page: www. sony. com. Sa katulad na paraan maaari kang makakuha ng:

www. cnn. com- Balita sa mundo ng CNN;

www. mtv. com- MTV music balita;

www.- COSMOPOLITAN magazine.

Kung nagpasok ka ng isang keyword sa address bar Internet Explorer at pindutin Ctrl+ Pumasok, pagkatapos ay susubukan ng browser na mag-navigate sa eksaktong URL, awtomatikong idaragdag ang pangalan ng protocol at ang Web tag, tulad ng http://www. at pinakamataas na antas ng domain. com. Halimbawa, kung i-type mo ako sa address bar at pindutin ang Ctrl-Enter, pagkatapos ay ang browser Internet Explorer ay susubukan na magbukas ng isang Web site na may address http:// www. ako. com. Kung hindi bumukas ang isang node, nangangahulugan ito na wala ito.

Maghanap ayon sa rehiyon. Para sa Russian at iba pang mga rehiyon, ang pamamaraan sa itaas ay nananatiling may bisa. Sa kasong ito, ang pinakamataas na antas ng domain ng rehiyon (dalawang titik na country code) ay idinagdag sa keyword, na nagbibigay ng address ng Web page. Halimbawa, upang maghanap ng mga server ng Russia, maaari mong subukang magdagdag ng domain sa keyword. ru.

Halimbawa 2. Ito ay kilala na mayroong isang server www. audi. com. Maaari mong subukang hanapin ang sangay nito sa Russia sa pamamagitan ng pagpapalit ng domain. com sa domain. ru, - www. audi. ru.

Maghanap ng malalaking institusyong pang-edukasyon. Ang isang domain ay idinagdag sa pangalan o abbreviation ng institusyong pang-edukasyon. edu (pangunahin para sa mga rehiyon ng Amerika at Europa), na, bilang panuntunan, ay nagbibigay ng nais na address.

Halimbawa 3. Kunin natin ang OXFORD University at magdagdag ng domain. edu, at sa unahan www. - kunin ang address ng OXFORD University Web page: www. oxford. edu. Kadalasan, ang address ng Web page ng isang institusyong pang-edukasyon ay walang domain. edu. Ang nakarehistrong pangalawang antas na domain (o domain alias) ay maaaring ang pinaikling Ingles na pangalan ng institusyong pang-edukasyon. Upang maghanap ng isang institusyong pang-edukasyon sa Russia, maaari mong kunin ang pagdadaglat nito sa Ingles, halimbawa MSU (Moscow State University), at magdagdag ng domain. ru - www. msu. ru- Moscow State University na pinangalanan.

Kadalasan ang address ng isang Web page ay naglalaman ng domain name ng Internet service provider kung saan ang computer ay naka-install ang Web page, halimbawa, www. kgtu. runnet. ru- address ng Krasnoyarsk State Technical University, kung saan ang ***** ay ang domain name ng Internet service provider.

Maraming bansa ang may rehistradong pangalawang antas na domain para sa mga institusyong pang-edukasyon. Halimbawa, para sa UK ito ang AC (Academic) na domain. Ang anumang Web page ay maaaring magkaroon ng ilang alias address, na, kapag na-access, dadalhin ang user sa parehong Web page. Halimbawa, para sa Unibersidad ng OXFORD ito ang mga address www. baka. ac. uk At www. oxford. edu.

Iba pang paghahanapWeb-mga pahina. Maaaring manipulahin ang mga keyword at top-level na domain para maghanap ng gobyerno (.gov), militar (.mil), at iba pang organisasyon (.org). Halimbawa, ang address ng US Government White House ay: www. whitehouse. gov.

2.2 Mga search engine sa webInternet

SA Ang Internet ay may makapangyarihang mga tool sa paghahanap para sa anumang impormasyon: mga dokumento, larawan, programa, Web page, atbp. Ang paghahanap ay isinasagawa sa tinatawag na mga search engine, na tinatawag ding mga programa sa paghahanap, mga server ng paghahanap, mga search engine. Maraming mga search engine sa Internet. Ang pinakakilalang sistema ng pagkuha ng impormasyon ay ipinapakita sa Talahanayan 2.1. Ang isang listahan ng mga link sa iba't ibang mga search engine ay nai-post sa Web page www. monghe. newmail. ru.

Talahanayan 2.1 - Ang pinakasikat na mga search engine

Pangalan ng search engine

Address

Yandex (wika ng Ruso)

http://www. *****

Rambler (wika ng Ruso)

http://www *****

Aport (salitang Ruso)

http://w w w. *****

Yahoo! (Ingles)

AltaVista (Ingles)

Google (Russian)

http://www. *****

Search engine ipinatupad bilang isang Web page na may regular na address, na naglalaman ng tinatawag na string ng paghahanap at isang pindutan Maghanap (Maghanap), at maaari ring maglaman thematic catalog of resources, mga link sa mga sikat na pahina, atbp.

Upang tumawag sa isang search engine, dapat mong ipasok ang address nito sa address bar ng iyong Internet browser. Pagkatapos i-load ang search engine, dapat kang pumasok sa search bar hiling (tanong), na isang string ng teksto (sa anumang wika), - ang pangunahing parirala ng mga hinanap na dokumento sa Internet at i-click ang pindutan Maghanap. Para sa isang mas mahusay na paghahanap, kinakailangan na ang kahilingan ay naglalaman ng mga salita o parirala na makikita sa nais na Web page o sa nais na dokumento (kailangan nilang "hulaan"). Pagkaraan ng ilang sandali, lalabas ang screen listahan ng addressWeb-mga pahina, naglalaman ng mga link sa mga dokumentong hinahanap mo, na kadalasang sinasamahan ng mga komento. Sa pamamagitan ng pag-click sa link, maaari kang pumunta sa alinman sa mga nahanap na dokumento.

Upang pumunta sa susunod na pahina ng listahan ng mga nahanap na dokumento, dapat mong i-click ang kaukulang numero (1, 2, 3, ...) sa pangunahing window na may resulta ng paghahanap. Kadalasan, ang mga dokumento mula sa unang sampung nahanap na pinaka malapit na tumutugma sa kahilingan.

Ang batayan ng anumang sistema ng paghahanap ay isang espesyal na programa - robot ng network o gagamba (gagamba), minsan makakahanap ka ng mga pangalan uod (uod),crawler (gumagapang). Ang search engine ay nagpapadala ng naturang "mga spider" sa Internet, na tinitingnan ang maximum na bilang (kung maaari) ng mga Web page na ipinakita sa Internet, at pagkatapos ay irehistro ang kanilang address (URL) at nilalaman sa database nito. Pagkatapos magpasok ang user ng query at i-click ang button Maghanap Ini-scan ng search engine ang database at ipinapakita ang resulta ng paghahanap.

Bilang karagdagan, halos lahat ng mga search engine ay nagpapahintulot sa iyo na magrehistro ng isang pahina ng gumagamit na nai-post sa Internet. Upang gawin ito, sa pahina ng isang pangunahing search engine, tulad ng YAHOO!, kailangan mong tawagan ang registration mode at ilagay ang URL at paglalarawan ng iyong pahina. Ipapamahagi ng search engine ang iyong impormasyon sa pagpaparehistro sa lahat ng iba pang pangunahing search node, na ibabahagi naman sa iba, atbp. Mayroon ding mga pandaigdigang server ng pagpaparehistro.

Maghanap ng mga direktoryo ay magagamit, halimbawa, sa mga server ng paghahanap na Rambler, Yahoo!, AltaVista, atbp. Upang maghanap sa catalog, kailangan mong pumili ng mga paksa gamit ang mouse, palalimin at paliitin ang paghahanap hanggang ang listahan ng mga link na ipinapakita ay nabawasan sa ilang mga pahina na maaari kang mag-browse nang manu-mano, o hanggang sa isang sapat na malaking grupo kung saan maaari kang magsagawa ng regular na paghahanap (halimbawa, sa search engine na Yankex: Mag-aral ng Mas mataas na edukasyon sa Moscow State University).

2.3 Mga panuntunan para sa pagsasagawa ng mga query sa mga search engine

Kapag nagsasagawa ng mga query, may ilang partikular na panuntunan na maaaring mag-iba-iba sa iba't ibang search engine, ngunit magkapareho ang mga pangunahing hakbang. Ang mga panuntunan para sa pagsasagawa ng mga query ay palaging makikita sa Web page ng isang partikular na search engine sa seksyon Tulong(maaaring tawagin ang seksyong ito Tulong, Paano maghanap, Mga tip sa paghahanap, Mga panuntunan para sa pagsasagawa ng mga query atbp.). Karaniwang kasama sa mga panuntunan sa query ang paggamit wika ng query para sa advanced na paghahanap.

Ang pinakasimpleng panuntunan na umiiral para sa lahat ng mga search engine ay upang tukuyin ang anumang parirala at pag-click Maghanap.

Tatalakayin ng susunod na talata ang ilang mga patakaran para sa pagpapatupad ng mga kahilingan gamit ang sistema ng Yandex bilang isang halimbawa. Marami sa mga panuntunang ito ay nalalapat din sa iba pang mga search engine. Ang mga halimbawa ng mga query ay kinuha mula sa mga pahina ng tulong ng Yandex search engine.

2.4 Mga halimbawa ng mga simpleng query sa Yandex search engine

Karaniwan ang isang query ay isa o higit pang mga keyword, halimbawa: microprocessor ng kumpanyaIntel. Para sa naturang query, matatagpuan ang mga dokumento na naglalaman ng lahat ng query na salita. Binabalewala ang ilang salita sa query (mga pang-ugnay, pang-ukol, atbp.) dahil wala silang semantic load. Halimbawa, kapag hiniling mansanas sa niyebe Ang lahat ng mga dokumento ay matatagpuan kung saan ang dalawang salita ay lilitaw nang sabay-sabay: "mansanas" at "snow" (gayunpaman, ang pagkakasunud-sunod kung saan ipinapakita ang mga ito sa listahan ay magkakaiba). Kung saan matatagpuan ang mga salita sa loob ng dokumento, kung anong gramatikal na anyo ang mga ito, ay hindi mahalaga. Pretext sa hindi pinansin. Samakatuwid, ang query sa itaas ay maaaring isulat tulad nito: niyebe sa isang mansanas. Magiging pareho ang resulta ng paghahanap.

Isang mahalaga at napaka-kapaki-pakinabang na pag-aari ng mga search engine: kahit anong grammatical form ka magsulat ng salita sa isang query, ito ay nasa mga dokumento sa lahat ng anyo nito. Halimbawa, kapag hiniling naglalakad ang lalaki Sa iba pa, makikita ang mga dokumentong naglalaman ng tekstong "darating ang mga tao". Ang pagkilala sa lahat ng mga anyo ay gumagana para sa mga ordinaryong salita ng wikang Ruso. Hindi ito isinasagawa para sa mga kakaibang salita, neologism, atbp.

Ang mga operator ng Yandex, ang kanilang layunin at mga halimbawa ng paggamit ay makikita sa help point ng system.

Upang biswal na lumikha ng mga kumplikadong query, maaari mong gamitin ang mga advanced na kakayahan sa paghahanap sa pahina ng Advanced na Paghahanap.

1. Maging pamilyar sa teoretikal na impormasyon.

2. Bumuo ng address ng website ng isang sikat na kumpanya sa mundo (Intel, IBM, Sony, atbp.) at buksan ito sa Internet Explorer. I-save ang nahanap na mga Web page sa isang hiwalay na folder.

3. Gamit ang parehong pamamaraan, pumunta sa Web site ng St. Petersburg State University at sa parehong paraan buksan ang Web site ng Faculty of Applied Mathematics ng parehong unibersidad. I-save ang nahanap na mga Web page sa isang hiwalay na folder.

4. Sa bawat search engine (Talahanayan 2.1), magpatakbo ng ilang mga query na tumutugon sa mga isyu na interesado ka at buksan ang mga dokumentong natagpuan.

5. Subukang maghanap sa mga pampakay na katalogo.

6. Gamit ang advanced na paghahanap sa Yandex, ihambing ang kasikatan ng mga sumusunod na site sa bilang ng mga pahinang nagli-link sa kanila: Pangulo at Pamahalaan ng Russian Federation; Moscow State University at St. Petersburg State University; Hermitage at Louvre. I-save ang nahanap na mga Web page sa isang hiwalay na folder. Gumawa ng text file kung saan mo itinatala ang bilang ng mga link sa bawat isa sa kanila.

7. Maghanap ng impormasyon tungkol sa kung kailan at saan ka ipinanganak. Gumawa ng isang listahan ng kanyang mga gawa. Maghanap ng mga larawan niya sa iba't ibang taon ng kanyang buhay. I-save ang lahat ng impormasyon sa isang hiwalay na folder.

8. Maghanap ng impormasyon sa Internet sa napiling paksa ng kursong gawain. Batay sa mga resulta ng paghahanap, gumawa ng talahanayan sa Word text editor ayon sa sample (Talahanayan 2.3) at punan ito.

Talahanayan 2.3 - Sample ng isang ulat sa mga resulta ng paghahanap

at/at

Mga katangian ng mga resulta ng paghahanap

URL ng nahanap na mapagkukunan

Maikling paglalarawan ng mapagkukunan

9. Anyayahan ang isang guro na mag-ulat tungkol sa gawaing ginawa.

10. Tanggalin ang mga file na na-save habang nagtatrabaho mula sa gumaganang folder.

2.6 Mga tanong sa seguridad

1. Ilarawan ang mga simpleng pamamaraan para sa paghahanap ng impormasyon sa Internet.

2. Ano ang mga prinsipyo ng pagpapatakbo ng mga search engine sa Internet?

3. Bumuo ng mga pangunahing panuntunan para sa pagbuo ng mga query sa paghahanap.

4. Alin sa mga search engine na iyong nasuri ang may kakayahan sa wika ng query?

5. Alin sa mga search engine na iyong sinuri ang may temang katalogo ng mga mapagkukunan?

6. Alin sa mga search engine na iyong sinuri ang may kakayahang maghanap ng iba't ibang kategorya ng mga mapagkukunan ng impormasyon?

4.5.1. Mga tradisyunal na search engine sa Internet

Upang maghanap ng impormasyon, ginagamit ang mga espesyal na panlabas na serbisyo - mga server ng paghahanap: mga search engine at direktoryo.

Ang mga search engine ay mga server na awtomatikong nag-iipon ng impormasyon tungkol sa nilalaman ng mga site, gamit ang mga espesyal na robot program.

Ang impormasyon para sa mga server ng direktoryo ay pinili ng mga tao. Hindi tulad ng mga search engine, ang impormasyon sa mga direktoryo ay mas tumpak na nakabalangkas, at sa isang patayong hierarchical na anyo.

Ang parehong mga search engine at mga direktoryo ay mga panlabas na serbisyo o, kung tawagin din sila, mga autonomous system. Ang isang tampok ng mga autonomous system ay ang siklo ng pagtatrabaho sa impormasyon ay ganap na isinasagawa sa system na ito, simula sa pagkuha ng impormasyon mula sa pangunahing pinagmulan at nagtatapos sa pagbibigay ng serbisyo sa paghahanap sa end user.

Ang mga automated na search engine ay sumasaklaw sa mas malaking dami ng impormasyon, ang kanilang impormasyon ay mas madalas na ina-update at samakatuwid ay mas nauugnay.

Gayunpaman, ang impormasyon sa naturang mga server ay hindi maganda ang pagkakaayos, dahil ang pagtatasa sa nilalaman ng isang partikular na site ay isang mahirap na gawain upang gawing pormal. Kadalasan, ang programa ng robot ay pumipili ng mga dokumento batay lamang sa pagkakaroon ng mga salita sa paghahanap sa teksto ng dokumento. Ang isang halimbawa ng isang search engine ay ang AltaVista (http://www.altavista.com).

Sa mga katalogo, ang lahat ng impormasyon ay may malinaw na vertical hierarchical na istraktura. Bukod dito, ang istrukturang ito ay itinayo batay sa nilalamang semantiko. Ito ang pangunahing halaga ng mga direktoryo na pinoproseso ng mga tao: hindi ka makakahanap ng maraming mga site na naglalaman ng mga keyword na ito, ngunit maraming mga site na nakatuon sa paksang ito. Ang isang halimbawa ng isang direktoryo ay ang Yahoo server (http://www.yahoo.com).

Ang mga direktoryo ng WWW na naglalaman ng malaking bilang ng mga entry ay kadalasang nagho-host ng mga lokal na search engine sa kanilang mga pahina. Ipinatupad sa anyo ng mga tradisyonal na template, na hindi gaanong naiiba sa mga template batay sa mga awtomatikong pag-index.

Para sa parehong mga search engine at direktoryo, ang isang tiyak na prinsipyo para sa pagpili ng impormasyon ay itinatag. Ang prinsipyong ito ay inilatag alinman sa mga algorithm ng mga search engine, o sa mga regulasyon para sa gawain ng mga tao (para sa mga direktoryo). Depende sa kung saan at kung anong uri ng impormasyon ang naipon, ang dalawang katangian ng mga autonomous system ay tinasa - spatial scale at espesyalisasyon.

Ang spatial na sukat ay inilaan upang limitahan ang bilang ng mga pangunahing mapagkukunan ng impormasyon sa isang tiyak na limitasyon. Halimbawa, ang isang search engine ay maaaring itayo sa loob lamang ng isang site. Ang paghahanap ay maaaring limitado sa isang heyograpikong domain (halimbawa, ru).

Ang ganitong mga sistema ay tinatawag na rehiyonal.

Maraming mga server ng paghahanap na walang ganitong mga paghihigpit. Ang mga ito ay tinatawag na global information retrieval system.

Kapag nag-access sa isang partikular na search engine, dapat mong isaalang-alang kung anong mga serbisyo ang ibinibigay nito. Halimbawa, sa domestic search engine na Yandex (http://www.yandex.ru) isang paghahanap ay ipinakilala hindi lamang para sa mga pahina, kundi pati na rin para sa mga server. Ang kakanyahan ng pamamaraang ito ay ang mga keyword ay hindi hinahanap para sa lahat ng mga pahina, ngunit sa pamamagitan lamang ng kanilang mga pamagat (kung ano ang nilalaman sa HTML sa pagitan ng mga "pamagat" na mga tag). Ang dayuhang AltaVista ay may hiwalay na serbisyo ng Real Names, na naglalaman ng listahan ng lahat ng nakarehistrong pahina ng mga kumpanya at organisasyon.

Ang susunod na mahalagang serbisyo ay ang espesyalisasyon sa paghahanap. Sa kasalukuyan, ang Internet ay isang imbakan ng iba't ibang uri ng impormasyon.

Samakatuwid, ang paghahanap para sa impormasyon ay maaari ding gawing pormal. Maaari kang maghanap ng eksklusibo para sa mga graphic na larawan, maaari kang maghanap ng mga pag-record ng multimedia sa MP3 na format, atbp.

Maraming mga search engine ang nagpapahintulot sa iyo na tukuyin ang uri ng impormasyon na iyong hinahanap. Bilang karagdagan, may mga server na dalubhasa sa paghahanap ng impormasyon ng isang mahigpit na partikular na uri. Eksklusibong dalubhasa ang FTPSearch (http://ftpsearch.lycos.com) sa mga paghahanap ng file. Ini-index nito ang lahat ng uri ng ftp server para sa mga file na matatagpuan doon. Ang paghahanap ay isinasagawa nang direkta sa pamamagitan ng pangalan ng nais na file. Katulad nito, ang MP3Search (http://mp3.box.sk) ay dalubhasa sa paghahanap ng eksklusibong mga MP3 file.

Ang isa pang mahalagang punto ay kung ano ang wika ng query na ginagamit ng isang partikular na system. Kung mas kumplikado ang wikang ito, mas magiging posible ang pag-fine-tune ng paghahanap. Sa kasalukuyan, walang iisang pinag-isang wika ng query para sa mga search engine. Ang pagbuo ng naturang wika ay magiging posible upang maisama ang iba't ibang mga serbisyo sa paghahanap sa isang solong super-search system. Noong Pebrero 1999, inilunsad ang proyekto ng SESP (Search Engine Standards Project), kung saan lumahok ang 15 pinakamalaking search engine sa Internet. Ang gawain ng proyekto ay i-standardize ang gawain ng mga serbisyo sa paghahanap (makikita ang mga materyales tungkol dito sa http://www.searchenginewatch.com).

Ang metasystem ay nagbibigay-daan, alinsunod sa mga kagustuhan ng gumagamit, na limitahan ang kanyang paghahanap sa ilang mga server ng paghahanap, suriin ang pagkakaroon ng mga mapagkukunan na itinuro ng mga resulta ng paghahanap, magsagawa ng mga pinong paghahanap sa mga resulta ng paghahanap, atbp. Ang mga metasearch engine ay madalas na tinatawag na mga kliyente sa mga search engine.

Ang isang halimbawa ng isang metasearch system ay ang domestic development ng "DISCo Seeker" ng kumpanyang "DISCo" (http://www.disco.ru).

Ang pangunahing tampok ng bagong henerasyon ng mga metasearch system ay ang kumbinasyon ng mga search server ng iba't ibang mga espesyalisasyon.

Maaari kang maghanap ng iba't ibang uri ng impormasyon sa loob ng isang application. Kapag nagpoproseso ng isang kahilingan sa paghahanap, ang koneksyon sa higit sa 100 mga search engine (kabilang ang mga dalubhasa) ay pinapayagan. Ang mga resulta ng paghahanap ay higit pang pinoproseso: ang mga link na duplicate sa mga nakita na ay hindi kasama ng system; Ang mga natanggap na address ay sinusuri para sa availability. Posibleng i-configure ang trabaho sa mga server ng paghahanap (maaari mong piliin ang mga server kung saan gagana ang system, tukuyin ang maximum na bilang ng mga link na natanggap mula sa bawat server, atbp.).

Gayunpaman, kahit na sa kaso ng paggamit ng mga metasearch engine, hindi mo magagawa nang walang kaalaman tungkol sa mga tradisyunal na server ng paghahanap - nagsisilbi silang batayan para sa anumang paghahanap.

Ang problema sa paghahanap at paraan ng organisasyon nito

Napakalaki at patuloy na pagtaas ng dami ng impormasyong makukuha sa Internet, kasama. operational, ginagawang napaka-kaugnay at kumplikado ang problema sa paghahanap ng kinakailangang impormasyon. Ang bilis ng paghahanap para sa kinakailangang impormasyon ay tumutukoy sa isang malaking lawak ng propesyonalismo ng gumagamit ng Internet. Ito ay nagkakahalaga na sabihin na upang i-automate ang gawaing ito, ang iba't ibang mga sistema ng paghahanap, parehong dayuhan at domestic, ay binuo, na mga web page ng isang espesyal na uri. Kasabay nito, sa kabila ng pagkakaroon ng maraming mga tool sa pag-automate ng paghahanap, ang gawaing ito ay nananatiling lubos na labor-intensive, na nangangailangan ng user na magkaroon ng ilang karanasan, intuwisyon, at kaalaman sa terminolohiya na ginamit sa kanyang paksa.

Pinapadali ng tool sa Paghahanap ng Internet Explorer ang pag-access ng mga tool sa paghahanap nang hindi kinakailangang malaman ang mga address ng search engine. Sa kasong ito, mas mahusay na direktang makipag-ugnay sa mga search engine sa pamamagitan ng pag-load ng may-katuturang pahina.

Batay sa paraan ng pag-aayos ng paghahanap at mga kakayahan na ibinigay, ang lahat ng mga tool sa paghahanap ay maaaring hatiin sa mga sumusunod na grupo:

mga katalogo at dalubhasang database;

mga search engine;

metasearch engine.

Mga katalogo at database

Ang mga katalogo sa WWW ay katulad ng mga sistematikong katalogo ng aklatan. Ang paghahanap sa direktoryo ay binubuo ng sunud-sunod na paggalaw sa pamamagitan ng isang hierarchical na listahan ng mga link na tinatawag na mga heading o kategorya. Ang unang pahina ng catalog ay naglalaman ng mga link sa mga pangunahing paksa, tulad ng Kultura at Sining; Medisina at kalusugan; Lipunan at Pulitika; Negosyo at Ekonomiya; Libangan, atbp. Ang pag-click sa mouse sa isang ibinigay na link (kategorya) ay magbubukas ng isang pahina na naglalaman ng mga link na nagdedetalye ng napiling paksa (kategorya) Sa paglipat pababa sa mga kategoryang nagdedetalye, makakahanap ka ng isang pahina na may kinakailangang impormasyon. Sa bawat page na bubukas kapag gumagalaw sa catalog sa isang paraan o iba pa, ang pagkakasunud-sunod ng mga tiningnang sub-category ay ipinahiwatig, halimbawa, Business World: Finance: Analytics, atbp.

Ang lahat ng mga catalog ay ginawa at pinapanatiling napapanahon nang manu-mano ng mga espesyalista, katulad ng kung paano ang mga bibliographer ay nag-compile at nagpapanatili ng mga katalogo ng library. Mahalagang tandaan na ang paglalarawan ng dokumento ay ginagawa alinman sa pamamagitan ng mga compiler ng catalog o ng may-akda. Dahil dito, ang nilalaman ng mga pahinang kasama sa catalog ay pinakasapat sa kategorya kung saan sila inuri. Ngunit, dahil sa bilis ng muling pagdadagdag at pagbabago ng impormasyon sa Internet, ang "manu-manong" na paraan ng pagpapanatili ng mga katalogo ay hindi sapat na sumasalamin sa totoong estado ng mga mapagkukunan ng Internet sa isang partikular na paksa.

Mga search engine

(mga search engine, search server, search robot)

Mayroong dose-dosenang malaki at libu-libong maliliit at dalubhasang Web site na idinisenyo para sa mga paghahanap sa Internet. Ang mga tool sa paghahanap ng ϶ᴛᴏth na pangkat ay magbibigay-daan sa gumagamit, ayon sa ilang mga patakaran, na bumalangkas ng mga kinakailangan para sa impormasyong kailangan niya (gamit ang isang wika ng query upang lumikha ng isang query, ang search engine ay awtomatikong tumitingin sa mga dokumento sa mga site). kinokontrol nito (nai-index) at pinipili ang mga ito na “sa palagay » search server, ϲᴏᴏᴛʙᴇᴛϲᴛʙ mga kinakailangan na binuo ng user (nauugnay sa kahilingan) Ang mga search node ay maaaring gumamit ng kanilang sariling mga index sa Internet, na patuloy na ina-update ng mga espesyal na programa na tinatawag na spider program sinusuri ang Web, sinusuri ang bawat link sa isang partikular na pahina, pagkatapos ay sa mga pahinang tinutugunan ang mga link, atbp., at ipinapaalam sa may-ari nito ang impormasyon tungkol sa lahat ng mga pahina para sa kasunod na pag-index.

Bilang resulta ng paghahanap, ang isa o ilang mga pahina ay nilikha na naglalaman ng mga link sa mga dokumento na nauugnay sa kahilingan (Mga pahina sa web Ito ay nagkakahalaga ng pagsasabi na para sa bawat link, ang petsa ng paglikha ng dokumento, ang dami nito, ang antas ng kaugnayan). sa kahilingan, at ang mga fragment ng teksto na nagpapakilala sa nilalaman ng dokumento ay karaniwang ipinahiwatig din. Ang pag-click sa naturang link ay nagbibigay-daan sa iyong i-load ang page na interesado ka. Sa kaso ng napakalaking bilang ng mga nahanap na dokumento, maaari mong linawin ang kahilingan at ulitin ang paghahanap kasama nito, ngunit sa mga napiling pahina lamang (iba ang tawag sa naturang paghahanap sa iba't ibang machine, ngunit kadalasan ϶ᴛᴏ - paghahanap sa natagpuan) Sa isang bilang ng mga search engine maaari kang gumamit ng isang partikular na paraan na baguhin ang link sa pahina na ang nilalaman ay pinakaangkop sa iyong mga pangangailangan, at ulitin ang paghahanap, humihiling na maghanap para sa mga katulad.

Ang bentahe ng awtomatikong paghahanap ay mahalagang nagbibigay ito ng pagtingin sa napakalaking dami ng impormasyong magagamit sa Internet sa ngayon. Kasabay nito, ang pagiging kumplikado ng isang tumpak na paglalarawan ng kahilingan na sapat na sumasalamin sa iyong mga pangangailangan sa impormasyon, pati na rin ang mas malaking kumplikado ng gawain ng awtomatikong pagtukoy sa antas ng mga pahinang tiningnan para sa iyong kahilingan, ay humahantong sa katotohanan na ang bilang ng mga pahinang pinili “sa unang pagbisita” ay ayon sa kaugalian ay napakaliit o napakalaki . Sa pangkalahatan, ang paghahanap gamit ang isang search engine ay isang umuulit (multi-pass) na proseso, bilang isang resulta kung saan ang anyo ng kahilingan ay unti-unting pino.

Mga metasearch engine

Tulad ng nabanggit sa itaas, ang anumang search engine ay nag-scan ng isang tiyak na hanay ng mga server at pumipili ng mga dokumento ayon sa sarili nitong pamantayan. Bilang resulta, ang paghahanap sa iba't ibang mga system gamit ang parehong mga keyword ay nagbibigay ng iba't ibang mga resulta. Ito ay humantong sa ideya ng paglikha ng tinatawag na metasearch (o multisearch) na mga sistema, na hindi naghahanap ng anumang bagay sa kanilang sarili, ngunit bumaling sa ilang mga search engine para sa tulong nang sabay-sabay. Tandaan na ang bawat isa sa mga metasearch engine ay may sariling query language. Isinasalin ng system ang isang query na nabuo sa wika nito sa mga wika ng query na ginagamit ng bawat search engine. Susunod, ang mga resulta ng paghahanap mula sa lahat ng mga system ay pinagsama at ipinakita sa isang malinaw na anyo. Naturally, ang paghahanap gamit ang metasearch engine ay mas tumatagal kumpara sa mga nakasanayang search engine.

Pagsusuri ng mga pinakasikat na search engine

Mayroong isang malaking bilang ng mga search engine sa Internet, at ang bawat gumagamit ay nakatuon sa isa na siya ay nakasanayan o kung saan ang kanyang mga kasamahan ay pinayuhan siya na gamitin. Gumamit tayo ng maikling paglalarawan ng mga pinakasikat na search engine, na ibinigay sa isa sa mga site.

1. Google (www.google.com) Ang pinakamabilis at pinakamalaking search engine. Mahigit sa 1.3 bilyong mga pahina ang na-index (kung saan higit sa 700 milyon ang ganap na na-index, tanging ang address at link na teksto lamang ang nalalaman tungkol sa iba ay karaniwang naghahanap ito gamit ang mga mapagkukunan sa wikang Ruso (siyempre, nang walang mga anyo ng salita). , posibleng piliin ang wika ng interface. Maaari mong isama/ibukod ang mga resulta mula sa mga partikular na site at/o domain. Hindi tulad ng karamihan sa mga search engine, sinusuri ng Google ang katanyagan ng isang mapagkukunan sa pamamagitan ng bilang ng mga link na humahantong dito mula sa iba pang mga pahina. Mayroong paghahanap na nakatuon sa paksa - Apple Macintosh, BSD UNIX, Linux, gobyerno ng US at mga paghahanap sa Unibersidad - maghanap sa mga mapagkukunan ng nangungunang mga institusyong pang-agham at pang-edukasyon.

2. Yandex (www.yandex.ru) Ang pinakamahusay sa mga domestic search engine. Pangunahing ini-index ang mga mapagkukunan sa wikang Ruso, habang ang mga kakayahan nito ay hindi mas mababa sa mga dayuhang sistema. Ang paghahanap ay maaaring isagawa nang eksakto o sa anumang anyo ng salita, na may limitasyon sa petsa, na nagpapahiwatig ng site o subdirectory nito. Maaari kang maghanap batay sa tinatawag na citation index, maghanap ng mga larawan, script, applet; itakda ang wika ng dokumento. Ang mga kinakailangang link ay tradisyonal na matatagpuan sa unang sampung resulta. Mayroon itong bersyon na "liwanag" (na may pinakamababang elemento ng disenyo) sa http://www.ya.ru.

3. AltaVista (www.altavista.com) Nagbibigay ng malaking pagpapalawak ng pamantayan sa paghahanap: sa Advanced na paghahanap mayroong isang pagpipilian ng yugto ng panahon, na kinabibilangan ng petsa ng paglikha o pagbabago ng mapagkukunan, suporta para sa 25 na wika; may kakayahang magbalik ng isang resulta sa bawat site (pinaliit ang paghahanap nang hindi sinasakripisyo ang kalidad) Ang Power search ay may karaniwang hanay ng mga feature. Hanggang kamakailan lamang, ang AV ay isang malaking portal, ngunit para sa mga kadahilanang pinansyal (at iba pa) ay makabuluhang nabawasan nito ang bilang ng mga serbisyo.

4. Yahoo! (www.yahoo.com) Mahalagang tandaan na isa sa mga unang search engine sa Internet. Bilang karagdagan sa karaniwang hanay ng mga function, pinapayagan ka nitong pumili ng mga mapagkukunan ayon sa petsa (4 na taon, 1, 3, 6 na buwan, linggo, 1, 3 araw) Sinusuportahan ang kakayahang tukuyin ang "*" sign sa halip na anumang pagkakasunud-sunod ng mga character sa mga keyword. Sa Yahoo! Ang isang malaking structured catalog ng mga kategorya ay na-compile Una, ang paghahanap ay isinasagawa sa mga ito, pagkatapos ay sa aming sariling archive, pagkatapos ay gamit ang Google system. Ang paghahanap sa mga kategorya ay nagbibigay ng magagandang resulta - hindi marami sa kanila at napakahusay ng mga ito.

5. Lycos (www.lycos.com) Kamakailan - isa sa mga pinakasikat na system. Kasabay nito, hindi ito nagbibigay ng anumang mga espesyal na kakayahan - "AT" "O", maghanap ng mga parirala, ipinag-uutos na presensya/kawalan ng isang salita; sa mga advanced na feature - maghanap sa pamagat, URL, host name at/o domain name; 25 mga wika, kabilang ang Russian - sa isang salita, ang buong set na "pangkalahatang tinatanggap". Maaari mong tukuyin ang uri ng resource content - auto, libro, ftp, download, balita, atbp. Malinaw, ang katanyagan ng Lycos ay bunga ng laki ng malaking proyektong ito.

6. Rambler (www.rambler.ru) Hanggang kamakailan, ang pinakasikat na search engine ng Russia. Hindi ka pinapayagan ng advanced na paghahanap na maghanap ng mga parirala, at ang regular na paghahanap hanggang Pebrero ng 2010 ay bihirang gumawa ng mga katanggap-tanggap na resulta. Mula noong Pebrero, ang sistema ay gumamit ng isang pinahusay na mekanismo ng paghahanap, ang disenyo ay nagbago, ngunit sa mga tuntunin ng kalidad ng Rambler ay hindi pa rin ihambing sa Yandex at Aport (ayon sa may-akda na nagsusuri ng mga search engine Ang site ay naglalaman ng isang katalogo ng rating ng mga mapagkukunan). Rambler Top 100, isa sa mga kinikilalang mapagkukunan ng istatistikal na impormasyon tungkol sa mga proyekto sa Internet.

7. Aport (www.aport.ru) Isa pang mahusay na server ng paghahanap sa Russia. Ang paghahanap ay isinasagawa sa pamamagitan ng teksto (sa lahat lamang ng mga anyo ng salita) at sa pamamagitan ng URL, gamit ang mga lohikal na operator at ang "..." operator (gayunpaman, ang mga stop na salita sa parirala ay binabalewala pa rin), ayon sa petsa at sa mga indibidwal na field (pamagat , paglalarawan, atbp. ), meta character * at! Ang pagtatanghal ng mga resulta ng paghahanap ay ang pinaka mahusay na idinisenyo kumpara sa iba pang mga search engine sa Russia. Ang disenyo ng pangunahing pahina, na malinaw na napuno ng impormasyon, ay nagdudulot ng ilang mga pagdududa. Mayroong bahagyang "mas madali" na bersyon sa http://aport.ru.

Paano pumili ng isang search engine

Kapag naghahanap sa Internet, dalawang bahagi ang mahalaga - kumpleto (walang nawala) at katumpakan (walang kalabisan ang matatagpuan, kadalasan, ang lahat ay tinatawag sa isang salita - kaugnayan, iyon ay, ang sagot sa tanong).

1. Saklaw at lalim

Sa pamamagitan ng saklaw, ang ibig naming sabihin ay ang dami ng database ng search engine, na sinusukat ng tatlong tagapagpahiwatig - ang kabuuang dami ng na-index na impormasyon, ang bilang ng mga natatanging server at ang bilang ng mga natatanging dokumento. Sa lalim ang ibig naming sabihin kung may limitasyon sa bilang ng mga pahina o ang lalim ng pagpupugad ng mga direktoryo sa isang server.

Paano suriin: Ang ilang mga makina ay nagsusulat ng mga istatistika ng robot sa isang website. Ngunit maaari mo itong suriin sa iyong sarili - kailangan mong magtakda ng ilang mga query sa paghahanap na binubuo ng isang salita (upang ibukod ang impluwensya ng wika ng query, kabilang ang iba't ibang mga interpretasyon ng espasyo), at sa parehong oras ay tumingin sa mga istatistika ng mga resulta na ginawa ng ang makina - kadalasan sa simula ng listahan ay nagpapahiwatig kung gaano karaming mga dokumento ang natagpuan. Bilang karagdagan sa katotohanan na ang mga salita ay dapat mula sa iba't ibang mga lugar, mainam din na kumuha ng mga salita na may iba't ibang timbang - bihira, "katamtaman" at "mabigat" (dalas), at ihambing ang halaga na natagpuan. Ang mabibigat na salita, sa partikular, ay sumubok sa buong teksto (pag-index ng lahat ng salita sa isang dokumento) ng isang search engine.

Mas mahirap suriin ang lalim ng pag-crawl ng robot - para dito kailangan mong kumuha ng ilang mga site, halimbawa, na may branched archive structure, at suriin kung ang mga dokumento ay na-index, na maaari lamang maabot, halimbawa, sa 6 na pag-click sa mga link.

2. Bilis ng pag-crawl at kaugnayan ng mga link

Ang bilis ng pag-crawl sa Web ay nagpapakita kung gaano kabilis na-index ang isang bagong idinagdag na mapagkukunan at kung gaano kabilis na-update ang impormasyon sa database. Huwag kalimutan na ang isang mahalagang tagapagpahiwatig ng kalidad ng isang search engine (robot nito) ay hindi lamang ang pagkuha ng mga bagong teritoryo, kundi pati na rin ang pagsubaybay sa katayuan ng mga nasasakupan na. Ang mga server ay mawawala at mananatili, ang mga pahina sa mga ito ay ina-update. Ang mga link na ginagawa ng isang search engine sa listahan ng kung ano ang nahanap nito ay dapat, una, ay umiiral, at, pangalawa, ang kanilang nilalaman ay dapat na tumutugma sa kahilingan.

Paano suriin: Ang layunin ng impormasyon ay maaaring makuha sa pamamagitan ng pagsusuri sa mga log ng server - ang isang robot ng search engine ay karaniwang ipinakilala sa pamamagitan ng pangalan ng makina nito (o isang katulad na bagay), upang makita mo kung gaano kadalas ito bumisita sa server, kung gaano karaming mga pahina ang tinitingnan nito, atbp. Sa kasamaang palad, kadalasan ang log lamang ng site nito ang magagamit para sa pag-aaral, kaya nananatili ang eksperimentong pamamaraan.

Upang matukoy ang bilis ng pag-crawl, kailangan mong lumikha ng isang pahina ng teksto sa isang lugar, idagdag ito sa mga search engine at makita kung gaano kabilis ito nagsimulang lumitaw. O baguhin ang isang umiiral na pahina. Ito ay nagkakahalaga ng pagsasabi na upang matukoy ang kaugnayan ng mga link, suriin ang mga dokumento ng hindi bababa sa unang pahina ng listahan na natagpuan para sa ilang mga query. Ang Not Found na mensahe ay nagpapahiwatig na ang dokumento ay wala na.

3. Kalidad ng paghahanap (subjective indicator)

Ito ay nagkakahalaga na sabihin na ang bawat search engine ay may algorithm para sa pag-uuri ng mga resulta ng paghahanap. Kung mas malapit sa tuktok ng listahan ang dokumentong kailangan mo, mas gumagana ang kaugnayan.

Paano suriin: Sa pamamagitan lamang ng eksperimento. Inirerekomenda na gumawa ng mga query na may iba't ibang haba para sa paghahambing. Maaari mo ring gamitin ang wika ng query, habang ang mga nag-aatubili na basahin ang paglalarawan ay maaaring gumamit ng pinalawak na pahina ng query ("advanced na paghahanap" sa Aport at Yandex, "detalyadong query" sa Rambler - mga pagpipilian sa pagsasalin sa Russian "advanced na paghahanap")

Bukod sa kaugnayan, may mahahalagang katangian ng user.

4. Bilis ng paghahanap

Kung ang isang search engine ay tumugon nang mabagal, ang pagtatrabaho dito ay hindi epektibo. Ito ay nagkakahalaga ng pagdaragdag na ang bilis na nakikita ng gumagamit ay nakasalalay hindi lamang sa mismong search engine, kundi pati na rin sa mga channel sa Internet.

Paano suriin: Sa pamamagitan ng eksperimento - kailangan mong maghanap ng mga query na may iba't ibang haba, naiiba<тяжести>mga salita at sa iba't ibang oras ng araw (ang pag-load ng server ay lubhang hindi pantay sa buong araw, ang peak ay bandang alas tres hanggang alas kuwatro ng hapon)

5. Mga kakayahan sa paghahanap (paggawa gamit ang wika ng dokumento, wika ng query)

Ang isa pang punto ng paghahambing ay kung ano ang eksaktong at kung paano pumapasok ang search engine sa index. Ito ay nagkakahalaga ng pagsasabi na ang isang full-text na search engine ay nag-index ng lahat ng mga salita ng teksto na nakikita ng gumagamit. Ang pagkakaroon ng morpolohiya ay ginagawang posible upang mahanap ang mga hinanap na salita sa lahat ng declensions o conjugations. Bilang karagdagan dito, sa wikang HTML mayroong mga tag na maaari ding iproseso ng isang search engine (heading, link, caption para sa mga larawan, atbp.)

Halos lahat ng machine ay may query language sa anyo ng mga karaniwang logical operator (AT, O, HINDI). Alam ng ilang tao kung paano maghanap ng mga parirala o salita sa isang partikular na distansya - madalas itong mahalaga para makakuha ng makatwirang resulta. Ang isang karagdagang opsyon ay ang paghahanap sa mga lugar ng dokumento - mga heading, link, keyword (META KEYWORDS), atbp. Ang isang karagdagang tampok ng wika ng query ay isang natural na query sa wika, na hindi nangangailangan ng kaalaman sa mga operator.

Paano suriin: Karaniwan ang impormasyong ito ay nai-publish sa server ng search engine (sa Tulong, tandaan na, gayunpaman, inirerekomenda na suriin ang mga tunay na kahilingan, dahil kung minsan ang ninanais ay ipinakita bilang katotohanan).

6. Karagdagang amenities

Ito ay mga karagdagang feature na ibinibigay ng search engine sa mga user. Kabilang dito ang lahat ng uri ng mga opsyon sa paghahanap (mga espesyal na pahina, paghahanap ng mga katulad na dokumento, nililimitahan ang lugar ng paghahanap), at isang listahan ng mga nahanap na server, at paghahanap ayon sa petsa at server, at isang maginhawang interface ng search engine, at ang kakayahang i-personalize ito.

Paano suriin: Maaaring bahagyang nai-publish ang impormasyon sa server ng search engine, ngunit pinakamahusay na subukang magtrabaho sa mga tampok na ito nang mag-isa.

Malinaw na magtatagal ang pagsusuring ito. Bilang karagdagan, ang mga search engine, tulad ng buong Internet, ay hindi tumitigil. Kasabay nito, dahil ang paghahanap ng impormasyon ay isa sa mga mahalagang bahagi ng teknolohiya ng computer, dapat itong bigyan ng sapat na atensyon - hindi bababa sa kakayahang magtrabaho sa isang lokal na network.

Ang isang survey ay isinagawa sa Yandex.ru: kung bakit kailangan ang Internet at kung ano ang nawawala dito (http://www.yandex.ru/polling/9.html) Sa pababang pagkakasunud-sunod, ang data ng survey ay ibinahagi tulad ng sumusunod: Ang Ginagamit ang Internet bilang isang reference na libro (23, 76%), isang tool sa pananaliksik (15.45%), entertainment (14.15%), at sa ikaapat na lugar lamang ay isang mapagkukunan ng balita (12.32%) palaging nagtatagumpay, at 73% ang madalas na nagtatagumpay sa paghahanap ng impormasyong kailangan mo. At ang Internet ay kulang: impormasyon, mahusay na paghahanap at kaayusan (kabilang ang: kaayusan, istraktura, istraktura, istraktura, istraktura, pati na rin ang sistema, sistematisasyon, sistematiko, sistematiko at sistematisasyon)

SAGUTIN ANG MGA TANONG:

Pangalanan kung anong mga paraan ng pagsasaayos ng mga paghahanap ang umiiral sa Internet?

Paano hinahanap ang impormasyon sa mga katalogo at database?

Paano ipinapasok ang impormasyon sa mga katalogo at database?

Ano ang mga search engine sa Internet?

Paano nabuo ang isang database ng impormasyon sa mga search engine?

Saan nagsisimula ang paghahanap ng impormasyon sa mga search engine?

Ano ang isang kahilingan?

Paano hinahanap ang impormasyon sa mga search engine?

Ano ang ibig mong sabihin sa kaugnayan sa isang query?

Ano ang maaaring gawin sa kaso ng napakalaking bilang ng mga dokumento na natagpuan sa karagdagang paghahanap?

Ano ang mga metasearch engine?

Ano ang pangunahing pagkakaiba sa pagitan ng mga metasearch engine at regular na mga search engine?

Alin sa mga sumusunod na system ang magiging metasearch engine:

Ano ang pinakasikat na domestic search engine?

Ano ang pinakasikat na mga dayuhang search engine?

Anong dalawang bahagi ang mahalaga kapag naghahanap ng impormasyon sa Internet?

Anong mga katangian ang tumutukoy sa pagiging epektibo ng mga search engine kapag naghahanap ng impormasyon sa Internet?

Kasunduan ng User:
Mga karapatang intelektwal sa materyal - Mga network ng impormasyon sa computer - Borisov N.A., Lukin A.A. nabibilang sa may-akda nito. Ang manwal/aklat na ito ay nai-post lamang para sa mga layuning pang-impormasyon nang walang paglahok sa komersyal na sirkulasyon. Ang lahat ng impormasyon (kabilang ang “Paksa 3. Paghahanap ng impormasyon sa INTERNET”) ay kinokolekta mula sa mga open source o idinagdag ng mga user nang walang bayad.
Para sa buong paggamit ng nai-post na impormasyon, ang pangangasiwa ng proyekto ng site ay mariing nagrerekomenda na bilhin ang libro / manu-manong Information Computer Networks - Borisov N.A., Lukin A.A. sa anumang online na tindahan.

Tag block: Impormasyon sa mga computer network - Borisov N.A., Lukin A.A., 2015. Paksa 3. Paghahanap ng impormasyon sa INTERNET.

(C) Website ng legal na repositoryo 2011-2016

Isaalang-alang natin ang pagbabalangkas ng problema sa paghahanap sa pangkalahatang anyo. Upang gawin ito, kailangan nating sagutin ang tatlong tanong:

1. ano ang hahanapin – anong mga mapagkukunan ng impormasyon;

2. kung saan titingnan - ang lokasyon ng mga mapagkukunang ito;

3. paano maghanap - anong mga tool ang gagamitin para dito.

I-highlight natin ang mga pangunahing pinagmumulan ng impormasyong ipinakita sa Internet. Ito ay mga dokumento sa WWW, mga artikulo sa mga grupo ng balita at mga mailing list, mga file sa mga file library, mga direktoryo ng impormasyon ng address ng mga organisasyon at mga tao (e-mail, address, telepono), mga artikulo sa thematic database, encyclopedia. Pakitandaan na ang listahan sa itaas ay hindi sinasabing kumpleto.

Ngayon sinasagot namin ang tanong kung saan matatagpuan ang mga mapagkukunang ito ng impormasyon. Ito ang mga sikat na mapagkukunan ng Internet tulad ng WWW, mga grupo ng balita, mga mailing list at FTP server.

Siyempre, maaari kang maghanap ng mga kinakailangang mapagkukunan ng impormasyon nang manu-mano, alamin ang mga address mula sa mga dalubhasang journal sa computer science at Internet, at gumamit ng mga espesyal na direktoryo ng papel na may mga address na inuri sa mga kategorya. Gayunpaman, para sa pagbabago ng espasyo tulad ng Internet, kinakailangan upang matutunan kung paano gumamit ng mga espesyal na tool, ang layunin nito ay upang mangolekta ng data tungkol sa mga mapagkukunan ng impormasyon at magbigay sa mga user ng isang mabilis na serbisyo sa paghahanap. Kaya, dumating tayo sa konsepto ng isang autonomous na tool sa paghahanap - isang sistema ng pagkuha ng impormasyon.

Sistema ng pagkuha ng impormasyon(IPS) ay isang sistema na nagbibigay ng paghahanap at pagpili ng mga kinakailangang data sa isang espesyal na database na may mga paglalarawan ng mga mapagkukunan ng impormasyon (index) batay sa wika ng pagkuha ng impormasyon at mga kaukulang panuntunan sa paghahanap.

Ang pangunahing gawain anuman IPS ay ang paghahanap ng impormasyong nauugnay sa mga pangangailangan ng impormasyon ng gumagamit. Napakahalaga na huwag mawalan ng anuman bilang resulta ng paghahanap, iyon ay, upang mahanap ang lahat ng mga dokumento na may kaugnayan sa kahilingan at hindi makahanap ng anumang bagay na labis. Samakatuwid, ang isang husay na katangian ng pamamaraan ng paghahanap ay ipinakilala - kaugnayan.

Kaugnayan– ito ang pagsusulatan ng mga resulta ng paghahanap sa nabuong query.

Ang mga pangunahing tagapagpahiwatig ng IPS para sa WWW ay spatial scale at espesyalisasyon.

Sa spatial scale, ang IPS ay maaaring nahahati sa:

- lokal;

- pandaigdigan;

- rehiyon;

- dalubhasa.

Mga lokal na search engine ay maaaring idisenyo upang mabilis na maghanap ng mga pahina sa isang solong sukat ng server. Panrehiyong IPS ilarawan ang mga mapagkukunan ng impormasyon ng isang tiyak na rehiyon, halimbawa, mga pahina sa wikang Ruso sa Internet. Mga pandaigdigang search engine , hangga't maaari, ilarawan ang mga mapagkukunan ng buong espasyo ng impormasyon ng Internet. Mga dalubhasang sistema ng pagkuha ng impormasyon nakatutok sa paghahanap ng mga partikular na pinagmumulan ng impormasyon: mga dokumento sa WWW, file, address, atbp.

Tingnan natin ang mga pangunahing gawain na dapat lutasin ng mga developer ng IPS. Tulad ng sumusunod mula sa kahulugan, ang mga sistema ng pagkuha ng impormasyon para sa WWW ay nagsasagawa ng paghahanap sa kanilang sariling database (index) na naglalarawan sa mga ibinahagi na mapagkukunan ng impormasyon. Samakatuwid, kailangan mo munang ilarawan ang mga mapagkukunan ng impormasyon at lumikha ng isang index. Ang pagbuo ng index ay nagsisimula sa pagtukoy sa paunang hanay ng mga URL ng mga mapagkukunan ng impormasyon. Pagkatapos ay isinasagawa ang pamamaraan ng pag-index.

Pag-index– paglalarawan ng mga mapagkukunan ng impormasyon at pagbuo ng isang espesyal na database (index) para sa epektibong paghahanap.

Sa ilang mga sistema ng pagkuha ng impormasyon, ang paglalarawan ng mga mapagkukunan ng impormasyon ay isinasagawa ng mga tauhan ng pagkuha ng impormasyon, iyon ay, ng mga taong sumulat ng isang maikling buod ng bawat mapagkukunan. Pagkatapos, bilang panuntunan, ang mga anotasyon ay pinagsunod-sunod ayon sa paksa (compilation ng isang thematic catalogue). Siyempre, ang paglalarawan na pinagsama-sama ng isang tao ay magiging ganap na sapat sa pinagmulan. Gayunpaman, sa kasong ito, ang pamamaraan ng paglalarawan ay tumatagal ng isang makabuluhang tagal ng panahon, kaya ang nabuong index, bilang panuntunan, ay may limitadong dami. Ngunit ang paghahanap sa ganoong sistema ay maaaring isagawa nang kasingdali

sa mga pampakay na katalogo ng mga aklatan.

Sa isa pang uri ng sistema ng pagkuha ng impormasyon, ang pamamaraan para sa paglalarawan ng mga mapagkukunan ng impormasyon ay awtomatiko. Para sa layuning ito, ang isang espesyal na programa ng robot ay binuo, na, gamit ang isang tiyak na teknolohiya, nag-crawl ng mga mapagkukunan, inilalarawan ang mga ito (i-index ang mga ito) at sinusuri ang mga link mula sa kasalukuyang pahina upang palawakin ang lugar ng paghahanap. Paano mailalarawan ng isang programa ang isang dokumento? Kadalasan, ang isang listahan ng mga salita na matatagpuan sa teksto at iba pang mga bahagi ng dokumento ay pinagsama-sama lamang, na isinasaalang-alang ang dalas ng pag-uulit at lokasyon ng salita, iyon ay, ang salita ay itinalaga ng isang uri ng weighting coefficient depende sa ang kahalagahan nito. Halimbawa, kung ang isang salita ay nasa pamagat ng isang Web page, markahan ng robot ang katotohanang ito para sa sarili nito. Dahil ang paglalarawan ay awtomatiko, ang oras na kinakailangan ay mababa, at ang index ay maaaring napakalaki sa laki.

Samakatuwid, ang susunod na gawain para sa pangalawang uri ng sistema ng pagkuha ng impormasyon ay ang pagbuo ng isang robot sa pag-index. Robot sa pag-index – isang programa na nagsisilbing i-scan ang Internet at panatilihing napapanahon ang index database. Upang maghanap sa mga system na may ganitong uri, kailangang matutunan ng user kung paano bumuo ng mga query, sa pinakasimpleng kaso na binubuo ng ilang salita. Pagkatapos ay maghahanap ang IRS sa index nito ng mga dokumento na ang mga paglalarawan ay naglalaman ng mga salita mula sa query. Upang magsagawa ng mas mahusay na paghahanap, kinakailangan na bumuo ng isang espesyal na wika ng query para sa gumagamit. Depende sa mga tampok ng disenyo ng modelo ng index at ang sinusuportahang wika ng query, isang mekanismo ng paghahanap at isang algorithm para sa pag-uuri ng mga resulta ng paghahanap ay binuo. Dahil malaki ang index, maaaring medyo malaki ang bilang ng mga dokumentong natagpuan. Samakatuwid, kung paano nagsasagawa ang isang search engine ng paghahanap at pag-uuri ng mga resulta nito ay lubhang mahalaga. Hindi bababa sa mahalaga ay ang hitsura ng sistema ng paghahanap na lumilitaw sa gumagamit, kaya ang isa sa mga gawain ay upang bumuo ng isang maginhawa at magandang interface. Sa wakas, ang anyo ng pagtatanghal ng mga resulta ng paghahanap ay lubos na mahalaga, dahil ang gumagamit ay kailangang matuto hangga't maaari tungkol sa pinagmulan ng impormasyon na natagpuan upang makagawa ng tamang desisyon tungkol sa pangangailangang bisitahin ito.

Upang ma-access ang server ng paghahanap, ang gumagamit ay gumagamit ng isang karaniwang programa ng kliyente para sa World Wide Web, iyon ay, isang browser. Sa address ng home page ng IRS, gumagana ang user sa interface ng search engine, na nagsisilbing komunikasyon sa pagitan ng user at ng search engine ng system (ang system para sa pagbuo ng mga query at pagtingin sa mga resulta ng paghahanap).

Ang pangunahing bahagi ng sistema ng pagkuha ng impormasyon ay isang search engine, na nagsisilbi upang isalin ang kahilingan ng user sa isang pormal na kahilingan ng system, maghanap ng mga link sa mga mapagkukunan ng impormasyon at magbigay ng mga resulta ng paghahanap sa user.

Tulad ng nabanggit kanina, ang paghahanap ay isinasagawa sa isang espesyal na database na tinatawag na index. Ang arkitektura ng index ay idinisenyo sa paraang maganap ang paghahanap nang mabilis hangga't maaari, at sa parehong oras posible na subaybayan ang halaga ng bawat isa sa mga mapagkukunang natagpuan. Ang ilang mga system ay nag-iimbak ng mga query ng user sa kanyang personal na database dahil ito ay tumatagal ng mahabang panahon upang i-debug ang bawat query, at ito ay lubhang mahalaga na mag-imbak ng mga query na sinasagot nang kasiya-siya.

Mga website– ang mga mapagkukunan ng impormasyon kung saan ang IPS ay nagbibigay ng access.

Tulad ng alam mo, ang isang Web page ay isang kumplikadong dokumento na binubuo ng maraming elemento. Kapag naglalarawan ng naturang dokumento sa pamamagitan ng isang robot program, kinakailangang isaalang-alang kung aling bahagi ng Web page ang ibinigay na salita. Ang mga mapagkukunan ng pag-index para sa mga dokumento ng WWW ay:

‒ Mga Pamagat.

‒ Mga Pamagat (H1-H6).

‒ Abstract (Paglalarawan).

‒ Mga listahan ng mga keyword (KeyWords).

‒ Buong teksto ng mga dokumento.

Ang mga search engine na ganap na naglalarawan sa buong teksto ng isang dokumento sa WWW ay tinatawag na full-text.

Upang ilarawan ang isang file sa isang mapagkukunan ng FTP, ginagamit ang URL nito. Upang ilarawan ang isang artikulo sa isang pangkat ng balita, ang mga pinagmumulan ng pag-index ay ang mga patlang ng Paksa at Mga Keyword.

Sa panahon ng pamamaraan ng pag-index, ang bokabularyo ay madalas na na-normalize (pagbabawas ng salita sa batayang anyo nito, halimbawa, mga pang-ugnay o pang-ukol, ay binabalewala). Ang bawat information retrieval system ay may sariling listahan ng tinatawag na stop words na hindi pinapansin sa proseso ng pagproseso.

dexing. Sa mga system na may mataas na variable na mga wika, halimbawa, Russian, ang morpolohiya ay isinasaalang-alang. Ang pagsasaalang-alang sa morpolohiya ay nangangahulugan ng kakayahang gumawa ng iba't ibang anyo ng mga salita sa isang partikular na wika. Dapat pansinin na ang wikang Ruso ay medyo kumplikado, ang mga salita na nagbabago ayon sa mga numero, kaso, kasarian at panahunan, at madalas sa hindi inaasahang paraan. Halimbawa: pumunta, pumunta, pumunta, pumunta

atbp. Ang lahat ng umiiral na IPS, na isinasaalang-alang ang morpolohiya ng wikang Ruso, ay gumagamit ng "Grammar Dictionary of the Russian Language", na pinagsama-sama ni Andrei Anatolyevich Zaliznyak. Ang diksyunaryo ay may kasamang 90,000 mga entry sa diksyunaryo, para sa bawat salita impormasyon ay ibinigay tungkol sa kung ito ay inflected at kung paano eksakto ito ay inflected o conjugated.

Kaya, pangkalahatang teknolohiya sa paghahanap ay binubuo ng mga sumusunod na hakbang:

1. Ang gumagamit ay bumubuo ng isang kahilingan.

2. Ang sistema ay naghahanap ng mga dokumento (o ang kanilang mga larawan sa paghahanap).

3. Natatanggap ng user ang resulta (impormasyon tungkol sa mga dokumento).

4. Pinagbubuti o binabago ng user ang kahilingan.

5. Organisasyon ng isang bagong paghahanap.

Mula sa itaas ay sumusunod na ang mga pangunahing kasangkapan para sa paghahanap ng impormasyon sa WWW ay mga sistema ng pagkuha ng impormasyon. Gayunpaman, may mga tool sa paghahanap sa Internet na may pangunahing pagkakaiba sa mga tinalakay. Sa pangkalahatan, ang mga sumusunod na tool sa paghahanap para sa WWW ay maaaring makilala:

- mga search engine;

- metasearch engine;

- pinabilis na mga programa sa paghahanap.

Ang gitnang lugar ay nararapat na kabilang sa mga search engine, na kung saan ay nahahati sa mga direktoryo, mga awtomatikong index (mga search engine) at mga direktoryo ng index. Ang mga search engine lamang ang halos ganap na nagtataglay ng mga kakayahan at katangian ng mga sistema ng pagkuha ng impormasyon.

Catalog– isang search engine na may listahan ng mga anotasyon na inuri ayon sa paksa na may mga link sa mga mapagkukunan ng web. Ang pag-uuri ay karaniwang ginagawa ng mga tao.

Search engine– isang sistema ng paghahanap na may database na binuo ng robot na naglalaman ng impormasyon tungkol sa mga mapagkukunan ng impormasyon.

Metasearch engine– isang sistema na walang sariling index, na may kakayahang magpadala ng mga kahilingan ng gumagamit nang sabay-sabay sa ilang mga server ng paghahanap, pagkatapos ay pagsasama-samahin ang mga resulta na nakuha at iharap ang mga ito sa gumagamit sa anyo ng isang dokumento na may mga link.

Pinabilis na programa sa paghahanap ay isang program na may mga kakayahan sa metasearch engine na naka-install sa iyong lokal na computer.

Ang pangunahing pagkakaiba sa pagitan ng mga metasearch system at pinabilis na mga programa sa paghahanap mula sa mga information retrieval system ay ang kawalan ng kanilang sariling index. Ngunit mahusay sila sa paggamit ng mga resulta ng iba pang mga search engine.

Tingnan natin ang mga tampok ng mga sistema ng direktoryo.

Ang paghahanap sa catalog ay napaka-maginhawa at isinasagawa sa pamamagitan ng sunud-sunod na paglilinaw ng mga paksa. Gayunpaman, sinusuportahan ng mga direktoryo ang kakayahang mabilis na maghanap para sa isang partikular na kategorya o pahina gamit ang mga keyword gamit ang isang lokal na search engine. Ang database ng link (index) ng direktoryo ay karaniwang may limitadong dami at manu-manong pinupunan ng mga tauhan ng direktoryo. Ang ilang mga direktoryo ay gumagamit ng awtomatikong pag-update ng index. Ang resulta ng paghahanap sa catalog ay ipinakita sa anyo ng isang listahan na binubuo ng isang maikling paglalarawan (annotation) ng mga dokumento na may hypertext na link sa orihinal na pinagmulan. Kabilang sa mga pinakasikat na dayuhang katalogo na maaari naming banggitin:

‒ Yahoo (www.yahoo.com),

‒ Magellan (www.mckinley.com),

‒ Mga katalogo ng Russia:

‒ @Rus (www.atrus.ru)

‒ Weblist (www.weblist.ru)

‒ Constellation Internet (www.stars.ru).

Ang isang natatanging tampok ng mga search engine ay ang katotohanan na ang database na naglalaman ng impormasyon tungkol sa mga Web page, mga artikulo sa Usenet, atbp. ay nabuo ng isang robot program. Ang isang paghahanap sa naturang sistema ay isinasagawa ayon sa isang query na pinagsama-sama ng gumagamit, na binubuo ng isang hanay ng mga keyword o isang parirala na nakapaloob sa mga panipi. Ang index ay nabuo at pinananatiling napapanahon sa pamamagitan ng pag-index ng mga robot. Upang paliitin ang lugar ng paghahanap, maaari mong ayusin ang mga nilalaman ng index ayon sa kategorya. Karaniwan, sinusuportahan ng mga search engine ang dalawang mode: simpleng mode ng paghahanap At advanced na mode ng paghahanap .

Isaalang-alang natin ang mga pangkalahatang posibilidad ng pagbuo ng query sa simpleng mode ng paghahanap. Maaari ka lamang magpasok ng isa o higit pang mga salita na pinaghihiwalay ng isang puwang; ang paghahanap para sa mga salita na may lahat ng posibleng pagtatapos ay namodelo ng simbolo * sa dulo ng salita. Pinapayagan ka ng maraming mga sistema na maghanap ng mga parirala o parirala upang gawin ito, kailangan mong ilakip ito sa mga panipi. Ang ipinag-uutos na pagsasama o pagbubukod ng ilang mga salita ay posible. Ang pangunahing problema ng paghahanap gamit ang isang primitively composed query (sa anyo ng listahan ng mga keyword) ay ang search engine ay mahahanap ang lahat ng mga pahina kung saan ang mga tinukoy na salita ay lumalabas sa anumang bahagi ng dokumento. Bilang isang tuntunin, ang bilang ng mga pahinang makikita ay masyadong malaki. Upang mapabuti ang kalidad ng paghahanap sa simpleng mode ng paghahanap, pinahihintulutang gumamit ng mga lohikal na operator at operator na nagpapahintulot sa iyo na limitahan ang lugar ng paghahanap, pati na rin pumili ng isang partikular na kategorya ng mga dokumento mula sa ipinakita na listahan.

Karamihan sa mga search engine ay gumagamit ng mga sumusunod bilang mga operator na nagtatatag ng mga ugnayan sa pagitan ng mga keyword:

AT (AT) &– ang ipinag-uutos na presensya ng lahat ng mga keyword;

O (O) |– ang pagkakaroon ng hindi bababa sa isa sa mga keyword;

HINDI (HINDI)!– kawalan ng isang keyword;

MALAPIT ~– isang tiyak na agwat sa pagitan ng mga keyword.

Maraming mga search engine ang may kasamang mga espesyal na operator sa kanilang wika ng query na nagbibigay-daan sa iyong maghanap sa ilang partikular na bahagi ng isang dokumento, halimbawa, sa pamagat nito, o maghanap ng isang dokumento gamit ang isang kilalang bahagi ng address nito. Ang isang kawili-wiling opsyon ay ang paghahanap ng mga dokumento sa web na nagli-link sa isang page na may URL na iyong tinukoy. Kaya, makakahanap ka ng mga pahina sa Internet na may mga link sa iyong Web site. Papayagan ka ng ilang system na limitahan ang lugar ng paghahanap sa loob ng isang tinukoy na domain.

Kasama sa mga karagdagang espesyal na operator ang:

‒ Mga operator para sa paghahanap ng mga dokumento na may partikular na graphic file;

‒ Mga operator na naglilimita sa petsa ng mga pahinang hinahanap;

‒ Proximity operator sa pagitan ng mga salita;

‒ Word form accounting operator;

‒ Mga operator para sa pag-uuri ng mga resulta (ayon sa kaugnayan, pagiging bago, kalumaan).

Dapat pansinin na ngayon ay walang pamantayan para sa bilang at syntax ng mga sinusuportahang operator para sa iba't ibang mga search engine. Samakatuwid, ang isang gumagamit, kapag nag-access sa isang partikular na search engine, ay dapat na maging pamilyar muna sa mga panuntunan nito para sa pagbubuo ng mga query. Bilang isang panuntunan, magkakaroon ng link ng Tulong sa home page, na magdadala sa iyo sa impormasyon ng tulong.

Ang pinalawig o detalyadong mode ng kahilingan ay ipinatupad nang paisa-isa sa iba't ibang mga sistema, ngunit kadalasan ito ay isang form kung saan ang mga nabanggit na operator at mga pangunahing elemento ay ipinapatupad sa pamamagitan lamang ng pagsuri sa naaangkop na mga kahon o pagpili ng mga parameter mula sa isang listahan.

Tingnan natin ang mga paraan upang ipakita ang mga resulta ng paghahanap sa mga search engine. Kadalasan, ang bilang ng mga dokumentong natagpuan ay lumampas sa ilang dosena, at sa ilang mga kaso ay maaaring umabot sa daan-daang libo! Samakatuwid, bilang isang paraan ng pagpapalabas, ang isang listahan ng mga dokumento ng 5-10-15 na mga yunit bawat pahina ay pinagsama-sama na may kakayahang lumipat sa susunod na bahagi sa ibaba ng pahina. Ang pamagat at URL (address) ng nahanap na dokumento ay dapat na ipahiwatig kung minsan ang sistema ay nagpapahiwatig ng antas ng kaugnayan ng dokumento bilang isang porsyento.

Ang paglalarawan ng isang dokumento ay kadalasang naglalaman ng mga unang ilang pangungusap o mga sipi mula sa teksto ng dokumento na may mga keyword na naka-highlight. Bilang isang patakaran, ang petsa ng pag-update (pag-verify) ng dokumento ay ipinahiwatig, ang laki nito sa kilobytes ay tinutukoy ang wika ng dokumento at ang pag-encode nito (para sa mga dokumento sa wikang Ruso).

Ano ang maaari mong gawin sa mga resultang nakuha? Kung ang pamagat at paglalarawan ng dokumento ay nakakatugon sa iyong mga kinakailangan, maaari kang pumunta kaagad sa orihinal na pinagmulan nito gamit ang link. Mas maginhawang gawin ito sa isang bagong window upang higit pang masuri ang mga resulta ng paghahanap. Maraming mga search engine ang nagpapahintulot sa iyo na maghanap sa mga dokumentong natagpuan, at maaari mong pinuhin ang iyong query sa pamamagitan ng pagpapakilala ng mga karagdagang termino. Kung ang katalinuhan ng system ay mataas, maaari kang mag-alok ng serbisyo ng paghahanap para sa mga katulad na dokumento. Upang gawin ito, pumili ka ng isang dokumento na partikular na gusto mo at ituro ito sa system bilang isang modelo na susundan. Gayunpaman, ang pag-automate sa pagtukoy ng pagkakatulad ay isang napaka-hindi maliit na gawain, at kadalasan ang function na ito ay hindi gumagana tulad ng inaasahan. Ang ilang mga search engine ay nagbibigay-daan sa iyo na muling ayusin ang mga resulta. Upang makatipid ka ng oras, maaari mong i-save ang iyong mga resulta ng paghahanap bilang isang file sa iyong lokal na drive para sa pag-aaral sa ibang pagkakataon offline.

Ang pinakasikat na mga search engine sa ibang bansa at sa Russia.

Mga dayuhang search engine:

Google www.google.com

Altavista www.altavista.com

Excited www.excite.com

HotBot www.hotbot.com

Northern Light www.northernlight.com

Pumunta (Infoseek) www.go.com (infoseek.com)

Mabilis www.alltheweb.com

Mga search engine sa Russia:

Yandex www.yandex.ru (o www.ya.ru)

Rambler www.rambler.ru

Aport www.aport.ru

Mga search engine ng Belarus:

System 09 www.09.open.by

Unibel search engine http://search.unibel.by

System *.BY http://search.promedia.minsk.by/

Belarusian internet catalog Akavita http://akavita.kryvia.net/

Pakitandaan na ang iba't ibang mga search engine ay naglalarawan ng iba't ibang bilang ng mga mapagkukunan ng impormasyon sa Internet. Samakatuwid, hindi mo maaaring limitahan ang iyong paghahanap sa isa lamang sa mga tinukoy na search engine.

Ngayon, kilalanin natin ang mga tool sa paghahanap na hindi gumagawa ng kanilang sariling index, ngunit maaaring gamitin ang mga kakayahan ng iba pang mga search engine. Ito ay mga metasearch engine (mga serbisyo sa paghahanap)

– mga system na maaaring magpadala ng mga query ng user sa ilang mga search server nang sabay-sabay, pagkatapos ay pagsamahin ang mga resultang nakuha at ipakita ang mga ito sa user sa anyo ng isang dokumento na may mga link.

Narito ang mga address ng mga kilalang metasearch engine.

MetaCrawlerwww.metacrawler.com

SavvySearchwww.savvysearch.com

Panghuli, tingnan natin ang huling tool sa paghahanap sa listahan - mga pinabilis na programa sa paghahanap.

Pinabilis na programa sa paghahanap ay isang program na naka-install sa computer ng user at may kakayahang:

‒ magpadala ng mga kahilingan sa ilang mga server ng paghahanap;

‒ pagbukud-bukurin ang mga resulta ng paghahanap ayon sa kaugnayan;

‒ alisin ang mga duplicate;

‒ suriin ang pagkakaroon ng mga dokumento sa network.

WebFerret, NewsFerret www.ferretsoft.com

Inforia Quest 99 http://www.inforia.com/quest

Paksang Paghahanap Spider (SSSpider) www.kryltech.com.

Pagkatapos ng isang detalyadong pag-aaral ng mga pangunahing kakayahan ng mga tool, buksan natin ang problema kahusayan sa paghahanap .Ang mga pangunahing parameter ng kahusayan sa paghahanap ay pagkakumpleto bilang ratio ng bilang ng mga dokumentong natagpuan sa kabuuang bilang ng mga nauugnay na dokumento (iyon ay, lahat ng dokumentong tumutugma sa query ay natagpuan), at katumpakan ng paghahanap - ang ratio ng bilang ng mga nauugnay na dokumento sa kabuuang bilang ng mga dokumentong natanggap (iyon ay, walang nakitang kalabisan o hindi nauugnay). Ito ang ibig sabihin ng konsepto ng kaugnayan. Ang hindi maliit na kahalagahan ay ang kaugnayan ng mga link sa mga dokumento, iyon ay, ang kasalukuyang pagkakaroon ng mga dokumento na matatagpuan sa network, at ang bilis ng paghahanap.

Kaya, ang mga sumusunod na salik na nakakaimpluwensya sa kahusayan sa paghahanap ay maaaring matukoy:

‒ Mga katangian at kakayahan ng search engine.

‒ Ang kalidad ng formulation ng query ng user.

‒ Paano mo masusuri ang kalidad ng isang tool sa paghahanap? Karaniwang inihahambing ang mga search engine batay sa mga sumusunod na parameter:

‒ Bilang ng mga naka-index na pahina (index volume).

‒ Bilang ng mga sinusuportahang operator.

‒ Isang karaniwang operator na pinagsasama-sama ang ilang mga keyword. Kung ang karaniwang operator ay ang AND operator, ang search engine ay awtomatikong maghahanap ng mga dokumento kung saan

Ang lahat ng ipinasok na mga keyword ay naroroon. Kung hindi, makikita ang mga dokumento (OR operator) kasama ng lahat ng keyword at sa bawat isa nang hiwalay

‒ Maghanap ng eksaktong parirala.

‒ Maghanap ng mga salita na may iba't ibang pagtatapos.

‒ Accounting para sa mga anyo ng salita. Sa kaso ng awtomatikong mode ng accounting para sa mga form ng salita, hahanapin ng system ang mga dokumento para sa salita kasama ang lahat ng mga pagbabago nito.

‒ Sensitibo sa malaking titik. Kung hindi matukoy ng system ang pagkakaiba sa pagitan ng malaki at maliit na titik, ang mga resulta ng paghahanap ay magiging mas mababa ang kalidad.

‒ Maghanap ng mga multimedia file.

‒ Form para sa paglalahad ng mga resulta.

‒ Panahon ng pag-update ng index. Naaapektuhan ng indicator na ito ang naturang parameter gaya ng kaugnayan ng mga link na natagpuan. Kung mas madalas na ina-update ang index, mas madalas na hindi napapanahong mga link ang lalabas sa mga resulta ng paghahanap.

‒ Pagkaantala bago magparehistro. Ang parameter na ito ay nagpapahiwatig ng agwat ng oras bago ipasok ang paglalarawan ng isang Web page sa index pagkatapos ng kahilingan ng may-akda nito.

Ngayon tingnan natin kung paano pinakamahusay na ihanda ang user para sa paglikha ng isang kahilingan. Una sa lahat, kinakailangang magsagawa ng komprehensibong pagsusuri ng leksikal ng impormasyong iyong hahanapin. Pagkatapos ay kinakailangan na mag-compile ng isang hanay ng mga keyword (kung kinakailangan, sa ilang mga wika) sa anyo ng mga indibidwal na termino, parirala, propesyonal na bokabularyo at cliches.

‒ Subukan ang mga query ng 1-2 keyword o parirala.

‒ Pagsusuri ng dami ng tugon.

‒ Pagsasaayos ng kahilingan batay sa kaugnayan ng tugon.

Batay sa itaas, maaari naming i-highlight ang mga sumusunod na epektibong diskarte sa paghahanap:

‒ Maghanap ng pangkalahatang impormasyon sa mga katalogo. Sa mga direktoryo, bilang panuntunan, tiyak na konektado ka sa mga dalubhasang server sa lugar na iyong hinahanap.

‒ Maghanap ng lubos na espesyalisadong impormasyon sa mga search engine. Upang magsagawa ng mas malawak na paghahanap, ang limitadong bilang ng mga link sa mga direktoryo ay malinaw na hindi sapat. Bilang karagdagan, ang mataas na espesyal na impormasyon sa mga katalogo ay maaaring nawawala. Samakatuwid, kinakailangang maghanap sa mga search engine na may malalaking index.

‒ Gumamit ng mga operator o isang advanced na form ng query upang paliitin ang lugar ng paghahanap. Upang magsagawa ng isang de-kalidad na paghahanap, kailangan mong maging pamilyar sa wika ng query ng isang partikular na search engine. Ang isang epektibo at simpleng paraan upang malutas ang problema sa paglikha ng isang de-kalidad na query ay ang paggamit ng advanced na query mode.

‒ Gamit ang function ng paghahanap sa kung ano ang natagpuan. Karamihan sa mga search engine ay sumusuporta sa kakayahang maghanap sa loob ng mga resultang natatanggap nila. Bilang isang patakaran, upang magawa ito, kailangan mong paganahin ang espesyal na Paghahanap sa nahanap na checkbox at maglagay ng mga karagdagang salita upang muling maghanap sa mga pahinang natagpuan para sa query.

‒ Gamit ang paghahanap para sa mga katulad na dokumento.

‒ Paggamit ng mga metasearch engine at programa para sa pinabilis na pagkuha ng impormasyon. Upang makakuha ng pangkalahatang pangkalahatang-ideya ng mga dokumento, ipinapayong gamitin ang mga kakayahan ng mga metasearch system o pinabilis na mga programa sa paghahanap. Ipinapaalala namin sa iyo na ipinapadala ng mga tool sa paghahanap na ito ang iyong kahilingan sa ilang mga search engine nang sabay-sabay at tumatanggap ng ilan sa mga pinaka-nauugnay na link mula sa bawat engine.

‒ Tingnan ang seksyong Mga Link sa mga espesyal na site. Ang mga may-akda ng maraming dalubhasang Web site ay nag-iipon ng kanilang mga koleksyon ng mga link sa paksa ng site. Madalas kang makakahanap ng maraming kapaki-pakinabang na mapagkukunan sa mga koleksyong ito, na nakakatipid sa iyo ng oras na ginugol sa paghahanap nang mag-isa gamit ang mga tool na tinalakay sa itaas.

‒ Paghahanap ng mga sagot sa mga tanong sa mga newsgroup. Kung gusto mo, maaari kang makipag-ugnayan sa isang espesyal na newsgroup na may isang partikular na tanong para sa tulong. Mahahanap mo ang pangkat na kailangan mo gamit ang mga espesyal na tool sa paghahanap, na titingnan namin sa ibang pagkakataon.

‒ Subscription sa mga espesyal na mailing list. Sa pamamagitan ng pag-subscribe sa isang nakalaang mailing list, maaari kang makatanggap ng pinakabagong impormasyon sa iyong paksa sa pamamagitan ng email, pati na rin magtanong sa iyong mga kapwa subscriber.

Talakayin natin ang problema sa paghahanap ng isang mapagkukunan ng impormasyon tulad ng mga artikulo sa mga newsgroup. Ang mga tool sa paghahanap sa kasong ito ay maaaring ituring na mga search engine sa WWW, na nag-index hindi lamang sa espasyo ng WWW, kundi pati na rin sa mga artikulo sa mga newsgroup at may espesyal na mode ng paghahanap sa partikular na mapagkukunang ito. Ang paghahanap sa mga newsgroup ay sinusuportahan, halimbawa, ng Altavist search server. Dapat tandaan na ang mga search engine ng WWW ay napakabilis na nag-index ng mga grupo ng balita at naglalaman ng impormasyon tungkol sa mga artikulo na aktwal na umiiral sa Internet. Mayroong mga espesyal na sistema para sa paghahanap ng mga archive ng balita, ang pinakasikat sa mga ito ay ang Deja system (www.deja.com). Binibigyang-daan ka ng system na ito na maghanap ng mga indibidwal na artikulo na naglalaman ng inilagay na termino, gayundin ang paghahanap para sa mga partikular na newsgroup na nakatuon sa pagtalakay sa isang partikular na paksa. Maaari kang magparehistro sa Deja at mag-subscribe sa ilang mga newsgroup.

Ngayon tingnan natin ang mga tool na nagbibigay-daan sa iyong maghanap ng mga file. Maraming mga search engine

Ang WWW ay nagsimulang magbigay ng serbisyo para sa paghahanap ng mga multimedia file (Altavista, Aport,...). Upang gawin ito, hindi na kailangang malaman ang mga espesyal na operator, ngunit pumunta lamang mula sa home page gamit ang mga link na Mga Larawan, MP3/Audio o Video patungo sa isang espesyal na mode ng paghahanap. Ang paghahanap ay isinasagawa sa pamamagitan ng isang posibleng pangalan ng file o sa pamamagitan ng teksto sa isang komento sa isang link sa isang multimedia file. Maaari mong hulaan ang pangalan ng file, halimbawa, ang isang file na may larawan ng isang agila ay maaaring tawaging eagle.gif. O hulaan na ang larawan ni Bill Gates ay magkakaroon ng kaukulang lagda.

Tulad ng para sa mga paghahanap ng software, may mga Web search server sa World Wide Web na may mga koleksyon ng shareware software, na ang ilan ay dalubhasa sa paghahanap ng software para sa Internet o para sa isang partikular na operating system. Dadalhin ka ng mga system na ito sa isang partikular na server, kung saan maaari mong i-download ang gustong produkto ng software. Ito ay nagkakahalaga ng pagbanggit ng mga server ng Archie, na nagbibigay din ng serbisyo para sa paghahanap ng mga file sa mga FTP server, ngunit ang paggamit ng mga Web server ay mas maginhawa.

Tingnan natin ang mga tool sa paghahanap para sa paghahanap ng impormasyon ng address. Ipakilala natin ang konsepto ng White at Yellow na paghahanap.

Puting paghahanap– maghanap ng impormasyon ng address gamit ang dating kilalang pangalan ng addressee (pangalan ng isang tao o organisasyon)

Yellow-search–hanapin ang iyong sariling pangalan gamit ang mga karagdagang katangian (ayon sa uri ng aktibidad, tampok na heograpikal), at pagkatapos ay hanapin ang impormasyon ng address nito.

Kadalasan, ang mga Yellow Pages system ay aktwal na agad na kasama ang White Pages - kapag ang isang address ay natagpuan, ang numero ng telepono at postal address nito ay makikita kaagad. Bilang karagdagan, binibigyang-daan ka ng ilang Yellow Pages na maghanap lamang sa isang alpabetikong listahan ng kanilang mga subscriber (white search). Sa kabilang banda, ang mga White page ay naglalaman din ng mga dilaw na elemento ng paghahanap - bilang karagdagan sa pagtukoy ng iyong sariling pangalan, kadalasang pinapayagan ka nitong tukuyin ang pangalan ng lungsod, estado, at iba pang data na nagpapaliit sa paghahanap (na kinakailangan sa kaso ng maraming pangalan). Marahil ito ang dahilan kung bakit maraming mga on-line na direktoryo ng telepono na aktwal na nagsasagawa ng mga puting paghahanap ay tinatawag ang kanilang mga sarili na Yellow page.

Narito ang mga address ng Web system para sa paghahanap ng impormasyon ng address para sa mga tao at organisasyon.

Maghanap ng mga tao:

‒ Maghanap ng mga tao sa Yahoo (http://people.yahoo.com).

‒ WhoWhere system (www.whowhere.com).

‒ Bigfoot system (www.bigfoot.com).

Maghanap ng mga organisasyon:

‒ Seksyon ng mga dilaw na pahina sa mga search engine

‒ mga dalubhasang server

‒ www.yellowpages.com – para sa paghahanap sa USA at iba pang mga bansa

GUMAGAWA SA MAIL CLIENT

Gaya ng nabanggit sa itaas, isa sa mga gamit ng Internet ay ang pagpapalitan ng impormasyon.

Isaalang-alang natin ang pangunahing paraan ng pagpapalitan ng impormasyon na magagamit sa pamamagitan ng pandaigdigang network:

E-mail, na nagbibigay-daan sa iyong napakabilis na magpadala ng mga email sa mga email address ng mga user ng Internet.

Mga mailing list, kung saan maaari kang mag-subscribe, tulad ng isang magazine, at pagkatapos ay pana-panahong makatanggap ng seleksyon ng mga artikulo sa isang partikular na paksa sa pamamagitan ng email. Pagkatapos, maaari mong ipadala ang iyong mga mensahe sa lahat ng mga subscriber.

Mga newsgroup, na nagbibigay-daan sa iyong mag-publish ng mga mensahe batay sa mga interes sa mga espesyal na server sa network. Mababasa ang mga mensahe sa pamamagitan ng pagkonekta sa server at pagpili ng paksa para sa iyong sarili. Dagdag pa, kung ninanais

Ang isang napaka-tanyag na mapagkukunan ay IRC , na nagsisilbi para sa direktang komunikasyon sa pagitan ng isang pangkat ng mga tao sa real time sa pamamagitan ng pagpasok ng text mula sa keyboard at agad na paglabas sa isang karaniwang board.

Ang mga espesyal na programa ay binuo para sa komunikasyon sa real time, na nagpapahintulot, pagkatapos magtatag ng isang koneksyon, upang ilipat ang tekstong ipinasok mula sa keyboard, pati na rin ang tunog, ang iyong imahe at anumang mga file. Gamit ang mga program na ito, maaari mong ayusin ang pakikipagtulungan sa pagitan ng mga malalayong user at isang program na tumatakbo sa lokal na computer.

‒ Gamit ang mga espesyal na kagamitan at software, maaari kang magsagawa ng mga audio at video conference sa pamamagitan ng Internet, iyon ay, magpadala ng tunog at imahe mula sa isa hanggang sa marami.

‒ Ang Internet ay may sariling paging system kung saan maaari kang magparehistro at tumanggap ng iyong personal na numero. Alam ang personal na numero ng ibang tao, maaari kang magpadala sa kanya ng isang mensahe sa pamamagitan ng gitnang server ng serbisyo ng paging na may isang alok upang magtatag ng isang koneksyon at makipag-usap. Ang pinakasikat na paging system sa Internet ay ang system

‒ Ang Internet telephony ay isang sistema na nagpapahintulot sa iyo na magsagawa ng isang pag-uusap sa real time sa pamamagitan ng Internet.

Lumipat tayo sa isang mas detalyadong paglalarawan ng mga paraan ng pagpapalitan ng impormasyon sa Internet. Magsimula tayo sa pinakalumang paraan ng komunikasyon sa network na tinatawag na email. Ipakilala natin ang kahulugan:

E-mail– isang paraan ng pagpapalitan ng impormasyong inihanda sa elektronikong anyo sa pagitan ng mga taong may access sa isang computer network.

Ang mga pangunahing lugar ng aplikasyon ng e-mail ay ang pagsasagawa ng personal na sulat at pagtatrabaho sa ilang mga mapagkukunan ng impormasyon sa Internet, tulad ng mga mailing list, off-line na mga grupo ng balita at mga sistema ng paglilipat ng file ng e-mail. Siyempre, ang pagkakaroon ng opsyon na kumonekta sa Internet online, mas maginhawang gumamit ng anumang FTP client o file download program upang kopyahin ang mga file. Gayunpaman, minsan para sa mga user na may paraan ng koneksyon gamit ang UUCP protocol, ang tanging paraan para makatanggap ng file mula sa isang FTP server ay mag-order nito sa pamamagitan ng koreo gamit ang isang espesyal na serbisyo ng file-mail. Bilang karagdagan, ang sistema ng mail ay hindi nangangailangan ng iyong ganap na presensya sa Internet, kaya ang kakayahang makatanggap ng isang disenteng laki ng archive na may isang programa sa pamamagitan ng e-mail ay kung minsan ay mas maginhawa kahit para sa mga gumagamit na may ganap na access sa lahat ng mga mapagkukunan ng Internet.

Paano ipinapatupad ang teknolohiya ng kliyente/server sa kaso ng email. Ang bahagi ng server ay kinakatawan ng isang mail server.

Mail server– isang program na nagpapasa ng mga mensahe mula sa mga mailbox patungo sa ibang mga server o sa computer ng user sa kahilingan ng kanyang mail client. Ang mga mailbox ay nilikha sa mail server para sa mga user na may partikular na username at password para sa pag-access.

Ang bahagi ng kliyente ng serbisyo ay kinakatawan ng isang email client. Mail client (mailer) ay isang programa na tumutulong sa pagbuo at pagpapadala ng mga elektronikong mensahe, pagtanggap at pagpapakita ng mga liham sa computer ng user.

Ang pagtatrabaho sa mail ay maaaring isagawa nang off-line. Nangangahulugan ito na upang makatanggap at magpadala ng mail sa itinakdang oras, magtatatag ka ng koneksyon sa provider. Pagkatapos ay magbibigay ka ng utos sa iyong mail client, kung saan kumokonekta ito sa iyong mail server, nagpapadala ng mga inihandang sulat at nangongolekta ng mga mensaheng dumating sa iyong mailbox sa nakalipas na panahon sa iyong lokal na computer. Maaari kang magsulat ng mga liham at magbasa ng mga mensaheng natanggap mula sa server sa offline mode, iyon ay, nang walang koneksyon sa Internet.

Ngayon tingnan natin ang mga protocol ng mail.

Ang isa sa mga opsyon para sa pagkonekta sa Internet ay ang pagkonekta gamit ang UUCP protocol. Ang UUCP (Unix to Unix Copy Protocol) ay ginamit upang maglipat ng impormasyon sa mga computer network matagal na ang nakalipas, bago ang pag-imbento ng TCP/IP protocol. UUCP (Unix to Unix copy protocol) – isang hindi na ginagamit na protocol para sa pagpapadala ng impormasyon sa mga network ng computer. Sa oras na iyon, ang tanging paraan ng komunikasyon ay ang email, na ipinadala gamit ang nabanggit na protocol, ang bentahe nito ay ang pagiging unpretentiousness nito sa mga mapagkukunan ng computer, mga parameter ng modem at ang kalidad ng linya ng telepono. Ngayon, ang protocol ng UUCP ay walang pag-asa na hindi napapanahon; hindi ito kabilang sa mga protocol ng Internet, iyon ay, hindi ito batay sa TCP/IP. Gayunpaman, ito ay nagkakahalaga ng pagbanggit sa programa-

client, na binuo ng mga Russian programmer partikular para sa pagtatrabaho sa mail gamit ang protocol na ito - isang program na tumatakbo sa ilalim ng kontrol