Mencari data di Internet. Pelajaran “Mencari maklumat di Internet. Bahasa pertanyaan enjin carian

Masalah dengan mencari World Wide Web bukan kerana terdapat sedikit maklumat, tetapi terdapat banyak maklumat itu. Mencari maklumat di Internet adalah asas kerja dalam talian yang berkesan. Memiliki kemahiran mencari menjadikan Internet berguna untuk pengguna semasa bekerja dan semasa masa lapang.
Untuk mengatur carian di Internet, terdapat perkhidmatan khusus yang dipanggil enjin carian.

Enjin carian.

Enjin carian ialah sistem perisian dan perkakasan dengan antara muka web yang menyediakan keupayaan untuk mencari maklumat di Internet.
Kebanyakan enjin carian mencari maklumat di laman web World Wide, tetapi terdapat juga sistem yang boleh mencari fail pada pelayan FTP, produk di kedai dalam talian dan maklumat dalam kumpulan berita Usenet. Untuk mencari maklumat menggunakan enjin carian, pengguna merumuskan pertanyaan carian. Atas permintaan pengguna, enjin carian menjana halaman hasil carian. Hasil carian sedemikian boleh menggabungkan pelbagai jenis fail, contohnya: halaman web, imej, fail audio. Sesetengah enjin carian juga mendapatkan data daripada pangkalan data dan direktori sumber di Internet.
Tujuan enjin carian adalah untuk mencari dokumen yang mengandungi sama ada kata kunci atau perkataan dalam beberapa cara yang berkaitan dengan kata kunci. Enjin carian lebih baik apabila lebih banyak dokumen yang dikembalikan yang berkaitan dengan pertanyaan pengguna. Hasil carian mungkin menjadi lebih teruk disebabkan sifat algoritma. Sebagai contoh, apabila diminta untuk haiwan peliharaan, pelayan carian Yandex (lihat lebih lanjut mengenainya di bawah) menyediakan lebih daripada 14,000,000 pautan ke halaman yang mengandungi maklumat yang difikirkannya diperlukan. Walau bagaimanapun, tidak semuanya begitu lancar: apabila anda melawati beberapa halaman yang ditemui, ternyata maklumat yang anda cari tidak mencukupi, atau bahkan tidak wujud.
Untuk mencari dengan keberkesanan maksimum, anda perlu mengetahui cara pelayan carian berfungsi dan merumuskan permintaan untuk mencari maklumat dengan betul.

Cara enjin carian berfungsi

Enjin carian berfungsi dengan menyimpan maklumat tentang banyak halaman web, yang mereka dapatkan semula daripada halaman HTML. Komponen utama sistem carian: robot carian, pengindeks, enjin carian. Biasanya sistem berfungsi secara berperingkat. Pertama, robot carian menerima kandungan, kemudian ia melihat kandungan laman web. Selepas itu barulah pengindeks menjana indeks yang boleh dicari. Pengindeks ialah modul yang menganalisis halaman, setelah memecahkannya menjadi beberapa bahagian, menggunakan algoritma leksikal dan morfologinya sendiri.
Kerja kebanyakan enjin carian moden adalah berdasarkan indeks petikan, yang dikira oleh pengindeks hasil daripada menganalisis pautan ke halaman semasa dari halaman Internet lain. Lebih ramai daripada mereka, lebih tinggi indeks petikan halaman yang dianalisis, lebih tinggi halaman ini akan dipaparkan dalam hasil carian dan lebih tinggi halaman akan dibentangkan dalam senarai sumber yang ditemui.

Peraturan untuk membina pertanyaan carian

Seperti yang telah dinyatakan, terdapat banyak pelayan carian di Internet, dalam dan luar negara.
Pelayan carian Rusia: Yandex (www.yandex.ru); Rambler (www.rambler.ru); Aport (www.aport.ru) dan Gogo (www.gogo.ru).

Pelayan carian asing: Google ( www.google.com); Altavista (www.altavista.com) dan Yahoo! (www.yahoo.com).
Pelayan Rusia lebih sesuai untuk mencari dalam bahasa Rusia, pelayan asing lebih sesuai untuk mencari dalam bahasa asing, walaupun Google melakukan kerja yang baik untuk mencari dalam banyak bahasa. Walaupun terdapat banyak dakwaan pemilik enjin carian bahawa pertanyaan boleh ditulis secara praktikal dalam bahasa yang digunakan orang untuk berkomunikasi antara satu sama lain, ini jauh daripada kes itu. Terima kasih kepada pengenalan teknologi bahasa baharu, enjin carian telah menjadi lebih berkebolehan untuk memahami pengguna. Enjin carian kini bukan sahaja mencari perkataan yang diminta, tetapi juga untuk bentuk perkataannya, yang menjadikan hasil carian lebih tepat. Sebagai contoh, jika pertanyaan carian mengandungi perkataan pintar, maka keputusannya akan mengandungi bukan sahaja perkataan ini, tetapi juga terbitannya: pintar, pintar, serta kecerdasan dan juga kecerdasan. Sememangnya, halaman dengan bentuk perkataan tidak akan menjadi antara hasil carian pertama, tetapi unsur-unsur kecerdasan buatan adalah jelas. Adalah berguna untuk mengambil kira fakta ini semasa membina pertanyaan carian.
Perlu diingat bahawa enjin carian tidak mengambil kira kes aksara semasa memproses permintaan, dan sama sekali tidak perlu menggunakan tanda baca dalam pertanyaan carian, kerana ia juga diabaikan oleh pelayan carian. Walau bagaimanapun, apabila membina pertanyaan lanjutan yang kompleks, hasil carian yang biasanya lebih hampir dengan jangkaan, tanda baca tradisional digunakan. Kebanyakan enjin carian boleh menangani kesilapan menaip. Jika pelayan carian berpendapat bahawa terdapat kesilapan atau kesilapan menaip dalam perkataan, ia akan memberi amaran kepada anda tentangnya dengan frasa yang sama: Mungkin anda sedang mencari….

Perkataan untuk menanyakan pelayan carian

Terdapat ungkapan "Sebuah mesin mesti berfungsi, seseorang mesti berfikir," dan ia dikatakan mengenai situasi sedemikian. Tugas pengguna semasa mengarang pertanyaan carian adalah untuk menyerlahkan kata kunci, tugas pelayan carian adalah untuk memproses pertanyaan yang dimasukkan dengan cara yang terbaik. Mari kita pertimbangkan contoh yang menggambarkan kesilapan biasa pengguna pemula semasa mencari di Internet. Enjin carian tidak mengembalikan sebarang hasil yang berguna untuk pertanyaan "Teka-teki tentang alat muzik." Kemudian pengguna memutuskan untuk membetulkan pertanyaan dengan menambah dan menulis: "Teka-teki untuk kanak-kanak tentang alat muzik" - hasil carian ternyata lebih buruk daripada yang sebelumnya. Untuk contoh ini, penyelesaian yang baik ialah mencari kata kunci "teka-teki". Terdapat banyak tapak sedemikian di Internet, dan dengan pergi ke tapak itu sendiri dan mencari sedikit melalui bahagiannya, anda boleh mencari maklumat yang anda minati dengan mudah. Mari kita rumuskan beberapa peraturan untuk mengarang pertanyaan:

  • pilih hanya kata kunci terpenting yang berkaitan dengan topik yang sedang dipertimbangkan;
  • tidak boleh terlalu banyak perkataan, tetapi tidak terlalu sedikit;
  • Jika hasil carian tidak memuaskan, gunakan keadaan "lebih lembut" untuk permintaan atau cuba cari dalam enjin carian lain, kerana Mekanisme enjin carian tidak sama, oleh itu, keputusan mungkin juga berbeza.

carian terperinci

Untuk membolehkan carian yang lebih cekap di Internet, enjin carian menyediakan keupayaan carian lanjutan serta carian menggunakan bahasa pertanyaan. Carian lanjutan - keupayaan untuk mencari menggunakan banyak parameter yang berbeza. Untuk tujuan ini, enjin carian menyediakan halaman berasingan di mana anda boleh menetapkan parameter tersebut. Prinsip carian lanjutan adalah serupa untuk kebanyakan enjin carian.
Mari kita pertimbangkan pilihan carian tambahan menggunakan contoh enjin carian Yandex dan Google kerana Yandex ialah pelayan carian paling popular di Internet berbahasa Rusia, dan Google ialah enjin carian paling popular di dunia. Apabila mencari di Internet, Yandex adalah salah satu yang pertama mengambil kira morfologi bahasa Rusia, iaitu, menggunakan pelbagai bentuk perkataan, seperti yang dibincangkan di atas. Dengan pergi ke laman web www.yandex.ru, pengguna boleh memasukkan pertanyaan dan segera menerima hasil carian, atau anda boleh menggunakan pautan Carian Lanjutan menggunakan ikon dan pergi ke halaman yang sepadan (lihat rajah di bawah), di mana anda boleh memperhalusi parameter carian.

Halaman carian lanjutan Yandex

Mari kita pertimbangkan ciri tambahan yang boleh digunakan pada halaman carian lanjutan: nyatakan lokasi anda sendiri (Moscow), nyatakan dalam bentuk apa maklumat itu harus dibentangkan (Jenis Fail), tempoh masa di mana kami mencari maklumat (sehari, setiap 2 minggu, sebulan, Dari ..Sebelumnya), dalam bahasa apa maklumat itu harus dibentangkan (Bahasa Rusia, Bahasa Inggeris Lagi), dan anda juga boleh menentukan URL tapak, dsb.
Pilihan (Tepat seperti dalam pertanyaan) ditunjukkan kepada enjin carian supaya morfologi perkataan pertanyaan tidak berubah, tetapi hanya mencari bentuk perkataan yang ditentukan.

Bahasa pertanyaan

Bahasa pertanyaan ialah sistem arahan yang membolehkan anda menukar parameter pertanyaan daripada rentetan carian utama menggunakan arahan khas. Ditujukan kepada pengguna yang berpengalaman.
Memandangkan bahasa pertanyaan agak rumit dan banyak, kami hanya akan membentangkan struktur utamanya yang mungkin paling diminati oleh pengguna. Beberapa arahan bahasa pertanyaan Yandex dibentangkan dalam jadual.

Operator

Penerangan

Sintaks

Contoh permintaan

Cari dokumen yang semestinya mengandungi perkataan yang diserlahkan.

Ia boleh diterima untuk menggunakan berbilang + operator dalam satu pertanyaan.

"perkataan 1 +perkataan 2"

Dokumen akan dijumpai yang semestinya mengandungi perkataan "boulevard" dan "Moscow" dan mungkin mengandungi perkataan "Sholokhov".

Cari mengikut petikan.

Cari dokumen yang mengandungi perkataan pertanyaan dalam urutan dan bentuk yang diberikan.

"perkataan 1 perkataan 2...perkataan N"

Dokumen yang mengandungi petikan ini akan ditemui.

Cari mengikut petikan dengan perkataan yang tiada.

Satu * operator sepadan dengan satu perkataan yang hilang.

Perhatian! Hanya boleh digunakan sebagai sebahagian daripada operator.

"perkataan 1 * perkataan 2 ... perkataan N "

Operator dipisahkan oleh ruang.

Dokumen yang mengandungi petikan yang diberikan, termasuk perkataan yang hilang, akan ditemui.

Dokumen yang mengandungi petikan yang diberikan, termasuk perkataan yang hilang, akan ditemui.

Struktur penuh bahasa pertanyaan Yandex boleh didapati di halaman Bantuan (http://help.yandex.ru/search/?id=481939). Bahasa pertanyaan carian di Google berbeza daripada Yandex, walaupun terdapat beberapa perkara biasa. Pertimbangkan beberapa arahan asas bahasa ini dengan mengkaji jadual (lihat di bawah)

Struktur penuh bahasa pertanyaan Google boleh didapati di halaman Bantuan:

Mencari maklumat di Internet

Internet berkembang pada kadar yang sangat pantas, jadi mencari maklumat yang anda perlukan di antara ratusan bilion halaman Web dan ratusan juta fail menjadi semakin sukar. Untuk mencari maklumat, enjin carian khas digunakan, yang mengandungi maklumat yang sentiasa dikemas kini tentang lokasi halaman Web dan fail pada ratusan juta pelayan Internet.

Enjin carian mengandungi maklumat yang dikumpulkan secara tematik mengenai sumber maklumat World Wide Web dalam pangkalan data. Program robot khas secara berkala "memintas" pelayan Web Internet, membaca semua dokumen yang mereka hadapi, menyerlahkan kata kunci di dalamnya dan masukkan alamat Internet dokumen ke dalam pangkalan data.

Kebanyakan enjin carian membenarkan pengarang laman web memasukkan maklumat ke dalam pangkalan data dengan mengisi borang pendaftaran. Dalam proses mengisi soal selidik, pembangun tapak memasukkan alamat tapak, namanya, penerangan ringkas tentang kandungan tapak, serta kata kunci yang akan memudahkan untuk mencari tapak.

Cari mengikut kata kunci. Mencari dokumen dalam pangkalan data sistem carian dijalankan dengan memasukkan pertanyaan ke dalam medan carian.

Pertanyaan mesti mengandungi satu atau lebih kata kunci yang menjadi pusat kepada dokumen ini. Sebagai contoh, untuk mencari sendiri sistem carian Internet, anda boleh memasukkan kata kunci "Sistem carian maklumat Internet Rusia" dalam medan carian (Gamb. 6.21).

Beberapa ketika selepas menghantar permintaan, enjin carian akan mengembalikan senarai alamat Internet dokumen di mana kata kunci yang ditentukan ditemui. Untuk melihat dokumen ini dalam penyemak imbas, hanya aktifkan pautan yang menunjuk kepadanya (Gamb. 6.22).

Jika kata kunci dipilih dengan buruk, maka senarai alamat dokumen mungkin terlalu besar (mungkin mengandungi puluhan atau bahkan ratusan ribu pautan). Untuk mengurangkan senarai, anda boleh memasukkan kata kunci tambahan dalam medan carian atau menggunakan direktori enjin carian.

Salah satu enjin carian yang paling lengkap dan berkuasa ialah Google (www.google.ru), yang pangkalan datanya menyimpan 8 bilion halaman Web dan setiap bulan program robot menambah 5 juta halaman baharu padanya. Di Runet (bahagian Internet Rusia), enjin carian Yandex (www.yandex.ru) dan Rambler (www.rambler.ru) mempunyai pangkalan data yang luas yang mengandungi 200 juta dokumen.

Cari dalam sistem direktori hierarki. Dalam pangkalan data enjin carian, laman web dikumpulkan ke dalam katalog tematik hierarki, yang merupakan analog katalog subjek dalam perpustakaan.

Bahagian tematik peringkat atas, contohnya: Internet, Komputer, Sains dan Pendidikan dsb., mengandungi subdirektori. Sebagai contoh, direktori Internet mungkin mengandungi subdirektori Cari, Mel dan lain-lain (Rajah 6.23).

Mencari maklumat dalam katalog dikurangkan kepada memilih katalog tertentu, selepas itu pengguna akan dibentangkan dengan senarai pautan ke alamat Internet laman web yang paling banyak dikunjungi dan bermaklumat. Setiap pautan biasanya diberi anotasi, iaitu, ia mengandungi ulasan ringkas tentang kandungan dokumen.

Katalog tematik hierarki berbilang peringkat yang paling lengkap bagi sumber Internet bahasa Rusia tersedia dalam sistem carian Aport (www.aport.ru). Katalog mengandungi ringkasan terperinci kandungan laman web dan petunjuk lokasi geografinya.

Cari fail. Untuk mencari fail pada pelayan arkib fail, terdapat enjin carian khusus, termasuk enjin carian FileSearch (www.filesearch.ru). Untuk mencari fail, anda mesti memasukkan nama fail dalam medan carian, dan enjin carian akan mengembalikan alamat Internet pelayan arkib fail di mana fail dengan nama yang ditentukan disimpan.

Mencari maklumat di bahagian Internet berbahasa Rusia menggunakan enjin carian yang paling banyak: Google, Rambler, Aport, Japs1ex dan sistem carian fail Penyelidikan boleh dilakukan menggunakan enjin carian bersepadu Gogle.ru (Rajah 6.24). Untuk melakukan ini, hanya masukkan kata kunci dalam bar carian, gunakan suis untuk menetapkan jenis maklumat yang diperlukan dan klik pada butang dengan nama enjin carian Gogle.ru (Rajah 6.24). Untuk melakukan ini, hanya masukkan kata kunci dalam bar carian, gunakan suis untuk menetapkan jenis maklumat yang diperlukan dan klik pada butang dengan nama enjin carian.


nasi. 6.24. Enjin carian bersepadu Gogle.ru

Cara-cara mencari di Internet

Tiga cara untuk mencari di Internet

Internet secara amnya dan World Wide Web khususnya menyediakan pelanggan dengan akses kepada beribu-ribu pelayan dan berjuta-juta halaman Web yang menyimpan jumlah maklumat yang tidak dapat dibayangkan. Bagaimana untuk tidak tersesat dalam "lautan maklumat" ini? Untuk melakukan ini, anda perlu belajar cara mencari dan mencari maklumat yang diperlukan di Internet.

Seperti yang telah disebutkan, terdapat tiga cara utama untuk mencari maklumat di Internet.

1. Menentukan alamat halaman. Ini adalah kaedah carian terpantas, tetapi hanya boleh digunakan jika alamat sebenar dokumen diketahui.

2. Navigasi melalui hiperpautan. Ini adalah kaedah yang paling tidak mudah, kerana dengan bantuannya anda boleh mencari dokumen yang hanya bermakna hampir dengan dokumen semasa. Jika dokumen semasa didedikasikan, sebagai contoh, untuk muzik, maka menggunakan hiperpautan dalam dokumen ini tidak mungkin anda akan dapat pergi ke tapak khusus untuk sukan.

3. Menghubungi pelayan carian (enjin carian). Menggunakan pelayan carian adalah cara yang paling mudah untuk mencari maklumat. Pada masa ini, enjin carian berikut popular di bahagian Internet berbahasa Rusia:

    Yandex;
    Rambler;
    Aport.

Terdapat enjin carian lain. Sebagai contoh, sistem carian yang berkesan dilaksanakan pada pelayan perkhidmatan mel mail.ru.

Cari pelayan

Cara yang paling mudah diakses dan mudah untuk mencari maklumat di World Wide Web adalah dengan menggunakan enjin carian. Dalam kes ini, maklumat boleh dicari melalui katalog, serta melalui set kata kunci yang mencirikan dokumen teks yang dicari.

Mari kita lihat penggunaan pelayan carian dengan lebih terperinci. Pelayan carian mengandungi sejumlah besar pautan ke pelbagai jenis dokumen, dan semua pautan ini disusun secara sistematik ke dalam katalog tematik. Contohnya: sukan, pawagam, kereta, permainan, sains, dsb. Selain itu, pautan ini dipasang oleh pelayan secara bebas, secara automatik dengan kerap melihat semua halaman Web yang muncul di World Wide Web. Di samping itu, enjin carian menyediakan pengguna dengan keupayaan untuk mencari maklumat menggunakan kata kunci. Selepas memasukkan kata kunci, pelayan carian mula melihat dokumen pada pelayan Web lain dan memaparkan pautan ke dokumen tersebut di mana perkataan yang dinyatakan muncul. Biasanya, hasil carian diisih dalam tertib menurun mengikut penilaian dokumen khas, yang menunjukkan sejauh mana dokumen yang diberikan memenuhi sepenuhnya istilah carian atau kekerapan ia diminta dalam talian.

Bahasa pertanyaan enjin carian

Sekumpulan kata kunci yang dibentuk mengikut peraturan tertentu - menggunakan bahasa pertanyaan - dipanggil permintaan kepada pelayan carian. Bahasa pertanyaan untuk pelayan carian yang berbeza sangat serupa. Anda boleh mengetahui lebih lanjut mengenai perkara ini dengan melawati bahagian "Bantuan" pada pelayan carian yang dikehendaki. Mari lihat peraturan untuk membentuk pertanyaan menggunakan enjin carian Yandex sebagai contoh.

Sintaks operator Apakah maksud pengendali? Contoh permintaan
ruang atau & Logik DAN (dalam ayat) fisioterapi
&& Logik DAN (dalam dokumen) resipi && (keju diproses)
| Logik ATAU foto | fotografi | petikan | imej fotografi
+ Kehadiran mandatori perkataan dalam dokumen yang ditemui +menjadi atau +tidak menjadi
() Mengumpul perkataan (teknologi | pengeluaran) (keju | keju kotej)
~ Operator binari DAN BUKAN (dalam ayat) bank ~ undang-undang
~~
atau
_
Operator binari DAN BUKAN (dalam dokumen) Panduan Paris ~~ (agensi | lawatan)
/(n m) Jarak dalam perkataan (tolak (-) - belakang, tambah (+) - hadapan) pembekal /2 muzik kopi /(-2 4) jawatan kosong pendidikan ~ /+1 pelajar
" " Cari frasa "tudung tunggang merah kecil" Bersamaan dengan: tudung tunggang merah /+1
&&/(n m) Jarak dalam ayat (tolak (-) - belakang, tambah (+) - hadapan) bank && /1 cukai

Untuk mendapatkan hasil carian yang terbaik, anda perlu mengingati beberapa peraturan mudah:

    1. Jangan mencari maklumat menggunakan satu kata kunci sahaja.

    2. Adalah lebih baik untuk tidak memasukkan kata kunci dengan huruf besar, kerana ini boleh menyebabkan fakta bahawa perkataan yang sama ditulis dengan huruf kecil tidak akan dijumpai.

    3. Jika anda tidak mendapat sebarang hasil daripada carian anda, semak sama ada terdapat sebarang ralat ejaan dalam kata kunci anda.

Enjin carian moden menyediakan keupayaan untuk menyambungkan penganalisis semantik kepada pertanyaan yang dijana. Dengan bantuannya, anda boleh memasukkan perkataan dan memilih dokumen di mana terbitan perkataan ini ditemui dalam pelbagai kes, kala, dsb.

Soalan kawalan

1. Bagaimanakah dokumen dicari menggunakan kata kunci? Dalam sistem direktori?

Tugas untuk penyiapan bebas

6.8 Tugasan amali. Bandingkan hasil carian untuk dokumen mengikut kata kunci menggunakan enjin carian yang berbeza (gunakan enjin carian bersepadu Gogle).

6.9 Tugas amali. Cari fail pemain media WinAmp pada pelayan arkib fail.

Mencari maklumat yang anda perlukan di Internet selalunya agak sukar. Internet berkembang dengan huru-hara, ia tidak mempunyai struktur yang jelas. Tiada siapa yang boleh menjamin bahawa satu domain hanya akan mengandungi maklumat mengenai topik tertentu, dan satu lagi - maklumat mengenai topik yang berbeza, tetapi juga ditakrifkan dengan jelas. Sebagai contoh, di domains.com anda boleh mencari bukan sahaja maklumat komersial, tetapi, sebagai contoh, pelbagai dokumentasi mengenai produk perisian atau bahkan jenaka.

Jika struktur domain serupa dengan struktur direktori, contohnya, dalam domain ru.comp.os.linux (seperti dalam sistem berita) akan terdapat semua maklumat tentang sistem pengendalian Linux dalam bahasa Rusia dan beberapa jenis organisasi penyederhana. akan memastikan bahawa domain lain tidak menyiarkan maklumat tentang Linux, maka carian akan menjadi lebih mudah. Lagipun, kita akan tahu di mana hendak mencari. Anda membuka penyemak imbas anda, masukkan ru.comp.os.linux dan anda mendapat... berjuta-juta pautan berbeza ke artikel, dokumen HOWTO dan maklumat lain yang berkaitan dengan Linux dalam satu cara atau yang lain.

Kecekapan carian

    Kecekapan carian bergantung pada banyak faktor:
  • Daripada maklumat itu sendiri - mungkin terdapat banyak maklumat mengenai satu topik, tetapi sedikit pada yang lain. Kadangkala anda boleh menemui banyak maklumat mengenai topik tertentu, tetapi kecekapan carian ini akan menghampiri 0.0%, dan anda boleh menemui hanya 3-4 pautan, dan ini akan menjadi apa yang anda perlukan. Ini juga termasuk keupayaan juruweb untuk menyampaikan maklumat dengan betul supaya enjin carian sendiri boleh menemuinya. Katakan di suatu tempat yang sangat jauh terdapat maklumat yang anda perlukan, tetapi enjin carian tidak mengetahui apa-apa mengenainya. Mungkin maklumat itu baru diterbitkan atau ringkasnya webmaster yang menerbitkan maklumat itu langsung tidak menyedari kewujudan enjin carian. Anda sedang mencari maklumat menggunakan enjin carian. Jika dia tidak "tahu" maklumat yang anda perlukan, maka, oleh itu, anda tidak akan tahu apa-apa tentang dia.
  • Dari enjin carian - terdapat banyak enjin carian dan semuanya berbeza. Walaupun mereka tergolong dalam jenis yang sama (kita akan bercakap tentang jenis enjin carian sedikit kemudian), setiap daripada mereka sudah pasti mempunyai algoritma sendiri. Jika anda tidak menemui maklumat menggunakan satu enjin carian, cuba cari maklumat tersebut menggunakan enjin carian yang lain. Jangan terperangkap pada satu enjin carian, tidak kira betapa anda menyukainya.
  • Banyak bergantung pada keupayaan untuk menggunakan enjin carian - bagaimana anda tahu cara menggunakan enjin carian. Jika anda tidak tahu cara menggunakan enjin carian, carian anda mungkin tidak berkesan.

Cara mencari maklumat dengan betul

Memandangkan selalunya anda tidak memilih tapak yang anda perlukan daripada katalog enjin carian, tetapi masukkan kata kunci tertentu (atau beberapa kata kunci), anda perlu sespesifik mungkin tentang kata kunci ini. Lebih tepat anda mentakrifkan subjek carian anda, lebih tepat hasilnya. Enjin carian tidak dapat meneka fikiran anda; anda perlu memberitahunya dengan jelas apa yang anda cari.

Setiap enjin carian mempunyai sintaks sendiri yang perlu anda ketahui. Bab ini akan menerangkan sintaks enjin carian Google, Yandex dan Rambler. Jika anda ingin menggunakan enjin carian lain, maka anda boleh mengetahui sintaksnya di laman webnya (biasanya ia diterangkan secara terperinci).

Enjin carian

Sekarang mari kita bercakap tentang enjin carian itu sendiri.

Di wilayah bekas CIS, enjin carian berikut adalah yang paling popular, menurut SpyLog (Openstat):

  • 1. Yandex (www.yandex.ru);
  • 2. Google (www.google.com);
  • 3. [email protected] (go.mail.ru);
  • 3. Rambler (www.rambler.ru);
  • 5. Yahoo! (www.yahoo.com);
  • 6. AltaVista (www.altavista.com);
  • 7. Bing (www.bing.com).

Enjin carian disenaraikan dalam susunan populariti menurun. Seperti yang anda lihat, enjin carian kami yang paling popular ialah Yandex.

Jenis enjin carian

    Terdapat dua jenis enjin carian utama:
  • indeks - Google, AltaVista, Rambler, HotBot, Yandex, dsb.;
  • pengelasan (katalog) - Rambler, Yahoo! dan sebagainya.

Jangan terkejut bahawa enjin carian Rambler disenaraikan dua kali - ia adalah indeks dan enjin klasifikasi. Kami akan kembali kepada perkara ini kemudian, tetapi buat masa ini mari kita bercakap tentang perbezaan antara kedua-dua sistem ini.

Bagaimanakah enjin carian indeks berfungsi? Enjin carian menjalankan program khas yang mengimbas kandungan pelayan web, mengindeks maklumat: ia memasukkan ke dalam pangkalan datanya kata kunci halaman web tertentu dan beberapa maklumat dari halaman web.

Sejarah Ringkas Google

Mari kita mulakan dengan nama. Google ialah versi perkataan googol yang diubah suai sedikit (ia selalunya dipanggil "Google"). Perkataan itu pula dicipta oleh Milton Sirota, anak saudara kepada ahli matematik terkenal Edward Kasner, dan kemudian dipopularkan dalam buku Kasner dan Newman Mathematics and the Imagination. Perkataan "googol" memaparkan nombor dengan satu satu dan 100 sifar. Nama "Google" menggambarkan percubaan untuk menyusun sejumlah besar maklumat di Web.

Jadi mari kita mulakan dari awal. Pembangun Google masa depan Sergey Brin dan Larry Page bertemu pada tahun 1999 di Universiti Stanford. Larry berumur 24 tahun pada masa itu, dan Sergei berumur 23 tahun. Larry adalah pelajar di Universiti Michigan pada masa itu dan datang ke Stanford selama beberapa hari. Sergei berada dalam kumpulan pelajar yang sepatutnya memperkenalkan tetamu kepada universiti. Dari pertemuan pertama, Sergei dan Larry, secara sederhana, tidak menyukai satu sama lain - mereka berhujah tentang semua yang boleh dipertikaikan. Walaupun pada akhirnya ini ternyata menjadi perkara yang positif, kerana pendapat mereka yang berbeza membawa kepada penciptaan algoritma untuk menyelesaikan salah satu masalah yang paling mendesak dalam komputer: mencari maklumat yang diperlukan di antara sejumlah besar data. Pada Januari 1996, Larry dan Sergei mula bekerja pada enjin carian BackRub, yang sepatutnya menganalisis "pautan balik" yang menunjuk ke tapak web tertentu. Kerja pada pelayan ini dijalankan dalam kekurangan dana yang berterusan - lagipun, pada masa itu Sergey dan Larry adalah pelajar siswazah di universiti - anda sendiri memahami bahawa pelajar siswazah tidak mempunyai banyak wang. Ngomong-ngomong, ini adalah kali pertama Larry mengambil bahagian dalam projek yang begitu serius, dan sebelum itu dia telah terlibat dalam pelbagai projek "sembrono", walaupun kadang-kadang anekdot, contohnya, dia membina pencetak yang berfungsi dari Lego.

Sintaks Google Asas

Antara muka Google sangat menarik dalam kesederhanaannya: medan input dan dua butang. Seperti yang mereka katakan, segala-galanya yang bijak adalah mudah.

Sintaks khas (lanjutan) Google

Selain pengendali Boolean, Google menyediakan anda dengan pengubah suai carian yang disenaraikan dalam jadual. Pengubah suai carian dipanggil sintaks khas Google. Ambil jadual ini dengan serius: sebaik sahaja anda cuba mencari sesuatu menggunakan pengubah suai, anda tidak akan dapat meletakkannya.

Penggunaan pengubah inurl yang betul

Pengubah suai inurl digunakan untuk mencari URL yang ditentukan. Dan tidak seperti pengubah suai tapak, yang membolehkan anda mencari maklumat pada satu tapak atau domain sahaja, pengubah inurl membolehkan anda mencari maklumat dalam subdirektori tapak, contohnya:

inurl: sitesskype-zvonim-besplatno

Pengubah suai inurl membenarkan anda menggunakan aksara * untuk menunjukkan domain, contohnya:
inurl: "*.redhat.com"

Ia adalah paling berkesan untuk menggunakan inurl bersama-sama dengan tapak. Pertanyaan berikut akan mencari maklumat dalam domain gidmir.ru, pada semua subdomain kecuali www:
tapak: gidmir.ru inurl: "*.gidmir" -inurl: "www.gidmir.ru"

sintaks campuran Google

Google membenarkan sintaks bercampur, i.e. sintaks di mana beberapa pengubah suai carian khas digunakan dalam pertanyaan. Ini membolehkan anda mencapai hasil yang terbaik.

Berikut ialah contoh sintaks campuran yang sangat mudah:
tapak: ru inurl: cakera

Dalam kes ini, carian akan dilakukan pada tapak domain dan URL mesti mengandungi perkataan cakera.

Berikut adalah contoh lain:
tapak: ru -inurl: org.ua

Carian akan dilakukan pada tapak domain ru, tetapi hasil carian tidak akan mengandungi halaman yang terletak di org.ua.

Bagaimana untuk mengatasi had kata kunci

Bagi kebanyakan pengguna Google biasa, had 10 kunci tidak ketara. Tetapi peminat pertanyaan panjang mungkin menyedari bahawa Google hanya mengambil kira 10 kata kunci pertama, dan semua yang lain diabaikan.

Mengapa anda perlu mencari frasa yang panjang? Dalam kebanyakan kes, ini adalah petikan daripada karya. Mari kita anggap bahawa kita sedang mencari karya "The Master and Margarita". Perlu diingatkan bahawa frasa utama harus kelihatan seperti "Master Margarita", kerana perkataan dan, atau, dan, daripada, atau, I, a, the dan beberapa yang lain diabaikan oleh enjin carian. Jika anda ingin memaksa salah satu perkataan ini ke dalam carian, awali perkataan itu dengan tanda "+", seperti +the.

Pembinaan pertanyaan yang betul membolehkan anda mengatasi had 10 perkataan. Pengesyoran berikut akan membantu anda bukan sahaja mengurangkan panjang pertanyaan anda, tetapi juga meningkatkan kecekapan carian keseluruhan.

Carian Terperinci Google

Kami menaip alamat dalam baris input penyemak imbas - www.google.ru/advanced_search dan pergi ke carian lanjutan Google.

Menggunakan carian lanjutan, anda boleh mencari maklumat hampir sama fleksibel seperti menggunakan pengubah suai carian. Kenapa "hampir"? Antara muka carian lanjutan tidak menyediakan akses kepada semua pengubah suai carian.

Menetapkan Sifat Carian Google

Saya tidak mahu mengisi kepala anda dengan butiran teknikal, jadi saya akan nyatakan secara ringkas apa itu Kuki dan tidak, bukan dengan apa ia dimakan, tetapi cara bekerja dengannya.

Bayangkan kami diberi tugasan berikut: kami perlu menulis laporan lawatan individu untuk setiap pelanggan tapak web syarikat kami. Iaitu, supaya pengguna tidak melihat jumlah lawatan, tetapi mengetahui dengan tepat berapa kali dia berada di tapak kami. Untuk setiap alamat IP, kami perlu menyimpan rekod dalam satu jadual, yang kemungkinan besar akan menjadi besar, dan ini bermakna kami secara tidak rasional menggunakan masa pemproses dan ruang cakera. Adalah lebih tepat di pihak kami untuk menggunakan ruang ini untuk manfaat yang lebih besar.

Kami menetapkan Kuki - pembolehubah yang akan disimpan pada cakera pengguna. Pembolehubah ini akan menyimpan maklumat tentang lawatan. Faedahnya jelas. Pertama, kami tidak memerlukan sebarang jadual, dan kedua, kami memudahkan kerja program kami.

Hasil carian Google

Hasil carian Google bukan sekadar koleksi pautan yang sepadan dengan istilah carian yang ditentukan. Ini adalah sesuatu yang lebih patut dipertimbangkan secara berasingan. Masukkan perkataan "rusopen" dan klik pada butang Cari Google.

Di bahagian atas kita lihat jumlah keputusan (883,000,000) dan jumlah masa pencarian yang diambil, iaitu 0.34 saat.

    Dalam kebanyakan kes, hasilnya dibentangkan sebagai:
  • tajuk halaman;
  • huraian halaman;
  • URL halaman;
  • saiz halaman;
  • tarikh pengindeksan halaman terakhir;

Carian imej Google

Imej Google membolehkan anda mencari pelbagai imej di Internet. Walaupun imej itu sendiri tidak boleh diindeks, halaman yang mengandungi imej akan diindeks. Masukkan perihalan imej dan anda akan mendapat banyak, banyak pautan, serta imej itu sendiri, yang dibentangkan dalam galeri.

    Untuk mencari imej dengan lebih cekap, anda perlu menggunakan pengubah suai carian berikut:
  • intitle: - cari dalam tajuk halaman;
  • jenis fail: - membolehkan anda menentukan jenis imej, anda boleh menentukan jenis berikut: JPEG dan GIF, bukan BMP, PNG, imej jenis lain tidak diindeks;
  • inurl: - cari mengikut URL yang ditentukan, contohnya inurl: www.gidmir.ru ;
  • tapak: cari pada domain atau tapak tertentu, contohnya tapak: com.

Google Apps

Google ialah enjin carian yang berkuasa dengan lebih 3 bilion halaman. Selain halaman web biasa, Google mengindeks fail dalam format Word, Excel, PowerPoint, PDF dan RTF. Anda juga boleh menggunakan Google untuk mencari imej dan nombor telefon: perkhidmatan Imej Google dan Buku Telefon direka untuk ini, masing-masing. Dalam artikel ini kita akan bercakap tentang perkhidmatan Google khas.

Google Mail

Cuba gunakan e-mel Google. Perlu diingatkan bahawa ini bukan mel web biasa.

    Beberapa ciri Gmail termasuk yang berikut:
  • saiz peti mel besar - lebih daripada 7 GB;
  • daripada memadamkan surat, anda boleh mengarkibkannya - maka anda akan mempunyai ruang yang cukup untuk masa yang lama, dan anda boleh memulihkan surat yang anda terima atau hantar beberapa tahun yang lalu;
  • keupayaan untuk mencari peti mel anda dengan kecekapan Google;
  • organisasi surat yang mudah dan balasan kepada mereka: semua surat dan balasan membentuk satu rantaian yang mudah dijejaki;
  • perlindungan anti-spam yang baik;
  • alamat yang tidak dapat dilupakan [email protected];
  • antara muka yang mudah.

Enjin carian Rambler

Sejarah Rambler

Semuanya bermula pada tahun 1991 di bandar Pushchino, wilayah Moscow. Pada tahun yang jauh itu, sekumpulan orang yang berfikiran sama berkumpul, di antaranya ialah Dmitry Kryukov, Sergei Lysakov, Viktor Voronkov, Vladimir Samoilov, Yuri Ershov. Minat bersama kumpulan ini ialah Internet. Mungkin, pada tahun 1991, tiada seorang pun pemaju Rambler masa depan yang membayangkan bahawa mereka akan menjadi pencipta salah satu enjin carian terbesar dan paling terkenal di Runet. Lagipun, sebelum itu, mereka semua servis peranti kejuruteraan radio di Institut Biokimia dan Fisiologi Mikroorganisma Akademi Sains Rusia. Pada tahun 1992, syarikat Stack telah dicipta, diketuai oleh Sergei Lysakov. Profil syarikat - rangkaian tempatan dan Internet. Pada asasnya, Stack ialah penyedia perkhidmatan Internet. Syarikat itu mencipta rangkaian intracity, kemudian menyambung Pushchino ke Moscow, dan melaluinya ke Internet. Ngomong-ngomong, ini adalah saluran IP pertama yang melangkaui Moscow. Dan ini pada tahun 1992! Pada masa kini, meletakkan saluran agak bermasalah - sentiasa ada banyak nuansa, tetapi kemudian kabel harus diletakkan secara bebas, secara manual, di bawah tanah, dan semua ini dilakukan pada musim sejuk.

Bagaimana Rambler berfungsi

Internet sentiasa berkembang: bilangan tapak dan saiznya meningkat setiap hari. Bayangkan sahaja: tapak besar dikemas kini setiap hari, walaupun jumlah kemas kini adalah 1024 bait (1 KB), maka jika kita mengandaikan terdapat 10,000 tapak sedemikian, setiap hari enjin carian perlu memproses (indeks) 10,000 KB (kira-kira bercakap, 10 MB ) maklumat. Nombor 10,000 telah diambil "dari udara tipis" - demi contoh. Ia mungkin lebih tinggi atau lebih rendah - lagipun, tapak besar pun tidak dikemas kini setiap hari. Saiz kemas kini juga dibuat-buat. Bayangkan tapak maklumat dan analisis yang mana artikel baharu diterbitkan hampir setiap hari atau bahan daripada tapak lain diterbitkan semula. Dalam kes ini, saiz kemas kini akan jauh dari 1 KB, tetapi sekurang-kurangnya 10. Tambahkan kepada semua berita ini dan maklumat lain dan ternyata dengan bilangan tapak yang dikemas kini 10,000, enjin carian mesti mengindeks 120 MB daripada teks. Dan dengan semua ini, enjin carian bukan sahaja mesti memaparkan hasil carian dengan tepat, tetapi juga melakukannya secepat mungkin supaya pengguna boleh bekerja dengannya dengan mudah. Siapa yang mahu menunggu 10 minit untuk hasil carian? Sudah tentu, saya membesar-besarkan perkara ini, tetapi secara peribadi saya tidak akan menunggu lebih daripada 30 saat untuk hasil carian (dari saat anda mengklik butang Cari sehingga sepuluh hasil pertama muncul). Ternyata pembangun enjin carian perlu sentiasa mengekalkan pada tahap yang betul bukan sahaja perkakasan, yang mesti dapat memproses jumlah maklumat yang sentiasa berkembang, tetapi juga "matematik" tidak boleh dicapai dengan perkakasan sahaja. Adalah perlu untuk sentiasa menambah baik algoritma carian supaya apabila volum pangkalan carian meningkat, masa carian tidak meningkat (ini bermakna peningkatan masa yang ketara - bagi pengguna ia tidak membuat perbezaan sama ada carian akan mengambil masa 2.5 saat atau 2.0555 saat, kerana dia tidak dapat menganggarkan masa ini).

Sintaks Rambler

Permintaan kepada Rambler boleh terdiri daripada satu atau lebih perkataan, dan permintaan itu boleh mengandungi tanda baca. Pembangun Rambler mereka bentuk enjin carian mereka untuk kemudahan pengguna maksimum. Rambler boleh digunakan walaupun oleh pengguna yang tidak berpengalaman yang sama sekali tidak biasa dengan bahasa pertanyaan. Apa yang dia perlu lakukan ialah memasukkan pertanyaan yang terdiri daripada beberapa perkataan (contohnya, beberapa frasa) dan tanpa tanda baca - Rambler sendiri menemui dokumen yang diperlukan, dan melakukannya dengan cekap yang mungkin. Sudah tentu, jika anda menggunakan bahasa pertanyaan dengan betul, kecekapan meningkat dengan ketara, tetapi walaupun dengan ketidaktahuan sepenuhnya tentang bahasa pertanyaan, kecekapan carian berada pada tahap yang tinggi. Seperti yang telah dinyatakan, mengetahui bahasa pertanyaan adalah untuk kepentingan anda sendiri; anda hanya akan dapat mencari maklumat yang anda perlukan dengan lebih cepat.

Enjin carian Yandex (Yandex)

Rujukan sejarah

Kembali pada tahun 1990, syarikat Arcadia, yang diketuai oleh Arkady Borkovsky dan Arkady Volozh, mula membangunkan perisian carian. Enam tahun kemudian, laman web Yandex muncul. Tetapi apa yang berlaku selama enam tahun ini?

Dalam dua tahun, dua sistem mendapatkan maklumat telah dicipta - "Pengkelasan Reka Cipta Antarabangsa" dan "Pengkelas Barangan dan Perkhidmatan". Kedua-dua sistem berjalan di bawah DOS dan membenarkan mencari perkataan daripada kamus tertentu menggunakan pengendali Boolean.

Pada tahun 1993, Arcadia menjadi bahagian CompTek. Sepanjang 1993-1994, teknologi carian telah dipertingkatkan dengan ketara, sebagai contoh, kamus yang menyediakan carian dengan mengambil kira morfologi bahasa Rusia menduduki hanya 300 KB, yang bermaksud ia muat secara bebas dalam RAM, dan berfungsi dengannya berlaku dengan cepat. Berdasarkan teknologi baharu ini, “Buku Rujukan Komputer Bible” telah dicipta pada tahun 1994, sebuah sistem pencarian maklumat yang berfungsi dengan terjemahan Perjanjian Lama dan Baru.

Bagaimana Yandex mentafsir perkataan

Bagaimanakah enjin carian akan mentafsir perkataan yang anda masukkan?

    Sekarang kita akan bercakap tentang ini:
  • Peraturan 1. Ternyata sistem itu menafsirkannya mengikut peraturan bahasa Rusia. Contoh: Jika anda memasukkan perkataan "kereta", anda juga akan mendapat hasil yang mengandungi perkataan "kereta", "kereta", dsb. Ia sama dengan kata kerja - dengan meminta "pergi" anda akan mendapat dokumen yang mengandungi perkataan "pergi", "pergi", "berjalan", "pergi", dll. Seperti yang anda lihat, enjin carian adalah lebih pintar daripada yang anda fikirkan - ia bukan hanya satu cara untuk mencari perkataan tertentu dalam pangkalan data.
  • Peraturan 2. Perhatian khusus diberikan kepada perkataan yang ditulis dengan huruf besar. Jika perkataan dihuruf besar dan bukan perkataan pertama dalam ayat, hanya perkataan berhuruf besar akan ditemui. Jika tidak, perkataan yang ditulis dalam kedua-dua huruf besar dan kecil akan ditemui. Contoh: untuk permintaan "Dachshund A." dokumen yang mengandungi kedua-dua "cukai" (yuran) dan "cukai" (nama keluarga) akan ditemui, kerana perkataan "cukai", walaupun ditulis dengan huruf besar, didahulukan dalam ayat. Tetapi pertanyaan "A. Dachshund" akan menemui dokumen yang mengandungi hanya perkataan "Dachshund" yang ditulis dengan huruf besar.

Sintaks asas Yandex

Secara lalai, Yandex menggunakan operator logik DAN. Ini bermakna jika anda memasukkan pertanyaan "Samsung TV", hasilnya akan mengembalikan dokumen yang mengandungi perkataan "TV" dan "Samsung" akan muncul dalam ayat yang sama. Jika anda ingin menentukan operator DAN secara eksplisit, gunakan ampersand & simbol. Dalam erti kata lain, pertanyaan "Samsung TV" adalah sama dengan pertanyaan "TV & Samsung". Anda juga boleh menggunakan pertanyaan "TV + Samsung".

Jika anda mahukan kesan sebaliknya, i.e. Jika anda ingin mendapatkan dokumen yang mengandungi perkataan "TV" dan perkataan "Samsung" secara berasingan, maka anda perlu menggunakan operator OR (|), contohnya: "TV | Samsung".

Tanda tilde (~) akan membantu anda mencari dokumen yang mengandungi perkataan pertama, tetapi bukan perkataan kedua. Contohnya, pertanyaan "TV ~ Horizon" akan menemui dokumen yang mengandungi perkataan "TV", tetapi di sebelahnya (dalam ayat yang sama) tiada perkataan "Horizon". Bagaimana jika kita perlu mencari dokumen yang tidak mengandungi perkataan "Horizon" sama sekali, tetapi mengandungi perkataan "TV". Untuk beralih dari peringkat ayat ke peringkat dokumen, nyatakan operator yang anda inginkan dua kali, contohnya: && atau ~~. Dalam kes kami, pertanyaan "TV ~~ Horizon" akan dilakukan.

Selalunya anda perlu mencari frasa yang tepat, sebagai contoh, "presiden Rusia", di mana perkataan "Rusia" diikuti dengan ketat selepas perkataan "presiden". Dalam kes ini, frasa carian mesti disertakan dalam tanda petikan.

Cari berdasarkan jarak dalam Yandex

Yandex nombor semua perkataan dalam teks dokumen mengikut urutan. Jarak antara perkataan bersebelahan ialah 1 (bukan 0!), dan jarak antara perkataan dalam susunan terbalik ialah -1. Perkara yang sama berlaku untuk tawaran.

Untuk menunjukkan jarak antara perkataan, letakkan a / tanda, diikuti dengan serta-merta dengan nombor, yang bermaksud ini adalah jarak antara perkataan. Sebagai contoh, pertanyaan "pembangun / 2 program" akan mencari dokumen yang mengandungi perkataan "pembangun" dan "program", dan jarak antara perkataan hendaklah tidak lebih daripada dua perkataan dan semua perkataan ini hendaklah dalam satu ayat. Dalam kes ini, dokumen yang mengandungi "pembangun program aplikasi", "pembangun program sistem", dll. akan ditemui.

Jika kita tahu dengan tepat jarak dan susunan perkataan, maka kita boleh menggunakan sintaks /+n. Sebagai contoh, pertanyaan "red /+1 cap" akan mengembalikan hasil dengan perkataan "cap" serta-merta mengikuti perkataan "red". Pertanyaan "tudung tunggang merah kecil" akan membawa kepada hasil yang sama.

Menggunakan kurungan semasa mencari dalam Yandex

Tanda kurung digunakan untuk mewakili keseluruhan ungkapan dalam pertanyaan. Contohnya, pertanyaan "(sejarah | teknologi | program)/+1 Linux" akan menemui dokumen yang mengandungi salah satu frasa "sejarah Linux", "Teknologi Linux", "Aturcara Linux".

Zon

Zon ialah tempat untuk mencari maklumat yang anda perlukan. Anda boleh menentukan zon yang anda ingin cari - tajuk (Zon Tajuk), pautan (sauh) atau alamat (Alamat). Anda juga boleh menggunakan zon semua untuk mencari keseluruhan dokumen.

Sintaks: permintaan $zone_name.

Contohnya: minta $title "Microsoft" найдет все документы, в заголовках которых встречается точная фраза "Microsoft".!}

Pilihan carian Yandex tambahan

Enjin carian Google memungkinkan untuk mengehadkan lokasi carian kepada senarai pelayan tertentu atau, sebaliknya, untuk mengecualikan beberapa pelayan daripada senarai carian. Keupayaan yang sama tersedia dalam enjin carian Yandex. Anda juga boleh mencari dokumen yang mengandungi pautan ke URL atau imej tertentu. Apabila menentukan topeng fail (contohnya, gambar), anda boleh menggunakan simbol *, yang bermaksud semua aksara, contohnya: “audi-*”.

Sintaksnya ialah: #element_name=”value”.

    Unsur tersebut boleh:
  • url - tapak tertentu;
  • pautan - pautan;
  • imej - gambar;
  • kata kunci - kata kunci (*);
  • abstrak - anotasi (*);
  • petunjuk - kapsyen untuk gambar (*).

Di Internet global anda boleh mencari maklumat mengenai sebarang topik yang diminati. Tetapi perkara yang paling sukar tentang bekerja di Internet ialah mencari maklumat yang anda perlukan. Memandangkan Internet tidak mempunyai struktur berpusat yang jelas, ia berkembang secara huru-hara, dan semakin banyak pelayan baharu muncul di dunia, isu mencari maklumat menjadi sangat relevan.

Enjin carian menjadikan kerja di Internet lebih mudah dan membantu kami mencari maklumat yang kami perlukan dengan cepat pada pelbagai besar pelayan Internet. Terdapat beberapa ribu enjin carian di World Wide Web, termasuk yang mantap dan yang kurang dikenali.

Enjin carian paling popular

  • Yandex— cara mendapatkan maklumat teks penuh dengan mengambil kira morfologi bahasa Rusia; cari tapak, katalog anda, berita, produk, peta geografi, kamus, blog, gambar, dokumen Microsoft Office dan Adobe Acrobat PDF
    • Yandex
  • Rambler(JSC Rambler Internet Holding) - cari di tapak dengan mengambil kira morfologi bahasa Rusia dan Inggeris; Ia juga mempunyai sistem carian katalog.
    • Rambler Lite: enjin carian— versi pendek halaman carian
  • Perkhidmatan carian Sputnik(OJSC Rostelecom) - carian di tapak, perkhidmatan kerajaan, dsb.; Carian Selamat
  • NIGMa - enjin carian pintar(M.V. Lomonosov Moscow State University dan Stanford University) - cari dokumen, gambar, buku, berita melalui Google, Yahoo, MSN, Yandex, Rambler, altavista, Aport; sistem ini juga menyediakan carian unik untuk formula dan tindak balas kimia
  • Google — cari di tapak (boleh mencari di tapak berbahasa Rusia); cari dokumen dalam format Adobe Acrobat PDF, Microsoft Office, PostScript, Corel WordPerfect, Lotus 1-2-3, dsb.; cari gambar, video, berita, carian pada peta; keupayaan untuk mencari di tapak berbahasa Rusia dan Rusia; terdapat sistem untuk menterjemah teks ke bahasa lain (49 bahasa)
  • Bing(Microsoft Corp.) - tapak carian, imej dan video; keupayaan untuk mencari di tapak berbahasa Rusia dan Rusia; terdapat sistem untuk menterjemah teks ke bahasa lain (22 bahasa)
  • Yahoo!(Yahoo) - cari mengikut tapak, alamat E-Mel, dsb.

Setiap enjin carian mempunyai kelebihan dan kekurangannya sendiri, yang ditentukan oleh prinsip operasi enjin carian, kemudahan penggunaan, reka bentuknya, kerumitan bahasa pertanyaan, kehadiran pelbagai fungsi lanjutan (mengurus format dan kedudukan maklumat output, membetulkan ralat ejaan dan susun atur papan kekunci yang salah apabila memasukkan kata kunci, menterjemah halaman ke dalam bahasa lain, dsb.), kelajuan kerja dan parameter lain. Pilihan enjin carian untuk aplikasi tertentu ditentukan oleh tujuan carian, sifat maklumat yang dicari, format data output yang dikehendaki dan keluasan liputan alamat pelayan yang dipantau di dunia Internet.

Cari mengikut kata kunci. Bahasa pertanyaan enjin carian

Enjin carian biasanya mempunyai medan untuk memasukkan kata kunci, yang digunakan untuk mencari dokumen yang mengandungi kata kunci tersebut. Lebih baik (lebih tinggi kualiti) pertanyaan dibuat kepada enjin carian, lebih kecil jumlah dokumen yang ditemui, dan lebih banyak daripada mereka adalah dokumen yang sepadan dengan apa yang anda perlukan. Jika permintaan itu sangat mudah atau kurang disusun, maka enjin carian boleh memberi anda beberapa juta dokumen yang anda tidak akan dapat lihat sepanjang hidup anda.

Menggunakan bahasa pertanyaan yang mengandungi operasi logik (operator Boolean DAN, ATAU, TIDAK, kurungan, dsb.), awalan yang memerlukan kehadiran kata kunci dalam dokumen «+» Dan «-» (apabila mencari istilah yang sangat khusus, lebih baik digunakan), lokasi kata kunci dalam dokumen berdekatan atau pada jarak tertentu, dsb.) dan elemen lain, dan lebih banyak kata kunci yang dikaitkan dengannya, anda boleh mengecilkan dengan ketara kawasan carian dan karang permintaan yang lebih baik kepada pelayan carian. Perlu diambil kira bahawa enjin carian yang berbeza mungkin mempunyai bahasa pertanyaan yang berbeza atau sangat serupa.

Sesetengah enjin carian juga mempunyai fungsi carian terperinci, membenarkan pengguna untuk menerangkan dengan lebih tepat apa yang dia perlukan secara khusus tanpa mengetahui bahasa pertanyaan. Fungsi carian lanjutan tersedia, sebagai contoh, dalam enjin carian Yandex dan Google.

Jenis utama enjin carian. Enjin carian mana yang hendak digunakan

Terdapat 2 jenis utama enjin carian Internet: indeks dan klasifikasi (katalog). Enjin carian indeks (contohnya, Yandex, Rambler, Sputnik, Google, Bing, dsb.), bekerja dalam mod automatik untuk mengemas kini maklumat mereka, menyemak imbas kandungan pelayan di Internet, mengindeks maklumat yang terkandung di dalamnya dan memasukkan maklumat tentang lokasi perkataan pada halaman tapak web ke dalam pangkalan data mereka. Enjin carian katalog (contohnya, Rambler, Yahoo!, dll.) mengandungi katalog pelayan berstruktur bertema dan paling kerap dikemas kini secara manual. Lazimnya, halaman WWW bagi enjin carian klasifikasi juga mengandungi medan untuk memasukkan kata kunci untuk carian dalam pangkalan datanya sendiri. Dalam sistem carian katalog, anda boleh bermula dengan tajuk tematik yang lebih besar, dan secara beransur-ansur turun lebih jauh melalui tajuk, untuk sampai ke pautan ke tapak yang anda perlukan. Dalam sesetengah kes adalah lebih mudah untuk menggunakan jenis enjin carian pertama, dalam yang lain - yang kedua. Terdapat enjin carian yang menggabungkan kedua-dua prinsip operasi. Khususnya, banyak enjin carian indeks juga mempunyai sistem carian katalog. Selain itu, enjin carian boleh menggunakan beberapa prinsip lain kaedah carian.

Banyak enjin carian telah berubah menjadi portal Internet yang menggabungkan sejumlah besar sumber dan perkhidmatan. Pada halaman portal sedemikian, anda boleh membaca berita, menonton program TV, mengetahui tentang cuaca, kadar pertukaran, menggunakan perkhidmatan peta dan banyak lagi. dan lain-lain.

Enjin carian Rusia yang paling popular mempunyai keupayaan carian dengan mengambil kira keistimewaan bahasa Rusia.

Untuk mencari secara serentak dalam beberapa enjin carian, anda boleh menggunakan apa yang dipanggil metamachines carian, yang mengakses beberapa alat carian sekaligus, contohnya, NIGMa.

Terdapat juga enjin carian yang pakar dalam mencari satu topik tertentu (contohnya, teknologi maklumat, muzik, sumber khusus untuk alam semula jadi, dll.)

Semakin ramai orang mencari maklumat yang mereka perlukan di World Wide Web. Ia akan menjadi lebih berkesan jika anda mengikuti peraturan mudah. Semua enjin carian mempunyai . Pencarian yang berjaya di Internet adalah mustahil tanpa sekurang-kurangnya pengetahuan yang cetek tentang prinsip-prinsip ini. Terdapat sejumlah besar maklumat yang berbeza di Internet yang carian yang huru-hara dan tidak teratur di Internet tidak akan membawa ke mana-mana. Anda akan membuang banyak masa dan saraf, tetapi anda hanya akan menemui butiran yang anda perlukan.

Mencari di Internet memerlukan pengetahuan tentang prinsip dan helah tertentu. Bagaimana untuk mencari maklumat yang diperlukan secepat mungkin? Anda hanya perlu mengikuti tertentu peraturan.

  1. Rumuskan pertanyaan carian anda dengan betul. Ia sepatutnya tidak terlalu pendek dan tidak terlalu panjang. Panjang optimum pertanyaan carian ialah 2-3 perkataan.
  2. Jika anda tidak berpuas hati dengan hasilnya, cuba tukar pertanyaan dengan menyusun semula perkataan dalam pertanyaan atau menggunakan sinonim.
  3. Untuk mencari frasa atau petikan yang tepat, sertakan pertanyaan carian anda dalam tanda petikan.
  4. Biasanya, memasukkan pertanyaan yang layak adalah lebih cekap daripada mencari melalui hasil carian.
  5. Cuba untuk tidak merumuskan pertanyaan carian anda sebagai soalan kepada enjin carian.
  6. Beri perhatian kepada domain tapak daripada hasil carian supaya tidak secara tidak sengaja mengklik pada pautan yang mencurigakan.
  7. Biasanya, pautan yang paling berjaya dan maklumat yang dicari ditemui pada dua atau tiga halaman pertama hasil carian. Ngomong-ngomong, bukan fakta bahawa maklumat terbaik akan ditemui secara eksklusif pada halaman pertama.
  8. Gunakan lebih daripada satu enjin carian. Enjin carian yang berbeza mempunyai prinsip kedudukan yang berbeza, jadi apa yang tidak terdapat dalam satu boleh didapati dalam yang lain.
  9. Gunakan teknologi carian tambahan bagi enjin carian (carian mengikut imej, carian mengikut wilayah, carian mengikut blog, carian lanjutan, dsb.).
  10. Gunakan keupayaan carian pelayar anda. Sebagai contoh, kombinasi kekunci Ctrl+F membolehkan carian halaman.

Sila ambil perhatian bahawa hasil carian adalah dinamik dan selepas beberapa hari atau jam mungkin berubah. Oleh itu, jika anda menjumpai pautan yang berguna, anda harus segera menambahkannya pada penanda halaman anda: kali seterusnya hasil carian Internet mungkin berbeza, dan anda hanya akan kehilangan tapak yang pernah anda temui.

Untuk memudahkan carian di Internet, enjin carian Google menawarkan beberapa pengendali dan fungsi tambahan, yang membolehkan anda merumuskan pertanyaan carian anda dengan lebih tepat dan menjadikan carian Internet lebih cekap.

  • Tanda + membolehkan anda memaksa perkataan untuk dimasukkan dalam pertanyaan: +cara mencari di Internet. Jika ia berada di tengah-tengah frasa, ia mesti didahului dengan ruang.
  • Tanda mengecualikan perkataan daripada senarai hasil carian: kereta adalah domestik.
  • Perkataan ATAU atau tandatangan | digunakan untuk mencari satu daripada dua perkataan: Pemain CD ATAU MP3 (CD | pemain MP3).
  • Tanda ~ (tilde) membolehkan anda mencari sinonim perkataan daripada pertanyaan: beli ~ motosikal.
  • Tanda * bermaksud apa-apa perkataan: abstrak oleh *.
  • dua titik ( .. ) digunakan untuk mencari dalam julat nilai tertentu: pemain untuk 150..200 dolar.

Pengendali ini mempunyai pengaruh kepada pertanyaan carian itu sendiri. Kumpulan pengendali berikut memudahkan carian Internet dengan mengecilkan julat carian: halaman dalam hasil carian dipilih mengikut kriteria tertentu.

  • Operator Tapak diperlukan untuk mencari halaman diindeks tapak tertentu. Ia boleh digunakan untuk mencari semua halaman yang diindeks ( tapak:tapak), dan untuk mencari mengikut kata kunci pada halaman ini ( tapak:tapak hobi).
  • Operator Jenis fail membolehkan anda mencari fail tertentu, contohnya: abstrak pada jenis fail biologi:rtf.
  • Operator Cache memaparkan halaman yang disimpan dalam cache enjin carian: cache:laman web. Mengapa ini perlu? Ia berlaku bahawa bahan yang diperlukan telah dialih keluar dari tapak, tetapi ia kekal dalam cache untuk beberapa waktu.
  • Operator takrifkan membolehkan anda mencari definisi perkataan dan frasa: tentukan enjin carian.
  • Untuk mencari tapak yang serupa dalam topik dengan tapak tertentu, gunakan operator Berkaitan: berkaitan:laman web.

Sesetengah ciri carian Google boleh menjadikan kehidupan seharian lebih mudah, termasuk ramalan cuaca, penukar mata wang dan banyak lagi.

  • Untuk mengetahui ramalan cuaca, hanya masukkan perkataan "cuaca" dan nama negara dan kawasan anda: Cuaca di Moscow. Untuk AS, sebagai tambahan kepada bandar, negeri dan poskod ditunjukkan.
  • Jika anda perlu tahu Zon masa di mana bandar ini atau itu terletak, masukkan frasa "zon waktu" dan nama bandar dalam bar carian: zon waktu Kaliningrad.
  • Anda boleh mengehadkan carian kepada pelbagai organisasi (restoran, kedai, dll.) bandar tertentu: pizza di Kazan.
  • Kalau nak tahu jadual tayangan filem di kawasan tertentu, tambahkan nama bandar anda pada permintaan "pawagam": pawagam di Sochi.
  • Untuk carian peta bandar Pertanyaan carian berikut digunakan: peta St. Petersburg(gantikan bandar yang dikehendaki), dari halaman hasil carian anda boleh pergi ke perkhidmatan Peta Google.
  • Bar carian Google boleh digunakan sebagai kalkulator, memasukkan ke dalamnya contoh yang perlu dikira: (7+3*5)/11=
  • Enjin carian ini juga membolehkan menukar unit ukuran daripada sistem ukuran Inggeris kepada sistem metrik dan sebaliknya: 9.5 ela dalam sentimeter.
  • Selain menukar unit ukuran, anda juga boleh menukar mata wang negara yang berbeza, contohnya: 200 dolar AS dalam rubel.

Sudah tentu, ini bukan senarai lengkap fungsi dan pengendali, tetapi ini sepatutnya cukup untuk anda bermula. Mencari di Internet boleh menjadi rumit oleh fakta itu tidak semua operator dan fungsi sentiasa berfungsi dengan betul. Selalunya, sebagai contoh, pengendali yang berkaitan "berdosa" dengan hasil carian yang salah.

Mencari di Internet adalah sangat mudah pada pandangan pertama. Tetapi kemudian, berhadapan dengan sejumlah besar maklumat yang sukar untuk ditapis, ramai pengguna menjadi kecewa dengan enjin carian. Tetapi sia-sia! Keupayaan untuk merumus dengan betul permintaan dan pengetahuan tentang beberapa kehalusan dan helah akan menyelamatkan anda daripada menyemak imbas yang membosankan di tapak yang tidak perlu dan tidak bermaklumat.

Mencari di Internet boleh menjadi pantas dan cekap - jika anda tahu cara mencari dengan betul!