ഇന്റർനെറ്റ് സെർച്ച് എഞ്ചിനുകൾ എങ്ങനെ പ്രവർത്തിക്കുന്നു. ഇന്റർനെറ്റ് തിരയൽ എഞ്ചിനുകൾ

സെർച്ച് എഞ്ചിനുകൾ(തിരയല് യന്ത്രം)

തന്നിരിക്കുന്ന വിഷയങ്ങളുമായി ബന്ധപ്പെട്ടതോ കീവേഡുകളോ അവയുടെ കോമ്പിനേഷനുകളോ ഉപയോഗിച്ച് സജ്ജീകരിച്ചിരിക്കുന്ന WWW പ്രമാണങ്ങൾ കണ്ടെത്താൻ തിരയൽ എഞ്ചിനുകൾ നിങ്ങളെ അനുവദിക്കുന്നു. തിരയൽ സെർവറുകളിൽ രണ്ട് തിരയൽ രീതികൾ ഉപയോഗിക്കുന്നു:

· ആശയങ്ങളുടെ ശ്രേണി അനുസരിച്ച്;

· കീവേഡുകൾ വഴി.

തിരയൽ സെർവറുകൾ സ്വയമേവയോ സ്വയമേവയോ ജനസംഖ്യയുള്ളതാണ്. തിരയൽ സെർവറിന് സാധാരണയായി മറ്റ് തിരയൽ സെർവറുകളിലേക്കുള്ള ലിങ്കുകൾ ഉണ്ട്, കൂടാതെ ഉപയോക്താവിന്റെ അഭ്യർത്ഥന പ്രകാരം അവർക്ക് ഒരു തിരയൽ അഭ്യർത്ഥന അയയ്ക്കുകയും ചെയ്യുന്നു.

രണ്ട് തരം സെർച്ച് എഞ്ചിനുകൾ ഉണ്ട്.

1. സ്റ്റോപ്പ് പദങ്ങൾ ഒഴികെ, ഒരു വെബ് പേജിലെ എല്ലാ വാക്കുകളും സൂചികയിലാക്കുന്ന "ഫുൾ-ടെക്സ്റ്റ്" തിരയൽ എഞ്ചിനുകൾ.

2. ഓരോ പേജിന്റെയും ഒരു സംഗ്രഹം സൃഷ്ടിക്കുന്ന "അമൂർത്ത" തിരയൽ എഞ്ചിനുകൾ.

വെബ്‌മാസ്റ്റർമാർക്ക്, ഫുൾ-ടെക്‌സ്‌റ്റ് എഞ്ചിനുകൾ കൂടുതൽ ഉപയോഗപ്രദമാണ്, കാരണം ഒരു വെബ്‌പേജിൽ കാണുന്ന ഏതൊരു വാക്കും ഉപയോക്തൃ അന്വേഷണങ്ങൾക്ക് അതിന്റെ പ്രസക്തി നിർണ്ണയിക്കാൻ വിശകലനം ചെയ്യുന്നു. എന്നിരുന്നാലും, അബ്‌സ്‌ട്രാക്റ്റ് എഞ്ചിനുകൾക്ക് ഫുൾ-ടെക്‌സ്‌റ്റുകളേക്കാൾ മികച്ച പേജുകൾ സൂചികയിലാക്കാൻ കഴിയും. ഇത് വിവരങ്ങൾ എക്‌സ്‌ട്രാക്റ്റുചെയ്യുന്നതിനുള്ള അൽഗോരിതത്തെ ആശ്രയിച്ചിരിക്കുന്നു, ഉദാഹരണത്തിന്, ഒരേ വാക്കുകളുടെ ഉപയോഗത്തിന്റെ ആവൃത്തി പ്രകാരം.

സെർച്ച് എഞ്ചിനുകളുടെ പ്രധാന സവിശേഷതകൾ.

1.ഇൻഡക്‌സ് ചെയ്‌ത പേജുകളുടെ എണ്ണം അനുസരിച്ചാണ് സെർച്ച് എഞ്ചിന്റെ വലുപ്പം നിർണ്ണയിക്കുന്നത്. എന്നിരുന്നാലും, ഏത് സമയത്തും, ഉപയോക്തൃ അഭ്യർത്ഥനകൾക്ക് മറുപടിയായി നൽകിയിരിക്കുന്ന ലിങ്കുകൾ വ്യത്യസ്ത പ്രായത്തിലുള്ളതാകാം. ഇത് സംഭവിക്കുന്നതിന്റെ കാരണങ്ങൾ:

· ചില സെർച്ച് എഞ്ചിനുകൾ ഉപയോക്താവിന്റെ അഭ്യർത്ഥന പ്രകാരം ഉടൻ തന്നെ പേജ് സൂചികയിലാക്കുന്നു, തുടർന്ന് ഇതുവരെ സൂചികയിലാക്കിയിട്ടില്ലാത്ത പേജുകൾ സൂചികയിൽ തുടരും.

· മറ്റുള്ളവർ ഏറ്റവും കൂടുതൽ സൂചികയിലാക്കുന്നു ജനപ്രിയ പേജുകൾനെറ്റ്വർക്കുകൾ.

2. സൂചിക തീയതി. ചില തിരയൽ എഞ്ചിനുകൾ ഒരു പ്രമാണം സൂചികയിലാക്കിയ തീയതി കാണിക്കുന്നു. ഒരു ഡോക്യുമെന്റ് ഓൺലൈനിൽ എപ്പോൾ പ്രത്യക്ഷപ്പെട്ടുവെന്ന് നിർണ്ണയിക്കാൻ ഇത് ഉപയോക്താവിനെ സഹായിക്കുന്നു.

3. ഇൻഡക്‌സിംഗ് ഡെപ്‌ത് വ്യക്തമാക്കിയതിന് ശേഷം എത്ര പേജുകൾ സെർച്ച് എഞ്ചിൻ സൂചികയിലാക്കുമെന്ന് കാണിക്കുന്നു. മിക്ക മെഷീനുകൾക്കും ഇൻഡെക്‌സിംഗ് ഡെപ്‌ത് ചെയ്യുന്നതിന് യാതൊരു നിയന്ത്രണവുമില്ല. എല്ലാ പേജുകളും സൂചികയിലാക്കാതിരിക്കാനുള്ള കാരണങ്ങൾ:

· അല്ല ശരിയായ ഉപയോഗംഫ്രെയിം ഘടനകൾ.

· ഡ്യൂപ്ലിക്കേഷൻ ഇല്ലാതെ ഒരു സൈറ്റ് മാപ്പിന്റെ ഉപയോഗം പതിവ് ലിങ്കുകൾ

4. ഫ്രെയിമുകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു. എങ്കിൽ തിരയൽ റോബോട്ട്ഫ്രെയിം ഘടനകൾ ഉപയോഗിച്ച് എങ്ങനെ പ്രവർത്തിക്കണമെന്ന് അറിയില്ല, അപ്പോൾ ഇൻഡെക്സിംഗ് സമയത്ത് ഫ്രെയിമുകളുള്ള പല ഘടനകളും നഷ്‌ടമാകും.

5. ലിങ്കുകളുടെ ആവൃത്തി. പ്രധാന സെർച്ച് എഞ്ചിനുകൾക്ക് ഒരു ഡോക്യുമെന്റ് എത്ര തവണ ലിങ്ക് ചെയ്‌തിരിക്കുന്നു എന്നതിനെ അടിസ്ഥാനമാക്കി അതിന്റെ ജനപ്രീതി നിർണ്ണയിക്കാനാകും. ചില മെഷീനുകൾ, അത്തരം ഡാറ്റയെ അടിസ്ഥാനമാക്കി, ഒരു ഡോക്യുമെന്റ് ഇൻഡക്‌സ് ചെയ്യുന്നത് മൂല്യവത്താണോ അല്ലയോ എന്ന് "അവസാനിപ്പിക്കുന്നു".

6.സെർവർ അപ്ഡേറ്റ് ഫ്രീക്വൻസി. സെർവർ ഇടയ്‌ക്കിടെ അപ്‌ഡേറ്റ് ചെയ്യുകയാണെങ്കിൽ, തിരയൽ എഞ്ചിൻ അത് കൂടുതൽ തവണ വീണ്ടും സൂചികയിലാക്കുന്നു.

7. സൂചിക നിയന്ത്രണം. സെർച്ച് എഞ്ചിൻ നിയന്ത്രിക്കാൻ നിങ്ങൾക്ക് ഏതൊക്കെ ഉപകരണങ്ങൾ ഉപയോഗിക്കാമെന്ന് കാണിക്കുന്നു.

8. റീഡയറക്ഷൻ. ചില സൈറ്റുകൾ സന്ദർശകരെ ഒരു സെർവറിൽ നിന്ന് മറ്റൊന്നിലേക്ക് റീഡയറക്ട് ചെയ്യുന്നു, കൂടാതെ ഇത് കണ്ടെത്തിയ പ്രമാണങ്ങളുമായി എങ്ങനെ ബന്ധപ്പെട്ടിരിക്കുമെന്ന് ഈ ഓപ്ഷൻ കാണിക്കുന്നു.

9. വാക്കുകൾ നിർത്തുക. ചില സെർച്ച് എഞ്ചിനുകൾ അവയുടെ സൂചികകളിൽ ചില വാക്കുകൾ ഉൾപ്പെടുത്തുന്നില്ല അല്ലെങ്കിൽ ഉപയോക്തൃ അന്വേഷണങ്ങളിൽ ആ വാക്കുകൾ ഉൾപ്പെടുത്തിയേക്കില്ല. ഈ വാക്കുകൾ സാധാരണയായി പ്രീപോസിഷനുകളോ അല്ലെങ്കിൽ പതിവായി ഉപയോഗിക്കുന്ന വാക്കുകളോ ആയി കണക്കാക്കപ്പെടുന്നു.

10.സ്പാം പിഴകൾ. സ്പാം തടയാനുള്ള കഴിവ്.

11.പഴയ ഡാറ്റ ഇല്ലാതാക്കുന്നു. സെർവർ അടയ്ക്കുമ്പോഴോ മറ്റൊരു വിലാസത്തിലേക്ക് നീക്കുമ്പോഴോ വെബ്‌മാസ്റ്ററുടെ പ്രവർത്തനങ്ങൾ നിർണ്ണയിക്കുന്ന ഒരു പാരാമീറ്റർ.

തിരയൽ എഞ്ചിനുകളുടെ ഉദാഹരണങ്ങൾ.

1. അൽതവിസ്റ്റ. 1995 ഡിസംബറിലാണ് ഈ സംവിധാനം ആരംഭിച്ചത്. ഡിഇസിയുടെ ഉടമസ്ഥതയിലുള്ളതാണ്. 1996 മുതൽ അദ്ദേഹം യാഹൂവുമായി സഹകരിക്കുന്നു. AltaVista ആണ് മികച്ച ഓപ്ഷൻഇഷ്ടാനുസൃത തിരയലിനായി . എന്നിരുന്നാലും, വിഭാഗം അനുസരിച്ച് ഫലങ്ങൾ അടുക്കുന്നുഇത് ചെയ്തിട്ടില്ല, നൽകിയിരിക്കുന്ന വിവരങ്ങൾ നിങ്ങൾ നേരിട്ട് അവലോകനം ചെയ്യണം. ലിസ്റ്റുകൾ വീണ്ടെടുക്കുന്നതിനുള്ള ഒരു മാർഗവും AltaVista നൽകുന്നില്ല സജീവ നോഡുകൾ, വാർത്തകൾ അല്ലെങ്കിൽ മറ്റ് ഉള്ളടക്ക തിരയൽ കഴിവുകൾ.

2.എക്സൈറ്റ് തിരയൽ. 1995 അവസാനത്തോടെ സമാരംഭിച്ചു. 1996 സെപ്റ്റംബറിൽ - WebCrawler ഏറ്റെടുത്തു. ഈ യൂണിറ്റിന് ശക്തമായ തിരയൽ രോമമുണ്ട്കുറഞ്ഞ, ഓട്ടോമാറ്റിക് വ്യക്തിഗത ക്രമീകരണങ്ങളുടെ സാധ്യതനൽകിയ വിവരങ്ങളും അതുപോലെ സമാഹരിച്ച യോഗ്യതകളുംയോഗ്യതയുള്ള ഉദ്യോഗസ്ഥരുടെ ഒന്നിലധികം നോഡുകളുടെ വിവരണങ്ങൾ.ആവേശം കൊള്ളിക്കുക അതിലെ മറ്റ് തിരയൽ നോഡുകളിൽ നിന്ന് വ്യത്യസ്തമാണ്വാർത്താ സേവനങ്ങൾ തിരയാനും അവലോകനങ്ങൾ പ്രസിദ്ധീകരിക്കാനും നിങ്ങളെ അനുവദിക്കുന്നുവെബ് പേജുകൾ. സെർച്ച് എഞ്ചിൻ ടൂളുകൾ ഉപയോഗിക്കുന്നുസാധാരണ കീവേഡ് തിരയലും ഹ്യൂറിസ്റ്റിക്ഉള്ളടക്ക തിരയൽ രീതികൾ. ഈ കോമ്പിനേഷന് നന്ദി,നിങ്ങൾക്ക് പ്രസക്തമായ പേജുകൾ കണ്ടെത്താനാകുംവെബ് അവ അടങ്ങിയിട്ടില്ലെങ്കിൽ ഉപയോക്താവ് വ്യക്തമാക്കിയത്താക്കോൽവാക്കുകൾ എക്സൈറ്റിന്റെ പോരായ്മ ഒരു പരിധിവരെ കുഴപ്പമില്ലാത്ത ഇന്റർഫേസ് ആണ്.

3.HotBot. 1996 മെയ് മാസത്തിൽ സമാരംഭിച്ചു. വയർഡിന്റെ ഉടമസ്ഥതയിലുള്ളത്. ബെർക്ക്‌ലി ഇങ്ക്‌ടോമി സെർച്ച് എഞ്ചിൻ സാങ്കേതികവിദ്യയെ അടിസ്ഥാനമാക്കി. ഫുൾ-ടെക്‌സ്റ്റ് ഇൻഡക്‌സ് ചെയ്‌ത ഡോക്യുമെന്റുകളും വെബിലെ ഏറ്റവും സമഗ്രമായ സെർച്ച് എഞ്ചിനുകളും അടങ്ങുന്ന ഒരു ഡാറ്റാബേസാണ് HotBot. ലോജിക്കൽ വ്യവസ്ഥകൾ ഉപയോഗിച്ച് തിരയുന്നതിനുള്ള അതിന്റെ മാർഗങ്ങളും തിരയൽ ഏതെങ്കിലും പ്രദേശത്തേക്ക് പരിമിതപ്പെടുത്തുന്നതിനുള്ള മാർഗങ്ങളും അല്ലെങ്കിൽ വെബ് സൈറ്റ്ഉപയോക്താവിനെ കണ്ടെത്താൻ സഹായിക്കുക ആവശ്യമായ വിവരങ്ങൾ, അനാവശ്യമായ കളയെടുക്കൽ. ഡ്രോപ്പ്-ഡൗൺ ലിസ്റ്റുകളിൽ നിന്ന് ആവശ്യമുള്ള തിരയൽ പാരാമീറ്ററുകൾ തിരഞ്ഞെടുക്കാനുള്ള കഴിവ് HotBot നൽകുന്നു.

4.ഇൻഫോസീക്ക്. 1995-ന് മുമ്പ് ആരംഭിച്ചത്, എളുപ്പത്തിൽ ആക്സസ് ചെയ്യാവുന്നതാണ്. നിലവിൽ ഏകദേശം 50 ദശലക്ഷം URL-കൾ അടങ്ങിയിരിക്കുന്നു. ഇൻഫോസീക്കിന് നന്നായി രൂപകൽപ്പന ചെയ്ത ഇന്റർഫേസും മികച്ച തിരയൽ സൗകര്യവുമുണ്ട്. ചോദ്യങ്ങൾക്കുള്ള മിക്ക പ്രതികരണങ്ങളും "ബന്ധപ്പെട്ട വിഷയങ്ങൾ" ലിങ്കുകളോടൊപ്പമുണ്ട്, കൂടാതെ ഓരോ പ്രതികരണത്തിനും ശേഷം "സമാന പേജുകൾ" ലിങ്കുകൾ ഉണ്ടാകും. ഡാറ്റാബേസ് തിരയല് യന്ത്രംപൂർണ്ണ വാചകം ഉപയോഗിച്ച് സൂചികയിലാക്കിയ പേജുകൾ. ഉത്തരങ്ങൾ രണ്ട് സൂചകങ്ങളാൽ ക്രമീകരിച്ചിരിക്കുന്നു: പേജിലെ വാക്ക് അല്ലെങ്കിൽ വാക്യങ്ങളുടെ ആവൃത്തി tsakh, അതുപോലെ പേജുകളിലെ വാക്കുകളുടെയോ ശൈലികളുടെയോ സ്ഥാനം.തിരയാൻ കഴിയുന്ന നൂറുകണക്കിന് ഉപവിഭാഗങ്ങളുള്ള 12 വിഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്ന ഒരു വെബ് ഡയറക്ടറി ഉണ്ട്. ഓരോ കാറ്റലോഗ് പേജിലും റെ ഒരു ലിസ്റ്റ് അടങ്ങിയിരിക്കുന്നു ശുപാർശ ചെയ്യുന്ന നോഡുകൾ.

5. ലൈക്കോസ്. 1994 മെയ് മുതൽ പ്രവർത്തിക്കുന്നു. വ്യാപകമായി അറിയപ്പെടുന്നതും ഉപയോഗിക്കുന്നതും. ഒരു വലിയ URL-കളുള്ള ഒരു ഡയറക്ടറി ഇതിൽ ഉൾപ്പെടുന്നു. സാങ്കേതികതയുള്ള പോയിന്റ് സെർച്ച് എഞ്ചിനും സ്ഥിതിവിവര വിശകലനംപേജ് ഉള്ളടക്കം, ഫുൾ ടെക്സ്റ്റ് ഇൻഡക്സിംഗിന് വിരുദ്ധമായി. വാർത്തകൾ, സൈറ്റ് അവലോകനങ്ങൾ, ജനപ്രിയ സൈറ്റുകളിലേക്കുള്ള ലിങ്കുകൾ, നഗര ഭൂപടങ്ങൾ, വിലാസങ്ങൾ, ചിത്രങ്ങൾ എന്നിവ കണ്ടെത്തുന്നതിനുള്ള ഉപകരണങ്ങൾ Lycos-ൽ അടങ്ങിയിരിക്കുന്നു. എക്സ്പ്രഷനുകളും ശബ്ദ വീഡിയോ ക്ലിപ്പുകളും.ലൈക്കോസ് പരസ്പര ബന്ധത്തിന്റെ അളവനുസരിച്ച് ഉത്തരങ്ങൾ ക്രമീകരിക്കുന്നുനിരവധി മാനദണ്ഡങ്ങളെ അടിസ്ഥാനമാക്കി ഒരു അഭ്യർത്ഥന തൃപ്തിപ്പെടുത്തുന്നു, ഉദാഹരണത്തിന്, നമ്പർഡോക്യുമെന്റിന്റെ അമൂർത്തത്തിൽ കാണുന്ന lu തിരയൽ പദങ്ങൾment, തമ്മിലുള്ള ഇടവേളപ്രമാണത്തിന്റെ ഒരു പ്രത്യേക വാക്യത്തിലെ വാക്കുകളിൽ, സ്ഥാനംപ്രമാണത്തിലെ നിബന്ധനകൾ.

6. WebCrawler. 1994 ഏപ്രിൽ 20-ന് വാഷിംഗ്ടൺ യൂണിവേഴ്സിറ്റിയുടെ ഒരു പ്രോജക്ടായി തുറന്നു. WebCrawler അവസരങ്ങൾ നൽകുന്നുചോദ്യങ്ങൾ വ്യക്തമാക്കുന്നതിനുള്ള വാക്യഘടന, അതുപോലെ വലിയ തിരഞ്ഞെടുപ്പ് ഒരു ലളിതമായ ഇന്റർഫേസ് ഉള്ള നോഡ് വ്യാഖ്യാനങ്ങൾ.


ഓരോ പ്രതികരണത്തിനും ശേഷം, WebCrawler ഒരു ചെറിയ ഐക്കൺ പ്രദർശിപ്പിക്കും, അഭ്യർത്ഥന പൊരുത്തപ്പെട്ടിട്ടുണ്ടോ എന്നതിന്റെ ഏകദേശ വിലയിരുത്തൽ. ഓരോ ഉത്തരത്തിനും ഒരു ചെറിയ സംഗ്രഹം, അതിന്റെ പൂർണ്ണ URL, കൃത്യമായ മാച്ച് സ്‌കോർ എന്നിവയുള്ള ഒരു പേജും Comee പ്രദർശിപ്പിക്കുന്നു. സാമ്പിൾ ചോദ്യത്തിലെ ഈ ഉത്തരം അതിന്റെ കീവേഡുകളായി.ചോദ്യങ്ങൾ കോൺഫിഗർ ചെയ്യുന്നതിനുള്ള ഗ്രാഫിക്കൽ ഇന്റർഫേസ്വെബ് ക്രാളർ ഇല്ല. എൻ അനുവദനീയമല്ലസാർവത്രിക ചിഹ്നങ്ങളുടെ ഉപയോഗവും അസാധ്യമാണ്കീവേഡുകൾക്ക് ഭാരം നൽകുക.തിരയൽ ഫീൽഡ് പരിമിതപ്പെടുത്താൻ ഒരു മാർഗവുമില്ലഒരു നിശ്ചിത പ്രദേശം.

7. യാഹൂ. യാഹൂവിന്റെ ഏറ്റവും പഴയ ഡയറക്ടറി 1994 ന്റെ തുടക്കത്തിലാണ് ആരംഭിച്ചത്. വ്യാപകമായി അറിയപ്പെടുന്നതും പതിവായി ഉപയോഗിക്കുന്നതും ഏറ്റവും ബഹുമാനിക്കപ്പെടുന്നതും. 1996 മാർച്ചിൽ കുട്ടികൾക്കായുള്ള യാഹൂലിഗൻസ് കാറ്റലോഗ് ആരംഭിച്ചു. Yahoo റീജിയണൽ, ടോപ്പ് ഡയറക്ടറികൾ ദൃശ്യമാകുന്നു. ഉപയോക്തൃ സബ്‌സ്‌ക്രിപ്‌ഷനുകളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് Yahoo. വെബിലെ ഏത് തിരയലിനും ഇത് ഒരു ആരംഭ പോയിന്റായി വർത്തിക്കും, കാരണം അതിന്റെ വർഗ്ഗീകരണ സംവിധാനം നന്നായി ചിട്ടപ്പെടുത്തിയ വിവരങ്ങളുള്ള ഒരു സൈറ്റ് കണ്ടെത്താൻ ഉപയോക്താവിനെ സഹായിക്കും. വെബ് ഉള്ളടക്കം ലിസ്റ്റുചെയ്തിരിക്കുന്ന 14 പൊതു വിഭാഗങ്ങളായി തിരിച്ചിരിക്കുന്നു ഹോം പേജ്യാഹൂ!. ഉപയോക്താവിന്റെ അഭ്യർത്ഥനയുടെ പ്രത്യേകതകളെ ആശ്രയിച്ച്, ഉപവിഭാഗങ്ങളും നോഡുകളുടെ ലിസ്റ്റുകളും പരിചയപ്പെടാൻ ഈ വിഭാഗങ്ങളുമായി പ്രവർത്തിക്കുകയോ തിരയുകയോ ചെയ്യാം. നിർദ്ദിഷ്ട വാക്കുകൾഡാറ്റാബേസിൽ ഉടനീളം നിബന്ധനകളും. ഉപയോക്താവിന് Yahoo! ന്റെ ഏത് വിഭാഗത്തിലോ ഉപവിഭാഗത്തിലോ ഉള്ള തിരയൽ പരിമിതപ്പെടുത്താനും കഴിയും. നോഡുകളുടെ വർഗ്ഗീകരണം ആളുകൾ നടത്തുന്ന വസ്തുത കാരണം, കൂടാതെകമ്പ്യൂട്ടർ വഴിയല്ല, ലിങ്കുകളുടെ ഗുണനിലവാരം സാധാരണയായി വളരെ ഉയർന്നതാണ്. എന്നിരുന്നാലും, പരാജയപ്പെടുമ്പോൾ തിരച്ചിൽ പരിഷ്കരിക്കുന്നത് ബുദ്ധിമുട്ടുള്ള കാര്യമാണ്. യാഹൂവിൽ ചേരുക ! സെർച്ച് എഞ്ചിൻ ഉൾപ്പെടുത്തിയിട്ടുണ്ട് AltaVista, അതിനാൽ നിങ്ങൾ Yahoo! അത് യാന്ത്രികമായി സംഭവിക്കുന്നു ഒരു തിരയൽ എഞ്ചിൻ ഉപയോഗിച്ച് ആവർത്തനം AltaVista . ഫലങ്ങൾ പിന്നീട് അയയ്ക്കുന്നുയാഹൂ!. Yahoo! വിലാസങ്ങൾ കണ്ടെത്താൻ Usenet, Fourl 1 എന്നിവയിലേക്ക് തിരയൽ അന്വേഷണങ്ങൾ അയയ്ക്കാനുള്ള കഴിവ് നൽകുന്നു ഇമെയിൽ.

റഷ്യൻ തിരയൽ എഞ്ചിനുകളിൽ ഇവ ഉൾപ്പെടുന്നു:

1. റാംബ്ലർ. ഇതൊരു റഷ്യൻ ഭാഷയിലുള്ള സെർച്ച് എഞ്ചിനാണ്. ഹോമിൽ ലിസ്റ്റ് ചെയ്തിരിക്കുന്ന വിഭാഗങ്ങൾ റാംബ്ലർ പേജ്, റഷ്യൻ ഭാഷയിലുള്ള വെബ് ഉറവിടങ്ങൾ ഉൾക്കൊള്ളുന്നു. ഒരു വിവര ക്ലാസിഫയർ ഉണ്ട്. സൗകര്യപ്രദമായ അവസരംഓരോന്നിനും ഏറ്റവും കൂടുതൽ സന്ദർശിച്ച നോഡുകളുടെ ഒരു ലിസ്റ്റ് നൽകുക എന്നതാണ് ജോലി നിർദ്ദിഷ്ട വിഷയം.

2. Aport തിരയൽ. അപോർട്ട് മുൻനിരയിലുണ്ട് സെർച്ച് എഞ്ചിനുകൾ, സർട്ടിഫൈഡ്മൈക്രോസോഫ്റ്റ് പ്രാദേശിക തിരയൽ എഞ്ചിനുകൾ പോലെറഷ്യൻ പതിപ്പിനുള്ള സംവിധാനങ്ങൾ Microsoft Internet Explorer. ഇംഗ്ലീഷ്-റഷ്യൻ, റഷ്യൻ-ഇംഗ്ലീഷ് വിവർത്തനമാണ് Aport-ന്റെ ഗുണങ്ങളിൽ ഒന്ന് ഓൺലൈൻ മോഡ്അന്വേഷണങ്ങളും ഫല തിരയലുകളും, റഷ്യൻ ഇന്റർനെറ്റ് ഉറവിടങ്ങളിൽ നിങ്ങൾക്ക് തിരയാൻ കഴിയുന്ന നന്ദി , റഷ്യൻ അറിയാതെ പോലും. മാത്രമല്ലനിങ്ങൾക്ക് വിവരങ്ങൾ തിരയാൻ കഴിയും വാക്യങ്ങൾക്ക് പോലും പദപ്രയോഗങ്ങൾ ഉപയോഗിക്കുന്നു.Aport തിരയൽ സിസ്റ്റത്തിന്റെ പ്രധാന സവിശേഷതകളിൽ നിങ്ങൾക്ക് കഴിയുംഇനിപ്പറയുന്നവ വിഭജിക്കുക:

റഷ്യൻ ഭാഷയിൽ നിന്ന് ഇംഗ്ലീഷിലേക്ക് അന്വേഷണത്തിന്റെയും തിരയൽ ഫലങ്ങളുടെയും വിവർത്തനംചൈനീസ് ഭാഷയും തിരിച്ചും;

യാന്ത്രിക പരിശോധനഅഭ്യർത്ഥനയിലെ അക്ഷരപ്പിശകുകൾ;

കണ്ടെത്തിയ സൈറ്റുകൾക്കായുള്ള തിരയൽ ഫലങ്ങളുടെ വിജ്ഞാനപ്രദമായ പ്രദർശനം;

ഏത് വ്യാകരണ രൂപത്തിലും തിരയാനുള്ള കഴിവ്;


പ്രൊഫഷണലുകൾക്കുള്ള വിപുലമായ അന്വേഷണ ഭാഷ പണം ഉപയോഗിക്കുന്നവർ.

മറ്റ് തിരയൽ പ്രോപ്പർട്ടികൾ ഉൾപ്പെടുന്നു:അഞ്ച് പ്രധാന കോഡ് പേജുകളുടെ പിന്തുണ (വ്യത്യസ്ത പ്രവർത്തനംസിസ്റ്റങ്ങൾ) റഷ്യൻ ഭാഷയ്ക്കായി, തിരയൽ സാങ്കേതികവിദ്യ ഉപയോഗിച്ച്യാതൊരു നിയന്ത്രണങ്ങളും ഇല്ല URL കൂടാതെ പ്രമാണങ്ങളുടെ തീയതി, തിരയൽ നടപ്പിലാക്കൽതലക്കെട്ടുകൾ, അഭിപ്രായങ്ങൾ, ഒപ്പുകൾ എന്നിവ പ്രകാരംചിത്രങ്ങൾ മുതലായവയിലേക്ക്, തിരയൽ പാരാമീറ്ററുകൾ സംരക്ഷിക്കുകയും നിർവചിക്കുകയും ചെയ്യുന്നുമുമ്പത്തെ ഉപയോക്തൃ അഭ്യർത്ഥനകളുടെ എണ്ണം, ലയിപ്പിക്കൽ വ്യത്യസ്ത സെർവറുകളിൽ സ്ഥിതിചെയ്യുന്ന പ്രമാണത്തിന്റെ പകർപ്പുകൾ.

3.ലിസ്റ്റ്. ru ( http://www.list.ru) അതിന്റെ നിർവ്വഹണത്തിൽ, ഈ സെർവറിന് ധാരാളം ഉണ്ട്ഇംഗ്ലീഷ് ഭാഷാ സമ്പ്രദായത്തിൽ സാധാരണമാണ്യാഹൂ!. ഓൺ ഹോം പേജ്സെർവറിൽ ഏറ്റവും ജനപ്രിയമായ തിരയൽ വിഭാഗങ്ങളിലേക്കുള്ള ലിങ്കുകൾ അടങ്ങിയിരിക്കുന്നു.


കാറ്റലോഗിന്റെ പ്രധാന വിഭാഗങ്ങളിലേക്കുള്ള ലിങ്കുകളുടെ ഒരു ലിസ്റ്റ് കേന്ദ്ര ഭാഗം ഉൾക്കൊള്ളുന്നു. ഒരു ചോദ്യത്തിന്റെ ഫലം വ്യക്തിഗത സൈറ്റുകളും വിഭാഗങ്ങളും കണ്ടെത്താൻ കഴിയുന്ന തരത്തിലാണ് കാറ്റലോഗിലെ തിരയൽ നടപ്പിലാക്കുന്നത്. തിരയൽ വിജയകരമാണെങ്കിൽ, URL, ശീർഷകം, വിവരണം, കീവേഡുകൾ. സ്വീകാര്യമായ ഉപയോഗം Yandex അന്വേഷണ ഭാഷ. കൂടെലിങ്ക് "ഘടനകാറ്റലോഗ്" ഒരു പ്രത്യേക വിൻഡോയിൽ മുഴുവൻ കാറ്റ വിഭാഗവും തുറക്കുന്നുലോഗ്. റബ്രിക്കേറ്ററിൽ നിന്ന് തിരഞ്ഞെടുത്ത ഏതെങ്കിലും ഉപവിഭാഗത്തിലേക്ക് മാറാനുള്ള കഴിവ് നടപ്പിലാക്കി. കൂടുതൽ വിശദമായ തീമാറ്റിക് ഡിവിഷൻനിലവിലെ വിഭാഗത്തെ ലിങ്കുകളുടെ ഒരു ലിസ്റ്റ് പ്രതിനിധീകരിക്കുന്നു.കാറ്റലോഗ് ഇതുപോലെ ക്രമീകരിച്ചിരിക്കുന്നു എല്ലാ സൈറ്റുകളിലും അടങ്ങിയിരിക്കുന്ന തരത്തിൽ താഴ്ന്ന നിലകൾസ്ട്രോക്ക്ടൂറുകൾ വിഭാഗങ്ങളിലും അവതരിപ്പിച്ചിരിക്കുന്നു.പ്രദർശിപ്പിച്ചിരിക്കുന്ന വിഭവങ്ങളുടെ ലിസ്റ്റ് അക്ഷരമാലാക്രമത്തിൽ അടുക്കിയിരിക്കുന്നു, എന്നാൽ സമയമനുസരിച്ച് അടുക്കാൻ നിങ്ങൾക്ക് തിരഞ്ഞെടുക്കാംസംക്രമണം വഴി മെനു ചേർക്കുക കാറ്റലോഗിലേക്ക് ചേർക്കുന്നതിനുള്ള ക്രമം, അനുസരിച്ച്കാറ്റലോഗ് സന്ദർശകർക്കിടയിൽ ജനപ്രീതി.

4. Yandex. സോഫ്റ്റ്വെയർ ഉൽപ്പന്നങ്ങൾറഷ്യൻ ഭാഷയുടെ രൂപഘടന കണക്കിലെടുത്ത് പൂർണ്ണ-ടെക്സ്റ്റ് സൂചികയിലാക്കുന്നതിനും ടെക്സ്റ്റ് ഡാറ്റ തിരയുന്നതിനുമുള്ള ഒരു കൂട്ടം ടൂളുകളെ Yandex സീരീസ് പ്രതിനിധീകരിക്കുന്നു. മോർഫോളജിക്കൽ വിശകലനത്തിനും സിന്തസിസിനുമുള്ള മൊഡ്യൂളുകൾ, ഇൻഡെക്‌സിംഗ്, സെർച്ച്, കൂടാതെ ഡോക്യുമെന്റ് അനലൈസർ, മാർക്ക്അപ്പ് ഭാഷകൾ, ഫോർമാറ്റ് കൺവെർട്ടറുകൾ, ഒരു സ്പൈഡർ എന്നിവ പോലുള്ള ഒരു കൂട്ടം ഓക്സിലറി മൊഡ്യൂളുകളും Yandex-ൽ ഉൾപ്പെടുന്നു.

അടിസ്ഥാന നിഘണ്ടു അടിസ്ഥാനമാക്കിയുള്ള മോർഫോളജിക്കൽ വിശകലനത്തിനും സിന്തസിസ് അൽഗോരിതങ്ങൾക്കും വാക്കുകളെ നോർമലൈസ് ചെയ്യാൻ കഴിയും, അതായത്, അവയുടെ പ്രാരംഭ രൂപം കണ്ടെത്തുക, കൂടാതെ അടിസ്ഥാന നിഘണ്ടുവിൽ അടങ്ങിയിട്ടില്ലാത്ത വാക്കുകൾക്കായി അനുമാനങ്ങൾ നിർമ്മിക്കുകയും ചെയ്യുന്നു. സിസ്റ്റം മുഴുവൻ ടെക്സ്റ്റ് സൂചികഒരു കോം‌പാക്റ്റ് ഇൻഡക്‌സ് സൃഷ്‌ടിക്കാനും ലോജിക്കൽ ഓപ്പറേറ്റർമാർ ഉപയോഗിച്ച് വേഗത്തിൽ തിരയാനും നിങ്ങളെ അനുവദിക്കുന്നു.

പ്രാദേശികമായും അകത്തുമുള്ള ടെക്‌സ്‌റ്റുകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നതിനാണ് Yandex രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നത് ആഗോള ശൃംഖല, കൂടാതെ മറ്റ് സിസ്റ്റങ്ങളിലേക്ക് ഒരു മൊഡ്യൂളായി ബന്ധിപ്പിക്കാനും കഴിയും.

ലബോറട്ടറി വർക്ക് നമ്പർ 10.

എന്നതിൽ വിവരങ്ങൾ തിരയുക ഇന്റർനെറ്റ് നെറ്റ്‌വർക്കുകൾ

ജോലിയുടെ ലക്ഷ്യം

പ്രധാന ഇന്റർനെറ്റ് സെർച്ച് എഞ്ചിനുകൾ പരിചയപ്പെടുക. സെർച്ച് എഞ്ചിനുകളിൽ പ്രവർത്തിക്കാനുള്ള കഴിവുകൾ മാസ്റ്റർ ചെയ്യുക. ടാസ്ക്കുകളുടെ പ്രത്യേകതകൾ കണക്കിലെടുത്ത് ഒപ്റ്റിമൽ സെർച്ച് എഞ്ചിൻ തിരഞ്ഞെടുക്കാൻ പഠിക്കുക.

ഉപകരണങ്ങളും മെറ്റീരിയലുകളും

നിങ്ങൾക്ക് ആവശ്യമുള്ള ലബോറട്ടറി ജോലികൾ ചെയ്യാൻ പെഴ്സണൽ കമ്പ്യൂട്ടർഒരു ഓപ്പറേറ്റിംഗ് സിസ്റ്റം പ്രവർത്തിപ്പിക്കുന്നു വിൻഡോസ് കുടുംബം. ഇൻസ്റ്റാൾ ചെയ്യണം ഇന്റർനെറ്റ് പ്രോഗ്രാംഎക്സ്പ്ലോറർ.

ആധുനിക സെർച്ച് എഞ്ചിനുകൾ

ഇൻറർനെറ്റ് വിവരങ്ങളുടെ ഭീമാകാരമായ ഒരു ശേഖരമാണ്. സൈറ്റിന്റെ രചയിതാക്കളുടെ യോഗ്യതകളും വ്യക്തിഗത മുൻഗണനകളും അനുസരിച്ച്, മൂല്യവത്തായതും അത്ര മൂല്യവത്തല്ലാത്തതുമായ നിരവധി പേജുകൾ യാതൊരു ക്രമവുമില്ലാതെ നിലവിലുണ്ട്, അവ ക്രമരഹിതമായ ലിങ്കുകളാൽ മാത്രം പരസ്പരം ബന്ധപ്പെട്ടിരിക്കുന്നു. എന്നിരുന്നാലും, ഉപയോക്താവിന് ഈ വൈവിധ്യം നാവിഗേറ്റ് ചെയ്യുകയും മിനിറ്റുകൾക്കുള്ളിൽ ആവശ്യമായ വിവരങ്ങൾ കണ്ടെത്തുകയും വേണം.

ഇന്റർനെറ്റിൽ ഉണ്ട് ഒരു വലിയ സംഖ്യസെർച്ച് എഞ്ചിനുകൾ. ഏറ്റവും യാഥാസ്ഥിതിക കണക്കുകൾ പ്രകാരം, ക്ലാസിക് ഉൾപ്പെടെ എണ്ണായിരത്തിലധികം അവയുണ്ട് തിരയൽ എഞ്ചിനുകൾ, പൊതുവായതും പ്രത്യേകവുമായ ഡയറക്ടറികൾ, ഒപ്പം മെറ്റാ സെർച്ച് വെബ് സൈറ്റുകൾ(അത് ഒരേസമയം നിരവധി തിരയൽ സെർവറുകളിലേക്ക് അഭ്യർത്ഥനകൾ അയയ്ക്കുന്നു). ഇതുകൂടാതെ, ഒരു സംഖ്യയുണ്ട് ബദൽ മാർഗങ്ങൾനിങ്ങൾക്ക് ഉപയോഗപ്രദമായേക്കാവുന്ന തിരയലുകൾ ഉൾപ്പെടെ ബ്രൗസറുമായി സംയോജിച്ച് പ്രവർത്തിക്കുന്ന, വെബിൽ നിന്ന് വിവരങ്ങൾ വേർതിരിച്ചെടുക്കുന്ന യൂട്ടിലിറ്റികൾ, വിളിക്കപ്പെടുന്നവ "വിദഗ്ധ നോഡുകൾ", യഥാർത്ഥ ആളുകൾ നിങ്ങളുടെ അഭ്യർത്ഥനകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നിടത്ത്. ഇന്റലിജന്റ് സെർച്ച് സിസ്റ്റങ്ങൾ നിലവിൽ വികസിപ്പിച്ചുകൊണ്ടിരിക്കുന്നു. അത്തരമൊരു സിസ്റ്റത്തിന്റെ ഒരു ഉദാഹരണം, ഉദാഹരണത്തിന്, ഒരു ഇന്റലിജന്റ് സെർച്ച് സിസ്റ്റം നിഗ്മ(www.nigma.ru).

സെർച്ച് എഞ്ചിനുകളും ഡയറക്ടറികളും

ഇൻറർനെറ്റിലെ എല്ലാ സമൃദ്ധമായ തിരയൽ രീതികളുമായും, വിവരങ്ങൾ കണ്ടെത്തുന്നതിനുള്ള ഏറ്റവും സാധാരണമായ മാർഗ്ഗങ്ങൾ ഇപ്പോഴും തിരയൽ എഞ്ചിനുകളും കാറ്റലോഗുകളുമാണ്. ഈ ഉപകരണങ്ങളിൽ ഓരോന്നിനും ചില ഗുണങ്ങളുണ്ട്, അവ തമ്മിലുള്ള പ്രധാന വ്യത്യാസം മനുഷ്യ പങ്കാളിത്തം/പങ്കാളിത്തമല്ല.

സെർച്ച് എഞ്ചിനുകൾഇന്റർനെറ്റ് തിരയുന്നതിനുള്ള പ്രത്യേക പ്രോഗ്രാമുകളുടെ ഒരു കൂട്ടമാണ്.

പ്രധാന ഭാഗങ്ങൾ സോഫ്റ്റ്വെയർ പാക്കേജ്:

1. റോബോട്ട് ചിലന്തി(ചിലന്തി). ഇൻഡെക്‌സിംഗിനായി ക്യൂവിലുള്ള സൈറ്റുകളുടെ പേജുകളിലൂടെ ആവർത്തിക്കുന്ന ഒരു ഒറ്റപ്പെട്ട പ്രോഗ്രാം. ഇത് സെർച്ച് സെർവർ ഡിസ്കിലേക്ക് തിരഞ്ഞ പേജുകളിലെ ഉള്ളടക്കങ്ങൾ ഡൗൺലോഡ് ചെയ്യുന്നു.

2. റോബോട്ട് ക്രാളർ("യാത്ര" ചിലന്തി). പരിശോധിക്കുന്ന പേജിലെ എല്ലാ ലിങ്കുകളും ശേഖരിക്കുക, സെർച്ച് എഞ്ചിന് അജ്ഞാതമായ പുതിയവ കണ്ടെത്തുക, ഇൻഡെക്‌സിംഗിനായി കാത്തിരിക്കുന്നവരുടെ പട്ടികയിൽ ചേർക്കുക എന്നിവയാണ് ഇതിന്റെ ചുമതല.

3. സൂചിക.ഇൻഡക്‌സിംഗിനായി ക്യൂവിൽ നിന്നുള്ള പേജുകൾ പ്രോസസ്സ് ചെയ്യുന്നു. ഇത് ചെയ്യുന്നതിന്, അവൻ പേജിന്റെ ഒരു "നിഘണ്ടു" സമാഹരിക്കുകയും ഉപയോഗിച്ച വാക്കുകളുടെ "ആവൃത്തി" ഓർക്കുകയും ചെയ്യുന്നു. വാചകത്തിൽ ഹൈലൈറ്റ് ചെയ്‌തിരിക്കുന്ന തലക്കെട്ടുകളിൽ ഉപയോഗിക്കുന്ന കീവേഡുകൾക്ക് ഊന്നൽ നൽകുന്നു ബോൾഡിൽ. ഇതെല്ലാം ഒരു പ്രത്യേക ഫയലിൽ സ്ഥാപിക്കുന്നു - "സൂചിക".


5. അഭ്യർത്ഥനകൾ പ്രോസസ്സ് ചെയ്യുന്നതിനും ഫലങ്ങൾ നൽകുന്നതിനുമുള്ള സിസ്റ്റം.ഉപയോക്താവിന്റെ അഭ്യർത്ഥന സ്വീകരിക്കുന്നു, ഡാറ്റാബേസിലേക്ക് ഒരു ചോദ്യം സൃഷ്ടിക്കുന്നു, അവിടെ നിന്ന് ഫലം സ്വീകരിച്ച് അത് ഉപയോക്താവിന് കൈമാറുന്നു.

സെർച്ച് എഞ്ചിനുകൾഅവർ വെബിൽ "സ്പൈഡർ" എന്ന സോഫ്റ്റ്‌വെയർ സമാരംഭിക്കുന്നു, അത് പേജിൽ നിന്ന് പേജിലേക്ക് സഞ്ചരിക്കുകയും ഓരോ പേജിന്റെയും മുഴുവൻ വാചകവും സൂചികയിലാക്കുകയും ചെയ്യുന്നു.

മിക്കവാറും എല്ലാ സെർച്ച് എഞ്ചിനുകൾക്കും ഒരേ അന്വേഷണ ഫോമും ഫലങ്ങൾ നൽകുന്നതിന് ഏകദേശം ഒരേ ഫോർമാറ്റും ഉണ്ട് (ഖണ്ഡിക കാണുക " രൂപഭാവം തിരയൽ പേജുകൾ"), എന്നാൽ സെർച്ച് എഞ്ചിനുകളുടെ പ്രവർത്തനം ഗണ്യമായി വ്യത്യാസപ്പെടുന്നു. ഒന്നാമതായി, പ്രസക്തി (ഉപയോക്താവിന്റെ അഭ്യർത്ഥനയുമായി പൊരുത്തപ്പെടുന്ന തിരയൽ ഫലങ്ങൾ), രണ്ടാമതായി, ഡാറ്റാബേസ് അപ്‌ഡേറ്റുകളുടെ വലുപ്പവും ആവൃത്തിയും, മൂന്നാമതായി, ഫലങ്ങൾ നൽകുന്ന വേഗതയും. കൂടാതെ, തീർച്ചയായും, തിരയൽ എഞ്ചിനുകൾ അവയുടെ എളുപ്പത്തിലുള്ള ഉപയോഗത്തിൽ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു.

ഇന്ന്, ഉപയോക്താക്കൾ ധാരാളം സമയം ചെലവഴിക്കുന്ന ഏറ്റവും ജനപ്രിയമായ വെബ് പേജുകളാണ് സെർച്ച് എഞ്ചിനുകൾ. അതിനാൽ, ഒരു തിരയൽ എഞ്ചിൻ തിരഞ്ഞെടുക്കുമ്പോൾ, അവ കൂടുതൽ പ്രാധാന്യമർഹിക്കുന്നു. ബന്ധപ്പെട്ട സേവനങ്ങൾ(മെയിൽ, വാർത്താ ഫീഡുകൾ, ട്രേഡിംഗ് പ്ലാറ്റ്ഫോമുകൾഇത്യാദി.).

കാറ്റലോഗുകൾ- വിവരങ്ങൾ സംഘടിപ്പിക്കുന്നതിനുള്ള ഒരു പരമ്പരാഗത മാർഗം. നാമെല്ലാവരും ലൈബ്രറി കാറ്റലോഗുകളും ഉൽപ്പന്ന കാറ്റലോഗുകളും കണ്ടിട്ടുണ്ടാകും. വിവിധ സംവിധാനങ്ങളിൽ ഡയറക്ടറികൾ ഉപയോഗിക്കുന്നു. നിങ്ങൾ വിവരങ്ങൾ സംഭരിക്കുകയും ഓർഗനൈസുചെയ്യുകയും ചെയ്യേണ്ട ഏതാണ്ട് എവിടെയും.

സാധാരണ ഉപയോക്താവിന് സ്വാഭാവികവും അവബോധജന്യവുമായ വിഭാഗങ്ങൾ സൃഷ്ടിക്കുക എന്നതാണ് കാറ്റലോഗ് കംപൈലറുകൾ നേരിടുന്ന പ്രധാന വെല്ലുവിളികളിൽ ഒന്ന്. നിർഭാഗ്യവശാൽ, ഈ ചുമതലഏകദേശത്തിന്റെ വ്യത്യസ്ത അളവുകൾ ഉപയോഗിച്ച് മാത്രമേ പരിഹരിക്കാൻ കഴിയൂ. ലോകം തുടർച്ചയായതാണ്, അതിൽ കർശനമായ അതിരുകളില്ല. ഒരേ സൈറ്റ് വ്യത്യസ്ത കോണുകളിൽ നിന്ന് കാണാനും അതിന്റെ വ്യത്യസ്ത പ്രവർത്തനങ്ങൾ കാണാനും കഴിയും. പേജുകൾ വായിക്കുകയും അനുചിതമായവ ഒഴിവാക്കുകയും വിഷയമനുസരിച്ച് നോഡുകൾ തരംതിരിക്കുകയും ചെയ്യുന്ന ഹ്യൂമൻ എഡിറ്റർമാരാണ് ഡയറക്‌ടറികൾ സമാഹരിക്കുന്നത്.

കാറ്റലോഗുകളുടെ പോരായ്മകളിൽ ഇനിപ്പറയുന്നവ ഉൾപ്പെടുന്നു.

ഒന്നാമതായി, ഘടനയുടെ അവ്യക്തത വിവരങ്ങളുടെ കാറ്റലോഗ് ഓർഗനൈസേഷന്റെ വ്യക്തമായ പോരായ്മയാണ് (എല്ലാ പ്രധാന കാറ്റലോഗിനും ഒരു കാറ്റലോഗ് തിരയൽ ഉള്ളതിനാൽ ഇത് ഒരു പരിധിവരെ ലഘൂകരിക്കപ്പെട്ടിട്ടുണ്ടെങ്കിലും).

രണ്ടാമതായി, കാറ്റലോഗുകൾ നിർമ്മിക്കുന്നത് ആളുകളാണ്. അവരുടെ സമ്പൂർണ്ണതയും ഗുണനിലവാരവും കാറ്റലോഗിൽ പ്രവർത്തിക്കുന്ന ആളുകളുടെ എണ്ണവും യോഗ്യതയും, അവരുടെ വ്യക്തിപരമായ അഭിരുചികളും മുൻഗണനകളും ആശ്രയിച്ചിരിക്കുന്നു. തലക്കെട്ടുകളുടെ ഉള്ളടക്കത്തിന്റെ അസമത്വം എല്ലാ കാറ്റലോഗുകളുടെയും സ്വഭാവ സവിശേഷതയാണ്.

മൂന്നാമതായി, മാനുവൽ വർഗ്ഗീകരണത്തിന്റെ അധ്വാനം കാറ്റലോഗ് ചെയ്ത വിവരങ്ങളുടെ അളവ് പരിമിതപ്പെടുത്തുന്നു.

അതേ സമയം, കാറ്റലോഗുകളുടെ നിസ്സംശയമായ ഗുണങ്ങൾ, അതിലെ വിവരങ്ങൾ പ്രാഥമിക മാനുഷിക യുക്തിക്ക് അനുസൃതമായി ക്രമമായ രീതിയിൽ സംഭരിച്ചിരിക്കുന്നു എന്നതാണ്. പ്രസക്തിഒരു കാറ്റലോഗിൽ തിരയുമ്പോൾ കണ്ടെത്തുന്ന പേജുകളുടെ എണ്ണം സാധാരണയായി സെർച്ച് എഞ്ചിനുകൾ ഉപയോഗിച്ച് തിരയുന്നതിനേക്കാൾ ഉയർന്ന അളവിലുള്ള ക്രമമാണ്.

മുകളിൽ സൂചിപ്പിച്ചതുപോലെ, ഡയറക്‌ടറികൾ സ്വമേധയാ സൃഷ്‌ടിച്ചതിനാൽ, അവ സെർച്ച് എഞ്ചിനുകളേക്കാൾ വളരെ കുറച്ച് ഉറവിടങ്ങൾ ഉൾക്കൊള്ളുന്നു. ഇപ്പോൾ, യാഥാസ്ഥിതിക കണക്കുകൾ പ്രകാരം, വെബിൽ ഒരു ബില്യൺ പേജുകൾ ഉണ്ട് (അവരുടെ എണ്ണം ഓരോ ദിവസവും ഒരു ദശലക്ഷം വർദ്ധിക്കുന്നു). മിക്ക സെർച്ച് എഞ്ചിനുകളും വെബിനെ മുഴുവൻ സൂചികയിലാക്കുന്നതിന് അടുത്തെങ്ങും എത്തിയിട്ടില്ല. ഒരു അപവാദം Google ആണ് (റഷ്യയ്ക്ക് www.google.ru), ഇത് കൃത്യമായി ഈ കണക്ക് അവകാശപ്പെടുന്നു - ഒരു ബില്യൺ പേജുകൾ, അതിന്റെ സൂചികകൾ ഭാഗികമായോ പൂർണ്ണമായോ ഉൾക്കൊള്ളുന്നു. ഏറ്റവും വലിയ കാറ്റലോഗ് - ഓപ്പൺ ഡയറക്ടറി പ്രോജക്റ്റ് (www.dmoz.org) - ഈ പശ്ചാത്തലത്തിൽ ചെറുതായി തോന്നുന്നു: ഏകദേശം 2 ദശലക്ഷം പേജുകൾ മാത്രമേ അതിൽ പട്ടികപ്പെടുത്തിയിട്ടുള്ളൂ.

1994 ൽ, ദ്രുതഗതിയിലുള്ള വളർച്ച ആരംഭിച്ചപ്പോൾ" വേൾഡ് വൈഡ് വെബ്", വെബ് സെർച്ച് ടൂളുകളുടെ തിരഞ്ഞെടുപ്പ് വളരെ പരിമിതമായിരുന്നു: Yahoo (www.yahoo.com). ഈ സെർവർ ഇന്നും വെബ് ഗവേഷണത്തിന്റെ ആണിക്കല്ലായി തുടരുന്നു, എന്നാൽ ഒരു ഡയറക്ടറി എന്ന നിലയിൽ ഇത് ഇപ്പോൾ ഓപ്പൺ ഡയറക്‌ടറി പ്രോജക്‌റ്റിൽ നിന്ന് കടുത്ത മത്സരത്തെ അഭിമുഖീകരിക്കുന്നു.

പല ഡയറക്ടറികളും വളരെ ഉപയോഗപ്രദമാണ്, എന്നാൽ എല്ലാം പരിഗണിക്കുമ്പോൾ, ഓപ്പൺ ഡയറക്‌ടറി പ്രോജക്‌റ്റ് തിരഞ്ഞെടുക്കുന്നതാണ്. പ്രോജക്റ്റ് ഓപ്പൺനെറ്റ്‌സ്‌കേപ്പ് ആരംഭിച്ച ഡയറക്‌ടറി പ്രോജക്‌റ്റ്, ലോകമെമ്പാടുമുള്ള 24,000-ലധികം വോളണ്ടിയർ എഡിറ്റർമാരാണ് നടത്തുന്നത്, അവർ ഏകദേശം 2 ദശലക്ഷം നോഡുകൾ സൂചികയിലാക്കി 200,000-ലധികം വിഭാഗങ്ങളായി തരംതിരിച്ചിട്ടുണ്ട്. ഏത് സെർച്ച് സെർവറിനും ലഭിക്കും ഓപ്പൺ ലൈസൻസ്ഡയറക്ടറി പ്രോജക്റ്റ്, അഭ്യർത്ഥനകൾ പ്രോസസ്സ് ചെയ്യുമ്പോൾ അതിന്റെ ഡാറ്റാബേസ് ഉപയോഗിക്കുക, ഇത് പലതിലും ചെയ്തു: AltaVista (www.altavista.com), HotBot (www.hotbot.com), Lycos (www.lycos.co.uk) കൂടാതെ നൂറോളം മറ്റ് സെർവറുകൾ ലിങ്കുകൾക്കായി അവിടെ മുങ്ങുന്നു.

ഒരാൾ അത് പ്രതീക്ഷിക്കും, മുതൽ ഡയറക്ടറി തുറക്കുകഡയറക്‌ടറി പ്രോജക്‌റ്റ് നടത്തുന്നത് സന്നദ്ധപ്രവർത്തകരാണ്, ഫലങ്ങളുടെ ഗുണനിലവാരം വ്യത്യസ്തമായിരിക്കും. എന്നാൽ ഓരോ ലിങ്കിന്റെയും വ്യക്തമായ വിവരണങ്ങളുള്ള അനുബന്ധ പേജുകളുടെ നന്നായി ചിട്ടപ്പെടുത്തിയ ലിസ്റ്റുകളാണ് ഫലം. ഓപ്പൺ ഡയറക്‌ടറി പ്രോജക്‌റ്റ് സൈറ്റിന് Google-ന്റെ അതേ വികാരമുണ്ട്: ഇത് സ്റ്റോറുകളിലേക്കുള്ള ലിങ്കുകൾ പോലെയുള്ള ശ്രദ്ധ വ്യതിചലിക്കാതെ "ശുദ്ധമായ തിരയൽ" ആണ്.

നിങ്ങൾ തിരഞ്ഞെടുക്കുന്ന ഡയറക്‌ടറി ഏതായാലും, അവയ്‌ക്കെല്ലാം സെർച്ച് എഞ്ചിനുകളേക്കാൾ ഒരു നേട്ടമുണ്ട്: അവ ഒരു ശ്രേണിപരമായ മെനു സിസ്റ്റം ഉപയോഗിച്ച് വ്യവസ്ഥാപിതമായി ബ്രൗസ് ചെയ്യാൻ കഴിയും.

വർഗ്ഗീകരണം

തിരയൽ ഏരിയ പ്രകാരം (സോപാധികമായി)

പ്രാദേശിക

ഏത് ഭാഗത്തും വിവരങ്ങൾ തിരയാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു ലോകമെമ്പാടുമുള്ള നെറ്റ്‌വർക്ക്, ഉദാഹരണത്തിന്, ഒന്നോ അതിലധികമോ സൈറ്റുകളിലൂടെയോ ഒരു പ്രാദേശിക നെറ്റ്‌വർക്കിലൂടെയോ.

ആഗോള

മുഴുവൻ ഇൻറർനെറ്റിലും അല്ലെങ്കിൽ അതിന്റെ ഒരു പ്രധാന ഭാഗത്തിലും വിവരങ്ങൾ തിരയാൻ രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്നു. അത്തരം സെർച്ച് എഞ്ചിനുകളുടെ പ്രതിനിധികൾ തിരയൽ എഞ്ചിനുകൾ Google, Yandex മുതലായവയാണ്. സെർച്ച് എഞ്ചിനുകൾ വിവരങ്ങൾക്കായി തിരയുന്നു വിവിധ തരം, ഉദാഹരണത്തിന്, ടെക്‌സ്‌റ്റുകൾ, വീഡിയോകൾ, ഇമേജുകൾ, ഭൂമിശാസ്ത്രപരമായ ഒബ്‌ജക്‌റ്റുകൾ, വ്യക്തിഗത ഡാറ്റ മുതലായവ. ഈ സാഹചര്യത്തിൽ, ഒരു തിരയൽ എഞ്ചിന് പ്രവർത്തിക്കാൻ കഴിയുന്ന ഫയലുകൾ ടെക്‌സ്‌റ്റ് ഫോർമാറ്റിൽ ആകാം (ഉദാഹരണത്തിന്, .html, .htm, .txt, . doc, .rtf...) , കൂടാതെ ഗ്രാഫിക് (.gif, .png, .svg...) അല്ലെങ്കിൽ മൾട്ടിമീഡിയ (വീഡിയോയും ശബ്ദവും). ഇതുവരെ, ഏറ്റവും സാധാരണമായത് ടെക്സ്റ്റ് ഡോക്യുമെന്റുകളിലൂടെ തിരയുക എന്നതാണ്.

തിരയൽ അന്വേഷണം

തിരച്ചിലിനുള്ള പ്രാഥമിക വിവരം തിരയൽ അന്വേഷണമാണ്.

പ്രവർത്തനങ്ങൾ

തിരയൽ എഞ്ചിനുകൾ നിരവധി പ്രവർത്തനങ്ങൾ ചെയ്യുന്നു:

ലിങ്കുകൾക്കായി തിരയുക

പേജുകളിലേക്കും മറ്റ് സൈറ്റ് പ്രമാണങ്ങളിലേക്കുമുള്ള ലിങ്കുകൾക്കായി തിരയുക.

ഓട്ടോ

മാനുവൽ മോഡ്

സെർച്ച് എഞ്ചിൻ ഡാറ്റാബേസിലേക്ക് ഉപയോക്താക്കൾ തന്നെ അവരുടെ സൈറ്റുകളുടെ പേജുകളിലേക്കുള്ള ലിങ്കുകൾ ചേർക്കുന്നു

വെബ്‌സൈറ്റ് പ്രമാണങ്ങൾ സൂചികയിലാക്കുന്നു

പ്രമാണങ്ങളിൽ നിന്ന് തിരയലുമായി ബന്ധപ്പെട്ട വിവരങ്ങൾ എക്‌സ്‌ട്രാക്‌റ്റുചെയ്യുക, ആ വിവരങ്ങൾ ഒരു തിരയൽ എഞ്ചിൻ-സൗഹൃദ ഫോർമാറ്റിലേക്ക് പരിവർത്തനം ചെയ്യുക, ആ വിവരങ്ങൾ ഒരു തിരയൽ എഞ്ചിൻ ഡാറ്റാബേസിൽ സംഭരിക്കുക

ഇൻഡെക്‌സ് ചെയ്‌ത പ്രമാണങ്ങളുടെ ഡാറ്റാബേസ് തിരയുക

നിരവധി ഘട്ടങ്ങൾ അടങ്ങിയിരിക്കാം

ഒരു തിരയൽ അന്വേഷണവുമായി പൊരുത്തപ്പെടുന്ന പ്രമാണങ്ങൾ കണ്ടെത്തുന്നു

തിരയൽ അന്വേഷണങ്ങളുടെ പ്രസക്തി അനുസരിച്ച് രേഖകളുടെ റാങ്കിംഗ്

ഡോക്യുമെന്റ് ക്ലസ്റ്ററിംഗ്

കുറിപ്പുകൾ

ഇതും കാണുക


വിക്കിമീഡിയ ഫൗണ്ടേഷൻ. 2010.

മറ്റ് നിഘണ്ടുവുകളിൽ "സെർച്ച് എഞ്ചിൻ" എന്താണെന്ന് കാണുക:

    തിരയല് യന്ത്രം- (സെർച്ചിംഗ് എഞ്ചിൻ): വെബ് പേജുകൾ ഇൻഡെക്സ് ചെയ്യുന്ന ഒരു വെബ് സെർവർ ലഭ്യമായ സെർവറുകൾ(ഉദാഹരണത്തിന്, Yandex)... ഉറവിടം: ഇന്റർനെറ്റ് റിസോഴ്സസ്. കാഴ്ച വൈകല്യമുള്ളവർക്കുള്ള പ്രവേശന ആവശ്യകതകൾ. GOST R 52872 2007 (ഓർഡർ ഓഫ് റോസ്റ്റെഖ്രെഗുലിറോവാനിയ തീയതി പ്രകാരം അംഗീകരിച്ചത്... ... ഔദ്യോഗിക പദാവലി

    തിരയല് യന്ത്രം- ലഭ്യമായ സെർവറുകളിൽ വെബ് പേജുകൾ ഇൻഡെക്സ് ചെയ്യുന്ന വെബ് സെർവർ (ഉദാഹരണത്തിന്, Yandex). [GOST R 52872 2007] വിഷയങ്ങൾ വിവരസാങ്കേതികവിദ്യപൊതുവെ EN സെർച്ചിംഗ് എഞ്ചിൻ... സാങ്കേതിക വിവർത്തകന്റെ ഗൈഡ്

    ഇന്റർനെറ്റിൽ പ്രത്യേക വെബ്ഒരു ഉപയോക്താവിന്, നൽകിയിരിക്കുന്ന അഭ്യർത്ഥന പ്രകാരം, ഈ അഭ്യർത്ഥനയുമായി പൊരുത്തപ്പെടുന്ന സൈറ്റുകളിലേക്കുള്ള ലിങ്കുകൾ സ്വീകരിക്കാൻ കഴിയുന്ന ഒരു സൈറ്റ്. തിരയൽ സംവിധാനത്തിൽ മൂന്ന് ഘടകങ്ങൾ അടങ്ങിയിരിക്കുന്നു: 1 തിരയൽ റോബോട്ട്; 2 സിസ്റ്റം സൂചികകൾ; കൂടാതെ 3 പ്രോഗ്രാമുകളും,...... സാമ്പത്തിക നിഘണ്ടു

    ഇന്റർനെറ്റിൽ, ഒരു സെർച്ച് എഞ്ചിൻ: നിരവധി സെർച്ച് എഞ്ചിനുകളിലേക്ക് ഒരു തിരയൽ അഭ്യർത്ഥന അയയ്ക്കുന്നു; കൂടാതെ ലഭിച്ച പ്രതികരണങ്ങളിൽ നിന്ന് ഒരു സംഗ്രഹം (ഒരു പേജിൽ) സൃഷ്ടിക്കുന്നു. ഇംഗ്ലീഷിൽ: മെറ്റാ സെർച്ച് എഞ്ചിൻ പര്യായങ്ങൾ: മെറ്റാ കാറ്റർപില്ലർ ഇംഗ്ലീഷ് പര്യായങ്ങൾ: മെറ്റാക്രാളർ... ... സാമ്പത്തിക നിഘണ്ടു

    ഈ ലേഖനം പൂർണ്ണമായും മാറ്റിയെഴുതേണ്ടതുണ്ട്. സംവാദം താളിൽ വിശദീകരണങ്ങളുണ്ടാകാം. സെർച്ച് എഞ്ചിൻ സോഫ്‌റ്റ്‌വെയറും ഹാർഡ്‌വെയർ കോംപ്ലക്‌സും വെബ് ഇന്റർഫേസുള്ളതും... വിക്കിപീഡിയ

    തിരയൽ സംവിധാനം- – (ഇംഗ്ലീഷ് സെർച്ച് എഞ്ചിൻ, പര്യായങ്ങൾ: സെർച്ച് എഞ്ചിൻ, സെർച്ച് എഞ്ചിൻ, സെർച്ച് എഞ്ചിൻ) - ഇന്റർനെറ്റിൽ വിവരങ്ങൾ തിരയുന്നതിനുള്ള ഒരു ഉപകരണം. ചട്ടം പോലെ, ഒരു തിരയൽ എഞ്ചിന്റെ പ്രവർത്തനം രണ്ട് ഘട്ടങ്ങൾ ഉൾക്കൊള്ളുന്നു. പ്രത്യേക പ്രോഗ്രാം (സെർച്ച് റോബോട്ട്, മെഷീൻ, ഏജന്റ്,... ... എൻസൈക്ലോപീഡിക് ഡിക്ഷണറി ഓഫ് മീഡിയ - ഇന്റർനെറ്റിൽ വിവരങ്ങൾക്കായി തിരയാനുള്ള കഴിവ് നൽകുന്ന ഒരു വെബ്‌സൈറ്റാണ് സെർച്ച് എഞ്ചിൻ. മിക്ക സെർച്ച് എഞ്ചിനുകളും വേൾഡ് വൈഡ് വെബ്‌സൈറ്റുകളിൽ വിവരങ്ങൾക്കായി തിരയുന്നു, എന്നാൽ ഫയലുകൾക്കായി തിരയാൻ കഴിയുന്ന സംവിധാനങ്ങളുമുണ്ട്. ftp സെർവറുകൾ, സാധനങ്ങൾ... ... വിക്കിപീഡിയ

പുസ്തകങ്ങൾ

  • ഇന്റർനെറ്റിൽ പ്രത്യേകതകൾക്കായി തിരയുന്നതിന്റെ ഫലപ്രാപ്തിയെക്കുറിച്ചുള്ള വിഷയത്തിൽ, I. A. സെമെനോവ്. ബെർക്ക്‌ലി ഗവേഷണമനുസരിച്ച്, 2003-ലെ ഇൻറർനെറ്റിലെ വിവരങ്ങളുടെ അളവ് 258.85 ടെറാബൈറ്റുകളായി കണക്കാക്കപ്പെട്ടിരുന്നു, ഇത് പൊതുവായി ലഭ്യമായ ഡാറ്റ മാത്രമാണ്. എഴുതിയത് ഇന്റർനെറ്റ് ഡാറ്റലോക സ്ഥിതിവിവരക്കണക്കുകൾ, വളർച്ച... ഇബുക്ക്

ഇൻറർനെറ്റിൽ വിവരങ്ങൾക്കായി തിരയുന്നത് ഇന്റർനെറ്റിലെ ഏറ്റവും ജനപ്രിയമായ പ്രവർത്തനങ്ങളിലൊന്നാണ്. ഇന്റർനെറ്റ് സന്ദർശകർക്ക് പലപ്പോഴും ഒരു പ്രത്യേക വിഷയത്തിൽ പ്രമാണങ്ങൾ തിരയേണ്ടി വരും. നിങ്ങൾക്ക് ഇന്റർനെറ്റിൽ പ്രമാണത്തിന്റെ കൃത്യമായ വിലാസം ഉണ്ടെങ്കിൽ, ഈ സാഹചര്യത്തിൽ തിരയുന്നതിൽ പ്രശ്നങ്ങളൊന്നുമില്ല: ബ്രൗസറിൽ വിലാസ ബാർനിങ്ങൾക്ക് അറിയാവുന്ന ഒരു ഉറവിട വിലാസം ഡയൽ ചെയ്യാം, എപ്പോൾ വിജയകരമായ കണക്ഷൻബ്രൗസർ ആവശ്യമുള്ള പേജ് പ്രദർശിപ്പിക്കും.

പ്രമാണത്തിന്റെ കൃത്യമായ വിലാസം ലഭ്യമല്ലെങ്കിൽ, നിങ്ങൾക്ക് ഒരു തിരയൽ എഞ്ചിന്റെ സേവനങ്ങൾ ഉപയോഗിക്കാം. തിരയല് യന്ത്രം? അത് "ഇന്റർനെറ്റിലെ ഒരു പ്രത്യേക സെർവറാണ്, അത് വിവിധ ഡോക്യുമെന്റ് സെർച്ച് സൗകര്യങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു." ഒരു തിരയൽ സെർവറിന്റെ ഒരു ഉദാഹരണം http://rambler.ru എന്നതിൽ സ്ഥിതിചെയ്യുന്ന റാംബ്ലർ സെർവർ (Rambler.ru) ആണ്. സെർവറിന്റെ പ്രധാന പേജിന്റെ കാഴ്ച ചിത്രത്തിൽ കാണിച്ചിരിക്കുന്നു.

അരി. 1.

തിരയൽ സെർവറുകൾ സാധാരണയായി ഇന്റർനെറ്റ് ഉറവിടങ്ങളുടെ സ്വന്തം ഡയറക്ടറികൾ സൃഷ്ടിക്കുന്നു. സെർച്ച് റോബോട്ടുകളിൽ നിന്നുള്ള നെറ്റ്‌വർക്കിൽ സൃഷ്‌ടിച്ച ഉറവിടങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾ ഉപയോഗിച്ച് തിരയൽ സെർവർ കാറ്റലോഗുകൾ പതിവായി അപ്‌ഡേറ്റുചെയ്യുന്നു. സെർച്ച് റോബോട്ടുകൾ അല്ലെങ്കിൽ സ്പൈഡറുകൾ ലഭ്യമായവ ആക്സസ് ചെയ്യുന്ന പ്രത്യേക നെറ്റ്‌വർക്ക് പ്രോഗ്രാമുകളാണ് ഈ നിമിഷംഇന്റർനെറ്റ് സെർവറുകൾ, പ്രമാണങ്ങൾ വിശകലനം ചെയ്യുക, അവരുടെ തിരയൽ എഞ്ചിന്റെ പട്ടികകൾ പൂരിപ്പിക്കുക. തിരയൽ റോബോട്ടുകൾ ഉറവിടങ്ങൾ തിരയുന്നതിനും വ്യവസ്ഥാപിതമാക്കുന്നതിനുമുള്ള ജോലി ചെയ്യുന്നു പശ്ചാത്തലംസമയം മുഴുവൻ.

വരുമാനത്തിന്റെ മറ്റൊരു സ്രോതസ്സ് സെർവറുകൾ തിരയുകനിലവിലുള്ള സൈറ്റുകളെക്കുറിച്ചുള്ള വിവരങ്ങൾ - വെബ് പേജുകളുടെ ഉടമകൾ ഉറവിടങ്ങളുടെ വ്യക്തമായ രജിസ്ട്രേഷൻ. റിസോഴ്സ് ഉടമകൾ പൂരിപ്പിക്കുന്ന ഫോമുകൾ സെർവറിനുണ്ട്. ഫോം ഉറവിട വിലാസം, ഹ്രസ്വ വിവരണം, കീവേഡുകൾ, ടാർഗെറ്റ് പ്രേക്ഷകർ മുതലായവ വ്യക്തമാക്കുന്നു. ഈ വിവരങ്ങൾ സ്വയമേവ വിശകലനം ചെയ്യുകയും സെർവർ ഡയറക്‌ടറികളിലേക്ക് ചേർക്കുകയും ചെയ്യുന്നു പ്രത്യേക പരിപാടികൾഅല്ലെങ്കിൽ വിദഗ്ദ്ധർ "സ്വമേധയാ" - സ്പെഷ്യലിസ്റ്റുകൾ റിസോഴ്സ് കാറ്റലോഗുകളുടെ രൂപീകരണം നിരീക്ഷിക്കുന്നു.

ഇന്റർനെറ്റിൽ വിവരങ്ങൾ തിരയുന്നതിനുള്ള സംവിധാനങ്ങൾ മനസ്സിലാക്കുന്നത് വെബ് പേജ് ഡെവലപ്പർമാർക്ക് അവരുടെ പ്രമാണങ്ങൾ തയ്യാറാക്കാൻ അനുവദിക്കുന്നു, അതുവഴി അവ പിന്നീട് സെർച്ച് എഞ്ചിനുകൾക്ക് കണ്ടെത്താനും റിസോഴ്സ് ഡയറക്ടറിയുടെ ഉചിതമായ വിഭാഗങ്ങളിൽ സ്ഥാപിക്കാനും കഴിയും.

ഇന്റർനെറ്റിൽ കീവേഡുകൾ ഉപയോഗിച്ച് തിരയുക

ഡോക്യുമെന്റുകൾക്കായി തിരയുന്നതിനുള്ള ജനപ്രിയ മാർഗങ്ങളിലൊന്ന് WWW നെറ്റ്‌വർക്കുകൾ-- കീവേഡുകൾ ഉപയോഗിച്ച് തിരയുക. നിങ്ങൾ തിരയൽ ഫോമിൽ കീവേഡുകൾ വ്യക്തമാക്കുമ്പോൾ, നിർദ്ദിഷ്ട കീവേഡുകൾ അടങ്ങിയ പ്രമാണങ്ങൾക്കായി തിരയൽ എഞ്ചിൻ തിരയും. തീർച്ചയായും, ഒരു ചോദ്യം നിറവേറ്റുന്നതിന്, ഒരു തിരയൽ എഞ്ചിൻ ഇന്റർനെറ്റിൽ പ്രവർത്തിക്കുന്ന ആയിരക്കണക്കിന് കമ്പ്യൂട്ടറുകളുടെ ഉള്ളടക്കം തിരയുകയില്ല - അത്തരമൊരു തിരയലിന്റെ ഫലത്തിനായി നിങ്ങൾ നിരവധി ദിവസം കാത്തിരിക്കേണ്ടിവരും. റോബോട്ടുകളുടെയും വിദഗ്ധരുടെയും സഹായത്തോടെ മുമ്പ് ശേഖരിക്കുകയും ചിട്ടപ്പെടുത്തുകയും ചെയ്ത സെർച്ച് എഞ്ചിന്റെ വിഭവങ്ങൾ (കാറ്റലോഗുകൾ, പട്ടികകൾ) ഇടയിലാണ് തിരയൽ നടത്തുന്നത്.

നെറ്റ്‌വർക്ക് ഉറവിടങ്ങളുടെ അളവ് യഥാർത്ഥത്തിൽ പരിധിയില്ലാത്തതാകുന്നതിനാൽ, ഒരു കീവേഡ് ഉപയോഗിച്ച് ഒരു ഡോക്യുമെന്റിനായി തിരയാനുള്ള അഭ്യർത്ഥനയിൽ, ഒരു സെർച്ച് എഞ്ചിന് നിർദ്ദിഷ്ട കീവേഡ് അടങ്ങിയ ആയിരക്കണക്കിന് പ്രമാണങ്ങൾ കണ്ടെത്താൻ കഴിയും. നിരവധി രേഖകൾ ഉള്ളതിനാൽ തന്നിരിക്കുന്ന വിഷയവുമായി ഏറ്റവും അനുയോജ്യമായത് കണ്ടെത്തുന്നത് ബുദ്ധിമുട്ടാണെന്ന് വ്യക്തമാണ്. എന്നിരുന്നാലും, സെർച്ച് എഞ്ചിനുകൾ സാധാരണയായി കൂടുതൽ വിശദമായ അന്വേഷണം രൂപപ്പെടുത്താനുള്ള അവസരം നൽകുന്നു.

ചോദ്യത്തിന് സങ്കീർണ്ണമായ ഒരു രൂപമുണ്ടാവുകയും കീവേഡുകളും ലോജിക്കൽ ഫംഗ്‌ഷനുകളും AND (AND), OR (OR), നെഗേഷൻ (NOT) എന്നിവ ഉപയോഗിച്ച് രചിക്കുകയും ചെയ്യാം. അല്ലെങ്കിൽ ഉപയോഗിച്ച് തിരയൽ അഭ്യർത്ഥന സൃഷ്ടിക്കാൻ കഴിയും പ്രത്യേക കഥാപാത്രങ്ങൾ, കീവേഡുകളുടെ പദ രൂപങ്ങൾ സജ്ജീകരിക്കാൻ (അല്ലെങ്കിൽ റദ്ദാക്കാൻ) നിങ്ങളെ അനുവദിക്കുന്നു. പ്രമാണങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിനുള്ള ആവശ്യകതകൾ കൂടുതൽ കൃത്യമായി രൂപപ്പെടുത്തുന്നതിന് അത്തരം സംവിധാനങ്ങൾ സഹായിക്കുന്നു. എല്ലാ സെർച്ച് എഞ്ചിനും ഉണ്ട് സഹായ സംവിധാനം, ഇത് സന്ദർശകനെ രചിക്കാൻ സഹായിക്കും തിരയൽ അന്വേഷണം.

സെർച്ച് എഞ്ചിനുകളിൽ നിന്ന് ഒരു സൈറ്റിൽ എത്തുന്ന ഉപയോക്താക്കൾ ട്രാഫിക്കിന്റെ നാൽപ്പത് ശതമാനം വരെ നൽകുന്നുവെന്ന് അറിയാം. അതിനാൽ, നിങ്ങളുടെ സൈറ്റിന്റെ ശരിയായ ഇൻഡക്‌സിംഗ് ശ്രദ്ധിക്കുക സെർച്ച് എഞ്ചിനുകൾവളരെ ഉപയോഗപ്രദം. "ശരിയായ ഇൻഡക്‌സിംഗ്" എന്നതുകൊണ്ട് ഞാൻ അർത്ഥമാക്കുന്നത്, അന്വേഷണത്തിന്റെ പ്രസക്തിയും സൈറ്റിന്റെ ഉള്ളടക്കവും മാനിക്കപ്പെടണം എന്നാണ്, അതായത്, ലളിതവും ആക്സസ് ചെയ്യാവുന്ന ഭാഷ, സൈറ്റിന്റെ ഉള്ളടക്കം അഭ്യർത്ഥനയുമായി പൊരുത്തപ്പെടണം (യാഥാർത്ഥ്യവുമായി പൊരുത്തപ്പെടാത്ത കീവേഡുകളുടെ ചില "മാസ്റ്റേഴ്സ്" ദുരുപയോഗം സെറ്റുകൾ. ഉദാഹരണത്തിന്, വെബ് പേജുകളുടെ ആദ്യ തലങ്ങളുടെ പ്രാദേശിക പകർപ്പുകളുള്ള ഒരു സിഡി റിലീസ് ചെയ്യാൻ എന്റെ സഹോദരി തയ്യാറെടുക്കുമ്പോൾ, "x#y" എന്ന വാക്കും അതുപോലുള്ള മറ്റുള്ളവയും സെർവറുകളിൽ വളരെ ഉയർന്നു പ്രശസ്തമായ കമ്പനികൾ, ഇത്തരത്തിലുള്ള പദാവലിയുമായി പൊതുവായി ഒന്നുമില്ല :-).

  • അൽതാവിസ്റ്റ
  • കണ്ടെത്തുക-തിരയൽ
  • മീഡിയലിംഗുവ
  • റാംബ്ലർ
  • RusInfOil
  • റഷ്യൻ എക്സ്പ്രസ്
  • ബോഡി-സെർച്ച്
  • HotBot
  • Yandex

എന്തുകൊണ്ടാണ് ഞാൻ ഈ പ്രത്യേക സെർച്ച് എഞ്ചിനുകൾ ലിസ്റ്റ് ചെയ്തത്? കാരണം, എന്റെ നിരീക്ഷണങ്ങൾ അനുസരിച്ച്, റഷ്യൻ സംസാരിക്കുന്ന നെറ്റിസൺസ് ഉപയോഗിക്കുന്നത് ഇവയാണ്. എന്താണ് "എന്റെ നിരീക്ഷണങ്ങൾ"? ഇത് എന്റെ സെർവറിലേക്കുള്ള ആക്സസ് ലോഗുകളുടെ വിശകലനമാണ് http://citforum.ru/, കൂടുതൽ കൃത്യമായി പറഞ്ഞാൽ ഒന്ന് HTTP_REFERER-നെക്കുറിച്ചുള്ള വിവരങ്ങൾ ശേഖരിക്കുന്ന ലോഗുകളുടെ ഭാഗങ്ങൾ, അതായത്. എന്റെ സെർവറിലെ ഏത് പേജിലേക്കും ക്ലയന്റുകൾ ഒരു ലിങ്ക് ഉപയോഗിച്ച വിലാസങ്ങൾ (URL-കൾ).

പ്രായോഗികമായി ഞാൻ ലിസ്‌റ്റ് ചെയ്‌ത മെഷീനുകളുടെ റേറ്റിംഗ് എന്താണ്, ഏതൊക്കെ മെഷീനുകളാണ് കൂടുതൽ ഉപയോഗിക്കുന്നത്, ഏതാണ് കുറവ്?

ബാക്കിയുള്ളവരിൽ നിന്ന് വൻ മാർജിനിൽ അൽതാവിസ്റ്റയാണ് ഒന്നാം സ്ഥാനത്ത്. വിവിധ ഭാഷകളിൽ (റഷ്യൻ ഭാഷാ രേഖകൾ ഉൾപ്പെടെ) തിരച്ചിൽ പ്രത്യക്ഷപ്പെടുന്നതിന് മുമ്പുതന്നെ ഈ തിരയൽ എഞ്ചിൻ മുന്നിലായിരുന്നു. ശരി, ഇത് മനസ്സിലാക്കാവുന്നതേയുള്ളൂ - ഒരു മികച്ച, എളുപ്പത്തിൽ ആക്സസ് ചെയ്യാവുന്ന സെർവർ, വളരെക്കാലമായി പ്രവർത്തിക്കുന്നു (1996 ന്റെ തുടക്കം മുതൽ), വലിയ അടിത്തറപ്രമാണങ്ങൾ (50 ദശലക്ഷത്തിലധികം വിലാസങ്ങൾ). റഷ്യൻ സംസാരിക്കുന്ന ഉപയോക്താക്കൾ റഷ്യയിൽ മാത്രമല്ല, ബൾഗേറിയ, ചെക്ക് റിപ്പബ്ലിക്, സ്ലൊവാക്യ, പോളണ്ട്, ഇസ്രായേൽ, ജർമ്മനി എന്നിവിടങ്ങളിലും സ്ഥിതിചെയ്യുന്നു എന്നതും കണക്കിലെടുക്കണം, സോവിയറ്റ് യൂണിയന്റെ മുൻ റിപ്പബ്ലിക്കുകളായ ഉക്രെയ്ൻ, ബെലാറസ് എന്നിവയെക്കുറിച്ച് പരാമർശിക്കേണ്ടതില്ല. .. (പ്രത്യേകിച്ച് ബാൾട്ടിക് സംസ്ഥാനങ്ങളെക്കുറിച്ച് പറയാൻ ഞാൻ ആഗ്രഹിക്കുന്നു: അവർ ചില കൗനാസിന്റെയോ ടാലിനിലെയോ തെരുവുകളിൽ കണ്ടുമുട്ടുമ്പോൾ റഷ്യൻ അറിയാത്തവരാണ്, പക്ഷേ മോണിറ്ററിന് മുന്നിൽ, പ്രത്യേകിച്ചും അത് ശരിക്കും ആവശ്യമാണെങ്കിൽ, അവർക്ക് ശരിക്കും അറിയാം :-)) അതിനാൽ ഈ ഉപയോക്താക്കൾക്കെല്ലാം Altavista ഉപയോഗിക്കുന്നത് കൂടുതൽ സൗകര്യപ്രദമാണ്, ഞങ്ങളുടെ ആഭ്യന്തര കാറുകളല്ല - അടുത്ത്, ഇപ്പോഴും...

അടുത്ത ഏറ്റവും ജനപ്രിയമായ തിരയൽ എഞ്ചിൻ, വിചിത്രമെന്നു പറയട്ടെ, റഷ്യയിലെ ഏറ്റവും പ്രായം കുറഞ്ഞ സെർച്ച് എഞ്ചിനാണ് - Yandex. Aleksey Amilyushchenko (Comptek കമ്പനി) എന്നോട് പറഞ്ഞതുപോലെ, ഇന്ന് പ്രതിദിനം ശരാശരി 72,000 അഭ്യർത്ഥനകൾ ഉണ്ട്, കൂടാതെ ആഴ്ചയിൽ +10% പ്രവണതയുണ്ട് (04/07/98 മുതലുള്ള ഡാറ്റ). Yandex ഏറ്റവും വാഗ്ദാനമായ റഷ്യൻ തിരയൽ എഞ്ചിൻ ആണെന്ന് എനിക്ക് തോന്നുന്നു. "മഹത്തായതും ശക്തവുമായ" റഷ്യൻ ഭാഷ പാഴ്‌സ് ചെയ്യുന്നതിനുള്ള കോംപ്‌ടെക്കിന്റെ സംവിധാനത്തിലൂടെ, ഈ പ്രദേശത്തെ രണ്ടാമത്തെ തിമിംഗലവുമായുള്ള മത്സരത്തിൽ യാൻഡെക്‌സ് വിജയിച്ചേക്കാം - റാംബ്ലർ.

റഷ്യൻ സംസാരിക്കുന്ന ഉപയോക്താക്കൾക്കുള്ള മൂന്നാമത്തെ ഗുരുതരമായ സെർച്ച് എഞ്ചിനാണ് റാംബ്ലർ. ഞാൻ അതിൽ ഇഷ്ടപ്പെടാത്ത പ്രധാന കാര്യം അത് ഘടനയുടെ ഉള്ളടക്കത്തെ അവഗണിക്കുന്നു എന്നതാണ് . (ഞാൻ ഇത് കൊണ്ടുവന്നില്ല, ഇത് സ്റ്റാക്ക് ലിമിറ്റഡിൽ നിന്നുള്ള ദിമിത്രി ക്രിയുക്കോവ് പറഞ്ഞു.) ഒരുപക്ഷേ, കീവേഡുകൾ കണക്കിലെടുക്കാൻ വിസമ്മതിച്ചതുകൊണ്ടാകാം, അന്വേഷണ ഫലങ്ങളിൽ അത്തരമൊരു വിചിത്രമായ ലിങ്കുകൾ പ്രദർശിപ്പിക്കുന്നത്. പൂർണ്ണമായും ഇന്റർഫേസ് സ്വഭാവത്തിന്റെ രണ്ടാമത്തെ പോരായ്മ ഫലങ്ങൾ നിരന്തരം പ്രദർശിപ്പിക്കുന്നു എന്നതാണ് KOI എൻകോഡിംഗ്, ഉപയോക്താവ് മുമ്പ് തിരഞ്ഞെടുത്തത് പരിഗണിക്കാതെ തന്നെ. മൂന്നാമത്തെ പോരായ്മ: റാംബ്ലർ സ്പൈഡർ എച്ച്ടിടിപി 0.9 പ്രോട്ടോക്കോൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു, ഇത് ഇൻഡെക്സിംഗ് പിശകുകളിലേക്ക് നയിക്കുന്നു, അതായത്. ഒരേ ഐപി വിലാസത്തിൽ നിരവധി വെർച്വൽ സെർവറുകൾ താമസിക്കുന്നുണ്ടെങ്കിൽ, റാംബ്ലർ ആദ്യത്തേത് മാത്രമേ കാണൂ, മറ്റുള്ളവയെ പര്യായങ്ങൾ മാത്രമായി കണക്കാക്കുന്നു. ശരി, ഇത് ഉടൻ പരിഹരിക്കപ്പെടുമെന്ന് നമുക്ക് പ്രതീക്ഷിക്കാം.

ശരി, എന്റെ റേറ്റിംഗിലെ അവസാന സ്ഥാനത്ത് സെർവറുകൾ വളരെ വിചിത്രമായി സൂചികയിലാക്കുന്ന Aport-Search, പുനർനിർമ്മാണത്തിനായി പതിവായി അടയ്ക്കുന്ന RusInfOil, കൂടാതെ TELA-Search - www.dux.ru സെർവറിനായുള്ള മനോഹരവും മിക്കവാറും ഉപയോഗശൂന്യവുമായ ഗാഡ്‌ജെറ്റ്.

നിങ്ങൾക്ക് ചോദിക്കാം: മീഡിയലിംഗുവയിൽ നിന്നുള്ള HotBot, Pathfinder മെറ്റാസെർച്ച് എഞ്ചിൻ എന്നിവയും പട്ടികയിൽ ഉണ്ടായിരുന്നോ? ഞാൻ അവരെ മറന്നിട്ടില്ല, ചില അജ്ഞാതമായ കാരണങ്ങളാൽ, HotBot എന്റെ ലോഗുകളിൽ ധാരാളം എൻട്രികൾ അവശേഷിക്കുന്നു, ഇത് റഷ്യൻ ഭാഷ മനസ്സിലാകാത്ത വിദേശികളുടെ റാൻഡം ഫ്ലൈറ്റുകളാകാൻ കഴിയില്ല (മറ്റുള്ളതിൽ നിന്ന് അത്തരം ഫ്ലൈറ്റുകൾ വളരെ കുറവാണ്. ഇറക്കുമതി ചെയ്ത യന്ത്രങ്ങൾ), ഞാൻ ഇതുവരെ “പാത്ത്ഫൈൻഡർ” വേണ്ടത്ര ഗൗരവമായി പഠിച്ചിട്ടില്ല.

എന്തുകൊണ്ടാണ് സെർച്ച് എഞ്ചിനുകൾ ഒരു വെബ്‌സൈറ്റ് പ്രൊമോട്ട് ചെയ്യേണ്ടത്?

ഇത് വളരെ ലളിതമാണ്, ഞാൻ ഇതിനകം പറഞ്ഞതുപോലെ, സെർച്ച് എഞ്ചിനുകൾക്ക് ഒരു സൈറ്റിലേക്കുള്ള ട്രാഫിക്കിന്റെ നാൽപ്പത് ശതമാനം വരെ നൽകാൻ കഴിയും. ഇത് സംഭവിക്കുന്നതിന്, നിങ്ങളുടെ സൈറ്റ് ശരിയായി സൂചികയിലാക്കേണ്ടത് ആവശ്യമാണ്, ഇതിനായി ഇത് എങ്ങനെ ചെയ്യുന്നുവെന്ന് നിങ്ങൾ അറിയേണ്ടതുണ്ട്.

ഇത് ഇനിപ്പറയുന്ന രീതിയിലാണ് ചെയ്യുന്നത്: ഒന്നുകിൽ സെർച്ച് എഞ്ചിൻ റോബോട്ട് തന്നെ നിങ്ങളുടെ സൈറ്റിലേക്ക് എത്തുന്നു, അല്ലെങ്കിൽ നിങ്ങൾ തന്നെ സൈറ്റിനെ ഉചിതമായ ഇന്റർഫേസിൽ (AddUrl) സൂചിപ്പിക്കുന്നു, അത് ഏത് ആത്മാഭിമാനമുള്ള സെർച്ച് എഞ്ചിനിലും ഉണ്ട്. ആദ്യ ഓപ്ഷൻ കാലതാമസം നേരിടുന്നു (റോബോട്ട് ഇപ്പോഴും അവിടെയെത്തും, ഒരുപക്ഷേ ഒരു ദിവസത്തിനുള്ളിൽ, ഒരുപക്ഷേ ഒരു വർഷത്തിനുള്ളിൽ: ഇന്റർനെറ്റ് വലുതാണ്). രണ്ടാമത്തേതിന് കുറച്ച് സമയം ചിലവഴിക്കേണ്ടതുണ്ട് (വിവിധ സോഫ്റ്റ്‌വെയർ ഓട്ടോമാറ്റിക് രജിസ്ട്രേഷൻസെർച്ച് എഞ്ചിനുകളുടെ ക്ലൗഡിൽ നിങ്ങളുടെ സൈറ്റ് ഞങ്ങൾക്ക് ഒന്നും നൽകുന്നില്ല - മെഷീനുകൾ ഇറക്കുമതി ചെയ്തതാണ്).

എല്ലാം സംഭവിക്കുന്നതിന് ഏറ്റവും മികച്ചത്ആവശ്യമാണ്:

  • സൈറ്റിൽ കുറഞ്ഞത് കുറച്ച് വാചകമെങ്കിലും ഉണ്ടായിരിക്കണം. സെർച്ച് എഞ്ചിനുകൾ അവയിലെ ചിത്രങ്ങളും പരിശോധനകളും അവഗണിക്കുന്നു. ശരിയാണ്, നിങ്ങൾക്ക് വാചകം ഡ്യൂപ്ലിക്കേറ്റ് ചെയ്യാം alt ആട്രിബ്യൂട്ട്ടാഗ് img
  • ഓരോ സൈറ്റ് ഡോക്യുമെന്റിലും അർത്ഥവത്തായ ശീർഷകവും കീവേഡുകളും ഒരു ചെറിയ വിവരണവും ഉണ്ടായിരിക്കണം. സെർച്ച് എഞ്ചിനുകൾ ഫുൾ-ടെക്സ്റ്റ് ആണെന്ന് മാത്രമേ അവർ എഴുതൂ, എന്നാൽ വാസ്തവത്തിൽ ഇത് അങ്ങനെയല്ല.
  • ഒരു robots.txt ഫയൽ സൃഷ്ടിക്കുന്നു (പ്രത്യേകിച്ച് നിങ്ങൾക്ക് ഉണ്ടെങ്കിൽ സ്വന്തം സെർവർ www.name.ru പോലെ).
  • നിങ്ങൾക്ക് താൽപ്പര്യമുള്ള ഓരോ സെർച്ച് എഞ്ചിനിലും സ്വമേധയാലുള്ള രജിസ്ട്രേഷനും നിങ്ങളുടെ സൈറ്റിന്റെ ഇൻഡെക്‌സിംഗ് നിയന്ത്രണവും.

അതിനാൽ, നിങ്ങളുടെ വെബ്‌സൈറ്റിന്റെ ആദ്യ പേജ് നിങ്ങൾ ഇതിനകം വിവിധ തിരയൽ എഞ്ചിനുകളിൽ രജിസ്റ്റർ ചെയ്തിട്ടുണ്ട്.

എല്ലാം ഇതിനകം കരാറിലാണെന്ന് നിങ്ങൾ കരുതുന്നുണ്ടോ? അത് എങ്ങനെയായാലും. ഒരു സെർച്ച് എഞ്ചിൻ പ്രതികരണത്തിൽ നിങ്ങളുടെ സൈറ്റിലേക്കുള്ള ഒരു ലിങ്ക് രണ്ടാമത്തെ സ്ക്രീനിൽ പ്രദർശിപ്പിച്ചാൽ, "ഇത് ഒരു ലിങ്കും ഇല്ലാത്തത് പോലെ മോശമാണ്" (Danny Sullivan, searchenginewatch.com)

മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, AddURL-ൽ പേജ് വ്യക്തമാക്കിയാൽ മാത്രം പോരാ. സെർച്ച് എഞ്ചിനിലേക്കുള്ള ഉചിതമായ അഭ്യർത്ഥനകൾക്ക് മറുപടിയായി, അഭ്യർത്ഥനയ്ക്കുള്ള പ്രതികരണത്തിൽ, നിങ്ങളുടെ പ്രമാണത്തിലേക്കുള്ള ലിങ്ക് ആദ്യത്തേതല്ലെങ്കിൽ, ഏറ്റവും മികച്ച പത്ത് ലിങ്കുകളിലെങ്കിലും (അല്ലെങ്കിൽ) പ്രമാണം മുൻകൂട്ടി തയ്യാറാക്കേണ്ടത് ആവശ്യമാണ്. ഈ ആദ്യ പത്തിൽ നിങ്ങളുടെ പ്രമാണങ്ങളിലേക്ക് നിരവധി ലിങ്കുകൾ ഉണ്ടെങ്കിൽ:- ). "തയ്യാറുക" എന്നതിന്റെ അർത്ഥമെന്താണ്? ഇത് ശുദ്ധമാണ് സാങ്കേതിക ചോദ്യം, അമാനുഷികത ഒന്നുമില്ല. നിങ്ങളുടെ സൈറ്റിലെ ഓരോ ഡോക്യുമെന്റിന്റെയും HEAD വിഭാഗത്തിൽ "സംസാരിക്കുന്ന" ശീർഷകം, കീവേഡുകൾ, വിവരണം, റോബോട്ടുകൾ എന്നിവ സൂചിപ്പിക്കണം.

തലക്കെട്ട്:പ്രമാണ ശീർഷകം. നല്ലൊരു, അർത്ഥവത്തായ ശീർഷകം ഒരു ഉപയോക്താവിനെ മറ്റ് പലരിൽ നിന്നും നിങ്ങളുടെ ലിങ്ക് തിരഞ്ഞെടുക്കാൻ പ്രേരിപ്പിക്കും. ഇനിപ്പറയുന്നതുപോലുള്ള തലക്കെട്ടുകൾ നിങ്ങൾ പലപ്പോഴും കാണുന്നു: “ഉള്ളടക്കം” - എന്ത്, എന്തുകൊണ്ട് - വ്യക്തമല്ല, പരിശോധിക്കാനുള്ള ആഗ്രഹമില്ല. മറ്റൊരു കേസ്: സൈറ്റിന്റെ എല്ലാ പേജുകളിലും, ശീർഷകം "കമ്പനിയിലേക്ക് സ്വാഗതം..." എന്നാണ് - ഈ രീതിയിൽ തലക്കെട്ടുള്ള എല്ലാ രേഖകളും പരിശോധിക്കുന്നതും വളരെ ആകർഷകമല്ല. ഓരോ ഡോക്യുമെന്റിന്റെയും വിവരണം കൂടാതെ, നിങ്ങൾ ശീർഷകങ്ങൾ അനുസരിച്ച് തിരയൽ മോഡ് തിരഞ്ഞെടുത്തുവെന്ന് സങ്കൽപ്പിക്കുക.

കീവേഡുകൾ:കീവേഡുകൾ. ഈ കണ്ടെയ്‌നറിന്റെ ഉള്ളടക്കമാണ് തിരയൽ അന്വേഷണത്തിനുള്ള പ്രമാണത്തിന്റെ പ്രസക്തിയെ ബാധിക്കുന്നത്.

സെർച്ച് എഞ്ചിനുകൾ ഫുൾ ടെക്സ്റ്റ് ആണെന്ന് അവർ എത്ര പറഞ്ഞാലും, ഇത് പൂർണ്ണമായും ശരിയല്ല, എന്നാൽ ഈ കണ്ടെയ്നറിലെ ഉള്ളടക്കങ്ങൾ തീർച്ചയായും തിരയൽ എഞ്ചിൻ സൂചികയിൽ അവസാനിക്കും. നിർഭാഗ്യവശാൽ, ഏറ്റവും വലിയ ആഭ്യന്തര സെർച്ച് എഞ്ചിനുകളിൽ ഒന്നായ റാംബ്ലറിന്റെ സ്രഷ്‌ടാക്കൾ ഈ കണ്ടെയ്‌നറിൽ പ്രവർത്തിക്കാൻ ആഗ്രഹിക്കുന്നില്ല. പക്ഷേ വെറുതെ.

  • ഉള്ളടക്ക ഫീൽഡിൽ വരി അവസാനങ്ങളോ ഉദ്ധരണികളോ മറ്റ് പ്രത്യേക പ്രതീകങ്ങളോ അടങ്ങിയിരിക്കരുത്; പ്രതീകങ്ങളുടെ കാര്യം പ്രശ്നമല്ല
  • ഒരേ കീവേഡുകൾ പല പ്രാവശ്യം ആവർത്തിക്കാൻ ശുപാർശ ചെയ്യുന്നില്ല; ഇത് സ്പാം ആയി കാണപ്പെടാം, കൂടാതെ സെർച്ച് എഞ്ചിൻ സൂചികയിൽ നിന്ന് പേജ് നീക്കം ചെയ്യപ്പെടാം.
  • നിങ്ങൾ ഒരേ കീവേഡുകൾ നിർമ്മിക്കരുത് വ്യത്യസ്ത പേജുകൾനിങ്ങളുടെ വെബ്സൈറ്റ്. ഇത് തീർച്ചയായും ലളിതമാണ്, പക്ഷേ പ്രമാണങ്ങളുടെ ഉള്ളടക്കം തന്നെ വ്യത്യസ്തമാണ്. നിങ്ങൾക്ക് ഈ പ്രക്രിയ യാന്ത്രികമാക്കാൻ ശരിക്കും താൽപ്പര്യമുണ്ടെങ്കിൽ, ഈ ഫീൽഡിൽ ഡോക്യുമെന്റിന്റെ തിരഞ്ഞെടുത്ത എല്ലാ ബ്ലോക്കുകളും എഴുതുന്ന ഒരു പ്രോഗ്രാം നിങ്ങൾക്ക് എഴുതാം, ഉദാഹരണത്തിന്, H, I, B എന്നീ ടാഗുകൾക്കിടയിൽ എന്താണ് ഉള്ളത്.
  • ഉള്ളടക്കത്തിലെ വരി വളരെ ദൈർഘ്യമേറിയതാണെങ്കിൽ, സമാനമായ നിരവധി നിർമ്മാണങ്ങൾ നിർമ്മിക്കുന്നത് വിലക്കില്ല.
  • പൊതുവായി പറഞ്ഞാൽ, ഒരു ഡോക്യുമെന്റിലെ കീവേഡുകളുടെ ആകെ വോളിയം ആ പ്രമാണത്തിന്റെ വോളിയത്തിന്റെ 50% വരെ എത്താം.

വിവരണം: ഹൃസ്വ വിവരണംപ്രമാണം. വളരെ ഉപയോഗപ്രദമായ ഒരു കണ്ടെയ്‌നർ, ആധുനിക സെർച്ച് എഞ്ചിനുകളുടെ പ്രതികരണത്തിൽ പ്രസക്തമായ പ്രമാണങ്ങളുടെ ഒരു ഹ്രസ്വ വിവരണമായി അതിന്റെ ഉള്ളടക്കങ്ങൾ ഉപയോഗിക്കുന്നു. ഈ കണ്ടെയ്നർ നിലവിലില്ലെങ്കിൽ, പ്രമാണത്തിന്റെ തുടക്കത്തിൽ നിന്നുള്ള ഒരു നിശ്ചിത എണ്ണം വരികൾ തിരികെ നൽകും. അതനുസരിച്ച്, പ്രമാണത്തിന്റെ തുടക്കത്തിൽ തന്നെ ജാവാസ്ക്രിപ്റ്റ് സ്ഥിതി ചെയ്യുന്നത് അസാധാരണമല്ല, കൂടാതെ ഒരു സാധാരണ വിവരണത്തിനുപകരം, ഒരു സ്ക്രിപ്റ്റിന്റെ രൂപത്തിൽ അബ്രകാഡബ്ര നൽകിയിരിക്കുന്നു.

  • ഉള്ളടക്ക ഫീൽഡിൽ ലൈൻ അവസാനങ്ങളോ ഉദ്ധരണികളോ മറ്റ് പ്രത്യേക പ്രതീകങ്ങളോ അടങ്ങിയിരിക്കരുത്.
  • രണ്ട് മനുഷ്യ വാക്യങ്ങളിൽ നിന്ന് പ്രമാണത്തിന്റെ അർത്ഥവത്തായ സംഗ്രഹം ഉണ്ടായിരിക്കുന്നത് അഭികാമ്യമാണ്, അതുവഴി സെർച്ച് എഞ്ചിൻ ഉപയോക്താവിന് ശീർഷകത്തിന് പുറമേ, പ്രമാണത്തിന്റെ അർത്ഥം മനസ്സിലാക്കാൻ കഴിയും.
  • നിർഭാഗ്യവശാൽ, ആഭ്യന്തര സെർച്ച് എഞ്ചിനുകൾക്ക് ഈ കണ്ടെയ്നറിൽ എങ്ങനെ പ്രവർത്തിക്കണമെന്ന് ഇതുവരെ അറിയില്ല, എന്നിരുന്നാലും അവർ ഉടൻ പഠിക്കുമെന്ന് അവർ വാഗ്ദാനം ചെയ്യുന്നു.

തിരയൽ എഞ്ചിനുകളുടെ പ്രവർത്തനങ്ങൾ നിയന്ത്രിക്കാൻ കഴിയുമോ?

ഇത് സാധ്യമാണ്, അത് ആവശ്യമാണ്! ഇതിനായി ആദ്യം ചെയ്യേണ്ടത് ഒരു robots.txt ഫയൽ എഴുതി നിങ്ങളുടെ സെർവറിന്റെ റൂട്ടിൽ ഇടുക എന്നതാണ്. ഈ ഫയൽ സെർച്ച് എഞ്ചിൻ റോബോട്ടിനോട് എന്താണ് സൂചികയിലാക്കേണ്ടതെന്നും എന്തെല്ലാം സൂചികയിലാക്കരുതെന്നും ജനപ്രിയമായി വിശദീകരിക്കുന്നു. ഉദാഹരണത്തിന്, സ്റ്റാറ്റിസ്റ്റിക്കൽ റിപ്പോർട്ടുകൾ പോലുള്ള സൂചിക സേവന ഫയലുകൾ എന്തിനാണ്? അതോ സ്ക്രിപ്റ്റുകളുടെ ഫലമോ? മാത്രമല്ല, പല "സ്മാർട്ട്" മെഷീനുകളും robots.txt കണ്ടെത്താതെ സെർവറുകൾ സൂചികയിലാക്കില്ല. വഴിയിൽ, ഈ ഫയലിൽ നിങ്ങൾക്ക് വ്യത്യസ്ത സെർച്ച് എഞ്ചിനുകൾക്കായി വ്യത്യസ്ത ഇൻഡെക്സിംഗ് മാസ്കുകൾ വ്യക്തമാക്കാൻ കഴിയും.

"റോബോട്ടുകൾ ഒഴിവാക്കുന്നതിനുള്ള സ്റ്റാൻഡേർഡ്" എന്ന എന്റെ വിവർത്തനത്തിൽ നിങ്ങൾക്ക് ഇതിനെക്കുറിച്ച് കൂടുതൽ വായിക്കാം. രണ്ടാമത്തെ പ്രവർത്തനം: Robots META ടാഗുകൾ ഉള്ള സൈറ്റ് പേജുകൾ നൽകുക. robots.txt എന്നതിനേക്കാൾ ഫ്ലെക്സിബിൾ ഇൻഡെക്സിംഗ് കൺട്രോൾ ടൂളാണിത്. പ്രത്യേകിച്ചും, ഈ ടാഗിൽ നിങ്ങൾക്ക് മറ്റ് സെർവറുകളിലേക്കുള്ള ലിങ്കുകൾ പിന്തുടരരുതെന്ന് സെർച്ച് എഞ്ചിൻ റോബോട്ടിനോട് നിർദ്ദേശിക്കാൻ കഴിയും, ഉദാഹരണത്തിന്, ലിങ്കുകളുടെ ലിസ്റ്റുകളുള്ള പ്രമാണങ്ങളിൽ. ഈ കുഴപ്പത്തിന്റെ ഫോർമാറ്റ് ഇപ്രകാരമാണ്:

robot_terms എന്നത് ഇനിപ്പറയുന്ന കീവേഡുകളുടെ ഒരു കോമയാൽ വേർതിരിച്ച പട്ടികയാണ് (വലിയക്ഷരമോ ചെറിയക്ഷരമോ പ്രശ്നമല്ല): എല്ലാം, ഒന്നുമില്ല, സൂചിക, NOINDEX, പിന്തുടരുക, പിന്തുടരുക.ഒന്നുമില്ല ഇൻഡക്‌സ് ചെയ്യുമ്പോൾ ഈ പേജ് അവഗണിക്കാൻ എല്ലാ റോബോട്ടുകളോടും പറയുന്നു (തുല്യമായത് ഒരേസമയം ഉപയോഗംകീവേഡുകൾ NOINDEX, NOFOLLOW).എല്ലാം ഈ പേജും അതിൽ നിന്നുള്ള എല്ലാ ലിങ്കുകളും സൂചികയിലാക്കാൻ അനുവദിക്കുന്നു (INDEX ഉപയോഗിക്കുന്നതിന് തുല്യമാണ്, ഒരേസമയം കീവേഡുകൾ പിന്തുടരുക).സൂചിക ഈ പേജ് സൂചികയിലാക്കാൻ അനുവദിക്കുന്നു NOINDEX ഈ പേജ് സൂചികയിലാക്കാൻ അനുവദിക്കുന്നില്ലപിന്തുടരുക ഈ പേജിൽ നിന്നുള്ള എല്ലാ ലിങ്കുകളും സൂചികയിലാക്കാൻ അനുവദിക്കുന്നുപിന്തുടരരുത് ഈ പേജിൽ നിന്നുള്ള ലിങ്കുകൾ സൂചികയിലാക്കാൻ അനുവദിക്കുന്നില്ല

ഈ മെറ്റാ ടാഗ് ഒഴിവാക്കുകയോ അല്ലെങ്കിൽ robot_terms വ്യക്തമാക്കിയിട്ടില്ലെങ്കിലോ, സ്ഥിരസ്ഥിതിയായി തിരയൽ റോബോട്ട് robot_terms=INDEX, FOLLOW (അതായത് ALL) വ്യക്തമാക്കിയതുപോലെ പ്രവർത്തിക്കുന്നു. ഉള്ളടക്കത്തിൽ ALL എന്ന കീവേഡ് കണ്ടെത്തിയാൽ, നിർദ്ദിഷ്ട മറ്റ് കീവേഡുകൾ അവഗണിച്ചുകൊണ്ട് റോബോട്ട് അതിനനുസരിച്ച് പ്രവർത്തിക്കുന്നു. CONTENT-ൽ വിപരീത അർത്ഥങ്ങളുള്ള കീവേഡുകൾ അടങ്ങിയിട്ടുണ്ടെങ്കിൽ, ഉദാഹരണത്തിന്, FOLLOW, NOFOLLOW, റോബോട്ട് സ്വന്തം വിവേചനാധികാരത്തിൽ പ്രവർത്തിക്കുന്നു (ഈ സാഹചര്യത്തിൽ, പിന്തുടരുക).

robot_terms-ൽ NOINDEX മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ എങ്കിൽ, ഈ പേജിൽ നിന്നുള്ള ലിങ്കുകൾ സൂചികയിലാക്കില്ല. robot_terms-ൽ NOFOLLOW മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ എങ്കിൽ, പേജ് സൂചികയിലാക്കുകയും അതനുസരിച്ച് ലിങ്കുകൾ അവഗണിക്കുകയും ചെയ്യും.

സെർച്ച് എഞ്ചിൻ സൂചികയിൽ നിങ്ങളുടെ പ്രമാണങ്ങളുടെ നിലവിലെ നില നിരീക്ഷിക്കുന്നു.

ശരി, നിങ്ങൾ മുകളിലുള്ളതെല്ലാം വായിച്ച് അങ്ങനെ ചെയ്തു. അടുത്തത് എന്താണ്? തുടർന്ന്, ദൈർഘ്യമേറിയതും മടുപ്പിക്കുന്നതും, ഏറ്റവും പ്രധാനമായി, കാര്യങ്ങൾ എങ്ങനെ പോകുന്നു എന്നറിയാൻ പതിവ് പരിശോധനയും ഉണ്ടാകും. രേഖകൾ ചിലപ്പോൾ സെർച്ച് എഞ്ചിനുകളിൽ നിന്ന് അപ്രത്യക്ഷമാകുമെന്നതിനാൽ സങ്കടകരമാണെങ്കിലും, നിങ്ങൾ ഇത് ശ്രദ്ധിക്കേണ്ടതുണ്ട്. എന്തുകൊണ്ട്? ഞാൻ അറിഞ്ഞിരുന്നെങ്കിൽ എന്ന് ഞാൻ ആഗ്രഹിക്കുന്നു... അതിനാൽ, നല്ല സെർച്ച് എഞ്ചിനുകളിൽ നിങ്ങൾക്ക് ഏതൊക്കെ ഡോക്യുമെന്റുകൾ ഉണ്ടെന്നും അവയിൽ എത്രയെണ്ണം സൂചികയിലുണ്ടെന്നും കാണാൻ കഴിയും. ഇത് എങ്ങനെ ചെയ്യുന്നുവെന്ന് ഇതാ:

Alta Vista
ഈ സെർച്ച് എഞ്ചിനിൽ, URL സ്റ്റാറ്റസ് പരിശോധിക്കുന്നത് വളരെ ലളിതമാണ് - അന്വേഷണ വരിയിൽ ടൈപ്പ് ചെയ്യുക:

url: citforum.ru
url:citforum.ru/win/
url:citforum.ru/win/internet/index.shtml

ആദ്യ സന്ദർഭത്തിൽ, എല്ലാ ഇൻഡെക്‌സ് ചെയ്‌ത സെർവർ പേജുകളും തിരികെ നൽകും. രണ്ടാമത്തേതിൽ - വിൻഡോസ് എൻകോഡിംഗ് പേജുകൾ മാത്രം. മൂന്നാമത്തേതിൽ - AltaVista സൂചികയിലെ നിർദ്ദിഷ്ട ഡയറക്ടറിയിൽ നിന്ന് index.shtml ഫയൽ ഉണ്ടോ?

ആവേശം കൊള്ളിക്കുക
Excite തിരയൽ എഞ്ചിനിലെ ഒരു URL-ന്റെ നില പരിശോധിക്കുന്നത് AltaVista-യിലെ പോലെ തന്നെ എളുപ്പമാണ്. URL ടൈപ്പ് ചെയ്താൽ മതി. ഉദാഹരണത്തിന്:

HotBot
URL സ്റ്റാറ്റസ് HotBot സെർച്ച് എഞ്ചിനിൽ അല്പം വ്യത്യസ്തമായ രീതിയിൽ പരിശോധിച്ചു. ഇത് ഇതുപോലെയാണ് ചെയ്യുന്നത്:

  • അഭ്യർത്ഥന ഫീൽഡിൽ URL നൽകുക
  • "എല്ലാ വാക്കുകളും" ഓപ്ഷൻ "ഈ URL-ലേക്കുള്ള ലിങ്കുകൾ" എന്നതിലേക്ക് മാറ്റുക

ഇൻഫോസീക്ക്
Infoseek സെർച്ച് എഞ്ചിനിൽ, URL-ന്റെ സ്റ്റാറ്റസ് പരിശോധിക്കുന്നതിന് ക്രമീകരണങ്ങളുടെ ഒരു പ്രത്യേക ഇന്റർഫേസ് ഉണ്ട്:

WebCrawler
ഒരു പേജിലെ URL-ന്റെ നില പരിശോധിക്കാനുള്ള കഴിവ് WebCrawler നൽകുന്നു:

റാംബ്ലർ
ഈ സെർച്ച് എഞ്ചിനിൽ, URL നില രണ്ട് തരത്തിൽ പരിശോധിക്കാം.

  • "വിപുലമായ തിരയൽ" വിഭാഗത്തിൽ സെർവറിന്റെ പേര് ഒരു മാസ്കായി ഓപ്‌ഷനുകളിലൊന്നിൽ വ്യക്തമാക്കി.റാംബ്ലറിലെ മികച്ച 100 വാക്കുകൾ