Yandex അൽഗോരിതം. പുതിയ Yandex തിരയൽ അൽഗോരിതങ്ങൾ. മെഷീൻ ലേണിംഗിൻ്റെ യുഗം

Yandex, Google എന്നീ സെർച്ച് എഞ്ചിനുകളുടെ നിലവിലുള്ള അൽഗോരിതങ്ങളെക്കുറിച്ച് നമുക്കെല്ലാം നേരിട്ട് അറിയാം. എല്ലാ ഒപ്റ്റിമൈസറുകളും അവരുടെ "നിരന്തരമായി അപ്‌ഡേറ്റ് ചെയ്യുന്ന" നിയമങ്ങൾ അനുസരിക്കുന്നതിനാണ് തിരയൽ ഫലങ്ങളുടെ ടോപ്പിൽ എത്താൻ കൂടുതൽ കൂടുതൽ പുതിയ വഴികൾ ഉപയോഗിച്ച് അവരുടെ തലച്ചോറിനെ ചലിപ്പിക്കുന്നത്. PS-ൻ്റെ ഭാഗത്ത് സൈറ്റ് ഉടമകൾക്ക് തോന്നിയ ഏറ്റവും പുതിയ കണ്ടുപിടുത്തങ്ങളിൽ ഇൻ്റർനെറ്റ് ഉറവിടങ്ങളുടെ മൊബിലിറ്റി ആവശ്യകതകളും ആ സൈറ്റുകൾക്കായുള്ള തിരയലിൽ കുറവും ഉൾപ്പെടുന്നു. ലിങ്കുകൾ വാങ്ങാൻ അറിയാത്തവർ. ഇതുവരെ തിരയലിൽ അവതരിപ്പിച്ച ഏത് അൽഗോരിതങ്ങൾ, സൈറ്റുകളുടെ റാങ്കിംഗിനെ കാര്യമായി സ്വാധീനിച്ചിട്ടുണ്ട്? വാസ്തവത്തിൽ, തിരയലിൽ ഓരോ സൈറ്റിനും ഏറ്റവും ന്യായമായ സ്ഥാനം നൽകുന്നതിനും "ജങ്ക്" എന്ന തിരയൽ ഫലങ്ങൾ മായ്‌ക്കുന്നതിനുമായി എന്ത് സാങ്കേതികവിദ്യകൾ, എപ്പോൾ, എന്തിനാണ് സൃഷ്‌ടിച്ചതെന്ന് എല്ലാ ഒപ്റ്റിമൈസർമാർക്കും അറിയില്ല. ഈ ലേഖനത്തിൽ തിരയൽ അൽഗോരിതങ്ങളുടെ സൃഷ്ടിയുടെയും വികാസത്തിൻ്റെയും ചരിത്രം ഞങ്ങൾ പരിശോധിക്കും.

Yandex: ഗർഭധാരണം മുതൽ ഇന്നുവരെയുള്ള അൽഗോരിതങ്ങളുടെ തരങ്ങൾ

അൽഗോരിതങ്ങൾ എല്ലാം ഒരു ദിവസം കൊണ്ട് സൃഷ്ടിച്ചതല്ല, അവ ഓരോന്നും പരിഷ്കരണത്തിൻ്റെയും പരിവർത്തനത്തിൻ്റെയും പല ഘട്ടങ്ങളിലൂടെ കടന്നുപോയി. Yandex അൽഗോരിതങ്ങളുടെ പേരുകളിൽ ഭൂരിഭാഗവും നഗര നാമങ്ങൾ ഉൾക്കൊള്ളുന്നു. അവയ്‌ക്ക് ഓരോന്നിനും അതിൻ്റേതായ പ്രവർത്തന തത്വങ്ങളും ആശയവിനിമയ പോയിൻ്റുകളും അതുല്യവുമുണ്ട് പ്രവർത്തന സവിശേഷതകൾ, യോജിപ്പോടെ പരസ്പരം പൂരകമാക്കുന്നു. Yandex-ന് എന്ത് അൽഗോരിതം ഉണ്ട്, അവ സൈറ്റുകളെ എങ്ങനെ ബാധിക്കുന്നു, ഞങ്ങൾ കൂടുതൽ പരിഗണിക്കും.

തിരയൽ അൽഗോരിതങ്ങളെക്കുറിച്ചുള്ള വിവരങ്ങൾക്ക് പുറമേ, എന്നതിനെക്കുറിച്ചുള്ള ഒരു ലേഖനം. Google, Yandex തിരയൽ എഞ്ചിനുകൾക്ക് അനുയോജ്യമായ ഉയർന്ന നിലവാരമുള്ള SEO ഉള്ളടക്കം സൃഷ്ടിക്കുന്നതിനുള്ള നുറുങ്ങുകൾ വായിക്കാൻ ഞാൻ നിർദ്ദേശിക്കുന്നു.

മഗദൻ

മഗഡൻ അൽഗോരിതം ചുരുക്കങ്ങൾ തിരിച്ചറിയുകയും നാമങ്ങളെ ക്രിയകൾ ഉപയോഗിച്ച് തിരിച്ചറിയുകയും ചെയ്യുന്നു. ഇത് ആദ്യമായി പരീക്ഷണ മോഡിൽ 2008 ഏപ്രിലിൽ സമാരംഭിച്ചു, രണ്ടാമത്തെ സ്ഥിരം പതിപ്പ് അതേ വർഷം മേയിൽ പുറത്തിറങ്ങി.

പ്രത്യേകതകൾ

വെബ്‌സൈറ്റുകളും ട്രാൻസ്‌ക്രിപ്റ്റുകളും ഉപയോഗിച്ച് ചുരുക്കെഴുതിയ ഉപയോക്താവിന് "മഗദാൻ" നൽകുന്നു. ഉദാഹരണത്തിന്, നിങ്ങൾ തിരയൽ ബാറിൽ ആഭ്യന്തര മന്ത്രാലയത്തിനായുള്ള അഭ്യർത്ഥന നൽകിയിട്ടുണ്ടെങ്കിൽ, അത്തരമൊരു കീവേഡുള്ള സൈറ്റുകൾക്ക് പുറമേ, ഒരു ചുരുക്കെഴുത്ത് ഇല്ലാത്തതും എന്നാൽ ഡീകോഡിംഗ് “ആഭ്യന്തര മന്ത്രാലയം” ഉള്ളവയും പട്ടികയിൽ അടങ്ങിയിരിക്കും. കാര്യങ്ങൾ". ലിപ്യന്തരണം തിരിച്ചറിയൽ ഉപയോക്താക്കൾക്ക് ഏത് ഭാഷയിൽ പേരുകൾ ശരിയായി എഴുതണമെന്ന് ചിന്തിക്കാതിരിക്കാനുള്ള അവസരം നൽകി, ഉദാഹരണത്തിന്, മെഴ്‌സിഡസ് അല്ലെങ്കിൽ മെഴ്‌സിഡസ്. ഇതിനെല്ലാം പുറമേ, Yandex ഏകദേശം ഒരു ബില്യൺ വിദേശ സൈറ്റുകൾ സൂചിക പട്ടികയിൽ ഉൾപ്പെടുത്തി. സംഭാഷണത്തിൻ്റെ ഭാഗങ്ങൾ തിരിച്ചറിയുകയും അവയെ തുല്യമായ തിരയൽ അന്വേഷണങ്ങളായി തിരിച്ചറിയുകയും ചെയ്യുന്നത് വ്യത്യസ്ത പ്രധാന ശൈലികളുള്ള സൈറ്റുകളെ ഒരു തിരയലിൽ ഉൾപ്പെടുത്താൻ അനുവദിച്ചു. അതായത്, ഇപ്പോൾ, "വെബ്സൈറ്റ് ഒപ്റ്റിമൈസേഷൻ" എന്ന കീവേഡിനായി, "വെബ്സൈറ്റ് ഒപ്റ്റിമൈസ് ചെയ്യുക" എന്ന വാക്യമുള്ള സൈറ്റുകളും തിരയൽ ഫലങ്ങളിൽ പ്രദർശിപ്പിക്കും.

ഫലം

മഗദാൻ അൽഗോരിതം സമാരംഭിച്ചതിനുശേഷം, ഇത് കൂടുതൽ ബുദ്ധിമുട്ടായിത്തീർന്നു, പ്രധാനമായും താഴ്ന്ന അധികാരമുള്ള സൈറ്റുകൾക്ക്. റാങ്കിംഗിൽ, കുറഞ്ഞ സന്ദർശകരുടെയും യുവ വിഭവങ്ങളുടെയും പ്രസക്തമായ ചോദ്യങ്ങൾക്കുള്ള സ്ഥാനങ്ങൾ കുറഞ്ഞു, കൂടാതെ ആധികാരികമായവ, കുറഞ്ഞ നിലവാരമുള്ള ഉള്ളടക്കത്തിൽ പോലും, കീവേഡുകളുടെ രൂപഘടനയും നേർപ്പും കണക്കിലെടുത്ത് ഒന്നാം സ്ഥാനത്തേക്ക് നീങ്ങി. ലിപ്യന്തരണം ഉൾപ്പെടുത്തിയതിനാൽ, വിദേശ വിഭവങ്ങളും Runet-ൻ്റെ TOP-ൽ പ്രവേശിച്ചു. അതായത്, ഒരു വിഷയത്തെക്കുറിച്ചുള്ള ഒപ്റ്റിമൈസ് ചെയ്ത വാചകം രണ്ടാമത്തെ പേജിൽ ദൃശ്യമാകും, കാരണം, അതേ വിഷയത്തിൽ കൂടുതൽ സന്ദർശിച്ച സൈറ്റ് അല്ലെങ്കിൽ സമാനമായ ഒരു വിദേശി ഉണ്ടെന്ന് കരുതപ്പെടുന്നു. ഇക്കാരണത്താൽ, കുറഞ്ഞ ആവൃത്തിയിലുള്ള കീവേഡുകൾക്കും വിദേശ ശൈലികൾക്കും വേണ്ടിയുള്ള മത്സരം കുത്തനെ വർദ്ധിച്ചു. പരസ്യം ചെയ്യലും കൂടുതൽ ചെലവേറിയതായിത്തീർന്നു - നിരക്കുകൾ വർദ്ധിച്ചു, കാരണം മുമ്പ് സൈറ്റുകൾ ഒരു നിർദ്ദിഷ്ട അഭ്യർത്ഥനയിൽ മാത്രമേ മത്സരിച്ചിട്ടുള്ളൂ, ഇപ്പോൾ അവർ "സഹപ്രവർത്തകരുമായി" മോർഫോളജിക്കൽ ശൈലികൾ, ലിപ്യന്തരണം, സംഭാഷണത്തിൻ്റെ മറ്റൊരു ഭാഗത്തേക്ക് മാറുന്ന വാക്കുകൾ എന്നിവയുമായി മത്സരിക്കുന്നു.

നഖോദ്ക

"നഖോദ്ക" അൽഗോരിതം ഒരു വിപുലീകരിച്ച പദാവലിയും വാക്കുകൾ നിർത്താനുള്ള ശ്രദ്ധാപൂർവമായ ശ്രദ്ധയുമാണ്. മഗദന് തൊട്ടുപിന്നാലെ റിങ്ങിൽ പുറത്തിറങ്ങി. സെപ്തംബർ 2008 മുതലുള്ള പ്രധാന തിരയൽ ഫലങ്ങൾ റാങ്ക് ചെയ്യുന്നു.

പ്രത്യേകതകൾ

ഇത് മെഷീൻ ലേണിംഗിനുള്ള ഒരു നൂതനമായ സമീപനമാണ് - റാങ്കിംഗ് കൂടുതൽ വ്യക്തവും കൂടുതൽ കൃത്യവുമാണ്. കണക്ഷനുകളുടെ വിപുലീകരിച്ച നിഘണ്ടുവും നഖോദ്ക അൽഗോരിതത്തിലെ വാക്കുകൾ നിർത്താനുള്ള ശ്രദ്ധയും തിരയൽ ഫലങ്ങളെ വളരെയധികം സ്വാധീനിച്ചു. ഉദാഹരണത്തിന്, "SEO ഒപ്റ്റിമൈസേഷൻ" എന്ന അഭ്യർത്ഥന ഇപ്പോൾ "SEO ഒപ്റ്റിമൈസേഷൻ" എന്ന കീയുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു, കൂടാതെ വാണിജ്യ സൈറ്റുകൾ വിവര പോർട്ടലുകളാൽ ലയിപ്പിച്ചിരിക്കുന്നു, പട്ടികയിൽ പ്രത്യക്ഷപ്പെട്ട ഉത്തരങ്ങളുള്ള വിശദമായ സ്നിപ്പെറ്റുകൾ ഉൾപ്പെടെ, വിക്കിപീഡിയ പ്രത്യേകിച്ചും പ്രദർശിപ്പിച്ചിരിക്കുന്നു.

ഫലം

വാണിജ്യ സൈറ്റുകൾ വിൽപ്പന അന്വേഷണങ്ങൾക്ക് കൂടുതൽ ഊന്നൽ നൽകിയിട്ടുണ്ട്, കാരണം വിവരദായകവും നിർദ്ദിഷ്ടമല്ലാത്തതുമായ ശൈലികൾക്കായി മത്സരം നിരവധി തവണ വർദ്ധിച്ചു. അതാകട്ടെ, പങ്കെടുക്കുന്നതിലൂടെ ശുപാർശ പേജുകൾ ഉപയോഗിച്ച് അവരുടെ ധനസമ്പാദനം വിപുലീകരിക്കാൻ വിവര പ്ലാറ്റ്‌ഫോമുകൾക്ക് കഴിഞ്ഞു അനുബന്ധ പ്രോഗ്രാമുകൾ. വാണിജ്യ അഭ്യർത്ഥനകളാൽ പ്രമോട്ട് ചെയ്യപ്പെടുന്ന മുൻനിര വിവര സൈറ്റുകൾ, ഓർഡർ ചെയ്യാനുള്ള ലിങ്കുകൾ വിൽക്കാൻ തുടങ്ങി. മത്സരം കടുപ്പമായി.

അർസാമസ്

അൽഗോരിതം "അർസാമസ്" - തിരയൽ അന്വേഷണങ്ങളുടെ ലെക്സിക്കൽ സ്ഥിതിവിവരക്കണക്കുകൾ അവതരിപ്പിക്കുകയും സൈറ്റിൻ്റെ ഭൂമിശാസ്ത്രപരമായ റഫറൻസ് സൃഷ്ടിക്കുകയും ചെയ്തു. ജിയോ-ആശ്രിതത്വമില്ലാതെ "അർസമാസ്" (ഏപ്രിൽ 2009) ൻ്റെ ആദ്യ പതിപ്പ് പ്രധാന തിരയൽ ഫലങ്ങളിലേക്ക് ഉടനടി റിലീസ് ചെയ്തു, കൂടാതെ പ്രദേശവുമായി സൈറ്റിനെ ലിങ്ക് ചെയ്യുന്നതിനുള്ള ക്ലാസിഫയർ ഉള്ള "അർസമാസ് 2" 2009 ഓഗസ്റ്റിൽ പ്രഖ്യാപിച്ചു.

പ്രത്യേകതകൾ

ഹോമോണിമുകളിലേക്കുള്ള ലിങ്ക് നീക്കംചെയ്യുന്നത് ഉപയോക്താവിന് ജീവിതം എളുപ്പമാക്കി, കാരണം ഇപ്പോൾ "അമേരിക്കൻ പൈ" എന്ന വാചകം മുമ്പത്തെപ്പോലെ മധുരപലഹാര പാചകങ്ങളൊന്നുമില്ലാതെ സിനിമാ-തീം സൈറ്റുകൾ മാത്രം നൽകി. മേഖലയിലേക്കുള്ള ലിങ്ക് ഒരു വഴിത്തിരിവുണ്ടാക്കി, നഗരത്തിൻ്റെ കൂട്ടിച്ചേർക്കലിനൊപ്പം പ്രധാന ശൈലികൾ പല പോയിൻ്റുകൾ താഴേക്ക് മാറ്റി. ഇപ്പോൾ ഉപയോക്താവിന് “റെസ്റ്റോറൻ്റുകൾ” എന്ന വാക്ക് നൽകാനും നേതാക്കളിൽ അവൻ്റെ ലൊക്കേഷൻ നഗരത്തിൽ നിന്നുള്ള സൈറ്റുകൾ മാത്രം കാണാനും കഴിയും. നിങ്ങൾ ഓർക്കുന്നുവെങ്കിൽ, നേരത്തെ നിങ്ങൾക്ക് കൂടുതൽ നിർദ്ദിഷ്ട വാചകം നൽകേണ്ടിവരുമായിരുന്നു, ഉദാഹരണത്തിന്, "സെൻ്റ് പീറ്റേഴ്‌സ്ബർഗിലെ റെസ്റ്റോറൻ്റുകൾ" അല്ലെങ്കിൽ Yandex "അഭ്യർത്ഥന വ്യക്തമാക്കുക - വളരെയധികം ഓപ്ഷനുകൾ കണ്ടെത്തി" എന്ന പ്രതികരണം നൽകാമായിരുന്നു. ജിയോ-ഇൻഡിപെൻഡൻ്റ് കീവേഡുകൾ റഫറൻസ് ഇല്ലാതെ, ഏത് പ്രദേശത്തുനിന്നും അഭ്യർത്ഥനയുമായി ബന്ധപ്പെട്ട സൈറ്റുകൾ മാത്രം നൽകി.

ഫലം

ഹൂറേ! അവസാനമായി, ചെറിയ പ്രദേശങ്ങളിൽ നിന്നുള്ള സൈറ്റുകൾ വലിയ നഗരങ്ങളുമായി മത്സരിക്കുന്നത് നിർത്തി. നിങ്ങളുടെ മേഖലയിലെ TOP-ൽ എത്താൻ ഇപ്പോൾ വളരെ എളുപ്പമാണ്. ഈ കാലയളവിലാണ് "റീജിയണൽ പ്രൊമോഷൻ" സേവനം വാഗ്ദാനം ചെയ്തത്. അർമാസാസ് അൽഗോരിതം ചെറുകിട കമ്പനികൾക്ക് അവരുടെ പ്രദേശത്ത് വേഗത്തിൽ വികസിക്കുന്നത് സാധ്യമാക്കി, പക്ഷേ ക്യാച്ച് ഇപ്പോഴും തുടർന്നു. എല്ലാ സൈറ്റുകളുടെയും ജിയോലൊക്കേഷൻ നിർണ്ണയിക്കാൻ Yandex-ന് കഴിഞ്ഞില്ല. നിങ്ങൾ സ്വയം മനസ്സിലാക്കുന്നതുപോലെ, അറ്റാച്ച്‌മെൻ്റില്ലാതെ, വിഭവങ്ങൾ അവശേഷിച്ചു, അതിനെ മിതമായ രീതിയിൽ പറഞ്ഞാൽ, അത്ര സുഖകരമല്ലാത്ത ഒരിടത്ത്. ജിയോ-ആശ്രിതത്വത്തിനായുള്ള ഒരു അപേക്ഷയുടെ പരിഗണന മാസങ്ങൾ നീണ്ടുനിൽക്കും, ട്രാഫിക്കും ലിങ്ക് മാസ്സും ഇല്ലാത്ത യുവ സൈറ്റുകൾക്ക് (ടിഐസികളിൽ ഒരു നിയന്ത്രണമുണ്ടായിരുന്നു) പൊതുവെ ഒരു പ്രാദേശികത നൽകാനുള്ള അഭ്യർത്ഥന സമർപ്പിക്കാൻ കഴിയില്ല. ഇത് ഇരുതല മൂർച്ചയുള്ള വാളാണ്.

സ്നെജിൻസ്ക്

അൽഗോരിതം "സ്നെജിൻസ്ക്" - ജിയോ-ആശ്രിതത്വം ശക്തിപ്പെടുത്തുകയും സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് തിരയൽ ഫലങ്ങൾക്കുള്ള അന്വേഷണങ്ങളുടെ പ്രസക്തി വ്യക്തമാക്കുകയും ചെയ്യുന്നു യന്ത്ര പഠനംമാട്രിക്സ്നെറ്റ്. 2009 നവംബറിൽ പ്രഖ്യാപനം നടന്നു, അതേ വർഷം ഡിസംബറിൽ "കൊനക്കോവോ" എന്ന പേരിൽ മെച്ചപ്പെട്ട മോഡൽ പ്രവർത്തനമാരംഭിച്ചു.

പ്രത്യേകതകൾ

നൽകിയ ചോദ്യങ്ങൾക്ക് തിരയൽ ഫലങ്ങൾ കൂടുതൽ കൃത്യതയുള്ളതായി മാറിയിരിക്കുന്നു. ജിയോലൊക്കേഷൻ ബൈൻഡിംഗ് ഇപ്പോൾ ഒരു പ്രത്യേക പങ്ക് വഹിക്കുന്നു - വാണിജ്യ സൈറ്റുകൾ Snezhinsk അൽഗോരിതം വഴി പ്രദേശങ്ങളുമായി ബന്ധപ്പെടുത്തിയിട്ടില്ല, അതിനാൽ അവ തിരയൽ ഫലങ്ങളിൽ നിന്ന് പുറത്തായി. ലൊക്കേഷനുമായി ബന്ധമില്ലാത്ത കീവേഡുകൾ തിരിച്ചറിയുന്നു വിവര ഉറവിടങ്ങൾ. പ്രസക്തി കണക്കാക്കുന്നതിനുള്ള സങ്കീർണ്ണമായ വാസ്തുവിദ്യ ഒപ്റ്റിമൈസറുകളുടെ ജീവിതത്തെ വളരെയധികം സങ്കീർണ്ണമാക്കി, സൂചകങ്ങളിലൊന്നിലെ ചെറിയ മാറ്റത്തോടെ, തിരയൽ ഫലങ്ങളിലെ സൈറ്റിൻ്റെ സ്ഥാനം തൽക്ഷണം മാറിയെന്ന് അവർ ശ്രദ്ധിച്ചു.

ഫലം

വളരെക്കാലമായി ഇൻ്റർനെറ്റ് വിപണിയിൽ നിലനിൽക്കുന്ന ഒരു സൈറ്റുമായി സമാനമായ ഒരു വാങ്ങൽ താരതമ്യം ചെയ്താൽ, യുവ സൈറ്റുകളിലേക്കുള്ള ബാഹ്യ ലിങ്കുകൾ വാങ്ങുന്നത് പുതിയ ഉറവിടങ്ങളുടെ പ്രകടനത്തെ വളരെ മന്ദഗതിയിലാക്കിയെന്ന് ആ സമയത്ത് ശ്രദ്ധിക്കപ്പെട്ടു. സെർച്ച് ഫലങ്ങളിൽ നിന്നുള്ള പ്രധാന പദസമുച്ചയങ്ങളാൽ പൂരിത ടെക്‌സ്‌റ്റുകളുള്ള സൈറ്റുകൾ നീക്കം ചെയ്‌ത അന്വേഷണങ്ങൾ തിരയുന്നതിനുള്ള ഉള്ളടക്കത്തിൻ്റെ പ്രസക്തി നിർണ്ണയിക്കുന്നതിനുള്ള പുതിയ രീതികൾ. ഗുണനിലവാരമുള്ള ടെക്‌സ്‌റ്റിൻ്റെ ഒരു പുതിയ യുഗം ആരംഭിച്ചു, അവിടെ എല്ലാത്തിനും ഒരു അളവ് ഉണ്ടായിരിക്കണം; അതില്ലാതെ, സൈറ്റ് സ്പാമിനുള്ള ഉപരോധത്തിന് കീഴിൽ വരാം. വാണിജ്യ ഉറവിടങ്ങൾ പരിഭ്രാന്തരാകാൻ തുടങ്ങി, കാരണം ജിയോ-ഇൻഡിപെൻഡൻ്റ് കീവേഡുകൾ ഉപയോഗിച്ച് ടോപ്പിലെത്തുന്നത് മിക്കവാറും അസാധ്യമായിരുന്നു (അവ ഏറ്റവും ഉയർന്ന ആവൃത്തിയുള്ളവയായിരുന്നു). ഇക്കാര്യത്തിൽ, Yandex ബ്ലോഗിൽ ഒരു എൻട്രി പ്രസിദ്ധീകരിച്ചു, അത് മനോഹരമായി എഴുതാത്ത വാണിജ്യ ഓർഗനൈസേഷനുകളെ ആദ്യ പേജുകളിൽ കാണാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു, എന്നാൽ ഇതിനായി ഞങ്ങൾ ഗുണനിലവാരം വിലയിരുത്തുന്നതിന് അൽഗോരിതങ്ങൾ പഠിപ്പിക്കേണ്ടതുണ്ട്. വാഗ്ദാനം ചെയ്യുന്ന സേവനങ്ങളുടെ. മുതൽ ഈ നിമിഷംഇത് അസാധ്യമായ ഒരു കാര്യമായി മാറി; വാണിജ്യ ഇൻ്റർനെറ്റ് ഉറവിടങ്ങളുടെ പ്രശസ്തി ഓൺലൈനിലും ഓഫ്‌ലൈനിലും തിരയൽ ഫലങ്ങളിൽ ഒരു പ്രധാന പങ്ക് വഹിച്ചു.

ഒബ്നിൻസ്ക്

"Obninsk" അൽഗോരിതം റാങ്കിംഗ് മെച്ചപ്പെടുത്തുകയും ഇൻ്റർനെറ്റ് സൈറ്റുകളുടെ ഭൂമിശാസ്ത്രപരമായ അടിത്തറ വികസിപ്പിക്കുകയും സൈറ്റിൻ്റെ പ്രകടനത്തിൽ കൃത്രിമ SEO ലിങ്കുകളുടെ സ്വാധീനം കുറയ്ക്കുകയും ചെയ്യുന്നു. 2010 സെപ്റ്റംബറിൽ സമാരംഭിച്ചു.

പ്രത്യേകതകൾ

ലിങ്ക് പിണ്ഡങ്ങൾ വാങ്ങുന്നതിൻ്റെ ജനപ്രീതി കുറയുന്നു, "ലിങ്ക് സ്ഫോടനം" എന്ന ആശയം പ്രത്യക്ഷപ്പെടുന്നു, അത് ഇപ്പോൾ എല്ലാവരും ഭയപ്പെട്ടിരുന്നു. "മോശം ഉറവിടങ്ങളിൽ" നിന്ന് അവരുടെ "സഹപ്രവർത്തകരിലേക്ക്" ധാരാളം ലിങ്കുകൾ വാങ്ങി അൽഗോരിതം തെറ്റിദ്ധരിപ്പിച്ച് എതിരാളികൾക്ക് പരസ്പരം ദോഷം ചെയ്യും. ഇതിനുശേഷം, മത്സരാർത്ഥി തിരയൽ ഫലങ്ങളിൽ നിന്ന് പുറത്തായി, വളരെക്കാലത്തേക്ക് അവിടെയെത്താൻ കഴിഞ്ഞില്ല. ഈ മേഖലയുമായി പ്രവർത്തിക്കുന്നതിലേക്ക് റോബോട്ടിൻ്റെ ശ്രദ്ധ ആകർഷിക്കുന്നതിനായി വാണിജ്യ സൈറ്റുകളുടെ വ്യത്യസ്ത പേജുകളിൽ ജിയോ സെൻസിറ്റീവ് വാക്കുകൾ കൂടുതലായി ചേർക്കുന്നു.

ഫലം

വാണിജ്യ സൈറ്റുകൾ ഇപ്പോൾ അവരുടെ പ്രശസ്തിയെക്കുറിച്ച് കൂടുതൽ ശ്രദ്ധാലുക്കളാണ്, ഇത് നല്ല വാർത്തയാണ്, പക്ഷേ പലരും ഇപ്പോഴും വൃത്തികെട്ട രീതികൾ അവലംബിക്കുന്നു (കൃത്രിമമായി ട്രാഫിക്ക് വർദ്ധിപ്പിക്കുകയും അവലോകനങ്ങൾ വാങ്ങുകയും ചെയ്യുന്നു). ഒബ്നിൻസ്ക് അൽഗോരിതം പുറത്തിറങ്ങിയതിനുശേഷം, ശാശ്വതമായ ലിങ്കുകളുടെയും ലേഖനങ്ങളുടെയും വാങ്ങൽ കൂടുതൽ ജനപ്രിയമായി; ലിങ്കുകളുടെ സാധാരണ വാങ്ങൽ മുമ്പത്തെപ്പോലെ റാങ്കിംഗിനെ സ്വാധീനിച്ചില്ല, കൂടാതെ ബാക്ക്ലിങ്കിൻ്റെ ഉറവിടം ഉപരോധത്തിന് കീഴിലാണെങ്കിൽ, അത് ചെയിൻ പ്രതികരണം. ഉയർന്ന നിലവാരമുള്ള SEO ടെക്‌സ്‌റ്റുകൾ ഏതൊരു ഉറവിടത്തിൻ്റെയും നിർബന്ധിത ആട്രിബ്യൂട്ടാണ്. അതുല്യവും ശരിയായി ഒപ്റ്റിമൈസ് ചെയ്തതുമായ ഉള്ളടക്കമുള്ള ഒരു യുവ സൈറ്റിന് ടോപ്പിൽ എത്താം.

ക്രാസ്നോദർ

അൽഗോരിതം "ക്രാസ്നോഡർ" - തിരയൽ ഫലങ്ങൾ നേർപ്പിക്കുന്നതിനും സ്നിപ്പെറ്റുകൾ വികസിപ്പിക്കുന്നതിനും സോഷ്യൽ നെറ്റ്‌വർക്കുകൾ സൂചികയിലാക്കുന്നതിനും "സ്പെക്ട്രം" സാങ്കേതികവിദ്യ നടപ്പിലാക്കൽ. 2010 ഡിസംബറിലാണ് വിക്ഷേപണം നടന്നത്.

പ്രത്യേകതകൾ

ചോദ്യങ്ങളെ വിഭാഗങ്ങളായി വർഗ്ഗീകരിക്കുന്നതിനാണ് "സ്പെക്ട്രം" സാങ്കേതികവിദ്യ സൃഷ്ടിച്ചത് കൂടാതെ നിർദ്ദിഷ്ടമല്ലാത്ത കീ വാക്യങ്ങൾ നൽകിയ സന്ദർഭങ്ങളിൽ ഇത് ഉപയോഗിച്ചു. "ക്രാസ്നോഡർ" തിരയൽ ഫലങ്ങൾ നേർപ്പിച്ചു, അത്തരമൊരു ഉപയോക്താവിന് കൂടുതൽ വൈവിധ്യമാർന്ന ഓപ്ഷനുകൾ വാഗ്ദാനം ചെയ്യുന്നു. ഉദാഹരണത്തിന്, തിരയലിൽ "മോസ്കോയുടെ ഫോട്ടോ" എന്ന വാചകം ഉപയോഗിച്ച്, പൊതുവായ പ്രകൃതിദൃശ്യങ്ങൾ മാത്രമല്ല, "ആകർഷണങ്ങൾ", "മാപ്പുകൾ", "റെസ്റ്റോറൻ്റുകൾ" തുടങ്ങിയ വിഭാഗങ്ങളിലുള്ള ഫോട്ടോഗ്രാഫുകളും കാണാൻ കഴിയും. എന്തിൻ്റെയെങ്കിലും അദ്വിതീയ പേരുകൾക്ക് (സൈറ്റുകൾ, മോഡലുകൾ, ഉൽപ്പന്നങ്ങൾ) ഊന്നൽ നൽകി - പ്രത്യേകതകൾ വേറിട്ടുനിൽക്കാൻ തുടങ്ങി. സമ്പന്നമായ സ്‌നിപ്പെറ്റുകൾ അത് ഉടനടി സാധ്യമാക്കി തിരയൽ ഫലങ്ങൾഉപയോക്താക്കളുടെ കോൺടാക്റ്റുകളും മറ്റ് ഓർഗനൈസേഷൻ ഡാറ്റയും കാണിക്കുക.

ഫലം

വാണിജ്യ സൈറ്റുകളുടെ റാങ്കിംഗ് ഗണ്യമായി മാറി; വിശദാംശങ്ങളിൽ പ്രത്യേക ശ്രദ്ധ ചെലുത്തുന്നു (ഉൽപ്പന്ന കാർഡുകൾ, വിഭജനം ഹൃസ്വ വിവരണംമൊത്തത്തിൽ നിന്ന്). VK-യിലെ സോഷ്യൽ നെറ്റ്‌വർക്ക് സൂചികയിലാക്കാൻ തുടങ്ങി, പങ്കെടുക്കുന്നവരുടെ പ്രൊഫൈലുകൾ ഇപ്പോൾ തിരയൽ ഫലങ്ങളിൽ നേരിട്ട് ദൃശ്യമാണ്. മറ്റ് സൈറ്റുകളെ അപേക്ഷിച്ച് ഉപയോക്താവിൻ്റെ ചോദ്യത്തിന് കൂടുതൽ വിപുലമായ ഉത്തരം ഉണ്ടെങ്കിൽ ഫോറങ്ങളിലെ പോസ്റ്റുകൾക്ക് ഒന്നാം റാങ്ക് ലഭിക്കും.

റെയ്ക്ജാവിക്

"Reykjavik" അൽഗോരിതം - തിരയൽ ഫലങ്ങളുടെ വ്യക്തിഗതമാക്കൽ സൃഷ്ടിക്കുകയും അന്വേഷണത്തിൻ്റെ പ്രാഥമിക ഫലങ്ങൾ പ്രദർശിപ്പിക്കുന്നതിന് "വിസാർഡ്സ്" സാങ്കേതികവിദ്യകൾ ചേർക്കുകയും ചെയ്തു. മെച്ചപ്പെട്ട ഇൻപുട്ട് സൂചന ഫോർമുല. 2011 ഓഗസ്റ്റിലാണ് അൽഗോരിതം ആരംഭിച്ചത്.

പ്രത്യേകതകൾ

വ്യക്തിഗതമാക്കിയ തിരയൽ ഫലത്തിൻ്റെ മുദ്രാവാക്യം "ഓരോ ഉപയോക്താവിനും അവരുടേതായ ഫലങ്ങൾ ഉണ്ട്." തിരയുന്നവരുടെ താൽപ്പര്യങ്ങൾ ഓർമ്മിക്കുന്നതിനുള്ള സംവിധാനം കുക്കികളിലൂടെയാണ് പ്രവർത്തിക്കുന്നത്, അതിനാൽ ഉപയോക്താവിൻ്റെ ചോദ്യങ്ങൾ പലപ്പോഴും ബന്ധപ്പെട്ടതാണെങ്കിൽ, ഉദാഹരണത്തിന്, വിദേശ വിഭവങ്ങളുമായി, അടുത്ത തവണ അവ തിരയൽ ഫലങ്ങളുടെ നേതാക്കളിൽ പ്രദർശിപ്പിക്കപ്പെടും. സെർച്ച് ബാറിലെ സൂചനകൾ ഓരോ മണിക്കൂറിലും അപ്ഡേറ്റ് ചെയ്യപ്പെടുന്നു, അതുവഴി ഒരു നിർദ്ദിഷ്ട തിരയലിൻ്റെ സാധ്യതകൾ വിപുലീകരിക്കുന്നു. ഉയർന്ന ഫ്രീക്വൻസി അന്വേഷണങ്ങൾക്കായുള്ള മത്സരം അവിശ്വസനീയമായ ശക്തിയോടെ വർദ്ധിച്ചുകൊണ്ടിരിക്കുകയാണ്.

ഫലം

വിപുലീകരിച്ച സെമാൻ്റിക് കോർ (വ്യത്യസ്‌ത ലോ-ഫ്രീക്വൻസി കീ അന്വേഷണങ്ങളുടെ ഒരു വലിയ സംഖ്യയുടെ സാന്നിധ്യം) കാരണം പ്രശസ്തമായ വാർത്താ സൈറ്റുകൾ പലപ്പോഴും ടോപ്പിൽ എത്തുന്നു. Reykvik അൽഗോരിതം പുറത്തിറങ്ങിയതിനുശേഷം വിവര സൈറ്റുകളിലെ നിർദ്ദിഷ്ട തിരയൽ അന്വേഷണങ്ങൾക്കായുള്ള പേജുകളുടെ എണ്ണത്തിൽ വർദ്ധനവ് ഒരു പ്രധാന പങ്ക് വഹിക്കാൻ തുടങ്ങി. വ്യക്തിഗതമാക്കൽ സിസ്റ്റത്തിൻ്റെ ഭാഗമാകാൻ ഓരോ സൈറ്റും ഉപയോക്താവിൻ്റെ ബുക്ക്മാർക്കുകളിൽ പ്രവേശിക്കാൻ ശ്രമിച്ചു; ഇതിനായി, RSS ഫീഡിലേക്ക് സബ്‌സ്‌ക്രൈബുചെയ്യുന്ന രീതികളും സൈറ്റ് ബുക്ക്‌മാർക്ക് ചെയ്യുന്നതിനുള്ള പോപ്പ്-അപ്പ് ബാനർ സൂചനകളും ഉപയോഗിച്ചു. ഇൻ്റർനെറ്റ് ഉറവിടങ്ങൾ കൂടുതൽ ശ്രദ്ധിക്കാൻ തുടങ്ങി വ്യക്തിഗത സമീപനം, ജനങ്ങളിൽ സമ്മർദ്ദം ചെലുത്തരുത്.

കലിനിൻഗ്രാഡ്

"കലിനിൻഗ്രാഡ്" അൽഗോരിതം, പെരുമാറ്റ ഘടകങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്ന, തിരയലിൻ്റെയും തിരയൽ സ്ട്രിംഗിൻ്റെയും ആഗോള വ്യക്തിഗതമാക്കലാണ്. 2012 ഡിസംബറിൽ കലിനിൻഗ്രാഡിൻ്റെ സമാരംഭം SEO സേവനങ്ങളുടെ വില ഗണ്യമായി വർദ്ധിപ്പിച്ചു.

പ്രത്യേകതകൾ

ഉപയോക്താവിൻ്റെ താൽപ്പര്യങ്ങൾ മുഴുവൻ തിരയൽ ഫലങ്ങളെയും തലകീഴായി മാറ്റി - മുമ്പ് സന്ദർശകൻ്റെ സൈറ്റിലെ താമസത്തിൻ്റെ സുഖത്തെക്കുറിച്ച് ശ്രദ്ധിക്കാതിരുന്ന സൈറ്റ് ഉടമകൾ മിന്നൽ വേഗതയിൽ ട്രാഫിക് നഷ്ടപ്പെടാൻ തുടങ്ങി. ഇപ്പോൾ Yandex അതിൻ്റെ താൽപ്പര്യങ്ങളെ ഹ്രസ്വകാല, ദീർഘകാല എന്നിങ്ങനെ വിഭജിച്ചു, അതിൻ്റെ ചാര ഡാറ്റാബേസുകൾ ദിവസത്തിൽ ഒരിക്കൽ അപ്ഡേറ്റ് ചെയ്യുന്നു. ഇന്നും നാളെയും ഒരേ അഭ്യർത്ഥനയ്ക്ക്, ഒരേ ഉപയോക്താവിനെ തികച്ചും വ്യത്യസ്തമായ ഫലം കാണിക്കാം എന്നാണ് ഇതിനർത്ഥം. ടാക്സി - ടാക്സി സേവനങ്ങൾ എന്ന വാചകം ടൈപ്പുചെയ്യുമ്പോൾ മുമ്പ് യാത്രയിൽ താൽപ്പര്യമുണ്ടായിരുന്ന ഒരു ഉപയോക്താവിന് താൽപ്പര്യങ്ങൾ ഇപ്പോൾ ഒരു പ്രത്യേക പങ്ക് വഹിക്കുന്നു, കൂടാതെ നിരന്തരം സിനിമകൾ കാണുന്ന ഒരാൾക്ക് - തിരയൽ ഫലങ്ങളിൽ "ടാക്സി" എന്ന കോമഡി ചിത്രത്തെക്കുറിച്ചുള്ള എല്ലാം അവർക്ക് ലഭിക്കും. . "വിവരങ്ങൾ കണ്ടെത്താൻ വിശക്കുന്ന" ഓരോ വ്യക്തിയുടെയും തിരയൽ ബാറിൽ, മുൻ താൽപ്പര്യങ്ങളെക്കുറിച്ചുള്ള നുറുങ്ങുകൾ ഇപ്പോൾ ആദ്യ സ്ഥാനങ്ങളിൽ പ്രദർശിപ്പിക്കും.

ഫലം

ഒപ്റ്റിമൈസറുകൾ എല്ലാം കവർ ചെയ്യാൻ തുടങ്ങി കൂടുതൽ വഴികൾഉപയോക്താവിനെ നിലനിർത്തുക: ഉപയോഗക്ഷമതയും രൂപകൽപ്പനയും മെച്ചപ്പെട്ടു, ഉള്ളടക്കം കൂടുതൽ വൈവിധ്യവും ഉയർന്ന നിലവാരവും സൃഷ്ടിക്കുന്നു. പുറത്തുകടക്കുമ്പോൾ, "നിങ്ങൾക്ക് പേജ് വിടണമെന്ന് തീർച്ചയാണോ" എന്നതുപോലുള്ള വിൻഡോകൾ പോപ്പ് അപ്പ് ചെയ്‌തേക്കാം, കൂടാതെ ഏതെങ്കിലും ജീവിയുടെ ദുഃഖകരമായ മുഖം ഉപയോക്താവിനെ ഉറ്റുനോക്കും. നന്നായി ചിന്തിക്കുന്ന പേജ് ലിങ്കിംഗും എപ്പോഴും ആക്‌സസ് ചെയ്യാവുന്ന മെനുവും ഉപയോക്തൃ പ്രവർത്തന സൂചകങ്ങൾ മെച്ചപ്പെടുത്തി, ഇത് തിരയൽ ഫലങ്ങളിൽ സൈറ്റുകളുടെ സ്ഥാനങ്ങൾ വർദ്ധിപ്പിച്ചു. വിശാലമായ ഇൻ്റർനെറ്റ് ഉപയോക്താക്കൾക്ക് വ്യക്തമല്ലാത്ത സൈറ്റുകൾ ആദ്യം സ്ഥാനങ്ങളിൽ തരംതാഴ്ത്തി, തുടർന്ന് സാധാരണയായി നിർദ്ദേശിച്ച ഫലങ്ങളുടെ പട്ടികയുടെ അവസാനം തൂക്കിയിടും.

ഡബ്ലിൻ

ഡബ്ലിൻ അൽഗോരിതം - നിലവിലെ ലക്ഷ്യങ്ങൾ തിരിച്ചറിയുന്നതിലൂടെ വ്യക്തിഗതമാക്കൽ മെച്ചപ്പെടുത്തി. "കാലിനിൻഗ്രാഡ്" ൻ്റെ ഈ നവീകരിച്ച പതിപ്പ് 2013 മെയ് മാസത്തിൽ ലോകത്തിന് പുറത്തിറങ്ങി.

പ്രത്യേകതകൾ

ഉപയോക്താക്കളുടെ മാറിക്കൊണ്ടിരിക്കുന്ന താൽപ്പര്യങ്ങൾ ട്രാക്കുചെയ്യുന്നതിനുള്ള ഒരു ഫംഗ്ഷൻ സാങ്കേതികവിദ്യയിൽ ഉൾപ്പെടുന്നു. അതായത്, തികച്ചും വ്യത്യസ്തമായ രണ്ട് തിരയൽ കാഴ്ചകൾ ഉണ്ടെങ്കിൽ നിശ്ചിത കാലയളവ്സമയം, അൽഗോരിതം രണ്ടാമത്തേത് തിരഞ്ഞെടുക്കുകയും തിരയൽ ഫലങ്ങളിൽ ഉൾപ്പെടുത്തുകയും ചെയ്യും.

ഫലം

വെബ്‌സൈറ്റുകൾക്ക്, പ്രായോഗികമായി ഒന്നും മാറിയിട്ടില്ല. ഗതാഗതത്തിനു വേണ്ടി മാത്രമല്ല, പുരോഗതിക്കു വേണ്ടിയും സമരം തുടരുകയാണ് പെരുമാറ്റ സൂചകങ്ങൾ. പഴയ വെബ്‌സൈറ്റ് ലേഔട്ടുകൾ ഉപേക്ഷിക്കാൻ തുടങ്ങിയിരിക്കുന്നു, കാരണം പഴയതിൽ എന്തെങ്കിലും ശരിയാക്കാൻ ശ്രമിക്കുന്നതിനേക്കാൾ പുതിയത് നിർമ്മിക്കുന്നത് എളുപ്പമാണ്. വെബ്‌സൈറ്റ് ടെംപ്ലേറ്റ് സേവനങ്ങളുടെ വിതരണം വർദ്ധിച്ചുകൊണ്ടിരിക്കുകയാണ്, സൗകര്യപ്രദവും മനോഹരവുമായ വെബ് റിസോഴ്‌സ് ലേഔട്ടുകൾക്കായുള്ള മത്സരം ആരംഭിക്കുന്നു.

ദ്വീപുകൾ

"ദ്വീപുകൾ" അൽഗോരിതം - തിരയൽ ഫലങ്ങളിൽ സംവേദനാത്മക ബ്ലോക്കുകൾ പ്രദർശിപ്പിക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യ അവതരിപ്പിച്ചു, Yandex തിരയൽ പേജിൽ നേരിട്ട് സൈറ്റുമായി സംവദിക്കാൻ ഉപയോക്താവിനെ അനുവദിക്കുന്നു. ബീറ്റാ പതിപ്പിനെ സജീവമായി പിന്തുണയ്ക്കാനും ഇൻ്ററാക്ടീവ് "ദ്വീപുകൾ" സൃഷ്‌ടിക്കുന്നതിന് ടെംപ്ലേറ്റുകൾ ഉപയോഗിക്കാനും വെബ്‌മാസ്റ്റർമാർക്കുള്ള നിർദ്ദേശത്തോടെ 2013 ജൂലൈയിൽ അൽഗോരിതം സമാരംഭിച്ചു. അടച്ചിട്ട വാതിലിനു പിന്നിലുള്ള സാങ്കേതിക വിദ്യയാണ് ഇപ്പോൾ പരീക്ഷിക്കുന്നത്.

പ്രത്യേകതകൾ

ഇപ്പോൾ, തിരയലിൽ നിന്ന് ഉടനടി കണ്ടെത്താൻ കഴിയുന്ന വിവരങ്ങൾക്കായി തിരയുമ്പോൾ, ഉപയോക്താവിന് “ദ്വീപുകൾ” വാഗ്ദാനം ചെയ്യുന്നു - ഫോമുകളും സൈറ്റ് സന്ദർശിക്കാതെ പ്രവർത്തിക്കാൻ കഴിയുന്ന മറ്റ് ഘടകങ്ങളും. ഉദാഹരണത്തിന്, നിങ്ങൾ ഒരു നിർദ്ദിഷ്‌ട സിനിമയ്‌ക്കോ റെസ്റ്റോറൻ്റിനോ വേണ്ടി തിരയുകയാണ്. തിരയലിലുള്ള സിനിമയ്‌ക്കായി, അതിൻ്റെ വലതുവശത്ത്, ചിത്രത്തിൻ്റെ കവർ, അതിൻ്റെ പേര്, അഭിനേതാക്കൾ, നിങ്ങളുടെ നഗരത്തിലെ സിനിമാശാലകളിലെ പ്രദർശന സമയങ്ങൾ, ടിക്കറ്റുകൾ വാങ്ങുന്നതിനുള്ള ഒരു ഫോം എന്നിവയ്‌ക്കൊപ്പം ബ്ലോക്കുകൾ പ്രദർശിപ്പിക്കും. റെസ്റ്റോറൻ്റ് അതിൻ്റെ ഫോട്ടോ, വിലാസം, ടെലിഫോൺ നമ്പറുകൾ, ടേബിൾ റിസർവേഷൻ ഫോം എന്നിവ പ്രദർശിപ്പിക്കും.

ഫലം

സൈറ്റുകളുടെ റാങ്കിംഗിൽ ആദ്യം കാര്യമായ മാറ്റമൊന്നും ഉണ്ടായില്ല. സെർച്ച് ഫലങ്ങളുടെ വലതുവശത്തും ഇൻ്ററാക്ടീവ് ബ്ലോക്കുകളുള്ള വെബ് റിസോഴ്‌സുകളുടെ രൂപം മാത്രമാണ് ശ്രദ്ധേയമായത്. ബീറ്റാ ടെസ്റ്റിംഗിൽ പങ്കെടുത്ത സൈറ്റുകളുടെ എണ്ണം പ്രാധാന്യമർഹിക്കുന്നുണ്ടെങ്കിൽ, ഉപയോക്താക്കൾക്കുള്ള ആകർഷകത്വവും ആകർഷകത്വവും കാരണം അവയ്ക്ക് സാധാരണ സൈറ്റുകൾ സ്ഥാനഭ്രഷ്ടനാക്കാം. കൂടുതൽ ഫോട്ടോകളും വീഡിയോകളും റേറ്റിംഗുകളും അവലോകനങ്ങളും ചേർത്ത് തിരയൽ ഫലങ്ങളിൽ അവരുടെ ഉള്ളടക്കത്തിൻ്റെ ദൃശ്യപരത മെച്ചപ്പെടുത്തുന്നതിനെക്കുറിച്ച് SEO-കൾ ആലോചിക്കുന്നു. ഓൺലൈൻ സ്റ്റോറുകൾക്ക് ജീവിതം മികച്ചതാണ് - ശരിയായി കോൺഫിഗർ ചെയ്ത ഉൽപ്പന്ന കാർഡുകൾ ഒരു മികച്ച സംവേദനാത്മക "ദ്വീപ്" ആകാം.

മിനുസിൻസ്ക്

“Minusinsk” അൽഗോരിതം - തിരയൽ റാങ്കിംഗ് ഫലങ്ങൾ വളച്ചൊടിക്കാൻ വാങ്ങിയ SEO ലിങ്കുകൾ തിരിച്ചറിയുമ്പോൾ, സൈറ്റിലേക്ക് ഒരു ഫിൽട്ടർ പ്രയോഗിച്ചു, ഇത് സൈറ്റിൻ്റെ സ്ഥാനം ഗണ്യമായി നശിപ്പിച്ചു. "Minusinsk" 2015 ഏപ്രിലിൽ പ്രഖ്യാപിക്കപ്പെട്ടു, അതേ വർഷം മെയ് മാസത്തിൽ പൂർണ്ണമായും പ്രാബല്യത്തിൽ വന്നു. ഈ അൽഗോരിതം ഉപയോഗിച്ചാണ് പ്രസിദ്ധമായത് ബന്ധപ്പെട്ടിരിക്കുന്നത്.

പ്രത്യേകതകൾ

Minusinsk-ൻ്റെ റിലീസിന് മുമ്പ്, 2014-ൽ, Yandex മോസ്കോയിലെ നിരവധി വാണിജ്യ കീകൾക്കായുള്ള SEO ലിങ്കുകളുടെ സ്വാധീനം പരിശോധനയ്ക്കായി പ്രവർത്തനരഹിതമാക്കി, ഫലങ്ങൾ വിശകലനം ചെയ്തു. ഫലം പ്രവചനാതീതമായി മാറി - വാങ്ങിയ ലിങ്ക് പിണ്ഡം ഇപ്പോഴും ഉപയോഗിക്കുന്നു, പക്ഷേ തിരയൽ എഞ്ചിന് ഇത് സ്പാം ആണ്. സൈറ്റ് ഉടമകൾക്ക് അവരുടെ ലിങ്ക് പ്രൊഫൈലുകളും ചെലവഴിച്ച ബജറ്റും വൃത്തിയാക്കേണ്ട ഒരു ദിവസമായി Minusinsk ൻ്റെ റിലീസ് അടയാളപ്പെടുത്തി. ലിങ്ക് പ്രമോഷൻ, നിങ്ങളുടെ ഇൻ്റർനെറ്റ് റിസോഴ്സിൻ്റെ ഗുണനിലവാരം മെച്ചപ്പെടുത്താൻ ഉപയോഗിക്കുക.

ഫലം

ലിങ്കുകളുടെ ബൾക്ക് പർച്ചേസിന് നന്ദി പറഞ്ഞ "പ്രശസ്ത" സൈറ്റുകൾ ആദ്യ പേജുകളിൽ നിന്ന് പറന്നുപോയി, ചിലർക്ക് നിയമങ്ങൾ ലംഘിച്ചതിന് ഉപരോധം ലഭിച്ചു. ബാക്ക്‌ലിങ്കുകളെ ആശ്രയിക്കാത്ത ഉയർന്ന നിലവാരമുള്ളതും ചെറുപ്പമുള്ളതുമായ സൈറ്റുകൾ പെട്ടെന്ന് TOP 10-ൽ ഇടം നേടി. "വിതരണത്തിൽ പിടിക്കപ്പെട്ടു" ദീർഘനേരം കാത്തിരിക്കാൻ ആഗ്രഹിക്കാത്ത വെബ്‌സൈറ്റുകൾ പുതിയ സൈറ്റുകൾ സൃഷ്‌ടിക്കുകയും ഉള്ളടക്കം കൈമാറുകയും പഴയവയിൽ പ്ലഗ് ഇടുകയും ചെയ്യുന്നു, അല്ലെങ്കിൽ റീഡയറക്‌ടുകൾ ഉപയോഗിച്ച് കൗശലപൂർവ്വം നാണംകെടുത്തി. ഏകദേശം 3 മാസങ്ങൾക്ക് ശേഷം, ഈ ഫിൽട്ടർ തൽക്ഷണം നീക്കം ചെയ്യാൻ ഞങ്ങളെ അനുവദിക്കുന്ന അൽഗോരിതത്തിൽ ഒരു ദ്വാരം ഞങ്ങൾ കണ്ടെത്തി.

ഉപയോഗക്ഷമതയും ഉള്ളടക്കവും കൂട്ടത്തോടെ മെച്ചപ്പെടുത്താൻ തുടങ്ങിയിരിക്കുന്നു. ലിങ്കുകൾ കൂടുതൽ ശ്രദ്ധയോടെ വാങ്ങുന്നു, ബാക്ക്‌ലിങ്കുകളുടെ നിയന്ത്രണം അതിലൊന്നായി മാറുന്നു പ്രവർത്തനപരമായ ഉത്തരവാദിത്തങ്ങൾഒപ്റ്റിമൈസർ.

ഇന്നത്തെ ഡാറ്റ അനുസരിച്ച്, നിങ്ങൾ അശ്രദ്ധമായി ലിങ്കുകൾ വാങ്ങുകയാണെങ്കിൽ, 100 ലിങ്കുകൾക്ക് പോലും നിങ്ങൾക്ക് ഒരു ഫിൽട്ടർ ലഭിക്കും. എന്നാൽ ലിങ്ക് പിണ്ഡം ശരിയായി നേർപ്പിച്ചാൽ, പഴയ നല്ല ദിവസങ്ങളിലെന്നപോലെ നിങ്ങൾക്ക് ആയിരക്കണക്കിന് ലിങ്കുകൾ സുരക്ഷിതമായി വാങ്ങാം. അതായത്, സാരാംശത്തിൽ, ആൾക്കൂട്ടവും പരാമർശങ്ങളും കളിച്ച ഈ നേർപ്പിക്കുന്നതിനുള്ള ലിങ്ക് ബജറ്റുകൾ ഗണ്യമായി വളർന്നു.

വ്ലാഡിവോസ്റ്റോക്ക്

മൊബൈൽ ഉപകരണങ്ങളുമായി പൂർണ്ണമായ അനുയോജ്യതയ്ക്കായി ഒരു സൈറ്റ് പരിശോധിക്കുന്നതിനുള്ള തിരയൽ സാങ്കേതികവിദ്യയുടെ ആമുഖമാണ് "വ്ലാഡിവോസ്റ്റോക്ക്" അൽഗോരിതം. പദ്ധതിയുടെ പൂർണ തുടക്കം 2016 ഫെബ്രുവരിയിലാണ് നടന്നത്.

പ്രത്യേകതകൾ

Yandex മൊബൈൽ ഉപയോക്താക്കൾക്കായി മറ്റൊരു ചുവടുവെപ്പ് നടത്തി. വ്ലാഡിവോസ്റ്റോക്ക് അൽഗോരിതം അവർക്കായി വികസിപ്പിച്ചെടുത്തതാണ്. ഇപ്പോൾ മികച്ച റാങ്കിങ്ങിനായി മൊബൈൽ തിരയൽസൈറ്റ് മൊബൈൽ പ്രവേശനക്ഷമത ആവശ്യകതകൾ പാലിക്കണം. തിരയൽ ഫലങ്ങളിൽ നിങ്ങളുടെ എതിരാളികളെക്കാൾ മുന്നിലെത്താൻ, ടാബ്‌ലെറ്റുകളും സ്‌മാർട്ട്‌ഫോണുകളും ഉൾപ്പെടെ ഏത് വെബ് ഉപകരണത്തിലും ഇൻ്റർനെറ്റ് ഉറവിടം ശരിയായി പ്രദർശിപ്പിക്കണം. വ്ലാഡിവോസ്റ്റോക്ക് പരിശോധിക്കുന്നു ജാവയുടെ അഭാവംഒപ്പം ഫ്ലാഷ് പ്ലഗിനുകൾ, സ്‌ക്രീൻ വിപുലീകരണത്തിന് ഉള്ളടക്കത്തിൻ്റെ പൊരുത്തപ്പെടുത്തൽ (ഡിസ്‌പ്ലേയുടെ വീതിയിലുടനീളം ടെക്‌സ്‌റ്റ് ശേഷി), ടെക്‌സ്‌റ്റ് വായിക്കാനുള്ള എളുപ്പവും ലിങ്കുകളിലും ബട്ടണുകളിലും സുഖമായി ക്ലിക്ക് ചെയ്യാനുള്ള കഴിവും.

ഫലം

വ്ലാഡിവോസ്റ്റോക്ക് അൽഗോരിതം സമാരംഭിച്ച സമയത്ത്, 18% സൈറ്റുകൾ മാത്രമേ മൊബൈൽ-സൗഹൃദമായി മാറിയുള്ളൂ - ബാക്കിയുള്ളവ പ്രദർശിപ്പിക്കാത്ത പേജുകളിലെ "ഭാരം" വേഗത്തിൽ ഒഴിവാക്കണം അല്ലെങ്കിൽ ഉള്ളടക്കം ശരിയായി പ്രദർശിപ്പിക്കുന്നത് തടയുന്നു. സ്മാർട്ട്ഫോണുകളും ടാബ്ലറ്റുകളും. മൊബൈൽ തിരയൽ ഫലങ്ങളിൽ വെബ്‌സൈറ്റിൻ്റെ റാങ്കിംഗിനെ സ്വാധീനിക്കുന്ന പ്രധാന ഘടകം മൊബൈൽ ഉപയോക്താവിൻ്റെ പെരുമാറ്റമാണ്. ഇപ്പോഴെങ്കിലും. എല്ലാത്തിനുമുപരി, തികച്ചും മൊബൈൽ-സൗഹൃദ സൈറ്റുകൾ അത്രയധികം ഇല്ല, അതിനാൽ പൂർണ്ണമായി അല്ലെങ്കിലും ഉപയോക്താവിന് ഏറ്റവും സുഖപ്രദമായ സാഹചര്യങ്ങൾ നൽകാൻ കഴിവുള്ളവരാണ് തിരയലിലെ സൌജന്യ സ്ഥലങ്ങൾ ഉൾക്കൊള്ളുന്നത്. മൊബൈൽ ഉപകരണങ്ങളുമായി പൊരുത്തപ്പെടാത്ത സൈറ്റുകൾ മൊബൈൽ തിരയലിൽ നിന്ന് ഒഴിവാക്കപ്പെടുന്നില്ല, എന്നാൽ സ്മാർട്ട് ഉപയോക്താക്കൾക്കുള്ള സേവനങ്ങളുടെ ഗുണനിലവാരം മെച്ചപ്പെടുത്തുന്നതിൽ കൈവരിച്ച സൈറ്റുകളേക്കാൾ താഴെയാണ് റാങ്ക് ചെയ്യപ്പെട്ടിരിക്കുന്നത്. മികച്ച ഫലങ്ങൾ. ഇപ്പോൾ, വെബ്‌സൈറ്റ് ലേഔട്ടുകൾ ഓർഡർ ചെയ്യുന്ന ഏറ്റവും ജനപ്രിയമായ തരം അഡാപ്റ്റീവ് ആണ്, മൊബൈൽ അല്ല, ഒരാൾ വിചാരിച്ചേക്കാം. അൽഗോരിതത്തിൻ്റെ എല്ലാ ആവശ്യകതകളും പാസാക്കുന്ന സൈറ്റുകൾ സ്വീകരിക്കുന്നു പരമാവധി തുക മൊബൈൽ ട്രാഫിക്നിങ്ങളുടെ സ്ഥലത്ത്.

ഗൂഗിൾ: അൽഗോരിതങ്ങളുടെ സൃഷ്ടിയുടെയും വികസനത്തിൻ്റെയും ചരിത്രം

റഷ്യൻ സംസാരിക്കുന്ന ഒപ്റ്റിമൈസറുകൾക്ക് Google-ൻ്റെ അൽഗോരിതങ്ങളും ഫിൽട്ടറുകളും ഇപ്പോഴും പൂർണ്ണമായി മനസ്സിലായിട്ടില്ല. എല്ലായ്‌പ്പോഴും Google-ന് പ്രധാനപ്പെട്ട പോയിൻ്റ്"മാന്യമായ" സൈറ്റുകൾ ഭയപ്പെടേണ്ട കാര്യമില്ലെന്നും "സത്യസന്ധതയില്ലാത്ത" സൈറ്റുകൾ തങ്ങളെ കാത്തിരിക്കുന്നത് എന്താണെന്ന് അറിയാതിരിക്കുന്നതാണ് നല്ലതെന്നും വിശദീകരിച്ചുകൊണ്ട് റാങ്കിംഗ് രീതികളെക്കുറിച്ചുള്ള വിശദാംശങ്ങൾ മറയ്ക്കുകയായിരുന്നു. അതിനാൽ, ഗൂഗിൾ അൽഗോരിതങ്ങളെക്കുറിച്ച് ഐതിഹ്യങ്ങൾ ഇപ്പോഴും സൃഷ്ടിക്കപ്പെടുന്നു, കൂടാതെ തിരയൽ ഫലങ്ങളിൽ സൈറ്റ് സാഗ് ചെയ്യുമ്പോൾ പിന്തുണയ്ക്കാൻ ചോദ്യങ്ങൾ ചോദിച്ചതിന് ശേഷമാണ് ധാരാളം വിവരങ്ങൾ ലഭിച്ചത്. ഗൂഗിളിന് നിരവധി ചെറിയ മെച്ചപ്പെടുത്തലുകൾ ഉണ്ടായിരുന്നു, അത് കണക്കാക്കാൻ കഴിയില്ല, എന്താണ് കൃത്യമായി മാറിയതെന്ന് ചോദിച്ചപ്പോൾ, വിദേശ പിഎസ് നിശബ്ദത പാലിച്ചു. സൈറ്റുകളുടെ സ്ഥാനങ്ങളെ സാരമായി സ്വാധീനിച്ച പ്രധാന അൽഗോരിതങ്ങൾ നമുക്ക് പരിഗണിക്കാം.

കഫീൻ

അൽഗോരിതം “കഫീൻ” - തിരയലിൻ്റെ ആദ്യ പേജിൽ ബ്രാൻഡ് അനുസരിച്ച് ഒരേ സൈറ്റിൻ്റെ നിരവധി പേജുകൾ ഉണ്ടാകാം, കൂടാതെ ഒരു പ്രിവ്യൂ ഓപ്ഷനുമുണ്ട്. 2010 ജൂണിലാണ് വിക്ഷേപണം നടന്നത്.

പ്രത്യേകതകൾ

ബ്രാൻഡ് പ്രകാരം തിരയുമ്പോൾ കമ്പനി വെബ്സൈറ്റുകൾ ഹൈലൈറ്റ് ചെയ്യുന്നു. പ്രിവ്യൂവിനായി ഔട്ട്‌പുട്ട് ലൈനിന് സമീപം ഒരു "മാഗ്‌നിഫൈയിംഗ് ഗ്ലാസ്" ദൃശ്യമാകുന്നു. ബ്രാൻഡ് കീവേഡുകൾ മൊത്തത്തിൽ ഇൻ്റർനെറ്റ് റിസോഴ്സിൻ്റെ സ്ഥാനങ്ങളിൽ നല്ല വളർച്ചാ പ്രവണത നൽകുന്നു. പേജ് റാങ്ക് സൂചിക അപ്‌ഡേറ്റുചെയ്‌തു, അതേസമയം അറിയപ്പെടുന്നതും സന്ദർശിച്ചതുമായ സൈറ്റുകളിൽ പിആർ വർദ്ധിച്ചു.

ഫലം

ഉൾപ്പെടെ വെബ്‌സൈറ്റ് ബ്രാൻഡിംഗിൽ SEO-കൾ കൂടുതൽ ശ്രദ്ധ ചെലുത്താൻ തുടങ്ങി വർണ്ണ സ്കീമുകൾ, ലോഗോകൾ, പേരുകൾ. ബ്രാൻഡിനായുള്ള കീവേഡുകൾ സൈറ്റിൻ്റെ പേജുകളെ തിരയലിൽ ഒരു പ്രത്യേക രീതിയിൽ വേറിട്ടുനിർത്തി, ഒരു സന്ദർശകൻ അത്തരമൊരു വാക്യത്തിൽ നിന്ന് പ്രധാന പേജിലേക്ക് മാറിയപ്പോൾ, തിരയൽ ഫലങ്ങളിൽ അവൻ്റെ സ്ഥാനം വർദ്ധിച്ചു (അതിനുമുമ്പ് ഉറവിടം ഒരു നേതാവായിരുന്നില്ലെങ്കിൽ) . ഉദ്ധരണികൾ വർദ്ധിപ്പിക്കുന്നതിനായി SEO ഒപ്റ്റിമൈസറുകൾ കൂടുതൽ ലിങ്കുകൾ വാങ്ങാൻ തുടങ്ങി. യുവാക്കൾക്കും അധികം അംഗീകൃതമല്ലാത്ത ബ്രാൻഡുകൾക്കും TOP തിരയൽ ഫലങ്ങളിലേക്ക് കടക്കുക എന്നത് മിക്കവാറും അസാധ്യമായിരുന്നു.

പാണ്ട

നിരവധി SEO ഘടകങ്ങൾ ഉൾപ്പെടെ, ഉള്ളടക്കത്തിൻ്റെ ഗുണമേന്മയും ഉപയോഗവും ഒരു വെബ്സൈറ്റ് പരിശോധിക്കുന്നതിനുള്ള ഒരു സാങ്കേതികവിദ്യയാണ് പാണ്ട അൽഗോരിതം. "കറുത്ത തൊപ്പി" SEO ഉള്ള സൈറ്റുകൾ തിരയലുകളിൽ നിന്ന് ഒഴിവാക്കിയിരിക്കുന്നു. 2012 ജനുവരിയിലാണ് പാണ്ടയെ പ്രഖ്യാപിച്ചത്.

പ്രത്യേകതകൾ

"പാണ്ട" തിരയാൻ പുറപ്പെട്ടു, അവശിഷ്ടങ്ങൾ വൃത്തിയാക്കി. അപ്രസക്തമായ ഒരുപാട് കാര്യങ്ങൾക്ക് ശേഷം നിങ്ങൾക്ക് പറയാൻ കഴിയുന്നത് അതാണ് പ്രധാന ചോദ്യങ്ങൾവെബ്‌സൈറ്റുകൾ അപ്രത്യക്ഷമായി Google ഫലങ്ങൾ. അൽഗോരിതം ശ്രദ്ധിക്കുന്നു: കീവേഡ് സ്പാമും അസമമായ ഉപയോഗവും, ഉള്ളടക്കത്തിൻ്റെ പ്രത്യേകത, പ്രസിദ്ധീകരണങ്ങളുടെയും അപ്‌ഡേറ്റുകളുടെയും സ്ഥിരത, ഉപയോക്തൃ പ്രവർത്തനവും സൈറ്റുമായുള്ള ആശയവിനിമയവും. വായനാ വേഗതയിൽ ഒരു സന്ദർശകൻ്റെ സ്ക്രോൾ ഒരു പേജിൻ്റെ അടിയിലേക്ക് വരുന്നത് ഒരു നല്ല ഘടകമായി കണക്കാക്കപ്പെട്ടു.

ഫലം

പാണ്ട ഓണാക്കിയ ശേഷം, സെർച്ച് എഞ്ചിനിൽ നിന്നുള്ള ഉപരോധത്തിന് ഒരുപാട് സൈറ്റുകൾ കീഴടങ്ങി. Google സിസ്റ്റങ്ങൾലിങ്ക് പിരമിഡുകളിലെ പങ്കാളിത്തവും ലിങ്ക് പിണ്ഡങ്ങൾ വാങ്ങുന്നതുമാണ് ഇതിന് കാരണമെന്ന് ആദ്യം എല്ലാവരും കരുതി. തൽഫലമായി, SEO ഒപ്റ്റിമൈസറുകൾ അൽഗോരിതം പരിശോധിക്കുന്നതിനുള്ള ഒരു പ്രക്രിയ നടത്തുകയും ആഘാതം വിശകലനം ചെയ്യുകയും ചെയ്തു. സന്ദർശകർക്കുള്ള മൂല്യത്തിനായി പാണ്ട ഇപ്പോഴും സൈറ്റിൻ്റെ ഗുണനിലവാരം പരിശോധിക്കുന്നു എന്നായിരുന്നു പരീക്ഷണങ്ങളുടെ നിഗമനം. ഇൻ്റർനെറ്റ് ഉറവിടങ്ങൾ കോപ്പി-പേസ്റ്റ് നിർത്തുകയും സജീവമായി കോപ്പിറൈറ്റിംഗ് ആരംഭിക്കുകയും ചെയ്തു. പെരുമാറ്റ ഘടകങ്ങൾസൈറ്റിൻ്റെ ഘടനയെ കൂടുതൽ സൗകര്യപ്രദമായ ഓപ്ഷനുകളാക്കി മാറ്റി, പ്രത്യേക ഹൈലൈറ്റുകൾ ഉപയോഗിച്ച് ലേഖനങ്ങൾക്കുള്ളിൽ ലിങ്ക് ചെയ്യുന്നത് ഒപ്റ്റിമൈസേഷൻ്റെ ഒരു പ്രധാന ഭാഗമായി മാറി. ഒരു സേവനമെന്ന നിലയിൽ SEO- യുടെ ജനപ്രീതി കുതിച്ചുയർന്നു. പാണ്ട നിയമങ്ങൾ പാലിക്കാത്ത സൈറ്റുകൾ തിരച്ചിലിൽ നിന്ന് വളരെ വേഗം അപ്രത്യക്ഷമായത് ശ്രദ്ധയിൽപ്പെട്ടു.

പേജ് ലേഔട്ട് (പൈജ് ലിയോട്ട്)

വെബ്‌സൈറ്റ് പേജുകളിലെ ഉപയോഗപ്രദമായ സ്പാം ഉള്ളടക്കത്തിൻ്റെ അനുപാതം കണക്കാക്കുന്ന തിരയൽ സ്പാമിനെ ചെറുക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യയാണ് പേജ് ലിയോട്ട് അൽഗോരിതം. 2012 ജനുവരിയിൽ സമാരംഭിക്കുകയും 2014 വരെ അപ്ഡേറ്റ് ചെയ്യുകയും ചെയ്തു.

പ്രത്യേകതകൾ

വളരെ കുറച്ച് പ്രസക്തമായ ഉള്ളടക്കമോ ആവശ്യമായ ഡാറ്റയോ ആക്‌സസ് ചെയ്യാൻ ബുദ്ധിമുട്ടുള്ളതോ ചിലപ്പോൾ പൂർണ്ണമായും ഇല്ലാത്തതോ ആയ പേജുകളിൽ സത്യസന്ധമല്ലാത്ത സൈറ്റ് ഉടമകളെക്കുറിച്ചുള്ള നിരവധി ഉപയോക്തൃ പരാതികൾക്ക് ശേഷമാണ് “പേജ് ലേഔട്ട്” സൃഷ്‌ടിച്ചത്. ഒരു ഇൻകമിംഗ് അഭ്യർത്ഥനയ്‌ക്കായി പേജിലെ പ്രസക്തമായ ഉള്ളടക്കത്തിൻ്റെയും സ്‌പാമിൻ്റെയും ശതമാനം അൽഗോരിതം കണക്കാക്കുന്നു. ആവശ്യകതകൾ പാലിക്കാത്ത സൈറ്റുകൾക്ക് ഉപരോധം ഏർപ്പെടുത്തുകയും സൈറ്റിനെ തിരച്ചിലിൽ നിന്ന് നീക്കം ചെയ്യുകയും ചെയ്തു. രണ്ടാമത്തെ സ്‌ക്രീനിലേക്ക് പോകേണ്ട ടെക്‌സ്‌റ്റ് കാണുമ്പോൾ, ഡോക്യുമെൻ്റുകൾ പോസ്‌റ്റ് ചെയ്യുന്നതിനുള്ള നിയമങ്ങൾ പാലിക്കാത്തതിൽ പരസ്യം നിറഞ്ഞ ഒരു സൈറ്റ് ഹെഡറും ഉൾപ്പെടുന്നു.

ഫലം

കീവേഡുകൾക്കായി പേജുകളിലെ ഉള്ളടക്കം മിതമായ രീതിയിൽ ഒപ്റ്റിമൈസ് ചെയ്‌തിരുന്നെങ്കിലും, പരസ്യം കൊണ്ട് വളരെ സ്‌പാമി ആയ സൈറ്റുകൾ അവയുടെ സ്ഥാനങ്ങളിൽ നിന്ന് വീണു. അന്വേഷണങ്ങളിൽ പ്രസക്തമല്ലാത്ത പേജുകൾ തിരയൽ ഫലങ്ങളിൽ തരംതാഴ്ത്തി. എന്നാൽ നഗ്നമായി നിയമങ്ങൾ പാലിക്കാത്തതും സന്ദർശകരുടെ സുഖസൗകര്യങ്ങളെക്കുറിച്ച് വിഷമിക്കാത്തതുമായ നിരവധി സൈറ്റുകൾ ഉണ്ടായിരുന്നില്ല. അൽഗോരിതത്തിലേക്കുള്ള മൂന്ന് അപ്‌ഡേറ്റുകൾക്ക് ശേഷം, ഫിൽട്ടറിന് കീഴിൽ വരുന്ന ഏകദേശ ഉറവിടങ്ങളുടെ എണ്ണം 3% ൽ കൂടുതലല്ല.

(വെനീസ്)

"വെനീസ്" അൽഗോരിതം സൈറ്റ് പേജുകളിലെ നഗര നാമങ്ങളുടെ സാന്നിധ്യം കണക്കിലെടുത്ത് ഒരു നിർദ്ദിഷ്ട പ്രദേശത്തേക്ക് സൈറ്റിനെ പരാമർശിക്കുന്നു. 2012 ഫെബ്രുവരിയിൽ സമാരംഭിച്ചു.

പ്രത്യേകതകൾ

കമ്പനിക്ക് യഥാർത്ഥ ലൊക്കേഷൻ ഇല്ലെന്ന വസ്തുത ശ്രദ്ധിക്കാതെ, ലൊക്കേഷൻ വിലാസം സൂചിപ്പിക്കുന്ന വെബ്‌മാസ്റ്റർമാരുടെ വെബ്‌സൈറ്റുകളിൽ "ഞങ്ങളെക്കുറിച്ച്" എന്ന പേജ് "വെനീസ്" ആവശ്യപ്പെടുന്നു. സന്ദർഭത്തിൽ, അൽഗോരിതം ഔട്ട്പുട്ട് ചെയ്യുന്നതിന് നഗര നാമങ്ങൾക്കായി നോക്കി പ്രത്യേക പേജ്അതിൽ വ്യക്തമാക്കിയ പ്രദേശം അനുസരിച്ച്. വ്യക്തമാക്കാൻ schema-creator.org മാർക്ക്അപ്പ് ഉപയോഗിക്കാൻ തുടങ്ങി തിരയൽ റോബോട്ട്അതിൻ്റെ ഭൂമിശാസ്ത്രപരമായ സ്ഥാനം.

ഫലം

സൈറ്റുകൾ അവരുടെ പേജുകളിൽ പരാമർശിക്കാത്ത പ്രദേശങ്ങൾക്കായുള്ള തിരയൽ ഫലങ്ങളിൽ പ്രത്യക്ഷപ്പെട്ടു, ജിയോ-സ്വതന്ത്ര അന്വേഷണങ്ങൾ കണക്കിലെടുക്കാതെ. ഒപ്റ്റിമൈസറുകൾ സജീവമായി ജിയോ സെൻസിറ്റീവ് കീവേഡുകൾ ഉൾപ്പെടുത്തുകയും മൈക്രോഡാറ്റ സൃഷ്ടിക്കാൻ ശ്രമിക്കുകയും ചെയ്യുന്നു. ഓരോ പേജിലെയും ഉള്ളടക്കം ഓരോ നിർദ്ദിഷ്ട നഗരത്തിനോ പ്രദേശത്തിനോ മൊത്തത്തിൽ വ്യക്തിഗതമാക്കിയിരിക്കുന്നു. തിരഞ്ഞെടുത്ത മേഖലയിലെ സ്ഥാനങ്ങൾ വർദ്ധിപ്പിക്കുന്നതിന് പ്രാദേശികവൽക്കരിച്ച ലിങ്ക് കെട്ടിടം സജീവമായി ഉപയോഗിക്കാൻ തുടങ്ങി.

(പെന്ഗിന് പക്ഷി)

അൽഗോരിതം "പെൻഗ്വിൻ" - സ്മാർട്ട് സാങ്കേതികവിദ്യസൈറ്റുകളുടെ ഭാരവും ഗുണനിലവാരവും നിർണ്ണയിക്കുന്നു ബാക്ക്‌ലിങ്കുകൾ. ഇൻ്റർനെറ്റ് ഉറവിടങ്ങളുടെ അധികാരത്തിൻ്റെ പെരുപ്പിച്ച സൂചകങ്ങൾ എഡിറ്റ് ചെയ്യുന്നതിനുള്ള ഒരു സംവിധാനം. 2012 ഏപ്രിലിൽ തിരച്ചിൽ ആരംഭിച്ചു.

പ്രത്യേകതകൾ

"പെൻഗ്വിൻ" ബാക്ക്ലിങ്കുകൾ വാങ്ങുന്നതിനെതിരായ യുദ്ധം ലക്ഷ്യമിടുന്നു, പ്രകൃതിവിരുദ്ധമായ, അതായത്, കൃത്രിമമായ, സൈറ്റ് അതോറിറ്റിയുടെ സെറ്റ്. ബാക്ക്‌ലിങ്കുകളുടെ ഗുണമേന്മയെ അടിസ്ഥാനമാക്കി അൽഗോരിതം അതിൻ്റെ സുപ്രധാന വിഭവങ്ങളുടെ അടിത്തറ ഉണ്ടാക്കുന്നു. ഒരു വെബ് റിസോഴ്‌സിലേക്കുള്ള ഏതൊരു ലിങ്കിനും തുല്യ ഭാരവും തിരയൽ ഫലങ്ങളിൽ അത്തരമൊരു സൈറ്റ് ഉയർത്തിയപ്പോൾ, ലിങ്ക് ഒപ്റ്റിമൈസറുകളുടെ ആവിർഭാവമാണ് പെൻഗ്വിൻ സമാരംഭിക്കുന്നതിനുള്ള പ്രചോദനം. കൂടാതെ, അവർ സാധാരണ ഇൻ്റർനെറ്റ് ഉറവിടങ്ങളുമായി തുല്യമായി തിരയലിൽ റാങ്ക് ചെയ്യാൻ തുടങ്ങി സാധാരണ പ്രൊഫൈലുകൾസോഷ്യൽ നെറ്റ്‌വർക്കുകളുടെ ഉപയോക്താക്കൾ, ഇത് ഉപയോഗിച്ച് സാധാരണ സൈറ്റുകളുടെ പ്രമോഷനെ കൂടുതൽ ജനകീയമാക്കി സാമൂഹിക സിഗ്നലുകൾ. ഈ അൽഗോരിതം കഴിവുകൾക്കൊപ്പം, കീവേഡുകളിലേക്കും ഡൊമെയ്ൻ നാമങ്ങളിലേക്കും തിരയൽ അന്വേഷണങ്ങളുടെ അപ്രസക്തമായ ഉൾപ്പെടുത്തലുകളെ സിസ്റ്റം ചെറുക്കാൻ തുടങ്ങി.

ഫലം

ബാക്ക്‌ലിങ്കുകളുടെ അസ്വാഭാവിക വളർച്ചയ്ക്കും ഉപയോക്തൃ അഭ്യർത്ഥനകളോടുള്ള ഉള്ളടക്കത്തിൻ്റെ അപ്രസക്തതയ്ക്കും വേണ്ടിയുള്ള തിരയൽ ഫലങ്ങളിൽ പെൻഗ്വിൻ നിരവധി സൈറ്റുകളെ "നിരുത്സാഹപ്പെടുത്തുന്നു". ലിങ്കുകൾ വിൽക്കുന്നതിനുള്ള കാറ്റലോഗുകളുടെയും സൈറ്റുകളുടെയും പ്രാധാന്യം പെട്ടെന്ന് കുറഞ്ഞു, അതേസമയം ആധികാരിക ഉറവിടങ്ങൾ (വാർത്ത സൈറ്റുകൾ, തീമാറ്റിക്, തീമാറ്റിക് സൈറ്റുകൾ) നമ്മുടെ കൺമുന്നിൽ വളർന്നു. പെൻഗ്വിൻ അൽഗോരിതം അവതരിപ്പിച്ചതിനാൽ, മിക്കവാറും എല്ലാ പൊതു സൈറ്റുകൾക്കുമുള്ള പിആർ വീണ്ടും കണക്കാക്കി. ബാക്ക്‌ലിങ്കുകൾ വൻതോതിൽ വാങ്ങുന്നതിൻ്റെ ജനപ്രീതി കുത്തനെ ഇടിഞ്ഞു. വെബ്‌സൈറ്റുകൾ സൈറ്റിലെ പേജുകളിലെ ഉള്ളടക്കത്തിന് കഴിയുന്നത്ര പ്രധാന ശൈലികൾ ക്രമീകരിക്കാൻ തുടങ്ങി. "പ്രസക്തി മാനിയ" ആരംഭിച്ചു. മൊഡ്യൂളുകളുടെ രൂപത്തിൽ പേജുകളിൽ സോഷ്യൽ ബട്ടണുകൾ സ്ഥാപിക്കുന്നത് വ്യാപകമായിരുന്നു വേഗത്തിലുള്ള സൂചികതിരയലിൽ സോഷ്യൽ നെറ്റ്‌വർക്ക് അക്കൗണ്ടുകൾ.

കടൽക്കൊള്ളക്കാരൻ

ഉപയോക്തൃ പരാതികളോട് പ്രതികരിക്കുന്നതിനും പകർപ്പവകാശ ലംഘന കേസുകൾ തിരിച്ചറിയുന്നതിനുമുള്ള ഒരു സാങ്കേതികവിദ്യയാണ് "പൈറേറ്റ്" അൽഗോരിതം. 2012 ഓഗസ്റ്റിലാണ് ഈ സംവിധാനം ആരംഭിച്ചത്.

പ്രത്യേകതകൾ

സൈറ്റ് ഉടമകൾ അവരുടെ പകർപ്പവകാശ ലംഘനത്തെക്കുറിച്ച് രചയിതാക്കളിൽ നിന്നുള്ള പരാതികൾ "പൈറേറ്റ്" സ്വീകരിച്ചു. ടെക്‌സ്‌റ്റുകൾക്കും ചിത്രങ്ങൾക്കും പുറമേ, സിനിമാശാലകളിൽ നിന്നുള്ള സിനിമകളുടെ പൈറേറ്റഡ് ഫൂട്ടേജ് ഹോസ്റ്റ് ചെയ്‌ത വീഡിയോ ഉള്ളടക്കമുള്ള സൈറ്റുകൾ ആക്രമണത്തിൻ്റെ ആഘാതം ഏറ്റുവാങ്ങി. വീഡിയോകളുടെ വിവരണങ്ങളും അവലോകനങ്ങളും ഫിൽട്ടറിംഗിന് വിധേയമായിരുന്നു - ഇപ്പോൾ ഉപരോധത്തിൻ്റെ വേദനയിൽ പകർത്തി-പേസ്റ്റ് ചെയ്യാൻ അനുവദിച്ചില്ല. ലംഘനങ്ങൾക്കായി സൈറ്റിനെതിരെ ധാരാളം പരാതികൾ ഉയർന്നതിനാൽ, അത്തരം ഒരു സൈറ്റ് തിരയൽ ഫലങ്ങളിൽ നിന്ന് പുറത്താക്കപ്പെട്ടു.

ഫലം

ഗൂഗിളിൻ്റെ പൈറേറ്റിൻ്റെ ആദ്യ മാസത്തെ പ്രവർത്തന ഫലങ്ങളുടെ അടിസ്ഥാനത്തിൽ, പകർപ്പവകാശ ഉടമകളുടെ അവകാശങ്ങൾ ലംഘിക്കുന്ന ദശലക്ഷക്കണക്കിന് വീഡിയോ ഫയലുകൾ വീഡിയോ ഹോസ്റ്റിംഗ് സൈറ്റുകളും ഓൺലൈൻ സിനിമാശാലകളും ഉൾപ്പെടെ മിക്കവാറും എല്ലാ സൈറ്റുകളിലും കാണുന്നതിൽ നിന്ന് തടഞ്ഞു. മാത്രമുള്ള വെബ്‌സൈറ്റുകൾ പൈറേറ്റഡ് ഉള്ളടക്കം, അനുവദിക്കുകയും തിരച്ചിലിൽ നിന്ന് ഒഴിവാക്കപ്പെടുകയും ചെയ്തു. "മോഷ്ടിച്ച" ഉള്ളടക്കത്തിൻ്റെ വൻതോതിലുള്ള വൃത്തിയാക്കൽ ഇപ്പോഴും തുടരുകയാണ്.

ഹമ്മിംഗ് ബേർഡ്

ചോദ്യങ്ങൾ കൃത്യമായ എൻട്രികളുമായി പൊരുത്തപ്പെടാത്തപ്പോൾ ഉപയോക്താവിനെ മനസ്സിലാക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യയുടെ ആമുഖമാണ് "ഹമ്മിംഗ്ബേർഡ്" അൽഗോരിതം. "കൃത്യമായ ആഗ്രഹങ്ങൾ തിരിച്ചറിയുന്നതിനുള്ള" സംവിധാനം 2013 സെപ്റ്റംബറിൽ ആരംഭിച്ചു.

പ്രത്യേകതകൾ

ഇപ്പോൾ ഉപയോക്താവിന് ആവശ്യമായ വിവരങ്ങൾ കൂടുതൽ വ്യക്തമായി കണ്ടെത്തുന്നതിനായി പദപ്രയോഗം മാറ്റിയില്ല. "ഹമ്മിംഗ്ബേർഡ്" അൽഗോരിതം നേരിട്ടുള്ള കൃത്യമായ സംഭവങ്ങൾ ഉപയോഗിച്ച് തിരയാതിരിക്കുന്നത് സാധ്യമാക്കി, പക്ഷേ "ഡീസിഫെറിംഗ് ആഗ്രഹങ്ങൾ" ഡാറ്റാബേസിൽ നിന്നുള്ള ഫലങ്ങൾ നൽകി. ഉദാഹരണത്തിന്, ഉപയോക്താവ് ടൈപ്പ് ചെയ്തു തിരയൽ ബാർ"വിനോദത്തിനുള്ള സ്ഥലങ്ങൾ", "കോലിബ്രി" എന്നീ വാക്യങ്ങൾ സാനിറ്റോറിയങ്ങൾ, ഹോട്ടലുകൾ, സ്പാ സെൻ്ററുകൾ, നീന്തൽക്കുളങ്ങൾ, ക്ലബുകൾ എന്നിവയെ കുറിച്ചുള്ള വിവരങ്ങളുള്ള സൈറ്റുകളെ തിരയലിൽ റാങ്ക് ചെയ്തു. അതായത്, അൽഗോരിതം അവരുടെ വിവരണത്തെക്കുറിച്ചുള്ള മാനുഷിക ശൈലികളുള്ള ഒരു സ്റ്റാൻഡേർഡ് ഡാറ്റാബേസ് ഗ്രൂപ്പുചെയ്‌തു. മനസ്സിലാക്കൽ സംവിധാനം തിരയൽ ഫലങ്ങളെ ഗണ്യമായി മാറ്റി.

ഫലം

ഹമ്മിംഗ്ബേർഡ് സാങ്കേതികവിദ്യയുടെ സഹായത്തോടെ, SEO ഒപ്റ്റിമൈസറുകൾക്ക് അവയുടെ വിപുലീകരണം സാധ്യമായി സെമാൻ്റിക് കോർമോർഫോളജിക്കൽ കീകൾ കാരണം സൈറ്റിലേക്ക് കൂടുതൽ ഉപയോക്താക്കളെ നേടുക. സൈറ്റുകളുടെ റാങ്കിംഗ് വ്യക്തമാക്കിയിട്ടുണ്ട്, കാരണം ഇപ്പോൾ നേരിട്ടുള്ള കീ പദസമുച്ചയങ്ങളുടെയും വാചക പ്രസക്തമായ അന്വേഷണങ്ങളുടെയും സംഭവങ്ങൾ മാത്രമല്ല, ഉപയോക്താക്കളുടെ വിഷയപരമായ ആഗ്രഹങ്ങളും കണക്കിലെടുക്കുന്നു. LSI കോപ്പിറൈറ്റിംഗ് എന്ന ആശയം പ്രത്യക്ഷപ്പെട്ടു - ഒളിഞ്ഞിരിക്കുന്ന സെമാൻ്റിക് ഇൻഡെക്സിംഗ് കണക്കിലെടുക്കുന്ന എഴുത്ത് വാചകം. അതായത്, ഇപ്പോൾ ലേഖനങ്ങൾ എഴുതിയത് തിരുകൽ കൊണ്ട് മാത്രമല്ല കീവേഡുകൾ, എന്നാൽ കഴിയുന്നത്ര പര്യായപദങ്ങളും തീമാറ്റിക് പദസമുച്ചയങ്ങളും ഉൾപ്പെടുത്തുക.

(മാടപ്രാവ്)

ഉപയോക്താക്കളെ പ്രാദേശികവൽക്കരിക്കുന്നതിനും തിരയൽ ഫലങ്ങൾ അവരുടെ സ്ഥാനവുമായി ബന്ധിപ്പിക്കുന്നതിനുമുള്ള ഒരു സംവിധാനമാണ് "ഡോവ്" അൽഗോരിതം. 2014 ജൂലൈയിലാണ് ഈ സാങ്കേതികവിദ്യ ആരംഭിച്ചത്.

പ്രത്യേകതകൾ

ഫലങ്ങൾ നൽകുന്നതിൽ ഉപയോക്താവിൻ്റെ സ്ഥാനം ഇപ്പോൾ ഒരു പ്രധാന പങ്ക് വഹിച്ചു. ജൈവ തിരച്ചിൽ ജിയോലൊക്കേഷനുമായി ബന്ധപ്പെട്ടിരിക്കുന്നു. സൈറ്റുകൾ ഗൂഗിൾ മാപ്പിലേക്ക് ലിങ്ക് ചെയ്യുന്നത് ഒരു പ്രത്യേക പങ്ക് വഹിച്ചു. ഇപ്പോൾ, ഒരു ഉപയോക്താവ് അഭ്യർത്ഥിക്കുമ്പോൾ, അൽഗോരിതം ആദ്യം ലൊക്കേഷനിലോ ടാർഗെറ്റുചെയ്‌ത ഉള്ളടക്കത്തിലോ അടുത്തുള്ള സൈറ്റുകൾക്കായി തിരയുന്നു, തുടർന്ന് സന്ദർശകനിൽ നിന്ന് അകന്നുപോകുന്നു. ഓർഗാനിക് തിരയൽ ഫലങ്ങൾ ഗണ്യമായി മാറിയിരിക്കുന്നു.

ഫലം

തിരയൽ റാങ്കിംഗിൽ പ്രാദേശിക സൈറ്റുകൾ വേഗത്തിൽ ഉയർന്നു, പ്രാദേശിക ട്രാഫിക്കും ലഭിച്ചു. ജിയോ ആശ്രിതത്വമില്ലാത്ത ഇൻ്റർനെറ്റ് പ്ലാറ്റ്‌ഫോമുകൾ സ്ഥാനങ്ങളിൽ വീണു. ഓരോ നഗരത്തിനും വേണ്ടിയുള്ള പോരാട്ടം വീണ്ടും ആരംഭിക്കുകയും വിവിധ മേഖലകളിലേക്കുള്ള ലിങ്കുകളും തിരുത്തിയ ഉള്ളടക്കവും ഉള്ള സമാന സൈറ്റുകൾ പ്രത്യക്ഷപ്പെടാൻ തുടങ്ങിയപ്പോൾ സാഹചര്യങ്ങളുടെ എണ്ണം വർദ്ധിക്കുകയും ചെയ്തു. സ്വീകരിക്കുന്നതിന് മുമ്പ് കൃത്യമായ വിവരംറഷ്യൻ ഭാഷയിലുള്ള ഇൻ്റർനെറ്റ് തിരയലിൽ "പ്രാവ്" അൽഗോരിതം അവതരിപ്പിക്കുന്നതിനെ കുറിച്ച്, പല വെബ്മാസ്റ്ററുകളും പെൻഗ്വിൻ ഉപരോധത്തിന് കീഴിലാണെന്ന് കരുതി.

(മൊബൈൽ സൗഹൃദം)

മൊബൈൽ-ഫ്രണ്ട്‌ലി അൽഗോരിതം എന്നത് മൊബൈൽ ഉപകരണങ്ങളുമായി പൊരുത്തപ്പെടുത്തുന്നതിന് സൈറ്റുകൾ പരിശോധിക്കുന്നതിനുള്ള സാങ്കേതികവിദ്യ നടപ്പിലാക്കുന്നതാണ്. 2015 ഏപ്രിലിൽ ഈ സിസ്റ്റം സമാരംഭിച്ചു, ഇൻ്റർനെറ്റിൽ "മൊബൈൽ അർമഗെദ്ദോൻ" (മൊബൈൽഗെദ്ദോൺ), "മൊബൈൽ അപ്പോക്കലിപ്സ്" (മൊബൈൽപോക്കലിസ്, മൊബോകാലിപ്സ്, മോപോകാലിപ്സ്) എന്ന പേരിൽ "വിളിക്കാൻ" കഴിഞ്ഞു.

പ്രത്യേകതകൾ

മൊബൈൽ-സൗഹൃദ ലോഞ്ച് പുതിയ യുഗംവേണ്ടി മൊബൈൽ ഉപയോക്താക്കൾ, ഒപ്റ്റിമൈസറുകൾ അവരുടെ സൈറ്റുകളിൽ മൊബൈൽ സന്ദർശകർക്ക് സുഖപ്രദമായ താമസം അടിയന്തിരമായി ഉറപ്പാക്കണമെന്ന് ശുപാർശ ചെയ്യുന്നു. സൈറ്റുകളുടെ മൊബൈൽ ഉപകരണങ്ങളിലേക്കുള്ള പൊരുത്തപ്പെടുത്തൽ അതിലൊന്നായി മാറിയിരിക്കുന്നു ഏറ്റവും പ്രധാനപ്പെട്ട സൂചകങ്ങൾഅവരുടെ സന്ദർശകരെക്കുറിച്ചുള്ള സൈറ്റ് ഉടമകളുടെ ആശങ്കകൾ. പ്രതികരിക്കാത്ത വെബ് പ്ലാറ്റ്‌ഫോമുകൾ ചെയ്യേണ്ടി വന്നു എത്രയും പെട്ടെന്ന്ബഗുകൾ പരിഹരിക്കുക: ടാബ്‌ലെറ്റുകളിലും സ്‌മാർട്ട്‌ഫോണുകളിലും പിന്തുണയ്‌ക്കാത്ത പ്ലഗിനുകൾ ഒഴിവാക്കുക, വിപുലീകരണത്തിന് അനുയോജ്യമായ രീതിയിൽ ടെക്‌സ്‌റ്റ് വലുപ്പം ക്രമീകരിക്കുക വ്യത്യസ്ത സ്ക്രീനുകൾ, ചെറിയ സ്ക്രീനുള്ള സന്ദർശകരെ സൈറ്റിന് ചുറ്റും നീങ്ങുന്നത് തടയുന്ന മൊഡ്യൂളുകൾ നീക്കം ചെയ്യുക. ആരോ ഒരു പ്രത്യേകം സൃഷ്‌ടിച്ചു മൊബൈൽ പതിപ്പ്നിങ്ങളുടെ ഇൻ്റർനെറ്റ് ഉറവിടം.

ഫലം

അത്തരം ഒരു വഴിത്തിരിവിനായി മുൻകൂട്ടി തയ്യാറാക്കിയ വിഭവങ്ങൾ തിരയൽ ഫലങ്ങളിൽ മറ്റ് ഇൻ്റർനെറ്റ് സൈറ്റുകൾക്കിടയിൽ പ്രത്യേക ഊന്നൽ ലഭിച്ചു, കൂടാതെ വിവിധതരം നോൺ-ഡെസ്ക്ടോപ്പ് ഉപകരണങ്ങളിൽ നിന്ന് അത്തരം വെബ്‌സൈറ്റുകളിലേക്കുള്ള ട്രാഫിക് 25%-ത്തിലധികം വർദ്ധിച്ചു. മൊബൈൽ തിരയലിൽ പൂർണ്ണമായും പ്രതികരിക്കാത്ത സൈറ്റുകൾ തരംതാഴ്ത്തി. മൊബിലിറ്റിയിൽ ശ്രദ്ധ കേന്ദ്രീകരിച്ചത് ഒരു പങ്കുവഹിച്ചു - വിഭവങ്ങളിൽ കനത്ത സ്ക്രിപ്റ്റുകളുടെ സാന്നിധ്യം കുറച്ചു, പരസ്യങ്ങളും പേജുകളും സ്വാഭാവികമായും വേഗത്തിൽ ലോഡുചെയ്യാൻ തുടങ്ങി, ടാബ്‌ലെറ്റുകൾ/സ്‌മാർട്ട്‌ഫോണുകൾ ഉള്ള മിക്ക ഉപയോക്താക്കളും ഉപയോഗിക്കുന്നു മൊബൈൽ ഇൻ്റർനെറ്റ്, ഇത് സ്റ്റാൻഡേർഡിനേക്കാൾ നിരവധി മടങ്ങ് വേഗത കുറവാണ്.

സംഗ്രഹം

അത്രയേയുള്ളൂ

സാധാരണ ഉപയോക്താക്കൾക്കും "ഹിറ്റ്-ആൻഡ്-മിസ്സ്" സൈറ്റുകൾക്കുമായി വർഷങ്ങളായി തിരയൽ എങ്ങനെ വികസിച്ചുവെന്ന് ഇപ്പോൾ നിങ്ങൾക്കറിയാം. മുകളിലുള്ള ഓരോ സെർച്ച് അൽഗോരിതവും ഇടയ്ക്കിടെ അപ്ഡേറ്റ് ചെയ്യുന്നു. എന്നാൽ ഒപ്റ്റിമൈസർമാരും വെബ്‌മാസ്റ്ററുകളും എന്തെങ്കിലും ഭയപ്പെടണമെന്ന് ഇതിനർത്ഥമില്ല (തീർച്ചയായും, നിങ്ങൾ ബ്ലാക്ക് ഹാറ്റ് എസ്ഇഒ ഉപയോഗിക്കുന്നില്ലെങ്കിൽ), പക്ഷേ അടുത്തത് കാരണം തിരയലിൽ അപ്രതീക്ഷിതമായി വീഴാതിരിക്കാൻ ഇത് ഇപ്പോഴും ശ്രദ്ധിക്കേണ്ടതാണ്. പുതിയ ഫിൽട്ടർ.

2016 നവംബർ 2-ന് Yandex ഒരു പുതിയ അൽഗോരിതം അവതരിപ്പിക്കുന്നതായി പ്രഖ്യാപിച്ചു. തിരയൽ റാങ്കിംഗ്"പലേഖ്". ഇപ്പോൾ വെബ്‌മാസ്റ്റർമാർ അതിൻ്റെ ആവശ്യകതകളുമായി പൊരുത്തപ്പെടേണ്ടതുണ്ട്.

അൽഗോരിതങ്ങൾ എന്ന് ഞാൻ നിങ്ങളെ ഓർമ്മിപ്പിക്കട്ടെ തിരയൽ എഞ്ചിൻ പ്രമോഷൻ, അവരുടെ പേര് സൂചിപ്പിക്കുന്നത് പോലെ, തിരയൽ ഫലങ്ങളിൽ റാങ്ക് ചെയ്യാൻ രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത് നിർദ്ദിഷ്ട അഭ്യർത്ഥന. വെബ്‌മാസ്റ്റർമാരേ, ഇത് ഞങ്ങൾക്ക് വളരെ പ്രധാനമാണ്, കാരണം... തിരയൽ ഫലങ്ങളിൽ 50-ാം സ്ഥാനത്തോ അതിൽ കൂടുതലോ ഉള്ള ഒരു സൈറ്റ് ആർക്കാണ് ആവശ്യമുള്ളത് - ആരും അത് കണ്ടെത്തുകയില്ല, ആരും അവിടെ വരുകയുമില്ല.

സാധാരണഗതിയിൽ, പുതിയ വെബ്‌മാസ്റ്റർമാർക്ക് കുറഞ്ഞ ആവൃത്തിയിലുള്ള അന്വേഷണങ്ങളിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കാൻ നിർദ്ദേശിക്കപ്പെടുന്നു, അവിടെ TOP-ലേക്ക് കടക്കുന്നത് വളരെ എളുപ്പമാണ്, കൂടാതെ വളരെ കുറഞ്ഞ സമയവും പണവും. കൃത്യമായും ഇത്തരം അഭ്യർത്ഥനകളിലേക്കാണ് പലേഖിൻ്റെ ലക്ഷ്യം.

മാത്രമല്ല, ഇത് ലോ-ഫ്രീക്വൻസി അന്വേഷണങ്ങളിൽ മാത്രമല്ല, വളരെ വളരെ കുറഞ്ഞ ആവൃത്തിയിലും അതുല്യമായ ചോദ്യങ്ങളിലും ശ്രദ്ധ കേന്ദ്രീകരിക്കുന്നു. പരിചയസമ്പന്നരായ SEO-കൾ, ഒരു ചട്ടം പോലെ, അത്തരം അഭ്യർത്ഥനകളിൽ വലിയ താൽപ്പര്യമില്ല, ഇത് ഞങ്ങളുടെ സൈറ്റുകളിലേക്ക് കൂടുതൽ സന്ദർശകരെ ആകർഷിക്കാനുള്ള അവസരം നൽകുന്നു.

പലേഖിൻ്റെ സാരം, ഇപ്പോൾ റാങ്കിംഗ് കൃത്യമായ കീ പദസമുച്ചയങ്ങളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ് (അവ ഊഹിക്കാൻ വളരെ ബുദ്ധിമുട്ടാണ്), മാത്രമല്ല അർത്ഥത്തിൽ സമാനമായവയെയും അടിസ്ഥാനമാക്കിയുള്ളതാണ്.

ഈ പ്രശ്നം പരിഹരിക്കാൻ, Yandex ന്യൂറൽ നെറ്റ്‌വർക്കുകളിലേക്ക് തിരിഞ്ഞു, അവ വാക്കിൻ്റെ സാധാരണ അർത്ഥത്തിൽ പ്രോഗ്രാം ചെയ്തിട്ടില്ല, പക്ഷേ സ്വയം പഠിക്കുന്നു. സ്വയം പഠനത്തിന് നന്ദി, അത്തരം നെറ്റ്‌വർക്കുകൾക്ക് തിരയൽ ശൈലികളുടെ അർത്ഥം മനസ്സിലാക്കാനും സമാനമായവ തിരയാനും കഴിയും. പലേഖിന് സമർപ്പിച്ചിരിക്കുന്ന അദ്ദേഹത്തിൻ്റെ ബ്ലോഗിൽ ഇതിനെക്കുറിച്ച് കൂടുതൽ വായിക്കുക.

തൽഫലമായി, വിളിക്കപ്പെടുന്നവയിൽ നിന്നുള്ള ശൈലികൾ കൂടുതൽ സജീവമായി റാങ്ക് ചെയ്യാൻ Yandex-ന് കഴിഞ്ഞു. "നീണ്ട വാൽ"; ഇത് എന്താണെന്ന് മറന്നുപോയവരെ ഓർമ്മിപ്പിക്കട്ടെ.

എന്താണ് "നീണ്ട വാൽ"

2004-ൽ, വയർഡ് മാഗസിൻ എഡിറ്റർ-ഇൻ-ചീഫ് ക്രിസ് ആൻഡേഴ്സൺ ഉൽപ്പന്ന വിൽപ്പനയെക്കുറിച്ച് (ഏതെങ്കിലും ഉൽപ്പന്നം) ഒരു പഠനം നടത്തി. ഈ ചോദ്യത്തിൽ അദ്ദേഹത്തിന് താൽപ്പര്യമുണ്ടായിരുന്നു: ഏറ്റവും കൂടുതൽ ലാഭം നൽകുന്നതെന്താണ് - ഇന്നത്തെ ഏറ്റവും ജനപ്രിയമായ ഉൽപ്പന്നങ്ങൾ (ബെസ്റ്റ് സെല്ലറുകൾ എന്ന് വിളിക്കപ്പെടുന്നവ) അല്ലെങ്കിൽ ബെസ്റ്റ് സെല്ലർ പട്ടികയിൽ നിന്ന് ഇറങ്ങി ഉപഭോക്തൃ ചരക്കുകളായി (പുനർവിൽപ്പനക്കാർ) മാറിയ ഉൽപ്പന്നങ്ങൾ.

രണ്ട് ഗ്രൂപ്പുകളുടെ ചരക്കുകളിൽ നിന്നുമുള്ള ലാഭം ഏകദേശം തുല്യമാണെന്ന് ഇത് മാറി: ബെസ്റ്റ് സെല്ലർമാർ അവരുടെ രൂപത്തിൻ്റെ ആദ്യ കാലയളവിൽ വളരെ വലിയ ലാഭം നൽകുന്നു, തുടർന്ന്, മറ്റ് ബെസ്റ്റ് സെല്ലറുകളുടെ വരവോടെ - പുതിയവ, ആദ്യത്തേത് റീസെല്ലർമാരാകുന്നു, പക്ഷേ തുടരുക ലാഭമുണ്ടാക്കാൻ - അവ വിൽപ്പനയിൽ നിന്ന് നീക്കം ചെയ്യപ്പെടുന്നതുവരെ, അവരുടെ ബെസ്റ്റ് സെല്ലിംഗ് കാലയളവിലെ അതേ സമയം.

നിങ്ങൾ ഈ ഡാറ്റയെല്ലാം ഒരു ഗ്രാഫിൽ ക്രമീകരിക്കുകയാണെങ്കിൽ, നിങ്ങൾക്ക് ഇതുപോലൊന്ന് ലഭിക്കും:

ഈ സിദ്ധാന്തം പ്രയോഗിച്ചു വ്യത്യസ്ത മേഖലകൾ SEO ഉൾപ്പെടെയുള്ള മനുഷ്യ പ്രവർത്തനങ്ങൾ. ഇത് മികച്ച ഫലങ്ങൾ നൽകി: പകുതിയോളം ഇൻ്റർനെറ്റ് ഉപയോക്താക്കളും “നീണ്ട വാൽ” ഉണ്ടാക്കുന്ന ചോദ്യങ്ങളിൽ ക്ലിക്കുചെയ്യുന്നതായി ഇത് മാറി.

നിങ്ങൾ Cherepovets-ൽ താമസിക്കുന്നുവെന്നും ഒരു മേശ വാങ്ങാൻ ആഗ്രഹിക്കുന്നുവെന്നും സങ്കൽപ്പിക്കുക. നിങ്ങൾ എഴുതും വിലാസ ബാർ"ഫർണിച്ചറുകൾ" അഭ്യർത്ഥിക്കണോ അതോ "ചെറെപോവെറ്റ്സിൽ രണ്ട് പെഡസ്റ്റൽ ഡെസ്ക് വിലകുറഞ്ഞ രീതിയിൽ വാങ്ങണോ"?

"ഫർണിച്ചർ" എന്ന ചോദ്യം ഒരു പ്രധാന ചോദ്യമായി തരംതിരിച്ചിരിക്കുന്നു, ഞങ്ങളുടെ നീണ്ട ചോദ്യം ഒരു നീണ്ട വാൽ ചോദ്യമായി വർഗ്ഗീകരിച്ചിരിക്കുന്നു. എങ്ങനെ കൂടുതൽ വാക്കുകൾഒരു അന്വേഷണത്തിൽ ഉപയോഗിക്കുന്നു, ഏറ്റവും കുറഞ്ഞ ആവൃത്തിയിൽ അത് വേഗത്തിൽ ദൃശ്യമാകും. രണ്ടോ മൂന്നോ വാക്കുകളിൽ കൂടുതൽ ഉള്ള ചോദ്യങ്ങളെ ലോ-ഫ്രീക്വൻസി അന്വേഷണങ്ങളായി തരംതിരിച്ചിട്ടുണ്ടെന്ന് സാധാരണയായി കണക്കാക്കപ്പെടുന്നു; അതിലും കൂടുതൽ വാക്കുകൾ ഉണ്ടെങ്കിൽ, ഇതൊരു സാധാരണ നീളമുള്ള വാലാണ്.

ഒരു മികച്ച ഉദാഹരണം ചിത്രത്തിൽ കാണിച്ചിരിക്കുന്നു:

ചിത്രം.2

Yandex സ്ഥിതിവിവരക്കണക്കുകൾ പ്രകാരം, 280 ദശലക്ഷം പ്രതിദിന അഭ്യർത്ഥനകളിൽ, ഏകദേശം 100 ദശലക്ഷം നീളമുള്ള വാൽ പ്രദേശത്ത് നിന്നുള്ള അഭ്യർത്ഥനകളാണ്. അത്തരം നിരവധി അഭ്യർത്ഥനകൾക്ക് എങ്ങനെയെങ്കിലും പ്രതികരിക്കേണ്ടത് ആവശ്യമാണ്, അദ്ദേഹം പ്രതികരിച്ചു - പലേഖിനൊപ്പം.

എന്തുകൊണ്ട് പലേഖ്?

കൂടെയുള്ള ചിത്രങ്ങൾ " നീണ്ട വാൽ» വ്യത്യസ്ത രീതികളിൽ ചിത്രീകരിച്ചിരിക്കുന്നു, സാധാരണയായി മൃഗങ്ങളുടെ ചിത്രങ്ങൾ ഉപയോഗിക്കുന്നു: എലികൾ, പല്ലികൾ മുതലായവ. ഒരു ദിനോസറിൻ്റെ ഒരു ഉദാഹരണം ഇതാ:

ചിത്രം.3

എന്നാൽ നമ്മുടെ രാജ്യത്ത് ഇപ്പോൾ ദേശസ്നേഹത്തിൻ്റെ ഉന്മാദമായതിനാൽ, യാൻഡെക്സിന് മറ്റാർക്കും ഇല്ലാത്തത് കണ്ടെത്തേണ്ടിവന്നു, പക്ഷേ റഷ്യക്കാർ മാത്രം. അവൻ ഫയർബേർഡ് കണ്ടെത്തി:

ചിത്രം.4

ഫയർബേർഡ് പലപ്പോഴും പലേഖ് മിനിയേച്ചറുകളിൽ ചിത്രീകരിച്ചിരിക്കുന്നു, അതിനാൽ "പലേഖ്" ശരിയാണോ?

എന്നാൽ ചിത്രവും പേരും പത്താമത്തെ കാര്യമാണ്, വെബ്‌മാസ്റ്റർമാരായ നമ്മൾ എന്തുചെയ്യണം, എന്താണ് പ്രതീക്ഷിക്കേണ്ടത്?

ഞങ്ങൾ പലേഖിൻ്റെ ഗതി നിശ്ചയിച്ചു

പലേഖിൽ നിന്ന് പ്രത്യേകമായി ഒന്നും പ്രതീക്ഷിക്കേണ്ടതില്ലെന്ന് ഞാൻ ഉടൻ തന്നെ പറയും: ഇത് രണ്ട് മാസമായി Yandex ഉപയോഗിക്കുകയും സൈറ്റുകളെ റാങ്ക് ചെയ്യാൻ നിയന്ത്രിക്കുകയും ചെയ്തു. അതിനാൽ, നിങ്ങളുടെ സൈറ്റിൻ്റെ സ്ഥാനം അടുത്തിടെ എങ്ങനെയെങ്കിലും മാറിയിട്ടുണ്ടെങ്കിൽ, ഇത് അവൻ്റെ പ്രവൃത്തിയാണ്. Yandex അത് നവംബർ 2 ന് മാത്രമാണ് പ്രഖ്യാപിച്ചത്, എന്നാൽ അൽഗോരിതം ഇതിനകം തന്നെ പ്രാബല്യത്തിൽ ഉണ്ട്.

ധാരാളം ഉള്ളടക്കങ്ങളുള്ള ആ സൈറ്റുകളിൽ അദ്ദേഹം പ്രാഥമികമായി സ്പർശിച്ചു. ഉള്ളടക്കം നല്ലതാണെങ്കിൽ, പുതിയ കീവേഡുകൾക്കായി സൈറ്റ് അധികമായി റാങ്ക് ചെയ്യാൻ തുടങ്ങി - ഏറ്റവും മികച്ചത് കുറഞ്ഞ ഫ്രീക്വൻസി അന്വേഷണങ്ങൾ. Yandex അത് മോശമായി കണക്കാക്കിയാൽ ...

സ്വാഭാവികമായും, നല്ല, ട്രസ്റ്റ് സൈറ്റുകൾ എന്ന് വിളിക്കപ്പെടുന്ന ഉള്ളടക്കം നല്ലതാണെന്ന് Yandex കണക്കാക്കുന്നു. ട്രസ്റ്റ് സൈറ്റുകളിലേക്ക് എങ്ങനെ എത്തിച്ചേരാം? - ഇത് ദൈർഘ്യമേറിയതും ചെലവേറിയതുമാണ്. ഏറ്റവും വേഗതയേറിയ പാത കടന്നുപോകുന്നു. സൌജന്യ രജിസ്ട്രേഷൻ ഉണ്ട്, എന്നാൽ തുടക്കക്കാരായ നിങ്ങൾക്ക് സാധ്യത കുറവാണെന്ന് ഞാൻ ഉടൻ പറയും. കൂടാതെ ഉണ്ട് - 14,500 റൂബിൾസ് പ്ലസ് വാറ്റ്. ഇവിടെ എല്ലാം ലളിതമാണ്, പക്ഷേ ആരും നിങ്ങൾക്ക് 100% ഗ്യാരണ്ടി നൽകില്ല.

ശരി, അല്ലെങ്കിൽ എഴുതുക, എഴുതുക, എഴുതുക, അതേ സമയം വളരെ കഠിനമായി ശ്രമിക്കുക, നിങ്ങൾക്ക് വിശ്വാസമുണ്ടാകും. ട്രസ്റ്റിലേക്കുള്ള വഴികൾ ഇൻ്റർനെറ്റിൽ നന്നായി വിവരിച്ചിരിക്കുന്നു, അത് തിരയുക.

വിഎൻ: എഫ്

...ഇതിനെക്കുറിച്ച് നിങ്ങളുടെ സുഹൃത്തുക്കളോട് പറയുക:

നിങ്ങൾക്ക് വാർത്താക്കുറിപ്പ് സബ്‌സ്‌ക്രൈബുചെയ്യാനും കഴിയും -
എനിക്ക് ധാരാളം രസകരമായ മെറ്റീരിയലുകൾ സ്റ്റോക്കിൽ ഉണ്ട്.

ലേഖനത്തെക്കുറിച്ചുള്ള സേവന വിവരങ്ങൾ:

പുതിയ Yandex അൽഗോരിതത്തിൻ്റെ സവിശേഷതകൾ ലേഖനം ഹ്രസ്വമായി പരിശോധിക്കുകയും പുതിയ വെബ്‌മാസ്റ്റർമാർക്ക് പ്രായോഗിക ഉപദേശം നൽകുകയും ചെയ്യുന്നു.

എഴുതിയത്: സെർജി വൗലിൻ

പ്രസിദ്ധീകരിച്ച തീയതി: 11/08/2016

പലേഖ് - ഒരു പുതിയ Yandex അൽഗോരിതം, 3 റേറ്റിംഗുകളെ അടിസ്ഥാനമാക്കി 5-ൽ 5.0

Yandex-ലെ വെബ്സൈറ്റ് റാങ്കിംഗ് അൽഗോരിതം നിരന്തരം മാറ്റങ്ങൾക്കും കൂട്ടിച്ചേർക്കലുകൾക്കും വിധേയമാണ്: പുതിയ പ്രവർത്തനം ചേർത്തു, നിയന്ത്രണങ്ങളും ഫിൽട്ടറുകളും അപ്ഡേറ്റ് ചെയ്യുന്നു... വളരെ ദീർഘനാളായിഎല്ലാ റാങ്കിംഗ് അൽഗോരിതങ്ങളുടെയും അക്കൌണ്ടിംഗ് കമ്പനിക്കുള്ളിൽ മാത്രമേ സൂക്ഷിച്ചിട്ടുള്ളൂ, അത് പെട്ടെന്ന് അപ്ഡേറ്റ് ചെയ്തപ്പോൾ, ഉപയോക്താക്കൾക്ക് ദേഷ്യം വരികയും, വ്യക്തമായി പറഞ്ഞാൽ, കുറച്ച് മനസ്സിലാക്കുകയും ചെയ്തു.

Yandex റാങ്കിംഗ് അൽഗോരിതങ്ങൾ ഗവേഷണം ചെയ്യാനും ഫിൽട്ടറുകളുടെ വിഷയത്തിനുള്ള ഉത്തരങ്ങൾക്കായി തിരയാനും "ബ്ലാക്ക് ലിസ്റ്റിൽ" എങ്ങനെ പ്രവേശിക്കാതിരിക്കാനും വളരെയധികം സമയമെടുത്തു. ഇപ്പോൾ എല്ലാം അൽപ്പം ലളിതമാണ്, എന്നാൽ Yandex എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിൻ്റെ വിശകലനം ഞങ്ങൾ അവഗണിക്കുന്നില്ല.

Yandex അൽഗോരിതങ്ങൾക്ക് 1997 മുതൽ സൃഷ്ടിയുടെയും വികാസത്തിൻ്റെയും വളരെ നീണ്ട ചരിത്രമുണ്ട്. അന്നുമുതൽ, Yandex മാറി, പുതിയ അൽഗോരിതങ്ങളും പുതിയ ഫിൽട്ടറുകളും പ്രത്യക്ഷപ്പെട്ടു. ഒരുപക്ഷേ, "പുതിയ" അൽഗോരിതങ്ങൾ ഉപയോഗിച്ച് നമ്മുടെ "ഡീബ്രീഫിംഗ്" ആരംഭിക്കാം.

പുതിയ Yandex അൽഗോരിതം "ബാഡൻ-ബേഡൻ". 2017

"ബേഡൻ-ബേഡൻ" എന്ന് വിളിക്കപ്പെടുന്ന ടെക്സ്റ്റ് സ്പാം കണ്ടെത്തുന്നതിന് Yandex-ന് ഒരു പുതിയ അൽഗോരിതം ഉണ്ട്.
ഉപയോക്താക്കൾക്ക് പ്രയോജനമില്ലാത്തതും "ഓവർ-ഒപ്റ്റിമൈസ് ചെയ്തതുമായ" (കീകളുടെ ധാരാളം സംഭവങ്ങളോടെ) ടെക്സ്റ്റുകൾ എഴുതി പ്രസക്തമായ "ചതി"യെ ചെറുക്കാനാണ് അൽഗോരിതം സൃഷ്ടിച്ചത്.

Yandex ബ്ലോഗിൽ പറഞ്ഞിരിക്കുന്നതുപോലെ, ടെക്സ്റ്റ് സ്പാം കണ്ടെത്തുന്ന അൽഗോരിതം ഗണ്യമായി മാറ്റുകയും മെച്ചപ്പെടുത്തുകയും ചെയ്തു. പ്രസിദ്ധീകരണത്തിൻ്റെ രചയിതാക്കൾ തന്നെ അത് അവകാശപ്പെടുന്നു ഈ അൽഗോരിതം"മൊത്തത്തിലുള്ള റാങ്കിംഗ് അൽഗോരിതത്തിൻ്റെ ഭാഗമാണ്, അതിൻ്റെ പ്രവർത്തനത്തിൻ്റെ ഫലം തിരയൽ ഫലങ്ങളിലെ ഓവർ-ഒപ്റ്റിമൈസ് ചെയ്ത പേജുകളുടെ സ്ഥാനത്തിലുണ്ടായ അപചയമായിരിക്കാം." ഇത് എന്താണ് അർത്ഥമാക്കുന്നത്?

ഒന്നാമതായി, ഇത് "പുനർനിർമ്മിക്കുകയും മെച്ചപ്പെടുത്തുകയും" ചെയ്തിട്ടുണ്ടെങ്കിൽ, ഇതിനകം പരിചിതമായ "ഓവർസ്പാം", "ഓവർ ഒപ്റ്റിമൈസേഷൻ" ഫിൽട്ടറുകൾ മാറ്റിസ്ഥാപിക്കുന്നതിനാണ് ഈ അൽഗോരിതം സൃഷ്ടിച്ചിരിക്കുന്നത്. ഇത് ശരിക്കും "മൊത്തത്തിലുള്ള റാങ്കിംഗ് അൽഗോരിതത്തിൻ്റെ ഭാഗമാണെങ്കിൽ", തീർച്ചയായും, ഈ അൽഗോരിതം ചുമത്തിയ "പിഴകളുടെ" സാന്നിധ്യം നിർണ്ണയിക്കുന്നത് കൂടുതൽ ബുദ്ധിമുട്ടായിരിക്കും.

പുതിയ Yandex അൽഗോരിതം 2016. "പലേഖ്"

ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ ഉപയോഗിച്ച് അഭ്യർത്ഥനയുടെ അർത്ഥങ്ങൾ താരതമ്യം ചെയ്യാൻ അൽഗോരിതം ശ്രമിക്കും, സാധാരണയായി ചെയ്യുന്നത് പോലെ കീവേഡുകൾ താരതമ്യം ചെയ്യുക മാത്രമല്ല. അപൂർവമായ ഉപയോക്തൃ അഭ്യർത്ഥനകൾക്ക് മികച്ച ഫലങ്ങൾ ഉറപ്പാക്കുന്നതിനാണ് ഇത് ചെയ്തത്. പുതിയ അൽഗോരിതം ന്യൂറൽ നെറ്റ്‌വർക്കുകളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്, കൂടാതെ പൊതുവായ കീ ശൈലികൾ ഇല്ലെങ്കിൽപ്പോലും, തിരയൽ അന്വേഷണവും പേജ് ശീർഷകങ്ങളും തമ്മിലുള്ള പൊരുത്തം കണ്ടെത്താൻ Yandex-നെ സഹായിക്കുന്നു. യഥാർത്ഥത്തിൽ എന്താണ് സംഭവിച്ചതെന്ന് മനസിലാക്കാൻ, Yandex കമ്പനിയുടെ ഔദ്യോഗിക ബ്ലോഗിൽ നിന്നുള്ള കുറച്ച് ഉദ്ധരണികൾ:

ഞങ്ങളുടെ കാര്യത്തിൽ, ഞങ്ങൾ കൈകാര്യം ചെയ്യുന്നത് ചിത്രങ്ങളല്ല, ടെക്സ്റ്റുകളിലാണ് - ഇവ തിരയൽ അന്വേഷണങ്ങളുടെയും വെബ് പേജ് ശീർഷകങ്ങളുടെയും പാഠങ്ങളാണ് - എന്നാൽ പരിശീലനം ഒരേ സ്കീം പിന്തുടരുന്നു: പോസിറ്റീവ്, നെഗറ്റീവ് ഉദാഹരണങ്ങൾ ഉപയോഗിച്ച്. ഓരോ ഉദാഹരണവും ഒരു അഭ്യർത്ഥന-ഹെഡർ ജോഡിയാണ്. തിരച്ചിൽ ശേഖരിച്ച സ്ഥിതിവിവരക്കണക്കുകൾ ഉപയോഗിച്ച് നിങ്ങൾക്ക് ഉദാഹരണങ്ങൾ തിരഞ്ഞെടുക്കാം. ഉപയോക്തൃ പെരുമാറ്റത്തിൽ നിന്ന് പഠിക്കുന്നതിലൂടെ, അഭ്യർത്ഥനയും പേജ് ശീർഷകങ്ങളും തമ്മിലുള്ള സെമാൻ്റിക് കത്തിടപാടുകൾ ന്യൂറൽ നെറ്റ്‌വർക്ക് "മനസ്സിലാക്കാൻ" തുടങ്ങുന്നു.

സെമാൻ്റിക് വെക്റ്റർ Yandex തിരയലിൽ മാത്രമല്ല, മറ്റ് സേവനങ്ങളിലും ഉപയോഗിക്കുന്നു - ഉദാഹരണത്തിന്, ചിത്രങ്ങളിൽ. ഒരു ടെക്സ്റ്റ് അന്വേഷണവുമായി ഏറ്റവും അടുത്ത് പൊരുത്തപ്പെടുന്ന ചിത്രങ്ങൾ ഇൻ്റർനെറ്റിൽ കണ്ടെത്താൻ അത് സഹായിക്കുന്നു.

സെമാൻ്റിക് വെക്റ്റർ സാങ്കേതികവിദ്യയ്ക്ക് വലിയ സാധ്യതകളുണ്ട്. ഉദാഹരണത്തിന്, തലക്കെട്ടുകൾ മാത്രമല്ല, പ്രമാണങ്ങളുടെ മുഴുവൻ പാഠങ്ങളും അത്തരം വെക്റ്ററുകളിലേക്ക് വിവർത്തനം ചെയ്യാൻ കഴിയും - ഇത് അന്വേഷണങ്ങളും വെബ് പേജുകളും കൂടുതൽ കൃത്യമായി താരതമ്യം ചെയ്യുന്നത് സാധ്യമാക്കും.
വെബ്‌സൈറ്റുകളുടെ വികസനത്തിലും പ്രമോഷനിലും ഏർപ്പെട്ടിരിക്കുന്നവർക്കുള്ള കുറഞ്ഞ ആവൃത്തിയിലുള്ള അന്വേഷണങ്ങൾക്കുള്ള പ്രമോഷനെ അനുകൂലിക്കുന്ന മറ്റൊരു പ്രധാന വാദമാണ് പുതിയ Yandex അൽഗോരിതം അവതരിപ്പിക്കുന്നത്. പുതിയ Yandex അൽഗോരിതം വികസിപ്പിക്കുന്നതിനുള്ള സാധ്യതകൾ തിരഞ്ഞെടുത്ത ദിശയുടെ കൃത്യത മാത്രമേ സ്ഥിരീകരിക്കുകയുള്ളൂ, കാരണം സമീപഭാവിയിൽ തലക്കെട്ടുകൾ മാത്രമല്ല, മുഴുവൻ ടെക്സ്റ്റ് ഡോക്യുമെൻ്റും മൊത്തത്തിൽ (!) മെച്ചപ്പെട്ട അംഗീകാരത്തെക്കുറിച്ച് സംസാരിക്കും.

Yandex-ൽ, ഫയർബേർഡിൻ്റെ സ്വഭാവസവിശേഷതയായ കൊക്കും ശരീരവും നീളമുള്ള വാലും ഉള്ള പക്ഷിയുടെ രൂപത്തിലാണ് ഫ്രീക്വൻസി ഡിസ്ട്രിബ്യൂഷൻ ഗ്രാഫ് അവതരിപ്പിച്ചിരിക്കുന്നത്.

കൊക്ക് - ഉയർന്ന ഫ്രീക്വൻസി അന്വേഷണങ്ങൾ. അത്തരം അഭ്യർത്ഥനകളുടെ പട്ടിക വളരെ വലുതല്ല, പക്ഷേ അവ വളരെ പലപ്പോഴും ചോദിക്കാറുണ്ട്.
ടോർസോ - മിഡ്-ഫ്രീക്വൻസി അഭ്യർത്ഥനകൾ.
വാൽ - ലോ-ഫ്രീക്വൻസി, മൈക്രോ-ലോ-ഫ്രീക്വൻസി അന്വേഷണങ്ങൾ. "വ്യക്തിപരമായി അവ അപൂർവമാണ്, പക്ഷേ അവ ഒരുമിച്ച് തിരയൽ പ്രവാഹത്തിൻ്റെ ഒരു പ്രധാന ഭാഗമാണ്, അതിനാൽ അവ ഒരു നീണ്ട വാൽ വരെ ചേർക്കുന്നു."

പലേഖ് മിനിയേച്ചറുകളിൽ പലപ്പോഴും പ്രത്യക്ഷപ്പെടുന്ന ഒരു പക്ഷിയുടേതാണ് ഈ വാൽ. അതുകൊണ്ടാണ് അൽഗോരിതം "പലേഖ്" എന്ന് വിളിച്ചത്.

എല്ലാ Yandex അൽഗോരിതങ്ങളും. (2007-2017)

ജൂലൈ 2, 2007. "പതിപ്പ് 7". ഒരു പുതിയ റാങ്കിംഗ് ഫോർമുല, ഘടകങ്ങളുടെ എണ്ണത്തിൽ വർദ്ധനവ്, പ്രഖ്യാപനം നടന്നത് searchengines.guru-ൽ മാത്രമാണ്.
ഡിസംബർ 20, 2007. ജനുവരി 17, 2008. "പതിപ്പ് 8", "എട്ട് SP1" എന്നിവ. റഫറൻസ് ഘടകങ്ങൾ വർദ്ധിപ്പിക്കുന്നതിന് "റണ്ണുകൾ" ഫിൽട്ടർ ചെയ്യുന്നതിനുള്ള ആമുഖം, റാങ്കിംഗിൽ പ്രശസ്തമായ വിഭവങ്ങൾക്ക് കാര്യമായ നേട്ടം ലഭിച്ചു.
മെയ് 16, ജൂലൈ 2, 2008. "മഗദാൻ" (അപേക്ഷകരെ വേഗത്തിൽ തിരഞ്ഞെടുക്കുന്നതിനുള്ള വേഗത്തിലുള്ള റാങ്ക്, മൃദുത്വം, ചുരുക്കങ്ങളുടെയും പര്യായങ്ങളുടെയും അടിത്തറയുടെ വികാസം, വിപുലീകരിച്ച ഡോക്യുമെൻ്റ് ക്ലാസിഫയറുകൾ), "മഗദാൻ 2.0" (ഉള്ളടക്കത്തിൻ്റെ പ്രത്യേകത, ഉപയോക്തൃ അഭ്യർത്ഥനകളുടെയും പ്രമാണങ്ങളുടെയും പുതിയ ക്ലാസിഫയറുകൾ).
സെപ്റ്റംബർ 11, 2008. “നഖോദ്ക” (തിരയൽ അന്വേഷണത്തിലെ വാക്കുകൾ നിർത്തുക, പുതിയ സമീപനംമെഷീൻ ലേണിംഗിലേക്ക്, തെസോറസ്).
ഏപ്രിൽ 10, ജൂൺ 24, ഓഗസ്റ്റ് 20, ഓഗസ്റ്റ് 31, സെപ്റ്റംബർ 23, സെപ്റ്റംബർ 28, 2009.
“അർസമാസ് / അനാദിർ” (ഉപയോക്താവിൻ്റെ പ്രദേശം കണക്കിലെടുത്ത്, ഹോമോണിമി നീക്കം ചെയ്യുന്നു), “അർസമാസ് 1.1” (മോസ്കോ, സെൻ്റ് പീറ്റേഴ്സ്ബർഗ്, യെക്കാറ്റെറിൻബർഗ് ഒഴികെയുള്ള നിരവധി നഗരങ്ങൾക്കുള്ള പുതിയ പ്രാദേശിക ഫോർമുല), “അർസമാസ് 1.2” (ജിയോയുടെ പുതിയ ക്ലാസിഫയർ -ചോദ്യങ്ങളുടെ ആശ്രിതത്വം), "അർസമാസ്+ 16" (റഷ്യയിലെ 16 പ്രദേശങ്ങൾക്കുള്ള സ്വതന്ത്ര സൂത്രവാക്യങ്ങൾ), "അർസമാസ് 1.5" (പുതിയത് പൊതു ഫോർമുലജിയോ-സ്വതന്ത്ര അന്വേഷണങ്ങൾക്ക്), "Arzamas 1.5 SP1" (ജിയോ-സ്വതന്ത്ര അന്വേഷണങ്ങൾക്കുള്ള മെച്ചപ്പെട്ട പ്രാദേശിക ഫോർമുല).
നവംബർ 17, 2009. "Snezhinsk" (MatrixNet മെഷീൻ ലേണിംഗ് ടെക്നോളജിയുടെ സമാരംഭം, റാങ്കിംഗ് ഘടകങ്ങളുടെ എണ്ണത്തിൽ ഒന്നിലധികം വർദ്ധനവ്, റഷ്യയിലെ ഏറ്റവും വലിയ പ്രദേശങ്ങൾക്കുള്ള 19 പ്രാദേശിക ഫോർമുലകൾ, തിരയൽ ഫലങ്ങളിൽ നാടകീയമായ മാറ്റങ്ങൾ).
ഡിസംബർ 22, 2009. മാർച്ച് 10, 2010. "കൊനക്കോവോ" (അനൗദ്യോഗിക നാമം, എന്നാൽ പിന്നീട് അത് ഒബ്നിൻസ്ക് ആയിരിക്കും, റഷ്യയിലുടനീളമുള്ള 1250 നഗരങ്ങൾക്കുള്ള സ്വന്തം ഫോർമുലകൾ), "കൊനക്കോവോ 1.1" ("സ്നെജിൻസ്ക് 1.1") - ജിയോ-സ്വതന്ത്ര അന്വേഷണങ്ങൾക്കുള്ള ഫോർമുല അപ്ഡേറ്റ് ചെയ്യുന്നു.
സെപ്റ്റംബർ 13, 2010. "Obninsk" (ഫോർമുല പുനഃക്രമീകരിക്കൽ, ഉൽപ്പാദനക്ഷമത വർദ്ധിപ്പിക്കൽ, പുതിയ ഘടകങ്ങൾ, ജിയോ-സ്വതന്ത്ര അന്വേഷണങ്ങൾക്കുള്ള റാങ്കിംഗ്, ഒഴുക്കിൽ 70% ത്തിൽ കൂടുതലുള്ള പങ്ക്).
ഡിസംബർ 15, 2010. "ക്രാസ്നോഡർ" (സ്പെക്ട്രം സാങ്കേതികവിദ്യയും വൈവിധ്യമാർന്ന തിരയൽ ഫലങ്ങളും വർദ്ധിപ്പിക്കുന്നു, ഉപയോക്താവിൻ്റെ അഭ്യർത്ഥനയെ ഉദ്ദേശ്യങ്ങളാക്കി വിഘടിപ്പിക്കുന്നു), കൂടുതൽ: ജിയോ-ആശ്രിത ചോദ്യങ്ങൾക്കുള്ള തിരയൽ ഫലങ്ങളുടെ പ്രാദേശികവൽക്കരണം വർദ്ധിപ്പിക്കൽ, റഷ്യയിലെ 1250 നഗരങ്ങൾക്കുള്ള സ്വതന്ത്ര സൂത്രവാക്യങ്ങൾ.
ഓഗസ്റ്റ് 17, 2011. "റെയ്ക്ജാവിക്" (ഉപയോക്താക്കളുടെ ഭാഷാ മുൻഗണനകൾ കണക്കിലെടുത്ത്, ഫലങ്ങൾ വ്യക്തിഗതമാക്കുന്നതിനുള്ള ആദ്യപടി).
ഡിസംബർ 12, 2012. "കാലിനിൻഗ്രാഡ്" (തിരയൽ ഫലങ്ങളുടെ കാര്യമായ വ്യക്തിഗതമാക്കൽ: സൂചനകൾ, ഉപയോക്താവിൻ്റെ ദീർഘകാല താൽപ്പര്യങ്ങൾ കണക്കിലെടുക്കുക, "പ്രിയപ്പെട്ട" സൈറ്റുകൾക്ക് പ്രസക്തി വർദ്ധിപ്പിക്കുക).
2013 മെയ് 30. "ഡബ്ലിൻ" (തിരയൽ ഫലങ്ങളുടെ കൂടുതൽ വ്യക്തിഗതമാക്കൽ: ഉപയോക്താക്കളുടെ ഉടനടി താൽപ്പര്യങ്ങൾ കണക്കിലെടുത്ത്, തിരയൽ സെഷനിൽ ഉപയോക്താവിന് നേരിട്ട് തിരയൽ ഫലങ്ങൾ ക്രമീകരിക്കൽ).
2014 മാർച്ച് 12. “നച്ചലോവോ”*, “ലിങ്കുകൾ ഇല്ല” (ഗ്രൂപ്പുകളുടെ റാങ്കിംഗിൽ ലിങ്കുകളുടെ / നിരവധി ലിങ്ക് ഘടകങ്ങളുടെ പരിഗണന റദ്ദാക്കുന്നു വാണിജ്യ അന്വേഷണങ്ങൾമോസ്കോ മേഖലയിൽ).
ജൂൺ 5, 2014. "ഒഡെസ"*, "ദ്വീപുകൾ" (ഡെലിവറിയുടെയും സേവനങ്ങളുടെയും പുതിയ "ദ്വീപ്" രൂപകൽപ്പന, സംവേദനാത്മക പ്രതികരണങ്ങളുടെ ആമുഖം, പിന്നീട് പരീക്ഷണം പരാജയപ്പെട്ടതായി കണക്കാക്കുകയും പൂർത്തിയാക്കുകയും ചെയ്തു).
ഏപ്രിൽ 1, 2015. “ആംസ്റ്റർഡാം”*, “ഒബ്ജക്റ്റീവ് പ്രതികരണം” (തിരയൽ ഫലങ്ങളുടെ വലതുവശത്തുള്ള അഭ്യർത്ഥനയുടെ വിഷയത്തെക്കുറിച്ചുള്ള പൊതുവായ വിവരങ്ങളുള്ള അധിക കാർഡ്, Yandex ഡാറ്റാബേസിൽ ദശലക്ഷക്കണക്കിന് തരംതിരിക്കുകയും സംഭരിക്കുകയും ചെയ്യുന്നു വിവിധ വസ്തുക്കൾതിരയുക).
2015 മെയ് 15. "Minusinsk" (ലിങ്ക് പ്രൊഫൈലിലെ SEO ലിങ്കുകളുടെ അമിതമായ സംഖ്യയും ഷെയറും ഉള്ള സൈറ്റുകളുടെ റാങ്കിംഗിൽ തരംതാഴ്ത്തൽ, SEO ലിങ്കുകൾ വൻതോതിൽ നീക്കംചെയ്യൽ, മോസ്കോ മേഖലയിലെ എല്ലാ ചോദ്യങ്ങൾക്കും റാങ്കിംഗിൽ ലിങ്ക് ഘടകങ്ങൾ കണക്കിലെടുക്കുന്നതിലേക്ക് കൂടുതൽ മടങ്ങുക).
സെപ്റ്റംബർ 14, 2015(± 3 മാസം). "കിറോവ്"*, "Yandex-ൻ്റെ മൾട്ടി-ആംഡ് ബാൻഡിറ്റുകൾ" ("Rel+" റേറ്റിംഗുള്ള നിരവധി പ്രമാണങ്ങളുടെ പ്രസക്തിയുടെ സംഖ്യാ മൂല്യത്തിലേക്ക് ക്രമരഹിതമായ കൂട്ടിച്ചേർക്കൽ, മോസ്കോ മേഖലയിലെ കൂടുതൽ പെരുമാറ്റ വിവരങ്ങൾ ശേഖരിക്കുന്നതിനായി, പിന്നീട് ക്രമരഹിതമാക്കൽ റഷ്യയുടെ പ്രദേശങ്ങളിൽ അവതരിപ്പിച്ചു).
ഫെബ്രുവരി 2, 2016. "വ്ലാഡിവോസ്റ്റോക്ക്" (പോർട്ടബിൾ ഉപകരണങ്ങളിൽ നിന്ന് കാണുന്നതിന് സൈറ്റിൻ്റെ അഡാപ്റ്റബിലിറ്റി കണക്കിലെടുക്കുന്നു, അഡാപ്റ്റഡ് പ്രോജക്റ്റുകളുടെ മൊബൈൽ ഇഷ്യുവിൻ്റെ ഫലങ്ങൾ വർദ്ധിപ്പിക്കുന്നു).
* - ക്രമം നിലനിർത്തുന്നതിനായി രചയിതാവിൻ്റെ വിവേചനാധികാരത്തിൽ അൽഗോരിതങ്ങളുടെ അനൗദ്യോഗിക പേരുകൾ, നഗരങ്ങൾ തിരഞ്ഞെടുത്തു.

ഇതിഹാസവും അസാധാരണവുമായ പേരുകളുള്ള "പലേഖ്", "ബാഡൻ-ബേഡൻ" എന്നീ പേരുകളുള്ള മുകളിൽ വിവരിച്ച അൽഗോരിതങ്ങളാണ് ഇപ്പോൾ (ഞങ്ങൾ വികസിപ്പിച്ചുകൊണ്ടിരിക്കുന്നത്) അവസാന അൽഗോരിതങ്ങൾ.

എല്ലാ Yandex ഫിൽട്ടറുകളും അവയുടെ തരങ്ങളും.

Yandex-ന് സൈറ്റിൽ മൊത്തത്തിലും അതിൻ്റെ വ്യക്തിഗത പേജുകളിലും പ്രയോഗിക്കാൻ കഴിയുന്ന നിരവധി ഫിൽട്ടറുകൾ ഉണ്ട്. നിർഭാഗ്യവശാൽ, സൈറ്റിൽ ഏതൊക്കെ ഫിൽട്ടറുകളാണ് ചുമത്തിയിരിക്കുന്നതെന്നും ഏതൊക്കെ ലംഘനങ്ങൾക്കായാണ് - ഇപ്പോൾ ഉപയോഗത്തിലുള്ള ചെറിയ പൊരുത്തക്കേടുകൾ എന്നും വ്യക്തമല്ല. സ്റ്റാൻഡേർഡ് രീതികൾപ്രമോഷനുകൾ "സ്പാം" ആയി അംഗീകരിക്കപ്പെട്ടേക്കാം. ഫലം: അശുഭാപ്തിവിശ്വാസം.

എല്ലാ Yandex ഫിൽട്ടറുകളും (അവയുടെ രൂപത്തെ ആശ്രയിച്ച്) 3 തരങ്ങളായി തിരിക്കാം:

— പ്രീ-ഫിൽട്ടറുകൾ:സൈറ്റിൻ്റെ പ്രസക്തി കണക്കാക്കുന്നതിന് മുമ്പുതന്നെ ഏതെങ്കിലും ഘടകങ്ങളുടെ മൂല്യം കിഴിവ് ചെയ്യുക. പ്രീ-ഫിൽട്ടറുകളുടെ പ്രഭാവം ഉടനടി ശ്രദ്ധയിൽപ്പെട്ടേക്കില്ല - സാധാരണയായി ഇത് ചില സ്ഥലങ്ങളിൽ "ഒട്ടിപ്പിടിക്കുന്ന" സൈറ്റിൽ സ്വയം പ്രത്യക്ഷപ്പെടുന്നു (സൈറ്റ് പേജ് 2 ൽ എത്തി, ലിങ്ക് പിണ്ഡം സൃഷ്ടിച്ചിട്ടും കൂടുതൽ നീങ്ങുന്നില്ല, ഉദാഹരണത്തിന്).
— പോസ്റ്റ് ഫിൽട്ടറുകൾ:സൈറ്റിൻ്റെ പ്രസക്തി കണക്കാക്കിയ ശേഷം അവർ ഒന്നോ അല്ലെങ്കിൽ മറ്റൊരു ഘടകത്തിൻ്റെ മൂല്യം പുനഃസജ്ജമാക്കുന്നു. ഇത്തരത്തിലുള്ള ഫിൽട്ടറുകൾ ശ്രദ്ധിക്കാതിരിക്കാൻ പ്രയാസമാണ് - അവയാണ് Yandex-ൽ നിന്നുള്ള സ്ഥാനങ്ങളിലും ട്രാഫിക്കിലും കുത്തനെയുള്ള ഇടിവിൽ സ്വയം പ്രത്യക്ഷപ്പെടുന്നത്. ആന്തരിക ഘടകങ്ങൾ വർദ്ധിപ്പിക്കുന്നതിന് മിക്കവാറും എല്ലാ ഫിൽട്ടറുകളെയും പോസ്റ്റ്-ഫിൽട്ടറുകളായി തരംതിരിക്കാം.
– ഇഷ്യൂ ചെയ്യുന്നതിന് മുമ്പ് ഫിൽട്ടർ ചെയ്യുന്നു:ഒരു സൈറ്റിൻ്റെ പ്രസക്തി കണക്കാക്കുന്നത് ഇതാണ്, എന്നാൽ ചില കാരണങ്ങളാൽ അത് തിരയൽ ഫലങ്ങളിൽ ദൃശ്യമാകാൻ അനുവദിക്കില്ല.
— നിരോധിക്കുക: ഇത് അപൂർവമാണ്, പക്ഷേ തിരയൽ ലൈസൻസിൻ്റെ മൊത്തത്തിലുള്ള ലംഘനങ്ങൾക്കായി തിരയൽ ഫലങ്ങളിൽ നിന്ന് ഒരു സൈറ്റ് പൂർണ്ണമായും ഒഴിവാക്കപ്പെടുന്നു.

പ്രത്യക്ഷമായും, Yandex സൈറ്റുകളുടെ ഗുണനിലവാരത്തിൽ വളരെയധികം ആവശ്യപ്പെടുന്നു, ഒപ്പം, ഉചിതമായ എല്ലാ അവസരങ്ങളിലും, അതിൻ്റെ ഔദ്യോഗിക സ്ഥാനം ഞങ്ങളെ ഓർമ്മിപ്പിക്കുന്നു - നിങ്ങളുടെ സൈറ്റ് വികസിപ്പിക്കുക, "തത്സമയ" ഉപയോക്താവിൽ ശ്രദ്ധ കേന്ദ്രീകരിക്കുക, Yandex-ൽ നിന്നുള്ള സൈറ്റിൻ്റെ റേറ്റിംഗ് "മികച്ചത്" ആണെങ്കിൽ, നിങ്ങളുടെ സൈറ്റ് അവഗണിക്കില്ല. ഒപ്റ്റിമൈസേഷൻ ദോഷം വരുത്താതിരിക്കാൻ നിങ്ങളുടെ സൈറ്റ് ഒപ്റ്റിമൈസ് ചെയ്യുക, മറിച്ച്, നിങ്ങളുടെ സൈറ്റ് നാവിഗേറ്റ് ചെയ്യാൻ ഉപയോക്താക്കളെ സഹായിക്കുന്നു.

ഇന്ന് ഞങ്ങൾ ഒരു പുതിയ തിരയൽ അൽഗോരിതം "പലേഖ്" പ്രഖ്യാപിച്ചു. ഞങ്ങൾ ഈയിടെയായി പ്രവർത്തിച്ചുകൊണ്ടിരിക്കുന്ന എല്ലാ മെച്ചപ്പെടുത്തലുകളും ഇതിൽ ഉൾപ്പെടുന്നു.

ഉദാഹരണത്തിന്, തിരയൽ ഇപ്പോൾ ആദ്യമായി ഉപയോഗിക്കുന്നു ന്യൂറൽ നെറ്റ്‌വർക്കുകൾഅഭ്യർത്ഥനയിലും പ്രമാണത്തിലും ഉപയോഗിച്ചിരിക്കുന്ന വാക്കുകളിലൂടെയല്ല, അഭ്യർത്ഥനയുടെയും ശീർഷകത്തിൻ്റെയും അർത്ഥം കൊണ്ടാണ് പ്രമാണങ്ങൾ കണ്ടെത്തുന്നതിന്.

നിരവധി പതിറ്റാണ്ടുകളായി, ഗവേഷകർ സെമാൻ്റിക് തിരയലിൻ്റെ പ്രശ്‌നവുമായി പൊരുത്തപ്പെടുന്നു, അതിൽ ഒരു അന്വേഷണത്തിൻ്റെ അർത്ഥപരമായ പ്രസക്തിയെ അടിസ്ഥാനമാക്കി രേഖകൾ റാങ്ക് ചെയ്യപ്പെടുന്നു. ഇപ്പോൾ അത് യാഥാർത്ഥ്യമാവുകയാണ്.

ഈ പോസ്റ്റിൽ ഞങ്ങൾ ഇത് എങ്ങനെ ചെയ്തു എന്നതിനെക്കുറിച്ചും ഇത് മറ്റൊരു മെഷീൻ ലേണിംഗ് അൽഗോരിതം മാത്രമല്ല, ഭാവിയിലേക്കുള്ള ഒരു സുപ്രധാന ചുവടുവയ്പ്പാണെന്നും കുറച്ച് സംസാരിക്കാൻ ഞാൻ ശ്രമിക്കും.

ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് അല്ലെങ്കിൽ മെഷീൻ ലേണിംഗ്?

ആധുനികമാണെന്ന് മിക്കവാറും എല്ലാവർക്കും അറിയാം സെർച്ച് എഞ്ചിനുകൾമെഷീൻ ലേണിംഗ് ഉപയോഗിച്ച് പ്രവർത്തിക്കുക. ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ അതിൻ്റെ ചുമതലകൾക്കായി ഉപയോഗിക്കുന്നതിനെക്കുറിച്ച് നമ്മൾ എന്തിന് പ്രത്യേകം സംസാരിക്കണം? ഈ വിഷയത്തെ ചുറ്റിപ്പറ്റിയുള്ള ഹൈപ്പ് വർഷങ്ങളായി ശമിക്കാത്തതിനാൽ ഇപ്പോൾ മാത്രം എന്തുകൊണ്ട്? പ്രശ്നത്തിൻ്റെ ചരിത്രത്തെക്കുറിച്ച് ഞാൻ നിങ്ങളോട് പറയാൻ ശ്രമിക്കും.

ഇൻ്റർനെറ്റ് തിരയൽ വളരെക്കാലം മുമ്പ് പ്രത്യക്ഷപ്പെട്ട ഒരു സങ്കീർണ്ണ സംവിധാനമാണ്. ആദ്യം ഇത് പേജുകൾക്കായുള്ള തിരയൽ മാത്രമായിരുന്നു, പിന്നീട് അത് ഒരു പ്രശ്നപരിഹാരമായി മാറി, ഇപ്പോൾ അത് ഒരു പൂർണ്ണ സഹായിയായി മാറുന്നു. എങ്ങനെ കൂടുതൽ ഇൻ്റർനെറ്റ്, കൂടുതൽ ആളുകൾ ഉണ്ട്, അവരുടെ ആവശ്യങ്ങൾ ഉയർന്നതാണ്, തിരയൽ കൂടുതൽ ബുദ്ധിമുട്ടാണ്.

നിഷ്കളങ്കമായ തിരയലിൻ്റെ കാലഘട്ടം

ആദ്യം ഒരു പദ തിരയൽ മാത്രമായിരുന്നു - ഒരു വിപരീത സൂചിക. പിന്നീട് വളരെയധികം പേജുകൾ ഉണ്ടായിരുന്നു, അവ റാങ്ക് ചെയ്യേണ്ടതുണ്ട്. വിവിധ സങ്കീർണതകൾ കണക്കിലെടുക്കാൻ തുടങ്ങി - പദ ആവൃത്തി, tf-idf.

ലിങ്കുകളുടെ പ്രായം

തുടർന്ന് ഏതെങ്കിലും വിഷയത്തിൽ വളരെയധികം പേജുകൾ ഉണ്ടായിരുന്നു, ഒരു പ്രധാന വഴിത്തിരിവ് സംഭവിച്ചു - അവർ ലിങ്കുകൾ കണക്കിലെടുക്കാൻ തുടങ്ങി, പേജ് റാങ്ക് പ്രത്യക്ഷപ്പെട്ടു.

മെഷീൻ ലേണിംഗിൻ്റെ യുഗം

ഇൻ്റർനെറ്റ് വാണിജ്യപരമായി പ്രധാനമായിത്തീർന്നു, അക്കാലത്ത് നിലവിലുണ്ടായിരുന്ന ലളിതമായ അൽഗോരിതങ്ങളെ കബളിപ്പിക്കാൻ ശ്രമിക്കുന്ന നിരവധി അഴിമതിക്കാർ ഉയർന്നുവന്നു. രണ്ടാമത്തെ പ്രധാന വഴിത്തിരിവ് സംഭവിച്ചു - സെർച്ച് എഞ്ചിനുകൾ ഉപയോക്തൃ പെരുമാറ്റത്തെക്കുറിച്ചുള്ള അവരുടെ അറിവ് ഉപയോഗിച്ച് ഏതൊക്കെ പേജുകളാണ് നല്ലതെന്നും അല്ലാത്തതെന്നും മനസ്സിലാക്കാൻ തുടങ്ങി.

ഈ ഘട്ടത്തിൽ എവിടെയോ, രേഖകൾ എങ്ങനെ റാങ്ക് ചെയ്യാമെന്ന് മനസിലാക്കാൻ മനുഷ്യ മനസ്സ് പര്യാപ്തമായിരുന്നില്ല. അടുത്ത പരിവർത്തനം സംഭവിച്ചു - തിരയൽ എഞ്ചിനുകൾ മെഷീൻ ലേണിംഗ് സജീവമായി ഉപയോഗിക്കാൻ തുടങ്ങി.

മികച്ച മെഷീൻ ലേണിംഗ് അൽഗോരിതം കണ്ടുപിടിച്ചത് Yandex - Matrixnet-ൽ ആണ്. ഉപയോക്താക്കളുടെ കൂട്ടായ ബുദ്ധിയും "ആൾക്കൂട്ടത്തിൻ്റെ ജ്ഞാനവും" റാങ്കിംഗിനെ സഹായിക്കുന്നുവെന്ന് നമുക്ക് പറയാം. സൈറ്റുകളെയും ആളുകളുടെ പെരുമാറ്റത്തെയും കുറിച്ചുള്ള വിവരങ്ങൾ പല ഘടകങ്ങളായി പരിവർത്തനം ചെയ്യപ്പെടുന്നു, അവയിൽ ഓരോന്നും ഒരു റാങ്കിംഗ് ഫോർമുല നിർമ്മിക്കാൻ Matrixnet ഉപയോഗിക്കുന്നു. വാസ്തവത്തിൽ, റാങ്കിംഗ് ഫോർമുല ഒരു യന്ത്രം എഴുതിയതാണ് (അത് ഏകദേശം 300 മെഗാബൈറ്റ് ആയി മാറി).

എന്നാൽ "ക്ലാസിക്കൽ" മെഷീൻ ലേണിംഗിന് ഒരു പരിധിയുണ്ട്: ധാരാളം ഡാറ്റ ഉള്ളിടത്ത് മാത്രമേ ഇത് പ്രവർത്തിക്കൂ. ഒരു ചെറിയ ഉദാഹരണം. ദശലക്ഷക്കണക്കിന് ഉപയോക്താക്കൾ ഇതേ സൈറ്റ് കണ്ടെത്താൻ അന്വേഷണം [VKontakte] നൽകുന്നു. IN ഈ സാഹചര്യത്തിൽഅവരുടെ പെരുമാറ്റം അങ്ങനെയാണ് ശക്തമായ സിഗ്നൽതിരയൽ ഫലങ്ങൾ നോക്കാൻ ആളുകളെ നിർബന്ധിക്കുന്നില്ല, എന്നാൽ ഒരു ചോദ്യം നൽകുമ്പോൾ ഉടൻ വിലാസം ആവശ്യപ്പെടുന്നു.

എന്നാൽ ആളുകൾ കൂടുതൽ സങ്കീർണ്ണമാണ്, അവരുടെ തിരയലിൽ നിന്ന് കൂടുതൽ കൂടുതൽ ആഗ്രഹിക്കുന്നു. ഇപ്പോൾ എല്ലാ അഭ്യർത്ഥനകളുടെയും 40% വരെ അദ്വിതീയമാണ്, അതായത്, മുഴുവൻ നിരീക്ഷണ കാലയളവിലും അവ രണ്ടുതവണയെങ്കിലും ആവർത്തിക്കില്ല. ഇതിനർത്ഥം, തിരയലിന് ഉപയോക്തൃ പെരുമാറ്റത്തെക്കുറിച്ചുള്ള മതിയായ ഡാറ്റ ഇല്ലെന്നും, മാട്രിക്സ്നെറ്റിന് വിലയേറിയ ഘടകങ്ങൾ നഷ്ടപ്പെടുകയും ചെയ്യുന്നു. Yandex-ലെ അത്തരം അന്വേഷണങ്ങളെ "നീണ്ട വാൽ" എന്ന് വിളിക്കുന്നു, കാരണം അവ ഒരുമിച്ച് ഞങ്ങളുടെ തിരയലിലെ ഹിറ്റുകളുടെ ഗണ്യമായ അനുപാതമാണ്.

ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസിൻ്റെ യുഗം

ഇപ്പോൾ ഏറ്റവും പുതിയ വഴിത്തിരിവിനെക്കുറിച്ച് സംസാരിക്കേണ്ട സമയമാണിത്: കുറച്ച് വർഷങ്ങൾക്ക് മുമ്പ്, കമ്പ്യൂട്ടറുകൾ വേണ്ടത്ര വേഗത്തിലായി, കൂടാതെ ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ ഉപയോഗിക്കുന്നതിന് ആവശ്യമായ ഡാറ്റയും ഉണ്ടായിരുന്നു. അവയെ അടിസ്ഥാനമാക്കിയുള്ള സാങ്കേതികവിദ്യകളെ മെഷീൻ ഇൻ്റലിജൻസ് അല്ലെങ്കിൽ ആർട്ടിഫിഷ്യൽ ഇൻ്റലിജൻസ് എന്നും വിളിക്കുന്നു - കാരണം ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ നമ്മുടെ തലച്ചോറിലെ ന്യൂറോണുകളുടെ പ്രതിച്ഛായയിലാണ് നിർമ്മിച്ചിരിക്കുന്നത്, മാത്രമല്ല അതിൻ്റെ ചില ഭാഗങ്ങളുടെ പ്രവർത്തനം അനുകരിക്കാൻ ശ്രമിക്കുകയും ചെയ്യുന്നു.

സംഭാഷണം തിരിച്ചറിയൽ അല്ലെങ്കിൽ ചിത്രങ്ങളിലെ പാറ്റേൺ തിരിച്ചറിയൽ പോലുള്ള മനുഷ്യർക്ക് ചെയ്യാൻ കഴിയുന്ന പഴയ രീതികളേക്കാൾ മെഷീൻ ഇൻ്റലിജൻസ് വളരെ മികച്ചതാണ്. എന്നാൽ ഇത് തിരയലിനെ എങ്ങനെ സഹായിക്കും?

ചട്ടം പോലെ, കുറഞ്ഞ ആവൃത്തിയും അതുല്യവുമായ അന്വേഷണങ്ങൾ തിരയുന്നത് വളരെ ബുദ്ധിമുട്ടാണ്, അവയ്ക്ക് നല്ല ഉത്തരം കണ്ടെത്തുന്നത് വളരെ ബുദ്ധിമുട്ടാണ്. ഇത് എങ്ങനെ ചെയ്യാം? ഞങ്ങൾക്ക് ഉപയോക്താക്കളിൽ നിന്ന് സൂചനകളൊന്നുമില്ല (ഏത് പ്രമാണമാണ് മികച്ചതും മോശമായതും), അതിനാൽ തിരയൽ പ്രശ്നം പരിഹരിക്കുന്നതിന് രണ്ട് പാഠങ്ങൾ തമ്മിലുള്ള സെമാൻ്റിക് കത്തിടപാടുകൾ നന്നായി മനസ്സിലാക്കാൻ പഠിക്കേണ്ടതുണ്ട്: അന്വേഷണവും പ്രമാണവും.

പറയാൻ എളുപ്പമാണ്

കൃത്യമായി പറഞ്ഞാൽ, കൃത്രിമ ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ മെഷീൻ ലേണിംഗിൻ്റെ ഒരു രീതിയാണ്. അടുത്തിടെ അത് അവർക്കായി സമർപ്പിച്ചു. ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ സ്വാഭാവിക വിവരങ്ങൾ - ശബ്ദവും ചിത്രങ്ങളും വിശകലനം ചെയ്യുന്ന മേഖലയിൽ ശ്രദ്ധേയമായ ഫലങ്ങൾ കാണിക്കുന്നു. ഇത് ഇപ്പോൾ കുറേ വർഷങ്ങളായി നടക്കുന്നു. എന്നാൽ എന്തുകൊണ്ടാണ് അവ ഇതുവരെ തിരച്ചിലിൽ ഇത്ര സജീവമായി ഉപയോഗിക്കാത്തത്?

ഒരു ചിത്രത്തിലെ ഒരു ചിത്രത്തെക്കുറിച്ചോ ശബ്ദങ്ങളെ ഡീകോഡ് ചെയ്ത പദങ്ങളാക്കി മാറ്റുന്നതിനേക്കാളും അർത്ഥത്തെക്കുറിച്ച് സംസാരിക്കുന്നത് വളരെ ബുദ്ധിമുട്ടാണ് എന്നതിനാലാണ് ലളിതമായ ഉത്തരം. എന്നിരുന്നാലും, അർത്ഥത്തിനായുള്ള തിരയലിൽ, കൃത്രിമബുദ്ധി അത് വളരെക്കാലമായി രാജാവായിരുന്ന പ്രദേശത്ത് നിന്ന് ശരിക്കും വരാൻ തുടങ്ങിയിരിക്കുന്നു - ഇമേജ് തിരയൽ.

ഇമേജ് തിരയലിൽ ഇത് എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നതിനെക്കുറിച്ച് കുറച്ച് വാക്കുകൾ. നിങ്ങൾ ഒരു ഇമേജ് എടുത്ത് ന്യൂറൽ നെറ്റ്‌വർക്കുകൾ ഉപയോഗിച്ച് അതിനെ എൻ-ഡൈമൻഷണൽ സ്‌പെയ്‌സിലെ വെക്‌ടറായി മാറ്റുന്നു. ഒരു അഭ്യർത്ഥന എടുക്കുക (ഇത് പോലെയാകാം ടെക്സ്റ്റ് ഫോം, കൂടാതെ മറ്റൊരു ചിത്രത്തിൻ്റെ രൂപത്തിൽ) കൂടാതെ അതും ചെയ്യുക. എന്നിട്ട് നിങ്ങൾ ഈ വെക്റ്ററുകൾ താരതമ്യം ചെയ്യുക. അവർ പരസ്പരം കൂടുതൽ അടുക്കുന്നു, കൂടുതൽ ചിത്രംഅഭ്യർത്ഥനയുമായി പൊരുത്തപ്പെടുന്നു.

ശരി, ഇത് ചിത്രങ്ങളിൽ പ്രവർത്തിക്കുന്നുണ്ടെങ്കിൽ, വെബ് തിരയലിലും ഇതേ ലോജിക് എന്തുകൊണ്ട് പ്രയോഗിച്ചുകൂടാ?

പിശാച് സാങ്കേതികവിദ്യയിലാണ്

നമുക്ക് പ്രശ്നം ഇനിപ്പറയുന്ന രീതിയിൽ രൂപപ്പെടുത്താം. ഇൻപുട്ടിൽ ഞങ്ങൾക്ക് ഒരു ഉപയോക്തൃ അഭ്യർത്ഥനയും ഒരു പേജ് ശീർഷകവും ഉണ്ട്. അർത്ഥത്തിൽ അവ പരസ്പരം എത്രത്തോളം പൊരുത്തപ്പെടുന്നുവെന്ന് നിങ്ങൾ മനസ്സിലാക്കേണ്ടതുണ്ട്. ഇത് ചെയ്യുന്നതിന്, അഭ്യർത്ഥന വാചകവും ഹെഡർ വാചകവും അത്തരം വെക്റ്ററുകളുടെ രൂപത്തിൽ പ്രതിനിധീകരിക്കേണ്ടത് ആവശ്യമാണ്, അതിൻ്റെ സ്കെയിലർ ഗുണനം ഇതിലും വലുതായിരിക്കും. അഭ്യർത്ഥനയ്ക്ക് കൂടുതൽ പ്രസക്തമാണ്ഈ തലക്കെട്ടുള്ള പ്രമാണം. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, ഒരു ന്യൂറൽ നെറ്റ്‌വർക്കിനെ പരിശീലിപ്പിക്കാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു, അർത്ഥത്തിൽ അടുത്തിരിക്കുന്ന ടെക്‌സ്‌റ്റുകൾക്ക് അത് സമാനമായ വെക്‌ടറുകൾ സൃഷ്‌ടിക്കുന്നു, എന്നാൽ അർത്ഥപരമായി ബന്ധമില്ലാത്ത അന്വേഷണങ്ങൾക്കും തലക്കെട്ടുകൾക്കും വെക്‌ടറുകൾ വ്യത്യസ്തമായിരിക്കണം.

ന്യൂറൽ നെറ്റ്‌വർക്കിനെ പരിശീലിപ്പിക്കുന്നതിനുള്ള ശരിയായ വാസ്തുവിദ്യയും രീതിയും തിരഞ്ഞെടുക്കുന്നതിലാണ് ഈ ടാസ്‌ക്കിൻ്റെ സങ്കീർണ്ണത. പ്രശ്നം പരിഹരിക്കുന്നതിനുള്ള ചില സമീപനങ്ങൾ ശാസ്ത്രീയ പ്രസിദ്ധീകരണങ്ങളിൽ നിന്ന് അറിയാം. word2vec അൽഗോരിതം ഉപയോഗിച്ച് ടെക്സ്റ്റുകളെ വെക്റ്ററായി പ്രതിനിധീകരിക്കുക എന്നതാണ് ഇവിടെയുള്ള ഏറ്റവും ലളിതമായ രീതി (നിർഭാഗ്യവശാൽ, പ്രായോഗിക അനുഭവം സൂചിപ്പിക്കുന്നത് പ്രശ്നത്തിന് ഇത് വളരെ ശരിയാണ് മോശം തീരുമാനം).

ഡി.എസ്.എസ്.എം

2013-ൽ, മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ ഗവേഷകർ അവരുടെ സമീപനം വിവരിച്ചു, അതിനെ ഡീപ് സ്ട്രക്ചർഡ് സെമാൻ്റിക് മോഡൽ എന്ന് വിളിക്കുന്നു.

ചോദ്യങ്ങളുടെയും തലക്കെട്ടുകളുടെയും പാഠങ്ങളാണ് മോഡൽ ഇൻപുട്ട്. മോഡലിൻ്റെ വലുപ്പം കുറയ്ക്കുന്നതിന്, അവയിൽ ഒരു ഓപ്പറേഷൻ നടത്തുന്നു, അതിനെ രചയിതാക്കൾ വേഡ് ഹാഷിംഗ് എന്ന് വിളിക്കുന്നു. ആരംഭ, അവസാന മാർക്കറുകൾ വാചകത്തിലേക്ക് ചേർത്തു, അതിനുശേഷം അത് അക്ഷര ട്രിഗ്രാമുകളായി തിരിച്ചിരിക്കുന്നു. ഉദാഹരണത്തിന്, [palek] എന്ന ചോദ്യത്തിന് നമുക്ക് ട്രിഗ്രാമുകൾ ലഭിക്കും [pa, ale, lekh, ex]. വ്യത്യസ്‌ത ട്രൈഗ്രാമുകളുടെ എണ്ണം പരിമിതമായതിനാൽ, നമുക്ക് അഭ്യർത്ഥന വാചകത്തെ വലുപ്പത്തിലുള്ള നിരവധി പതിനായിരക്കണക്കിന് മൂലകങ്ങളുടെ വെക്‌ടറായി പ്രതിനിധീകരിക്കാൻ കഴിയും (ഞങ്ങളുടെ അക്ഷരമാലയുടെ വലുപ്പം 3-ആം പവർ വരെ). അഭ്യർത്ഥനയുടെ ട്രിഗ്രാമുകളുമായി പൊരുത്തപ്പെടുന്ന വെക്റ്ററിൻ്റെ ഘടകങ്ങൾ 1-ന് തുല്യമായിരിക്കും, ബാക്കി - 0. സാരാംശത്തിൽ, അറിയപ്പെടുന്ന എല്ലാ ട്രിഗ്രാമുകളും അടങ്ങുന്ന ഒരു നിഘണ്ടുവിലേക്ക് വാചകത്തിൽ നിന്ന് ട്രിഗ്രാമുകളുടെ പ്രവേശനം ഞങ്ങൾ അടയാളപ്പെടുത്തുന്നു. നിങ്ങൾ അത്തരം വെക്റ്ററുകൾ താരതമ്യം ചെയ്യുകയാണെങ്കിൽ, അഭ്യർത്ഥനയിലും തലക്കെട്ടിലും സമാനമായ ട്രിഗ്രാമുകളുടെ സാന്നിധ്യത്തെക്കുറിച്ച് മാത്രമേ നിങ്ങൾക്ക് കണ്ടെത്താൻ കഴിയൂ, അത് പ്രത്യേക താൽപ്പര്യമില്ലാത്തതാണ്. അതിനാൽ, ഇപ്പോൾ അവ മറ്റ് വെക്റ്ററുകളായി പരിവർത്തനം ചെയ്യേണ്ടതുണ്ട്, അവയ്ക്ക് ഇതിനകം തന്നെ നമുക്ക് ആവശ്യമായ സെമാൻ്റിക് പ്രോക്സിമിറ്റി പ്രോപ്പർട്ടികൾ ഉണ്ടായിരിക്കും.

ഇൻപുട്ട് ലെയറിന് ശേഷം, ആഴത്തിലുള്ള ആർക്കിടെക്ചറുകളിൽ പ്രതീക്ഷിക്കുന്നത് പോലെ, അഭ്യർത്ഥനയ്ക്കും തലക്കെട്ടിനുമായി നിരവധി മറഞ്ഞിരിക്കുന്ന പാളികൾ ഉണ്ട്. അവസാന ലെയർ 128 മൂലകങ്ങളുടെ വലിപ്പമുള്ളതും താരതമ്യത്തിനായി ഉപയോഗിക്കുന്ന വെക്‌ടറായി വർത്തിക്കുന്നു. മോഡലിൻ്റെ ഔട്ട്പുട്ട് അവസാനത്തെ ഹെഡറിൻ്റെയും അഭ്യർത്ഥന വെക്റ്ററുകളുടെയും സ്കെയിലർ ഗുണനത്തിൻ്റെ ഫലമാണ് (കൃത്യമായി പറഞ്ഞാൽ, വെക്റ്ററുകൾക്കിടയിലുള്ള കോണിൻ്റെ കോസൈൻ കണക്കാക്കുന്നു). പോസിറ്റീവ് പരിശീലന ഉദാഹരണങ്ങൾക്ക് ഔട്ട്‌പുട്ട് മൂല്യം വലുതും നെഗറ്റീവായവയ്ക്ക് ചെറുതും ആയ രീതിയിലാണ് മോഡൽ പരിശീലിപ്പിച്ചിരിക്കുന്നത്. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, അവസാന ലെയറിൻ്റെ വെക്റ്ററുകൾ താരതമ്യം ചെയ്യുന്നതിലൂടെ, നമുക്ക് പ്രവചന പിശക് കണക്കാക്കുകയും മോഡൽ പരിഷ്കരിക്കുകയും അങ്ങനെ പിശക് കുറയുകയും ചെയ്യാം.

Yandex-ൽ ഞങ്ങൾ കൃത്രിമ ന്യൂറൽ നെറ്റ്‌വർക്കുകളെ അടിസ്ഥാനമാക്കിയുള്ള മോഡലുകൾ സജീവമായി ഗവേഷണം ചെയ്യുന്നു, അതിനാൽ ഞങ്ങൾക്ക് DSSM മോഡലിൽ താൽപ്പര്യമുണ്ടായി. അടുത്തതായി, ഈ മേഖലയിലെ ഞങ്ങളുടെ പരീക്ഷണങ്ങളെക്കുറിച്ച് സംസാരിക്കും.

സിദ്ധാന്തവും പ്രയോഗവും

ശാസ്ത്രസാഹിത്യത്തിൽ വിവരിച്ചിരിക്കുന്ന അൽഗോരിതങ്ങളുടെ ഒരു സവിശേഷത, അവ എല്ലായ്പ്പോഴും ബോക്സിൽ നിന്ന് പ്രവർത്തിക്കുന്നില്ല എന്നതാണ്. ഒരു "അക്കാദമിക്" ഗവേഷകനും വ്യാവസായിക ഗവേഷകനും വ്യത്യസ്തമായ അവസ്ഥകളിലാണ് എന്നതാണ് വസ്തുത. രചയിതാവ് ഒരു ആരംഭ പോയിൻ്റായി (അടിസ്ഥാനം). ശാസ്ത്രീയ പ്രസിദ്ധീകരണംഅതിൻ്റെ പരിഹാരം താരതമ്യം ചെയ്യുന്നു, അറിയപ്പെടുന്ന ചില അൽഗോരിതം ഉപയോഗിക്കണം - ഇത് ഫലങ്ങളുടെ പുനരുൽപാദനക്ഷമത ഉറപ്പാക്കുന്നു. ഗവേഷകർ മുമ്പ് പ്രസിദ്ധീകരിച്ച ഒരു സമീപനത്തിൻ്റെ ഫലങ്ങൾ എടുക്കുകയും അവ എങ്ങനെ മറികടക്കാമെന്ന് കാണിക്കുകയും ചെയ്യുന്നു. ഉദാഹരണത്തിന്, യഥാർത്ഥ DSSM-ൻ്റെ രചയിതാക്കൾ അവരുടെ മോഡലിനെ NDCG മെട്രിക് ഉപയോഗിച്ച് BM25, LSA അൽഗോരിതങ്ങളുമായി താരതമ്യം ചെയ്യുന്നു. ഒരു യഥാർത്ഥ സെർച്ച് എഞ്ചിനിലെ തിരയലിൻ്റെ ഗുണനിലവാരം പഠിക്കുന്ന ഒരു പ്രായോഗിക ഗവേഷകൻ്റെ കാര്യത്തിൽ, ആരംഭ പോയിൻ്റ് ഒരു നിർദ്ദിഷ്ട അൽഗോരിതം അല്ല, മറിച്ച് മൊത്തത്തിലുള്ള റാങ്കിംഗാണ്. Yandex ഡവലപ്പറുടെ ലക്ഷ്യം BM25-നെ മറികടക്കുകയല്ല, മറിച്ച് മുമ്പ് അവതരിപ്പിച്ച ഘടകങ്ങളുടെയും മോഡലുകളുടെയും മുഴുവൻ പശ്ചാത്തലത്തിലും പുരോഗതി കൈവരിക്കുക എന്നതാണ്. അതിനാൽ, Yandex-ലെ ഒരു ഗവേഷകൻ്റെ അടിസ്ഥാനം വളരെ ഉയർന്നതാണ്, കൂടാതെ ശാസ്ത്രീയ പുതുമയുള്ളതും “അക്കാദമിക്” സമീപനത്തിലൂടെ നല്ല ഫലങ്ങൾ കാണിക്കുന്നതുമായ നിരവധി അൽഗോരിതങ്ങൾ പ്രായോഗികമായി ഉപയോഗശൂന്യമായി മാറുന്നു, കാരണം അവ തിരയലിൻ്റെ ഗുണനിലവാരം ശരിക്കും മെച്ചപ്പെടുത്തുന്നില്ല.

DSSM-ൻ്റെ കാര്യത്തിൽ, ഞങ്ങൾ ഇതേ പ്രശ്നം നേരിട്ടു. പലപ്പോഴും സംഭവിക്കുന്നത് പോലെ, "കോംബാറ്റ്" സാഹചര്യങ്ങളിൽ, ലേഖനത്തിൽ നിന്നുള്ള മാതൃകയുടെ കൃത്യമായ നടപ്പാക്കൽ മിതമായ ഫലങ്ങൾ കാണിച്ചു. ഒരു പ്രായോഗിക വീക്ഷണകോണിൽ നിന്ന് രസകരമായ ഫലങ്ങൾ ലഭിക്കുന്നതിന് മുമ്പ് നിരവധി പ്രധാനപ്പെട്ട "ഫയൽ പരിഷ്ക്കരണങ്ങൾ" ആവശ്യമായിരുന്നു. ഇവിടെ നമ്മൾ പ്രധാന പരിഷ്കാരങ്ങളെക്കുറിച്ച് സംസാരിക്കും യഥാർത്ഥ മോഡൽ, അത് കൂടുതൽ ശക്തമാക്കാൻ ഞങ്ങളെ അനുവദിച്ചു.

വലിയ ഇൻപുട്ട് ലെയർ

യഥാർത്ഥ DSSM മോഡലിൽ, ഇൻപുട്ട് ലെയർ അക്ഷര ട്രിഗ്രാമുകളുടെ ഒരു കൂട്ടമാണ്. ഇതിൻ്റെ വലിപ്പം 30,000. ട്രൈഗ്രാം സമീപനത്തിന് നിരവധി ഗുണങ്ങളുണ്ട്. ഒന്നാമതായി, അവയിൽ താരതമ്യേന കുറച്ച് മാത്രമേ ഉള്ളൂ, അതിനാൽ അവരുമായി പ്രവർത്തിക്കുന്നതിന് വലിയ വിഭവങ്ങൾ ആവശ്യമില്ല. രണ്ടാമതായി, അവയുടെ ഉപയോഗം അക്ഷരത്തെറ്റുകളും അക്ഷരത്തെറ്റുകളും തിരിച്ചറിയുന്നത് എളുപ്പമാക്കുന്നു. എന്നിരുന്നാലും, ടെക്‌സ്‌റ്റുകളെ ട്രൈഗ്രാമുകളുടെ ഒരു "ബാഗ്" ആയി പ്രതിനിധീകരിക്കുന്നത് നെറ്റ്‌വർക്കിൻ്റെ പ്രകടമായ ശക്തിയെ ഗണ്യമായി കുറയ്ക്കുന്നുവെന്ന് ഞങ്ങളുടെ പരീക്ഷണങ്ങൾ കാണിച്ചു. അതിനാൽ, അക്ഷര ട്രിഗ്രാമുകൾക്ക് പുറമേ, ഏകദേശം 2 ദശലക്ഷം വാക്കുകളും ശൈലികളും ഉൾപ്പെടെ ഇൻപുട്ട് ലെയറിൻ്റെ വലുപ്പം ഞങ്ങൾ സമൂലമായി വർദ്ധിപ്പിച്ചു. അങ്ങനെ, പദങ്ങൾ, പദ ബിഗ്രാം, അക്ഷര ട്രിഗ്രാമുകൾ എന്നിവയുടെ സംയുക്ത "ബാഗ്" ആയി ഞങ്ങൾ അന്വേഷണത്തെയും തലക്കെട്ടിനെയും പ്രതിനിധീകരിക്കുന്നു.

ഒരു വലിയ ഇൻപുട്ട് ലെയർ ഉപയോഗിക്കുന്നത് മോഡൽ വലുപ്പത്തിലും പരിശീലന സമയത്തിലും വർദ്ധനവിന് കാരണമാകുന്നു, കൂടാതെ കൂടുതൽ കമ്പ്യൂട്ടിംഗ് ഉറവിടങ്ങൾ ആവശ്യമാണ്.

പഠിക്കാൻ പ്രയാസമാണ്: ഒരു ന്യൂറൽ നെറ്റ്‌വർക്ക് എങ്ങനെ സ്വയം പോരാടുകയും അതിൻ്റെ തെറ്റുകളിൽ നിന്ന് പഠിക്കുകയും ചെയ്തു

ഒറിജിനൽ DSSM-നെ പരിശീലിപ്പിക്കുന്നത് നെറ്റ്‌വർക്കിനെ ധാരാളം പോസിറ്റീവ്, നെഗറ്റീവ് ഉദാഹരണങ്ങളിലേക്ക് തുറന്നുകാട്ടുന്നതാണ്. ഈ ഉദാഹരണങ്ങൾ തിരയൽ ഫലങ്ങളിൽ നിന്ന് എടുത്തതാണ് (പ്രത്യക്ഷമായും, Bing തിരയൽ എഞ്ചിൻ ഇതിനായി ഉപയോഗിച്ചു). ക്ലിക്കുചെയ്‌ത തിരയൽ പ്രമാണങ്ങളുടെ ശീർഷകങ്ങളാണ് പോസിറ്റീവ് ഉദാഹരണങ്ങൾ, ക്ലിക്കുചെയ്യാത്ത പ്രമാണങ്ങളുടെ ശീർഷകങ്ങളാണ് നെഗറ്റീവ് ഉദാഹരണങ്ങൾ. ഈ സമീപനത്തിന് ചില ദോഷങ്ങളുമുണ്ട്. ഒരു ക്ലിക്കിൻ്റെ അഭാവം എല്ലായ്പ്പോഴും പ്രമാണം അപ്രസക്തമാണെന്ന് സൂചിപ്പിക്കുന്നില്ല എന്നതാണ് വസ്തുത. വിപരീത പ്രസ്താവനയും ശരിയാണ് - ഒരു ക്ലിക്കിൻ്റെ സാന്നിധ്യം പ്രമാണത്തിൻ്റെ പ്രസക്തി ഉറപ്പുനൽകുന്നില്ല. അടിസ്ഥാനപരമായി, യഥാർത്ഥ ലേഖനത്തിൽ വിവരിച്ചിരിക്കുന്ന രീതിയിൽ പഠിക്കുന്നതിലൂടെ, തലക്കെട്ടുകളുടെ ആകർഷണീയത പ്രവചിക്കാൻ ഞങ്ങൾ ശ്രമിക്കുന്നു, അവ തിരയൽ ഫലങ്ങളിൽ ഉണ്ടായിരിക്കും. തീർച്ചയായും ഇതും മോശമല്ല, പക്ഷേ ഇതിന് നമ്മുടെ പ്രധാന ലക്ഷ്യവുമായി പരോക്ഷമായ ബന്ധമുണ്ട് - സെമാൻ്റിക് സാമീപ്യം മനസ്സിലാക്കാൻ പഠിക്കുക.

ഞങ്ങളുടെ പരീക്ഷണങ്ങൾക്കിടയിൽ, നെഗറ്റീവ് ഉദാഹരണങ്ങൾ തിരഞ്ഞെടുക്കുന്നതിന് മറ്റൊരു തന്ത്രം ഉപയോഗിച്ചാൽ ഫലം ഗണ്യമായി മെച്ചപ്പെടുത്താൻ കഴിയുമെന്ന് ഞങ്ങൾ കണ്ടെത്തി. ഞങ്ങളുടെ ലക്ഷ്യം നേടുന്നതിന്, ചോദ്യത്തിന് അപ്രസക്തമാണെന്ന് ഉറപ്പുനൽകുന്ന പ്രമാണങ്ങളാണ് നല്ല നെഗറ്റീവ് ഉദാഹരണങ്ങൾ, എന്നാൽ അതേ സമയം വാക്കുകളുടെ അർത്ഥം നന്നായി മനസ്സിലാക്കാൻ ന്യൂറൽ നെറ്റ്‌വർക്കിനെ സഹായിക്കുന്നു. എനിക്ക് അവ എവിടെ നിന്ന് ലഭിക്കും?

ആദ്യ ശ്രമം

ആദ്യം, ഒരു റാൻഡം ഡോക്യുമെൻ്റിൻ്റെ തലക്കെട്ട് ഒരു നെഗറ്റീവ് ഉദാഹരണമായി എടുക്കാം. ഉദാഹരണത്തിന്, അഭ്യർത്ഥനയ്ക്ക് [പലേഖ് പെയിൻ്റിംഗ്], ക്രമരഹിതമായ ഒരു തലക്കെട്ട് "നിയമങ്ങൾ" ആയിരിക്കാം ഗതാഗതം 2016 റഷ്യൻ ഫെഡറേഷൻ". തീർച്ചയായും, ശതകോടികളിൽ നിന്ന് ക്രമരഹിതമായി തിരഞ്ഞെടുത്ത ഒരു പ്രമാണം അഭ്യർത്ഥനയ്ക്ക് പ്രസക്തമാകാനുള്ള സാധ്യത പൂർണ്ണമായും ഒഴിവാക്കുക അസാധ്യമാണ്, എന്നാൽ ഇതിൻ്റെ സാധ്യത വളരെ ചെറുതാണ്, അത് അവഗണിക്കാം. ഇതുവഴി നമുക്ക് വളരെ എളുപ്പത്തിൽ നെഗറ്റീവ് ഉദാഹരണങ്ങൾ ലഭിക്കും. ഇപ്പോൾ നമുക്ക് ആവശ്യമുള്ളത് കൃത്യമായി നമ്മുടെ നെറ്റ്‌വർക്കിനെ പഠിപ്പിക്കാൻ കഴിയുമെന്ന് തോന്നുന്നു - വേർതിരിച്ചറിയാൻ നല്ല രേഖകൾ, അഭ്യർത്ഥനയുമായി യാതൊരു ബന്ധവുമില്ലാത്ത പ്രമാണങ്ങളിൽ നിന്നുള്ള ഉപയോക്താക്കൾക്ക് താൽപ്പര്യമുള്ളവ. നിർഭാഗ്യവശാൽ, അത്തരം ഉദാഹരണങ്ങളിൽ പരിശീലനം ലഭിച്ച മോഡൽ വളരെ ദുർബലമായി മാറി. ഒരു ന്യൂറൽ നെറ്റ്‌വർക്ക് ഒരു മികച്ച കാര്യമാണ്, മാത്രമല്ല അതിൻ്റെ പ്രവർത്തനം ലളിതമാക്കാൻ എപ്പോഴും ഒരു വഴി കണ്ടെത്തുകയും ചെയ്യും. ഈ സാഹചര്യത്തിൽ, അവൾ ചോദ്യങ്ങളിലും തലക്കെട്ടുകളിലും ഒരേ വാക്കുകൾ തിരയാൻ തുടങ്ങി: അതെ - ഒരു നല്ല ജോഡി, അല്ല - ഒരു മോശം ഒന്ന്. എന്നാൽ നമുക്ക് ഇത് സ്വയം ചെയ്യാൻ കഴിയും. വ്യക്തമല്ലാത്ത പാറ്റേണുകൾ വേർതിരിച്ചറിയാൻ നെറ്റ്‌വർക്ക് പഠിക്കുന്നത് ഞങ്ങൾക്ക് പ്രധാനമാണ്.

മറ്റൊരു ശ്രമം

നെഗറ്റീവായ ഉദാഹരണങ്ങളുടെ തലക്കെട്ടിലേക്ക് ചോദ്യത്തിൽ നിന്ന് വാക്കുകൾ ചേർക്കുന്നതായിരുന്നു അടുത്ത പരീക്ഷണം. ഉദാഹരണത്തിന്, അഭ്യർത്ഥനയ്ക്ക് [പലേഖ് പെയിൻ്റിംഗ്] ക്രമരഹിതമായ തലക്കെട്ട് [റഷ്യൻ ഫെഡറേഷൻ്റെ പെയിൻ്റിംഗിൻ്റെ റോഡ് നിയമങ്ങൾ 2016] പോലെ തോന്നി. ന്യൂറൽ നെറ്റ്‌വർക്കിന് അൽപ്പം ബുദ്ധിമുട്ടുണ്ടായിരുന്നു, എന്നിരുന്നാലും, സ്വമേധയാ സമാഹരിച്ചവയിൽ നിന്ന് സ്വാഭാവിക ജോഡികളെ നന്നായി വേർതിരിച്ചറിയാൻ അത് വേഗത്തിൽ പഠിച്ചു. അത്തരം രീതികൾ ഉപയോഗിച്ച് ഞങ്ങൾ വിജയിക്കില്ലെന്ന് വ്യക്തമായി.

വിജയം

പല വ്യക്തമായ പരിഹാരങ്ങളും അവ കണ്ടെത്തിയതിനുശേഷം മാത്രമേ വ്യക്തമാകൂ. ഇത്തവണയും അത് സംഭവിച്ചു: കുറച്ച് സമയത്തിന് ശേഷം അത് കണ്ടെത്തി ഏറ്റവും മികച്ച മാർഗ്ഗംനെഗറ്റീവ് ഉദാഹരണങ്ങൾ സൃഷ്ടിക്കുക എന്നതിനർത്ഥം നെറ്റ്‌വർക്കിനെ സ്വയം "പോരാടാൻ" നിർബന്ധിക്കുകയും സ്വന്തം തെറ്റുകളിൽ നിന്ന് പഠിക്കുകയും ചെയ്യുന്നു. നൂറുകണക്കിന് റാൻഡം തലക്കെട്ടുകളിൽ, നിലവിലെ ന്യൂറൽ നെറ്റ്‌വർക്ക് ഏറ്റവും മികച്ചതായി കരുതുന്ന ഒന്ന് ഞങ്ങൾ തിരഞ്ഞെടുത്തു. പക്ഷേ, ഈ തലക്കെട്ട് ഇപ്പോഴും ക്രമരഹിതമായതിനാൽ, ഇത് അഭ്യർത്ഥനയുമായി പൊരുത്തപ്പെടുന്നില്ല. ഞങ്ങൾ നെഗറ്റീവ് ഉദാഹരണങ്ങളായി ഉപയോഗിക്കാൻ തുടങ്ങിയ തലക്കെട്ടുകൾ ഇവയാണ്. മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, നിങ്ങൾക്ക് നെറ്റ്‌വർക്കിനെ മികച്ച റാൻഡം ഹെഡറുകൾ കാണിക്കാനും അത് പരിശീലിപ്പിക്കാനും പുതിയ മികച്ച റാൻഡം ഹെഡറുകൾ കണ്ടെത്താനും നെറ്റ്‌വർക്ക് വീണ്ടും കാണിക്കാനും കഴിയും. വീണ്ടും വീണ്ടും ആവർത്തിക്കുന്നു ഈ നടപടിക്രമം, മോഡലിൻ്റെ ഗുണനിലവാരം എങ്ങനെ ശ്രദ്ധേയമായി മെച്ചപ്പെട്ടുവെന്ന് ഞങ്ങൾ കണ്ടു, കൂടാതെ ക്രമരഹിതമായ ജോഡികളിൽ ഏറ്റവും മികച്ചത് യഥാർത്ഥ പോസിറ്റീവ് ഉദാഹരണങ്ങളായി കാണപ്പെടാൻ തുടങ്ങി. പ്രശ്നം പരിഹരിച്ചു.

ശാസ്ത്രീയ സാഹിത്യത്തിലെ സമാനമായ പരിശീലന പദ്ധതിയെ സാധാരണയായി ഹാർഡ് നെഗറ്റീവ് മൈനിംഗ് എന്ന് വിളിക്കുന്നു. യാഥാർത്ഥ്യബോധമുള്ള ചിത്രങ്ങൾ സൃഷ്ടിക്കുന്നതിന് സമാനമായ പരിഹാരങ്ങൾ ശാസ്ത്ര സമൂഹത്തിൽ വ്യാപകമായിത്തീർന്നിരിക്കുന്നു എന്നതും ശ്രദ്ധിക്കേണ്ടതാണ്; ഈ തരം മോഡലുകളെ ജനറേറ്റീവ് അഡ്‌വേഴ്സേറിയൽ നെറ്റ്‌വർക്കുകൾ എന്ന് വിളിക്കുന്നു.

വ്യത്യസ്ത ലക്ഷ്യങ്ങൾ

മൈക്രോസോഫ്റ്റ് റിസർച്ചിലെ ഗവേഷകർ ഡോക്യുമെൻ്റ് ക്ലിക്കുകൾ നല്ല ഉദാഹരണങ്ങളായി ഉപയോഗിച്ചു. എന്നിരുന്നാലും, ഇതിനകം സൂചിപ്പിച്ചതുപോലെ, അഭ്യർത്ഥനയിലേക്കുള്ള തലക്കെട്ടിൻ്റെ സെമാൻ്റിക് കത്തിടപാടുകളെക്കുറിച്ചുള്ള വിശ്വസനീയമല്ലാത്ത സിഗ്നലാണിത്. അവസാനം, ഞങ്ങളുടെ ചുമതല തിരയൽ ഫലങ്ങളിൽ ഏറ്റവും കൂടുതൽ സന്ദർശിച്ച സൈറ്റുകൾ റാങ്ക് ചെയ്യുകയല്ല, മറിച്ച് ശരിക്കും കണ്ടെത്തുക എന്നതാണ് ഉപകാരപ്രദമായ വിവരം. അതിനാൽ, പരിശീലന ലക്ഷ്യമായി ഉപയോക്തൃ പെരുമാറ്റത്തിൻ്റെ മറ്റ് സവിശേഷതകൾ ഉപയോഗിക്കാൻ ഞങ്ങൾ ശ്രമിച്ചു. ഉദാഹരണത്തിന്, ഒരു ഉപയോക്താവ് സൈറ്റിൽ തുടരുമോ അല്ലെങ്കിൽ പോകുമോ എന്ന് മോഡലുകളിലൊന്ന് പ്രവചിച്ചു. അവൻ സൈറ്റിൽ എത്രനാൾ തുടരും എന്നതാണ് മറ്റൊന്ന്. ഇത് മാറുന്നതുപോലെ, അത്തരമൊരു ടാർഗെറ്റ് മെട്രിക് നിങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്താൽ നിങ്ങൾക്ക് ഫലങ്ങൾ ഗണ്യമായി മെച്ചപ്പെടുത്താൻ കഴിയും, ഇത് ഉപയോക്താവിന് ആവശ്യമുള്ളത് കണ്ടെത്തിയെന്ന് സൂചിപ്പിക്കുന്നു.

ലാഭം

ശരി, ഇത് പ്രായോഗികമായി നമുക്ക് എന്താണ് നൽകുന്നത്? നമ്മുടെ ന്യൂറൽ മോഡലിൻ്റെ സ്വഭാവവും അന്വേഷണ പദങ്ങളും വാചകവും തമ്മിലുള്ള കത്തിടപാടുകളെ അടിസ്ഥാനമാക്കിയുള്ള ലളിതമായ ഒരു ടെക്സ്റ്റ് ഫാക്ടറും താരതമ്യം ചെയ്യാം - BM25. റാങ്കിംഗ് ലളിതമായിരുന്ന ആ കാലങ്ങളിൽ നിന്നാണ് ഇത് ഞങ്ങൾക്ക് വന്നത്, ഇപ്പോൾ ഇത് ഒരു അടിസ്ഥാന തലമായി ഉപയോഗിക്കുന്നത് സൗകര്യപ്രദമാണ്.

ഒരു ഉദാഹരണമായി [കെൽസിൻ്റെ പുസ്തകം] ചോദ്യം എടുത്ത് വ്യത്യസ്ത തലക്കെട്ടുകളിൽ ഘടകങ്ങൾ എന്ത് പ്രാധാന്യമാണ് എടുക്കുന്നതെന്ന് നോക്കാം. ഇത് നിയന്ത്രിക്കുന്നതിന്, ഹെഡറുകളുടെ പട്ടികയിലേക്ക് വ്യക്തമായി അപ്രസക്തമായ ഒരു ഫലം ചേർക്കാം.

Yandex-ലെ എല്ലാ ഘടകങ്ങളും ഇടവേളയിലേക്ക് നോർമലൈസ് ചെയ്യുന്നു. അന്വേഷണ പദങ്ങൾ ഉൾക്കൊള്ളുന്ന ശീർഷകങ്ങൾക്കായി BM25 ന് ഉയർന്ന മൂല്യങ്ങൾ ഉണ്ടെന്ന് പ്രതീക്ഷിക്കുന്നു. കൂടാതെ ഈ ഘടകത്തിന് ഇല്ലാത്ത തലക്കെട്ടുകളിൽ പൂജ്യം മൂല്യം ലഭിക്കുമെന്നത് തികച്ചും പ്രവചിക്കാവുന്നതാണ് സാധാരണ വാക്കുകൾഒരു അഭ്യർത്ഥനയോടെ. ന്യൂറൽ മോഡൽ എങ്ങനെ പ്രവർത്തിക്കുന്നുവെന്ന് ഇപ്പോൾ ശ്രദ്ധിക്കുക. പ്രസക്തമായ വിക്കിപീഡിയ പേജിൻ്റെ റഷ്യൻ തലക്കെട്ടും ഇംഗ്ലീഷിലുള്ള ഒരു ലേഖനത്തിൻ്റെ തലക്കെട്ടും തമ്മിലുള്ള അഭ്യർത്ഥന തമ്മിലുള്ള ബന്ധം ഇത് ഒരുപോലെ നന്നായി തിരിച്ചറിയുന്നു! കൂടാതെ, അന്വേഷണവും ശീർഷകവും തമ്മിലുള്ള ബന്ധം മോഡൽ "കണ്ടതായി" തോന്നുന്നു, അതിൽ കെൽസ് പുസ്തകത്തെ പരാമർശിക്കുന്നില്ല, എന്നാൽ സമാനമായ ഒരു വാചകം ("ഐറിഷ് സുവിശേഷങ്ങൾ") അടങ്ങിയിരിക്കുന്നു. അപ്രസക്തമായ തലക്കെട്ടിനുള്ള മോഡലിൻ്റെ മൂല്യം വളരെ കുറവാണ്.

അഭ്യർത്ഥനയുടെ അർത്ഥം മാറ്റാതെ തന്നെ പരിഷ്കരിച്ചാൽ നമ്മുടെ ഘടകങ്ങൾ എങ്ങനെ പ്രവർത്തിക്കുമെന്ന് നോക്കാം: [കെൽസിൻ്റെ സുവിശേഷം].

BM25-ന്, അന്വേഷണത്തിൻ്റെ പരിഷ്കരണം ഒരു യഥാർത്ഥ ദുരന്തമായി മാറി - പ്രസക്തമായ തലക്കെട്ടുകളിൽ ഘടകം പൂജ്യമായി. ഞങ്ങളുടെ മോഡൽ പരിഷ്കരണത്തിനെതിരായ മികച്ച പ്രതിരോധം പ്രകടമാക്കുന്നു: പ്രസക്തമായ തലക്കെട്ടുകൾക്ക് ഇപ്പോഴും ഉയർന്ന ഫാക്ടർ മൂല്യമുണ്ട്, അതേസമയം അപ്രസക്തമായ തലക്കെട്ടിന് ഇപ്പോഴും കുറഞ്ഞ ഫാക്ടർ മൂല്യമുണ്ട്. ഒരു വാചകത്തിൻ്റെ സെമാൻ്റിക്‌സ് "മനസ്സിലാക്കാൻ" കഴിയുമെന്ന് അവകാശപ്പെടുന്ന ഒരു കാര്യത്തിൽ നിന്ന് ഞങ്ങൾ പ്രതീക്ഷിച്ച പെരുമാറ്റം ഇതാണ് എന്ന് തോന്നുന്നു.

മറ്റൊരു ഉദാഹരണം. അഭ്യർത്ഥന [ഒരു ചിത്രശലഭത്തെ തകർത്ത കഥ].

നമുക്ക് കാണാനാകുന്നതുപോലെ, ചോദ്യത്തിനൊപ്പം പൊതുവായ പദങ്ങളുടെ പൂർണ്ണമായ അഭാവം ഉണ്ടായിരുന്നിട്ടും, ശരിയായ ഉത്തരം ഉപയോഗിച്ച് തലക്കെട്ട് ഉയർന്ന രീതിയിൽ വിലയിരുത്താൻ ന്യൂറൽ മോഡലിന് കഴിഞ്ഞു. കൂടാതെ, ചോദ്യത്തിന് ഉത്തരം നൽകാത്ത തലക്കെട്ടുകൾ, എന്നാൽ ഇപ്പോഴും അർത്ഥവുമായി ബന്ധപ്പെട്ടിരിക്കുന്നതിനാൽ, ഉയർന്ന ഫാക്ടർ മൂല്യം ലഭിക്കുന്നത് വ്യക്തമായി കാണാം. ഞങ്ങളുടെ മോഡൽ ബ്രാഡ്‌ബറിയുടെ കഥ "വായിക്കുകയും" അഭ്യർത്ഥനയിൽ അദ്ദേഹം സംസാരിക്കുന്നത് ഇതാണ് എന്ന് "അറിയുകയും" ചെയ്യുന്നതുപോലെ!

അടുത്തത് എന്താണ്?

ദീർഘവും രസകരവുമായ ഒരു യാത്രയുടെ തുടക്കത്തിലാണ് ഞങ്ങൾ. പ്രത്യക്ഷത്തിൽ, ന്യൂറൽ നെറ്റ്‌വർക്കുകൾക്ക് റാങ്കിംഗ് മെച്ചപ്പെടുത്തുന്നതിന് വലിയ സാധ്യതകളുണ്ട്. സജീവമായ വികസനം ആവശ്യമുള്ള പ്രധാന ദിശകൾ ഇതിനകം വ്യക്തമാണ്.

ഉദാഹരണത്തിന്, ശീർഷകത്തിൽ പ്രമാണത്തെക്കുറിച്ചുള്ള അപൂർണ്ണമായ വിവരങ്ങൾ അടങ്ങിയിരിക്കുന്നു എന്നത് വ്യക്തമാണ്, അതിനെ അടിസ്ഥാനമാക്കി ഒരു മോഡൽ എങ്ങനെ നിർമ്മിക്കാമെന്ന് പഠിക്കുന്നത് നന്നായിരിക്കും. മുഴുവൻ വാചകം(അത് മാറിയതുപോലെ, ഇത് തികച്ചും നിസ്സാരമായ ഒരു ജോലിയല്ല). കൂടാതെ, DSSM-നേക്കാൾ സങ്കീർണ്ണമായ വാസ്തുവിദ്യ ഉള്ള മോഡലുകൾ നമുക്ക് സങ്കൽപ്പിക്കാൻ കഴിയും - ഈ രീതിയിൽ നമുക്ക് ചില ഡിസൈനുകൾ നന്നായി കൈകാര്യം ചെയ്യാൻ കഴിയുമെന്ന് വിശ്വസിക്കാൻ കാരണമുണ്ട്. സ്വാഭാവിക ഭാഷകൾ. ഒരു മനുഷ്യനുമായി താരതമ്യപ്പെടുത്താവുന്ന തലത്തിൽ അന്വേഷണങ്ങളും രേഖകളും തമ്മിലുള്ള സെമാൻ്റിക് കത്തിടപാടുകൾ "മനസ്സിലാക്കാൻ" കഴിയുന്ന മാതൃകകൾ സൃഷ്ടിക്കുന്നതാണ് ഞങ്ങളുടെ ദീർഘകാല ലക്ഷ്യം. ഈ ലക്ഷ്യത്തിലേക്കുള്ള വഴിയിൽ നിരവധി ബുദ്ധിമുട്ടുകൾ ഉണ്ടാകും - അതിലൂടെ കടന്നുപോകുന്നത് കൂടുതൽ രസകരമായിരിക്കും. ഈ മേഖലയിലെ ഞങ്ങളുടെ പ്രവർത്തനത്തെക്കുറിച്ച് സംസാരിക്കാമെന്ന് ഞങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നു. അടുത്ത പ്രസിദ്ധീകരണങ്ങൾ പിന്തുടരുക.