നിർദ്ദേശങ്ങൾ sse sse2 sse3 sse4. പ്രോസസർ SSE2-നെ പിന്തുണയ്ക്കുന്നില്ല - എന്തുചെയ്യണം. SSE2 എങ്ങനെ പ്രവർത്തനക്ഷമമാക്കാം

ആമുഖം അടുത്തിടെ നടന്ന ഇന്റൽ ഡെവലപ്പേഴ്‌സ് ഫോറത്തിൽ പ്രെസ്‌കോട്ട് ഔദ്യോഗികമായി അവതരിപ്പിച്ചു - പുതിയ പ്രൊസസർ ഇന്റലിൽ നിന്ന്, പേഴ്സണൽ കമ്പ്യൂട്ടറുകളിൽ ഉപയോഗിക്കാൻ ഉദ്ദേശിച്ചുള്ളതാണ്. ഇത് ഒരു അടുത്ത തലമുറ പ്രോസസറായി അവതരിപ്പിക്കുന്നു - ഒരു പുതിയ തലമുറ പ്രോസസർ. 90 നാനോമീറ്റർ സാങ്കേതികവിദ്യ ഉപയോഗിച്ചാണ് പ്രോസസർ നിർമ്മിച്ചിരിക്കുന്നത്, ഇത് 4-5 GHz ക്ലോക്ക് ഫ്രീക്വൻസികൾ നേടാൻ അനുവദിക്കും. രണ്ടാമത്തെ ലെവൽ കാഷെയുടെ വലുപ്പം 1MB ആയി വർദ്ധിപ്പിച്ചു - പ്രത്യക്ഷത്തിൽ, പുതിയ സാങ്കേതിക പ്രക്രിയയ്ക്ക് നന്ദി, ചെലവ് വീക്ഷണകോണിൽ നിന്ന് അത്തരമൊരു വർദ്ധനവ് ന്യായീകരിക്കപ്പെട്ടു. ആദ്യ ലെവൽ കാഷെയുടെ വലുപ്പവും ഇരട്ടിയായി, മെച്ചപ്പെട്ട സാങ്കേതികവിദ്യയുടെ നല്ല സ്വാധീനം ഇവിടെ ശ്രദ്ധേയമാണ്. ആവൃത്തി സിസ്റ്റം ബസ് 800MHz ആയി വർദ്ധിച്ചു. പൊതുവേ, എല്ലാ പ്രോസസർ ബ്ലോക്കുകളും കടന്നുപോയി ചെറിയ മെച്ചപ്പെടുത്തലുകൾ. എന്നാൽ ഈ മിനുക്കിയ പെന്റിയം 4 സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് പുതിയതായി എന്താണ് കൊണ്ടുവരുന്നത്? വർദ്ധിച്ച കാഷെ തീർച്ചയായും നല്ലതാണ്; മെമ്മറിയിൽ നിന്ന് ഡാറ്റ വായിക്കുന്നതിനും എഴുതുന്നതിനുമുള്ള വേഗതയെക്കുറിച്ച് നിങ്ങൾ കുറച്ചുകൂടി ചിന്തിക്കേണ്ടതുണ്ട്, ഇത് പലപ്പോഴും ഗുരുതരമായ പ്രകടന പരിമിതപ്പെടുത്തുന്ന ഘടകമാണ്. പക്ഷേ, എല്ലാം ഒരേപോലെ, ഇത് എല്ലാ പ്രശ്നങ്ങളും പരിഹരിക്കുന്നില്ല; ഡാറ്റയുടെ അളവ് വലുതായിരിക്കുമ്പോൾ, കാഷെ രണ്ട് മടങ്ങ് വർദ്ധിപ്പിക്കുന്നത് പ്രധാനമല്ല.
വർദ്ധിച്ച സിസ്റ്റം ബസ് ഫ്രീക്വൻസി ഇന്റലിൽ നിന്നുള്ള പുതിയ പ്രോസസർ തികച്ചും സന്തുലിതമാകുമെന്നും മൊത്തത്തിലുള്ള സിസ്റ്റം പ്രകടനത്തെ മന്ദഗതിയിലാക്കുന്ന വ്യക്തമായ തടസ്സങ്ങൾ ഉണ്ടാകില്ലെന്നും ഉറപ്പ് നൽകുന്നു. അത് പോലെ, അയ്യോ, ചില മുൻകാല പ്രോസസ്സറുകൾ ഉപയോഗിച്ച്, ആവൃത്തി വർദ്ധിപ്പിക്കുമ്പോൾ വേഗതയിൽ ആനുപാതികമായ വർദ്ധനവ് നൽകിയില്ല.
എന്നിരുന്നാലും, ഒരു പുതിയ സെവൻ-ലെയർ പ്രോസസർ ഡിസൈൻ പോലുള്ള ഒരു കാര്യം സോഫ്റ്റ്വെയർ ഡെവലപ്പർമാർക്ക് താൽപ്പര്യമുള്ളതല്ല. പുതിയ പ്രോസസർ കമാൻഡുകൾ എന്തൊക്കെയാണ് ലഭ്യമായത്, പരമാവധി പ്രകടനം നേടുന്നതിന് എന്ത് ഒപ്റ്റിമൈസേഷൻ ടെക്നിക്കുകൾ പ്രയോഗിക്കേണ്ടതുണ്ട്, അല്ലെങ്കിൽ കുറഞ്ഞത് പഴയതിനേക്കാൾ വേഗത കുറവല്ലെന്ന് ഉറപ്പാക്കുക എന്നത് അവർക്ക് വളരെ പ്രധാനമാണ്. ഇന്റലിന്റെ മുൻ പ്രൊസസറായ പെന്റിയം 4-ന് പ്രകടനം വർദ്ധിപ്പിക്കുന്നതിന് കാര്യമായ സോഫ്റ്റ്‌വെയർ ഒപ്റ്റിമൈസേഷൻ ആവശ്യമായിരുന്നു. പെന്റിയം 4 പല തരത്തിലുള്ള ടാസ്ക്കുകളിൽ നഷ്ടപ്പെട്ടു പെന്റിയം IIIതുല്യ ആവൃത്തി മാത്രമല്ല, രണ്ട് മടങ്ങ് വരെ ഗണ്യമായി കുറയുന്നു. എന്തുകൊണ്ടാണ് ഇത് സംഭവിച്ചതെന്ന് ഞങ്ങൾ ചുവടെ വിശദമായി പരിശോധിക്കും; ആവൃത്തി വർദ്ധിപ്പിക്കുന്നതിന് കാമ്പിനെ ഗണ്യമായി മാറ്റേണ്ടതിന്റെ ആവശ്യകതയാണ് ആഗോള കാരണം എന്ന് നമുക്ക് ഉടനടി ശ്രദ്ധിക്കാൻ കഴിയും.
പൊതുവേ, പ്രോസസർ കോർ അടിസ്ഥാനപരമായ മാറ്റങ്ങൾക്ക് വിധേയമായിട്ടില്ല. പെന്റിയം 4 ഇഷ്ടപ്പെടാത്തതെല്ലാം - ഒന്നാമതായി, ശാഖകൾ - 90 നാനോമീറ്റർ സാങ്കേതിക പ്രക്രിയയിലെ പരിഷ്കാരങ്ങളാൽ പാരമ്പര്യമായി ലഭിച്ചു. അത് അൽപ്പം കൂടി തീവ്രമായി. ആവൃത്തി വർദ്ധിപ്പിക്കുന്നതിന്, പ്രെസ്‌കോട്ടിന്റെ പൈപ്പ്ലൈനിന്റെ ആഴം വർദ്ധിപ്പിച്ചു, അതിനാൽ പൈപ്പ്ലൈൻ റീസെറ്റിലേക്ക് നയിക്കുന്ന സോപാധിക ശാഖകളുടെ തെറ്റായി പ്രവചിക്കുമ്പോൾ ഒരാൾക്ക് വലിയ നഷ്ടം പ്രതീക്ഷിക്കാം.
എന്നാൽ ഒരു നല്ല വാർത്ത കൂടിയുണ്ട്, പ്രധാന കാര്യം സെറ്റിന്റെ വിപുലീകരണമാണ് പ്രോസസ്സർ നിർദ്ദേശങ്ങൾ. MMX, SSE, SSE2 എന്നിവയുടെ ആമുഖം സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് ആഹ്ലാദകരമായിരുന്നു, കാരണം അത് അവരോട് ചോദിച്ചു. അധിക ജോലിപ്രോഗ്രാം ഒപ്റ്റിമൈസേഷനിൽ. അല്ലെങ്കിൽ, പല പ്രോഗ്രാമുകളും വേഗത്തിൽ നടപ്പിലാക്കാൻ വിസമ്മതിച്ചു. എന്നിരുന്നാലും, പ്രെസ്‌കോട്ടിൽ പ്രത്യക്ഷപ്പെട്ട 13 പുതിയ നിർദ്ദേശങ്ങൾ ഡവലപ്പർമാരുടെ ഭാരം ഗണ്യമായി ലഘൂകരിക്കുന്നു.

MMX, 3DNow! SSE, SSE2 - പ്രവർത്തനത്തിന്റെയും ഒപ്റ്റിമൈസേഷന്റെയും തത്വം

പുതിയ നിർദ്ദേശങ്ങൾ നോക്കുന്നതിന് മുമ്പ്, നമുക്ക് പൂർത്തിയാക്കാം ചെറിയ അവലോകനംപ്രൊസസർ ഇൻസ്ട്രക്ഷൻ സെറ്റിന്റെ മുൻ SIMD എക്സ്റ്റൻഷനുകൾ, ഒന്നാമതായി, ഒരു പ്രത്യേക സെറ്റ് നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുമ്പോൾ സാധ്യമായ പ്രകടന നേട്ടം നമുക്ക് വിലയിരുത്താം. വിഷയം പരിചയമുള്ളവർ കാണാതെ പോയേക്കാം ഈ വിഭാഗംപുതിയ പ്രെസ്കോട്ട് കമാൻഡുകളുടെ വിവരണത്തിലേക്ക് നേരിട്ട് പോകുക.
ഇപ്പോൾ, ചിലപ്പോഴൊക്കെ ടെസ്റ്റ് അവലോകനങ്ങൾ, തന്നിരിക്കുന്ന പ്രോഗ്രാം SSE-യ്‌ക്ക് നന്നായി ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്നുവെന്ന് പറയുന്നു, ഇതിന് നന്ദി, അത്തരമൊരു പ്രോസസർ നല്ല ഫലങ്ങൾ കാണിക്കുന്നു. എന്താണ് SSE? ഈ നിർദ്ദേശങ്ങളുടെ കൂട്ടത്തിന്റെ സ്വഭാവത്തെക്കുറിച്ച് പേര് തന്നെ സംസാരിക്കുന്നു. SSE - സ്ട്രീമിംഗ് SIMD വിപുലീകരണം. സ്ട്രീമിംഗ് SIMD വിപുലീകരണം. എന്താണ് SIMD? SIMD - സിംഗിൾ ഇൻസ്ട്രക്ഷൻ മൾട്ടിപ്പിൾ ഡാറ്റ. ഒരു നിർദ്ദേശം - നിരവധി ഡാറ്റ ഓപ്പറണ്ടുകൾ.
പ്രോസസ്സറുകൾ സാധാരണയായി എങ്ങനെ പ്രവർത്തിക്കുന്നു, ആദ്യത്തെ പെന്റിയമായ 486 പോലെയുള്ള പ്രോസസ്സറുകൾ എങ്ങനെ പ്രവർത്തിച്ചു? വെറും. നിരവധി രജിസ്റ്റർ സെല്ലുകളുണ്ട്, അവയിൽ നമ്പറുകൾ സംഭരിച്ചിരിക്കുന്നു, ഒരു സെല്ലിൽ ഒരു നമ്പർ അടങ്ങിയിരിക്കുന്നു, പ്രോസസ്സർ കമാൻഡുകൾ നടപ്പിലാക്കുന്നു: രണ്ട് രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങൾ ചേർക്കുക, ഒരു പുതിയ നമ്പർ ലഭിച്ചു, ഈ നമ്പർ മൂന്നാമത്തെ രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങളുമായി താരതമ്യം ചെയ്യുക, കൂടുതലാണെങ്കിൽ, നിർദ്ദേശങ്ങളുടെ പട്ടികയിലൂടെ നീങ്ങുക. എന്നിരുന്നാലും, ഈ സമീപനത്തിലൂടെ, ഉൽപാദനക്ഷമത വർദ്ധിപ്പിക്കുന്നതിൽ ക്രമേണ ബുദ്ധിമുട്ടുകൾ ഉണ്ടാകാൻ തുടങ്ങി. മുൻ നിർദ്ദേശങ്ങളാൽ ആവശ്യമായ ഓപ്പറണ്ടുകൾ കണക്കാക്കുന്നതിന് മുമ്പ് പ്രോസസറിന് അടുത്ത നിർദ്ദേശം നടപ്പിലാക്കാൻ കഴിയില്ല എന്നതാണ് വസ്തുത. നിങ്ങൾക്ക് പ്രോസസറിൽ നൂറ് ഗുണന ബ്ലോക്കുകൾ പോലും സ്ഥാപിക്കാൻ കഴിയും, അത് വേഗത്തിൽ കണക്കാക്കില്ല, ഒരു ബ്ലോക്ക് മാത്രം എല്ലാ സമയത്തും പ്രവർത്തിക്കും, മറ്റുള്ളവർ അതിന്റെ കണക്കുകൂട്ടലുകളുടെ ഫലങ്ങൾക്കായി കാത്തിരിക്കും. അതിനാൽ, ഒരു ജോടി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചല്ല, ഒരേസമയം നിരവധി ജോഡികൾ ഉപയോഗിച്ച് പ്രവർത്തനങ്ങൾ നടത്തുക എന്ന ആശയം അവർ കൊണ്ടുവന്നു. പേഴ്സണൽ കമ്പ്യൂട്ടറുകളിലെ ആദ്യത്തെ ആധുനിക SIMD എക്സ്റ്റൻഷന്റെ ഉദാഹരണം ഉപയോഗിക്കുന്നത് എങ്ങനെയായിരിക്കും - MMX.

ഓപ്പറേഷൻഭാഗം 3ഭാഗം 2ഭാഗം 1ഭാഗം 0രജിസ്റ്റർ ചെയ്യുക
70 50 30 10 1 രജിസ്റ്റർ
+
80 60 40 20 2 രജിസ്റ്റർ
=
150 110 70 30 ഫലമായി

അതേ സമയം, ഒരു ജോടി സംഖ്യകളല്ല, നാല് ചേർക്കുന്നു. നിങ്ങൾക്ക് കുറയ്ക്കാനും ഗുണിക്കാനും കഴിയും. ഒരേസമയം നിരവധി ജോഡി ഓപ്പറണ്ടുകൾ, അവ ഓരോന്നും ഒരു രജിസ്റ്ററിലാണ്. ഈ സാങ്കേതികവിദ്യയുടെ ആമുഖം, ക്ലോക്ക് ഫ്രീക്വൻസി വർദ്ധിപ്പിക്കാതെ, കമ്പ്യൂട്ടിംഗ് മൊഡ്യൂളുകളുടെ എണ്ണം വർദ്ധിപ്പിച്ച് പ്രോസസ്സർ പ്രകടനം എളുപ്പത്തിൽ വർദ്ധിപ്പിക്കുന്നത് സാധ്യമാക്കുന്നു. കൂടുതൽ കൃത്യമായി പറഞ്ഞാൽ, മൊഡ്യൂളുകളുടെ എണ്ണമല്ല വർദ്ധിക്കുന്നത്, മറിച്ച് ഒരേസമയം നിരവധി ജോഡി ഓപ്പറണ്ടുകളുമായി പ്രവർത്തിക്കാനുള്ള കഴിവ് അവർ നേടുന്നു. എന്നാൽ പ്രോഗ്രാമിംഗിന് ഇത് പ്രധാനമല്ല.
എന്നിരുന്നാലും, SIMD സാങ്കേതികവിദ്യ ഉപയോഗിക്കുന്നതിന്, പ്രോഗ്രാം കോഡിന്റെ തലത്തിൽ തന്നെ പിന്തുണ ആവശ്യമാണ്. പ്രോസസ്സറിന് തന്നെ ഒരു രജിസ്റ്ററിൽ സമാനമായ പ്രവർത്തനങ്ങളുള്ള നിരവധി ഡാറ്റ സ്ഥാപിക്കാൻ കഴിയില്ല. പ്രോഗ്രാമർ, അവർ പറയുന്നതുപോലെ, ഒരു പ്രോഗ്രാം എഴുതുമ്പോൾ സ്വമേധയാ, പ്രോസസ്സർ മെമ്മറിയിൽ നിന്ന് അത്തരം ഡാറ്റ MMX രജിസ്റ്ററുകളിലേക്ക് ലോഡ് ചെയ്യുകയും അവ ഉപയോഗിച്ച് അത്തരം SIMD പ്രവർത്തനങ്ങൾ നടത്തുകയും ചെയ്യുന്നുവെന്ന് വ്യക്തമായി സൂചിപ്പിക്കണം. ഇത് ചെയ്യുന്നതിന്, അവൻ തന്നെ മെമ്മറിയിൽ ഡാറ്റ ശരിയായി തയ്യാറാക്കണം, അങ്ങനെ അത് രജിസ്റ്ററുകളിലേക്ക് നന്നായി യോജിക്കുന്നു. ചില സന്ദർഭങ്ങളിൽ അത് സാധ്യമാണ് കാര്യക്ഷമമായ ഉപയോഗംവളരെ കാര്യക്ഷമമായ SIMD നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്ന കോഡ് സ്വയമേവ സൃഷ്ടിക്കുന്ന പ്രത്യേക SIMD-ഒപ്റ്റിമൈസിംഗ് കംപൈലറുകൾ. പക്ഷേ, ഒരു ചട്ടം പോലെ, ഫലപ്രദമായ സമാഹാരത്തിനായി, ചില നിയമങ്ങൾക്ക് അനുസൃതമായി പ്രോഗ്രാം കോഡ് ഇതിനകം എഴുതിയിരിക്കണം.
എന്നാൽ എല്ലാ അൽഗോരിതങ്ങളും തത്വത്തിൽ, SIMD വിപുലീകരണങ്ങളുമായി നന്നായി പൊരുത്തപ്പെടുത്താൻ കഴിയില്ല. ഇനിപ്പറയുന്ന പദപ്രയോഗം കണക്കാക്കാൻ ശ്രമിക്കുക - (a+b*c)*d. മൂന്നിൽ താഴെ ടീമുകൾക്കൊപ്പം നിങ്ങൾക്ക് പോകാൻ കഴിയില്ല. ഫോമിന്റെ (x,y,z,w) നാല് വെക്റ്ററുകളുടെ ആകെത്തുക കണ്ടെത്താൻ ഇതേ മൂന്ന് കമാൻഡുകൾ ഉപയോഗിക്കാം. (x1+x2+x3+x4, y1+y1+y3+y4, z1+z2+z3+z4, w1+w2+w3+w4). SIMD ഓപ്പറേഷനുകൾ സാധാരണ പ്രവർത്തനങ്ങളുടെ ഏതാണ്ട് അതേ വേഗതയിൽ നടക്കുന്നുണ്ടെങ്കിൽ, പ്രോസസറിന് ഒന്നും ചെയ്യാനില്ലാത്തതിനാൽ യാഥാർത്ഥ്യമാണ്, SIMD-നായി നന്നായി ഒപ്റ്റിമൈസ് ചെയ്ത പ്രോഗ്രാമുകൾ എക്സിക്യൂട്ട് ചെയ്യുമ്പോൾ നിങ്ങൾക്ക് വേഗതയിൽ ഒന്നിലധികം വർദ്ധനവ് കാണാൻ കഴിയും.
ഒരു ഡവലപ്പറുടെ വീക്ഷണകോണിൽ നിന്ന്, നിരവധി തരം SIMD ഒപ്റ്റിമൈസേഷൻ ഉണ്ട്. നേരിട്ടുള്ള മാനുവൽ കോഡ് ഒപ്റ്റിമൈസേഷൻ, വളരെ കാര്യക്ഷമവും തികച്ചും അധ്വാനവും. വ്യത്യസ്ത അളവിലുള്ള വിജയത്തോടെ പ്രവർത്തിക്കുന്ന സാധാരണ കോഡ് സൃഷ്ടിക്കുന്നതിന് പകരം കംപൈലറിന്റെ "പ്രേരണ". സാധാരണ പൊതു പ്രവർത്തനങ്ങൾ നടത്തുന്ന പ്രോസസ്സർ നിർമ്മാതാക്കൾ നൽകുന്ന ഫംഗ്ഷനുകളുടെ പ്രീ-ഒപ്റ്റിമൈസ് ചെയ്ത ലൈബ്രറികളുടെ ഉപയോഗം. അവസാന ഓപ്ഷൻ ഏറ്റവും മികച്ചതാണെന്ന് വ്യക്തമാണ്.
SIMD വിപുലീകരണങ്ങൾ എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, 3DNow-ൽ നിന്ന് MMX എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു! കൂടാതെ എസ്എസ്ഇ മുതലായവ? ഒന്നാമതായി, പിന്തുണയ്ക്കുന്ന ഡാറ്റയുടെ തരങ്ങൾ, രജിസ്റ്ററുകളുടെ വലുപ്പം, എണ്ണം, സാധ്യമായ പ്രവർത്തനങ്ങളുടെ സെറ്റുകൾ എന്നിവയിൽ അവ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. ഡാറ്റ തരമാണ് ഏറ്റവും കൂടുതൽ പ്രധാന വ്യത്യാസം, ബാക്കിയുള്ള പരാമീറ്ററുകൾ വ്യത്യസ്ത വിപുലീകരണങ്ങൾക്ക് കൂടുതലോ കുറവോ സമാനമാണ്.
പ്രോസസർ നിരവധി ഫോർമാറ്റുകളിൽ നമ്പറുകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നു, പ്രാഥമികമായി ഡാറ്റ ഫ്ലോട്ടിംഗ് ഡെസിമൽ പോയിന്റ് നമ്പറുകളും പൂർണ്ണസംഖ്യകളും ആയി തിരിച്ചിരിക്കുന്നു. വിവിധ ജോലികൾവ്യത്യസ്ത ഡാറ്റ അവതരണം ആവശ്യമാണ്. രണ്ടാമത്തെ പാരാമീറ്റർ ബൈറ്റുകളിലെ വലുപ്പമാണ്. ഫ്ലോട്ടിംഗ്-പോയിന്റ് ഡാറ്റ ചില കൃത്യതയോടെ ഏകപക്ഷീയമായ യഥാർത്ഥ സംഖ്യകളെ ഏകദേശമാക്കുന്നു; ഓരോ നമ്പറിനും കൂടുതൽ ബൈറ്റുകൾ അനുവദിച്ചാൽ കൃത്യത വർദ്ധിക്കും. ഒരു പൂർണ്ണസംഖ്യയിലേക്ക് കൂടുതൽ ബൈറ്റുകൾ അനുവദിച്ചാൽ, അത് ഉൾപ്പെടുന്ന മൂല്യങ്ങളുടെ വലിയ ശ്രേണി.

MMX

എംഎംഎക്സ് എക്സ്റ്റൻഷൻ വളരെക്കാലം മുമ്പ് പ്രത്യക്ഷപ്പെട്ടു, പേഴ്സണൽ കമ്പ്യൂട്ടറുകൾക്ക് സ്റ്റാൻഡേർഡ് ആയി. MMX എന്നാൽ മൾട്ടി മീഡിയ എക്സ്റ്റൻഷനുകൾ. മൾട്ടിമീഡിയ ഡാറ്റ, ഇമേജ്, ശബ്ദം എന്നിവയിൽ പ്രവർത്തിക്കാൻ രൂപകൽപ്പന ചെയ്ത ഒരു വിപുലീകരണം.
MMX സാങ്കേതികവിദ്യയുള്ള പ്രോസസ്സറുകൾക്ക് 8 MMX രജിസ്റ്ററുകൾ ഉണ്ട്, ഓരോന്നിനും 64 ബിറ്റുകൾ = 8 ബൈറ്റുകൾ വലിപ്പമുണ്ട്. MMX പൂർണ്ണസംഖ്യകളിൽ മാത്രമേ പ്രവർത്തിക്കൂ; 1, 2, 4 അല്ലെങ്കിൽ 8 ബൈറ്റുകളുടെ ഡാറ്റ വലുപ്പങ്ങൾ പിന്തുണയ്ക്കുന്നു. അതായത്, ഒരു MMX രജിസ്റ്ററിൽ 8, 4, 2 അല്ലെങ്കിൽ 1 ഓപ്പറാൻറ് അടങ്ങിയിരിക്കാം.


തുടങ്ങിയവ. MMX രജിസ്റ്ററുകളിൽ അടങ്ങിയിരിക്കുന്ന ഡാറ്റ കൂട്ടിച്ചേർക്കാം, ഗുണിക്കുക, ഘടകം പ്രകാരം കുറയ്ക്കുക, മൾട്ടിമീഡിയ ആപ്ലിക്കേഷനുകൾക്ക് ആവശ്യമായ വിവിധ നിർദ്ദിഷ്ട പ്രവർത്തനങ്ങൾ നടത്താം, ഓവർഫ്ലോ ഇല്ലാതെ കൂട്ടിച്ചേർക്കൽ, ഗണിത ശരാശരി കണക്കാക്കൽ, പ്രകടനം എന്നിവ. ലോജിക്കൽ പ്രവർത്തനങ്ങൾബിറ്റുകൾ ഉപയോഗിച്ച്. ബിറ്റ്വൈസ്, അല്ലെങ്കിൽ, xor. എന്നിരുന്നാലും, വിഭജിക്കുന്നത് അസാധ്യമാണ്, ഇപ്പോഴും നിയന്ത്രണങ്ങളുണ്ട്. എന്നാൽ പല പ്രവർത്തനങ്ങളും വേഗത്തിലുള്ള ക്രമത്തിൽ ചെയ്യാൻ കഴിയും, അതിലും കൂടുതൽ. എന്നിരുന്നാലും, പ്രത്യേകിച്ച് MMX-ന്റെ ഉപയോഗത്തിന് പ്രത്യേക മാനുവൽ ഒപ്റ്റിമൈസേഷൻ ആവശ്യമാണ്; ഒരു കമ്പൈലറും ഇവിടെ കാര്യമായി സഹായിക്കില്ല. ഉദാഹരണത്തിന്, MMX-ന്, വിവിധ ഓഡിയോ ഫയൽ കോഡെക്കുകൾ ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്നു, ഇവയുടെ അൽഗോരിതങ്ങൾ MMX-നൊപ്പം നന്നായി പ്രവർത്തിക്കുന്നു. മാത്രമല്ല, മുഴുവൻ പ്രോഗ്രാമും അല്ല, പ്രധാന ജോലി ചെയ്യുന്ന ഒരു ചെറിയ ഭാഗം, ഈ സാഹചര്യം ഒപ്റ്റിമൈസേഷൻ ലളിതമാക്കുന്നു.

SSE2 - പൂർണ്ണസംഖ്യ പ്രവർത്തനങ്ങൾ

പെന്റിയം 4-നൊപ്പം താരതമ്യേന അടുത്തിടെ വന്ന ഒരു നൂതനത്വത്തിലേക്ക് എപ്പോഴാണെന്ന് ദൈവത്തിനറിയാവുന്ന MMX-ൽ നിന്ന് ഞങ്ങൾ എങ്ങനെയാണ് പെട്ടെന്ന് കുതിച്ചത്? SSEയും 3DNow ഉം വിജയിച്ചു! SSE2 അടിസ്ഥാനപരമായി വ്യത്യസ്തമായ രണ്ട് ഭാഗങ്ങൾ ഉൾക്കൊള്ളുന്നു - SSE യുടെ തുടർച്ചയും MMX ന്റെ തുടർച്ചയും. SSE തുടർച്ച യഥാർത്ഥ സംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു, MMX തുടർച്ച പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു. SSE2-ൽ, MMX-നെ അപേക്ഷിച്ച് രജിസ്റ്ററുകൾ ഇരട്ടിയായി, അതായത്, അത് 8 അക്കങ്ങളല്ല, 16-നെ നിലനിർത്താൻ തുടങ്ങി. നിർദ്ദേശ നിർവ്വഹണത്തിന്റെ വേഗത മാറാത്തതിനാൽ, SSE2-നായി ഒപ്റ്റിമൈസ് ചെയ്യുമ്പോൾ, പ്രോഗ്രാമിന് എളുപ്പത്തിൽ ഇരട്ടി വർദ്ധനവ് ലഭിച്ചു. പ്രകടനത്തിൽ. ഇനിപ്പറയുന്ന സാഹചര്യവും ശ്രദ്ധിക്കേണ്ടതാണ്. MMX-നായി പ്രോഗ്രാം ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, കമാൻഡ് സിസ്റ്റത്തിന്റെ സമാനത കാരണം SSE2-നുള്ള ഒപ്റ്റിമൈസേഷൻ താരതമ്യേന എളുപ്പമാണ്.
അത്‌ലോൺ എക്‌സ്‌പി SSE2-നെ പിന്തുണയ്‌ക്കുന്നില്ല, അതിനാൽ എൻകോഡ് ചെയ്യുമ്പോൾ ആദ്യം പെന്റിയം 4 അത്‌ലോൺ എക്‌സ്‌പിയോട് തോറ്റപ്പോൾ രസകരമായ ഒരു ചിത്രം നിരീക്ഷിക്കാൻ കഴിയും, എന്നാൽ എസ്‌എസ്‌ഇ 2 നുള്ള കോഡെക് ഒപ്റ്റിമൈസ് ചെയ്‌തതിന് ശേഷം അത് വിജയിക്കാൻ തുടങ്ങി. ഒരാൾക്ക് സമ്മതിക്കാം നല്ല ആശയം SSE2-ൽ MMX എക്സ്റ്റൻഷനുകൾ, കാരണം MMX-നായി ഒപ്റ്റിമൈസ് ചെയ്തിട്ടില്ലാത്ത പ്രോഗ്രാമുകൾ, ഒപ്റ്റിമൈസ് ചെയ്തവ ശരിയായി ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു. ചില സാധാരണ കോഡിംഗ് പ്രവർത്തനങ്ങൾ നടത്തുന്ന SSE2 നായി ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്ത ഫംഗ്ഷനുകളുടെ ഏതാണ്ട് സൗജന്യ ലൈബ്രറികൾ സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് നൽകുന്നതിൽ ഇന്റൽ സ്വയം വ്യതിരിക്തമാണ് എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. പെന്റിയം 4 പ്രോസസറുകളുടെ പ്രകടനം "സംരക്ഷിക്കുന്നതിൽ" ഈ സാഹചര്യം ഒരു പ്രധാന പങ്ക് വഹിച്ചു.

എസ്.എസ്.ഇ

ഇനി നമുക്ക് SSE ഇൻസ്ട്രക്ഷൻ സെറ്റ് നോക്കാം. പെന്റിയം III പ്രൊസസറുകൾക്കൊപ്പം ഇത് പ്രത്യക്ഷപ്പെട്ടു, പക്ഷേ പെന്റിയം 4 പുറത്തിറങ്ങിയതിനുശേഷം പൂർണ്ണമായും പൂത്തു, അതിൽ എസ്എസ്ഇയുടെ ഉപയോഗം പ്രകടനത്തിൽ സമൂലമായ വർദ്ധനവ് നൽകി.
ജ്യാമിതീയ കണക്കുകൂട്ടലുകളിൽ, അതായത് ത്രിമാന ഗ്രാഫിക്സ് ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കുന്ന യഥാർത്ഥ-ടൈപ്പ് ഡാറ്റ ഉപയോഗിച്ചാണ് എസ്എസ്ഇ പ്രവർത്തിക്കുന്നത്, കാരണം എസ്എസ്ഇ രസകരമാണ്. കമ്പ്യൂട്ടർ ഗെയിമുകൾ, 3DStudioMax പോലെയുള്ള എഡിറ്റർമാർ, കൂടാതെ മറ്റു പലതും. ക്വേക്ക് പോലുള്ള കമ്പ്യൂട്ടർ ഗെയിമുകളിൽ, വീഡിയോ ആക്‌സിലറേറ്ററുകൾ ഉപയോഗിച്ച് ട്രയാംഗിൾ ടെക്‌സ്‌ചറിംഗ് ചെയ്യാൻ തുടങ്ങിയതിനാൽ, പൂർണ്ണസംഖ്യകളുടെ കണക്കുകൂട്ടലുകളുടെ ആവശ്യമില്ല. ഒരു യഥാർത്ഥ വെക്റ്ററിനെ ഒരു യഥാർത്ഥ മാട്രിക്സ് കൊണ്ട് ഗുണിക്കുന്നത് പോലെയുള്ള ഫ്ലോട്ടിംഗ് പോയിന്റ് പ്രവർത്തനങ്ങളുടെ വേഗതയാണ് ആദ്യം വന്നത്. ഡെവലപ്പർക്ക് SSE എന്താണ് വാഗ്ദാനം ചെയ്യുന്നതെന്ന് ഇപ്പോൾ നോക്കാം.
എസ്എസ്ഇ നടപ്പിലാക്കുമ്പോൾ, x87 ആർക്കിടെക്ചറിന്റെ സ്റ്റാൻഡേർഡ് രജിസ്റ്ററുകൾക്ക് പുറമേ, 128 ബിറ്റ് വലുപ്പമുള്ള 8 പുതിയ വലിയ രജിസ്റ്ററുകൾ പ്രോസസറിന് ലഭിച്ചു, അവയിൽ ഓരോന്നിനും 4 32-ബിറ്റ് യഥാർത്ഥ സംഖ്യകൾ അടങ്ങിയിരിക്കുന്നു.

ഭാഗം 3ഭാഗം 2ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
രജിസ്റ്റർ 3
* * * * രജിസ്റ്റർ 2
2 55.9 -1.9ഇ101.567ഇ-6രജിസ്റ്റർ 1
0.7 -100.0 11.2 0.5 രജിസ്റ്റർ 0

ക്വാഡ്രപ്പിൾ ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ച്, നിങ്ങൾക്ക് ഇനിപ്പറയുന്ന പ്രവർത്തന ഘടകങ്ങൾ ഘടകം പ്രകാരം നിർവഹിക്കാൻ കഴിയും: രണ്ട് ക്വാഡ്രപ്പിൾ സംഖ്യകൾ ചേർക്കുക, കുറയ്ക്കുക, ഗുണിക്കുക, ഹരിക്കുക. 4 (പരസ്പരം) വർഗ്ഗമൂലങ്ങൾ ഒരേസമയം, കൃത്യമായി അല്ലെങ്കിൽ ഏകദേശം കണക്കാക്കുക. നിങ്ങൾക്ക് രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങൾ ഷഫിൾ ചെയ്യാനും രജിസ്റ്ററിന്റെ ഒരു ഭാഗത്ത് നിന്ന് മറ്റൊന്നിലേക്ക് ഡാറ്റ കൈമാറാനും സമാനമായ മറ്റ് ചില പ്രവർത്തനങ്ങൾ നടത്താനും കഴിയും. എന്നിരുന്നാലും, ഡാറ്റാ ചലനം അതിന്റെ കൂട്ടിച്ചേർക്കലിനേക്കാൾ വേഗതയുള്ളതല്ല, അതിനാൽ തയ്യാറാക്കിയതും ശരിയായി പായ്ക്ക് ചെയ്തതുമായ ഡാറ്റയിൽ മാത്രമേ എസ്എസ്ഇയുടെ ഫലപ്രദമായ ഉപയോഗം സാധ്യമാകൂ.
പെന്റിയം 4 പ്രോസസറിൽ, ഒരു SSE പ്രവർത്തനം സമാനമായ ഒരു സാധാരണ പ്രവർത്തനത്തോളം തന്നെ എടുക്കും. അതായത്, ഒപ്റ്റിമൈസേഷൻ ഉപയോഗിച്ച് നിങ്ങൾക്ക് പ്രകടനത്തിൽ 4 മടങ്ങ് വർദ്ധനവ് ലഭിക്കും. കൂടുതൽ കൃത്യമായി പറഞ്ഞാൽ, പുതിയ വലിയ രജിസ്റ്ററുകളുടെ ഉപയോഗം കാരണം. എന്നിരുന്നാലും, എല്ലാ കണക്കുകൂട്ടലുകളും എസ്എസ്ഇക്ക് ഫലപ്രദമായി ഒപ്റ്റിമൈസ് ചെയ്യാൻ കഴിയില്ല. ഒരു "നല്ല" പ്രശ്നത്തിന്റെ ഒരു ഉദാഹരണം ഒരു ചതുരാകൃതിയിലുള്ള മാട്രിക്സ് ഒരു ചതുരാകൃതിയിലുള്ള വെക്റ്റർ കൊണ്ട് ഗുണിക്കുക എന്നതാണ്. പ്രത്യേക ചെലവുകളില്ലാതെ നാലിരട്ടി ത്വരണം.
ഒന്നാമതായി, SSE യുടെ ഉപയോഗം ഒരു ത്രിമാന രംഗം സൃഷ്ടിക്കുന്ന ത്രികോണങ്ങളുടെ ശീർഷകങ്ങളുടെ പരിവർത്തനം നടത്തുമ്പോൾ ഏറ്റവും പുതിയ വീഡിയോ ആക്സിലറേറ്ററുകളുമായി വിജയകരമായി മത്സരിക്കാൻ ആധുനിക പ്രോസസ്സറുകളെ അനുവദിക്കുന്നു. മറ്റൊരു കാര്യം, പ്രോസസ്സറിന് മറ്റ് നിരവധി ജോലികൾ ഉണ്ട്, സാധ്യമെങ്കിൽ അത് അൺലോഡ് ചെയ്യുന്നതാണ് നല്ലത്, അങ്ങനെ അത് വീഡിയോ ആക്സിലറേറ്ററുമായി സമാന്തരമായി പ്രവർത്തിക്കുന്നു.
അത്‌ലോൺ എക്സ്പിയുടെ കാര്യമോ? യഥാർത്ഥത്തിൽ, സാധാരണ അത്‌ലോണുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പ്രധാന കണ്ടുപിടുത്തങ്ങളിലൊന്ന് എസ്എസ്ഇ സാങ്കേതികവിദ്യയുടെ ആമുഖമായിരുന്നു. സാധാരണ കോഡുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ നിങ്ങൾക്ക് ഏകദേശം 2x വേഗത പ്രതീക്ഷിക്കാം. എന്നിരുന്നാലും, അത്ലൺ എക്സ്പിയിൽ "മോശം" നടപ്പിലാക്കുന്നത് എസ്എസ്ഇ അല്ല, എന്നാൽ സാധാരണ കോഡിന്റെ നിർവ്വഹണം വളരെ കാര്യക്ഷമമാണ്. അതേ ആവൃത്തിയിൽ, SSE നിർദ്ദേശങ്ങൾ മാത്രം ഉപയോഗിച്ച്, Athlon XP, Pentium 4 എന്നിവയ്ക്ക് സമാനമായ പ്രകടനമുണ്ട്. സോപാധിക ജമ്പുകൾ നടത്തുമ്പോൾ അത്‌ലോൺ എക്‌സ്‌പിക്കും ഒരു നേട്ടമുണ്ട്, അതിനാൽ ഇത് ഇതിന് നന്നായി പ്രവർത്തിക്കുന്നു. എന്നാൽ പെന്റിയം 4 ഉയർന്ന ആവൃത്തികളിൽ എത്തുന്നു, ഇത് SIMD നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുമ്പോൾ, ചിലപ്പോൾ അത് കാര്യമായ വേഗത കൈവരിക്കാൻ അനുവദിക്കുന്നു.

3Dഇപ്പോൾ! കൂടാതെ 3 എഎംഡി സ്ട്രാറ്റജി തെറ്റുകൾ

എഎംഡിയിൽ നിന്നുള്ള പ്രോസസർ നിർദ്ദേശങ്ങളുടെ പ്രൊപ്രൈറ്ററി എക്സ്റ്റൻഷൻ - നമുക്ക് ഇപ്പോൾ ഒരർത്ഥത്തിൽ, എസ്എസ്ഇയുടെ ഒരു എതിരാളിയെ പരിഗണിക്കാം. SSE-യെ 3DNow-യുടെ എതിരാളി എന്ന് വിളിക്കുന്നത് കൂടുതൽ കൃത്യമായിരിക്കാം! കാരണം അത് പിന്നീട് പ്രത്യക്ഷപ്പെട്ടു. ഞാൻ നിങ്ങളെ ഓർമ്മിപ്പിക്കട്ടെ, 3DNow! ഇന്റൽ പെന്റിയം II ന്റെ എതിരാളികളായ AMD k6-2-3D ​​പ്രോസസറുകളിൽ ആദ്യമായി നടപ്പിലാക്കി. യഥാർത്ഥത്തിൽ, 3DNow ന്റെ ആമുഖം കാരണം അവർക്ക് ലഭിച്ചു! പ്രിഫിക്സ് അല്ലെങ്കിൽ, നിങ്ങൾക്ക് താൽപ്പര്യമുണ്ടെങ്കിൽ, പോസ്റ്റ്ഫിക്സ് 3D. എന്തുകൊണ്ട് 3DNow! നമുക്ക് അതിനെ SSE-യുടെ എതിരാളി എന്ന് സുരക്ഷിതമായി വിളിക്കാമോ? ഈ വിപുലീകരണങ്ങളുടെ വ്യത്യസ്ത "ബ്രാൻഡ്" അഫിലിയേഷനുകളിൽ മാത്രമല്ല പോയിന്റ്; എല്ലാത്തിനുമുപരി, അവ ഒരേ പ്രൊസസർ നിർമ്മാതാവിന് സൃഷ്ടിക്കാമായിരുന്നു. ഈ രണ്ട് വിപുലീകരണങ്ങളും യഥാർത്ഥ സംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു, ജ്യാമിതീയ ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തവയാണ്.
അതിനാൽ, 3DNow! ഈ വിപുലീകരണം എസ്എസ്ഇക്ക് പല തരത്തിൽ സമാനമാണ്, എന്നാൽ കാര്യമായ വ്യത്യാസങ്ങളുമുണ്ട്. 8 രജിസ്റ്ററുകളും ഉണ്ട്, എന്നാൽ അവ 128 ബിറ്റുകളല്ല, 64. അതനുസരിച്ച്, അവയിൽ 4 അക്കങ്ങളല്ല, 2 മാത്രമേ അടങ്ങിയിട്ടുള്ളൂ. സമാനമായ ഒന്ന് ഉണ്ട്. എസ്എസ്ഇ സെറ്റ് ഗണിത പ്രവർത്തനങ്ങൾരജിസ്റ്ററുകൾക്കൊപ്പം. രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ മുതലായവ കൂട്ടിച്ചേർക്കുക-ഗുണിക്കുക-വിഭജിക്കുക. കണ്ടെത്താനുള്ള പ്രവർത്തനങ്ങളും ഉണ്ട് (റിവേഴ്സ്) സ്ക്വയർ റൂട്ട്, കൃത്യവും വേഗത്തിലുള്ളതുമായ ഏകദേശ കണക്കുകൾ.

ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
* * രജിസ്റ്റർ 3
10000.1 6.7 രജിസ്റ്റർ 2
-0.5 1.5e7രജിസ്റ്റർ 1
2.0 1.0 രജിസ്റ്റർ 0

നിങ്ങൾ ഊഹിക്കുന്നതുപോലെ, 3DNow!-യ്‌ക്കായി പൂർണ്ണമായും ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്ന കോഡിന്റെ വിഭാഗങ്ങളിൽ, രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ച് ഒരേസമയം പ്രവർത്തനങ്ങൾ നിർവ്വഹിക്കുന്നതിനാൽ നിങ്ങൾക്ക് പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് പ്രതീക്ഷിക്കാം. ഇത് എസ്എസ്ഇ ഉപയോഗിക്കുന്നതിനേക്കാൾ കുറവാണെന്ന് തോന്നുന്നു. തീർച്ചയായും, നിങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്യാൻ പോകുകയാണെങ്കിൽ, പ്രത്യേകിച്ച് സ്വമേധയാ, പരമാവധി പ്രകടന വർദ്ധനവിനായി നോക്കുന്നതാണ് നല്ലത്. ഈ സാഹചര്യം, വിപണിയിലെ ഇന്റൽ പ്രോസസറുകളുടെ പരമ്പരാഗതമായി വലിയ വിഹിതവുമായി ചേർന്ന്, പ്രധാന ഘടകങ്ങൾ, ഇത് 3DNow ന്റെ വ്യാപനം തടഞ്ഞു! ഡെവലപ്പർമാർക്കിടയിൽ.
തീർച്ചയായും, SSE പ്രോസസ്സറുകളുടെ വലിയ വിഹിതത്തിന്റെ "ഷെയർ" ഘടകം 3DNow ന്റെ വിതരണത്തെ സ്വാധീനിക്കുന്നു! പരമാവധി. പ്രയോഗത്തിന് ക്ഷമിക്കണം. മാത്രമല്ല, പെന്റിയം III-ലെ എസ്എസ്ഇ ഉപയോഗത്തിൽ നിന്നുള്ള വർദ്ധനവ് - 3DNow ഉള്ള അത്ലോൺ പ്രൊസസറുകളുടെ മുൻ എതിരാളികൾ! - പെന്റിയം 4-ൽ ഉള്ളതിന്റെ പകുതിയോളം. 3DNow ഉപയോഗിക്കുന്നതിന് സമാനമാണ് പ്രഭാവം! എഎംഡി അത്‌ലോണിൽ.
എന്നിരുന്നാലും, 3DNow തമ്മിൽ ഒരു പ്രധാന വ്യത്യാസം കൂടിയുണ്ട്! നിങ്ങൾക്ക് ഒരു രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങൾ ഒരുമിച്ച് ചേർക്കാം. അതായത്, "ലംബമായ" പ്രവർത്തനങ്ങൾ മാത്രമല്ല, തിരശ്ചീനമായവയും നടത്തുക. രണ്ട് ത്രിമാന വെക്റ്ററുകളുടെ സ്കെയിലർ ഉൽപ്പന്നമായ - SSE-യിൽ അടിസ്ഥാന ജ്യാമിതീയ പ്രവർത്തനങ്ങളിൽ ഒന്ന് നടപ്പിലാക്കാൻ ശ്രമിക്കുക. നല്ലതൊന്നും വരില്ല. ഒരു നീണ്ട SSE രജിസ്റ്ററിന്റെ ഘടകങ്ങൾ ചേർക്കാൻ കഴിയില്ല; അധിക രജിസ്റ്ററുകൾ ഉപയോഗിക്കേണ്ടതാണ്. ഇത് ഏതെങ്കിലും എസ്എസ്ഇ ഇല്ലാത്തതിനേക്കാൾ വേഗത്തിൽ മാറില്ല, ഒരുപക്ഷേ മന്ദഗതിയിലായിരിക്കാം. ഒരു വെക്റ്ററിന്റെ മാനദണ്ഡവും പോയിന്റുകൾ തമ്മിലുള്ള ദൂരവും കണ്ടെത്തുമ്പോൾ ഉൾപ്പെടെ, സ്കെയിലർ ഉൽപ്പന്നം പലപ്പോഴും കണ്ടുമുട്ടുന്നു. ഇക്കാര്യത്തിൽ, 3DNow! കൂടുതൽ വഴക്കമുള്ളതിനാൽ കൂടുതൽ അഭികാമ്യമായി തോന്നുന്നു.
3DNow ന് അനുകൂലമായി സംസാരിക്കുന്ന മറ്റൊരു പ്രധാന സാഹചര്യം കംപൈലർ ഉപയോഗിച്ച് വളരെ ഫലപ്രദമായ ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷന്റെ സാധ്യതയാണ്. സ്വയമേവയുള്ള ഡാറ്റാ ഓർഗനൈസേഷനായി SSE വളരെ വലുതാണ് - രജിസ്റ്റർ വലുപ്പങ്ങൾ വലുതാണ്. ഫ്ലോട്ടിംഗ് പോയിന്റ് കണക്കുകൂട്ടലുകൾ നിറഞ്ഞ കോഡിൽ, നിങ്ങൾക്ക് പ്രകടനത്തിൽ ഏകദേശം ഒന്നര തവണ വർദ്ധനവ് സൗജന്യമായി ലഭിക്കും. എന്നാൽ എ‌എം‌ഡി അത്തരമൊരു കംപൈലർ സൃഷ്‌ടിച്ചില്ല, അതേസമയം ഇന്റൽ എസ്‌എസ്‌ഇയെ പിന്തുണയ്‌ക്കുന്ന സ്വന്തം ഒപ്‌റ്റിമൈസിംഗ് കമ്പൈലറിനെ ശക്തമായി പ്രോത്സാഹിപ്പിക്കുകയായിരുന്നു, തീർച്ചയായും, ഏതെങ്കിലും 3DNow നെക്കുറിച്ചല്ല! അറിയാതെ. സ്‌പെക് പ്രോസസർ ടെസ്റ്റുകൾക്കായി (www.spec.org) സോഴ്‌സ് കോഡ് കംപൈൽ ചെയ്യാൻ എഎംഡി ഇന്റലിന്റെ കംപൈലർ ഉപയോഗിച്ചു. നമുക്ക് സ്വന്തമായി ഇല്ല, പരമാവധി ഉൽപ്പാദനക്ഷമത കൈവരിക്കണം ടെസ്റ്റ് ആപ്ലിക്കേഷൻഏറ്റവും കാര്യക്ഷമമായ കമ്പൈലർ ഉപയോഗിക്കുക.
ഡവലപ്പർമാർ, സ്വാഭാവികമായും, പ്രോഗ്രാമുകൾ കൂടുതൽ ഒപ്റ്റിമൈസ് ചെയ്യാൻ ശ്രമിച്ചില്ല, കൂടാതെ ഏറ്റവും സാധാരണമായ ഇന്റൽ പ്രോസസറുകൾക്ക് ആവശ്യമുള്ള ഒപ്റ്റിമൈസേഷനിൽ ഇതിനകം തന്നെ ധാരാളം ബുദ്ധിമുട്ടുകൾ ഉണ്ട്. ഒന്നുകിൽ SIMD ഒപ്റ്റിമൈസേഷൻ ഇല്ലായിരുന്നു, അപ്പോൾ അത്ലോൺ പ്രോസസർ മികച്ച പ്രകടനം കാഴ്ചവച്ചു, പ്രത്യേകിച്ച് പെന്റിയം 4 നെ അപേക്ഷിച്ച്. അല്ലെങ്കിൽ SSE(2) ന് ഒപ്റ്റിമൈസേഷൻ ഉണ്ടായിരുന്നു, തുടർന്ന് അത്ലൺ, താരതമ്യേന പറഞ്ഞാൽ, നഷ്ടപ്പെട്ടു.
3DNow ഉപയോഗിച്ച് AMD ഗൌരവമായി കണക്കുകൂട്ടിയെന്ന് നമുക്ക് പറയാം!, തീർച്ചയായും, ആദ്യ അവതരണത്തിൽ ഒരു പ്രത്യേക പ്രാദേശിക പ്രഭാവം ഉണ്ടായിരുന്നു. പ്രധാനമായും പരസ്യംചെയ്യൽ, കാരണം ഒപ്റ്റിമൈസ് ചെയ്തതിൽ നിന്ന് ജനപ്രിയ ആപ്ലിക്കേഷനുകൾഓപ്പൺജിഎൽ ഡ്രൈവറുകൾ മാത്രമാണ് ശ്രദ്ധിക്കാൻ കഴിയുന്നത്, അത് വേഗതയിൽ ഗണ്യമായ വർദ്ധനവ് കാണിച്ചു. അവർക്ക് അവരുടെ കമാൻഡ് എക്സ്റ്റൻഷൻ "ഭേദിക്കാൻ" കഴിയാത്തതിനാൽ, അവരുടെ പ്രോസസറുകളിൽ എല്ലാ ഇന്റൽ പുതുമകളും കർശനമായി നടപ്പിലാക്കുന്നത് നല്ലതാണ്. ഉപയോഗിക്കാത്ത 3DNow-ന് പകരം ഞങ്ങൾ ഇത് നടപ്പിലാക്കും! അത്‌ലോൺ XP SSE2 കമാൻഡ് സിസ്റ്റം ഉപയോഗിക്കുന്നു, അത് അത്ര കാര്യക്ഷമമല്ലെങ്കിലും. പ്രോസസർ സുവർണ്ണ നിറമായിരിക്കും, മിക്കവാറും ദുർബലമായ പോയിന്റുകളൊന്നുമില്ല.
മുന്നോട്ട് നോക്കുമ്പോൾ, എഎംഡിയെ അതിന്റെ പ്രോസസറുകൾക്കായുള്ള ഒരു കംപൈലറിനെക്കുറിച്ച് വിഷമിക്കാൻ ജീവിതം ഒടുവിൽ നിർബന്ധിച്ചുവെന്ന് ഞാൻ പറയും. കാരണം പുതിയ എഎംഡി x86-64 ആർക്കിടെക്ചറിന് പുതിയ ഫീച്ചറുകൾ പ്രയോജനപ്പെടുത്തുന്നതിന് നിലവിലുള്ള ആപ്ലിക്കേഷനുകൾ വീണ്ടും കംപൈൽ ചെയ്യേണ്ടതുണ്ട്. AMD അത്‌ലോൺ 64 പ്രോസസറുകളും 3DNow നിലനിർത്തുന്നു, അതിനാൽ SSE, 3DNow എന്നിവയ്‌ക്കായുള്ള ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷന്റെ ഫലപ്രാപ്തി താരതമ്യം ചെയ്യാൻ കഴിയും! ഇത് ശരിക്കും രസകരമായിരിക്കും.

SSE2

അവസാനമായി, നമുക്ക് SSE2 നോക്കാം - x86-അനുയോജ്യമായ പേഴ്സണൽ കമ്പ്യൂട്ടർ മാർക്കറ്റിൽ നിലവിൽ ലഭ്യമായ ഏറ്റവും പുതിയ SIMD വിപുലീകരണം. പൂർണ്ണസംഖ്യ ഘടകത്തെക്കുറിച്ച് നമ്മൾ നേരത്തെ ചർച്ച ചെയ്തിട്ടുണ്ട്. എന്നാൽ SSE2 പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നതിനുള്ള നിർദ്ദേശങ്ങൾ മാത്രമല്ല ഉൾപ്പെടുത്തിയത്. അതേ 8 വലിയ 128-ബിറ്റ് രജിസ്റ്ററുകൾ ഇപ്പോൾ നാല് 32-ബിറ്റ് യഥാർത്ഥ സംഖ്യകളല്ല, രണ്ട് 64-ബിറ്റ് ഉയർന്ന കൃത്യതയുള്ള യഥാർത്ഥ സംഖ്യകൾ ഉൾക്കൊള്ളുന്നതായി വ്യാഖ്യാനിക്കാം. ഉള്ള നമ്പറുകൾ വർദ്ധിച്ച കൃത്യതസാധാരണ കൃത്യതയുള്ള കണക്കുകൂട്ടലുകൾ വലിയ പിശകുകളിലേക്ക് നയിക്കുന്ന സന്ദർഭങ്ങളിൽ ഉപയോഗിക്കുന്നു. എല്ലാ പ്രവർത്തനങ്ങളും എസ്‌എസ്‌ഇയിൽ നിന്ന് ഏറ്റെടുത്തു, അവ പ്രവർത്തിക്കുന്നത് നാല് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചല്ല, രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചാണ്. ശരിയാണ്, സ്ക്വയർ റൂട്ടിന്റെ ഏകദേശ കണക്കുകൂട്ടൽ സ്വാഭാവികമായും അപ്രത്യക്ഷമായി.

ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
രജിസ്റ്റർ 3
* * രജിസ്റ്റർ 2
-1.5ഇ10 0.00001 രജിസ്റ്റർ 1
1e-25 5.5 രജിസ്റ്റർ 0

ഇത് 3DNow! ന്റെ ഒരു അനലോഗ് ആയി മാറി, എന്നാൽ ഒരു രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങൾ ഒരുമിച്ച് ചേർക്കുന്നതിനുള്ള വഴക്കമുള്ള പ്രവർത്തനമില്ലാതെ.
വേഗതയുടെ കാര്യമോ? ഒരു ഗവേഷകൻ ഒരിക്കൽ എന്നോട് ചോദിച്ചു, എസ്‌എസ്‌ഇയ്‌ക്കായി തന്റെ കണക്കുകൂട്ടൽ പ്രവർത്തനം എങ്ങനെ മികച്ച രീതിയിൽ ഒപ്റ്റിമൈസ് ചെയ്യാമെന്ന്; മാഗ്നിറ്റ്യൂഡ് ആക്സിലറേഷന്റെ ക്രമം കൈവരിക്കാൻ കഴിയുമെന്ന് അദ്ദേഹം എവിടെയോ കേട്ടിരുന്നു. ഏത് തരത്തിലുള്ള ഡാറ്റയാണ് ഇത് ഉപയോഗിക്കുന്നത്? കണക്കുകൂട്ടലുകളുടെ കൃത്യതയെക്കുറിച്ച് ഒരിക്കൽ കൂടി ഉറപ്പാക്കാൻ, വർദ്ധിച്ച കൃത്യതയോടെ അത് മാറി. തുടർന്ന് അവൻ ഒപ്റ്റിമൈസേഷനായി SSE2 ഉപയോഗിക്കുകയും പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് "മാത്രം" കൊണ്ട് തൃപ്തിപ്പെടുകയും വേണം.
കണക്കുകൂട്ടൽ പ്രോഗ്രാമുകളുടെ പ്രകടനം വിലയിരുത്തുന്നതിന് നിങ്ങൾക്ക് ഒരു ലളിതമായ നിയമം നേടാനാകും: പ്രോഗ്രാം എസ്എസ്ഇ2-നായി പ്രത്യേകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, അത് ലോൺ എക്സ്പിയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പെന്റിയം 4 പ്രോസസറുകളിൽ അത് കൂടുതലോ കുറവോ വേഗത്തിൽ പ്രവർത്തിക്കും. ഏറ്റവും ഉയർന്ന ആവൃത്തിയിൽ വാറ്റിയെടുക്കുക. പ്രത്യേക ഒപ്റ്റിമൈസേഷൻ ഇല്ലെങ്കിൽ, അത് നഷ്ടപ്പെടും അത്ലോൺ പ്രൊസസർഅനുബന്ധ റേറ്റിംഗുള്ള XP.

പുതിയ പ്രെസ്കോട്ട് നിർദ്ദേശങ്ങൾ

പ്രെസ്‌കോട്ട് പ്രോസസറിൽ നടപ്പിലാക്കുന്ന സാധാരണ സെറ്റ് കമാൻഡുകളിലെ പുതുമകൾ പരിചയപ്പെടാനും അവയുടെ ഉപയോഗക്ഷമത വിലയിരുത്താനുമുള്ള സമയമാണിത്.
ഒന്നാമതായി, നമുക്ക് യഥാർത്ഥത്തിൽ എന്താണ് വേണ്ടത്? ഞാൻ ഉദ്ദേശിക്കുന്നത് പ്രാഥമികമായി സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാരെയാണ്.
ത്രിമാന പ്രോഗ്രാമുകളുടെ മിക്കവാറും എല്ലാ ഡെവലപ്പർമാർക്കും, പ്രാഥമികമായി കമ്പ്യൂട്ടർ ഗെയിമുകൾ, ഒരു ചെറിയ സ്വപ്നമുണ്ട്: ജ്യാമിതീയ വസ്തുക്കൾ, വെക്റ്ററുകൾ, മെട്രിക്സുകൾ എന്നിവയെ പ്രതിനിധീകരിക്കുന്ന ക്ലാസുകളുടെ സൗകര്യപ്രദവും വേഗതയേറിയതുമായ ഒരു ലൈബ്രറി ഉണ്ടായിരിക്കുക.

ക്ലാസ് വെക്റ്റർ
{
ഫ്ലോട്ട് x,y,z;

പൊതു:

ഇൻലൈൻ സുഹൃത്ത് വെക്റ്റർ ഓപ്പറേറ്റർ +(കോൺസ്റ്റ് വെക്റ്റർ &എ, കോൺസ്റ്റ് വെക്റ്റർ &ബി); //കൂടാതെ

ഇൻലൈൻ ഫ്ലോട്ട് മാനദണ്ഡം () കോൺസ്റ്റ്; // വെക്റ്റർ നീളം
ഇൻലൈൻ ഫ്ലോട്ട് norm2() const; // വെക്റ്റർ നീളം ചതുരാകൃതിയിലുള്ളത്

ഇൻലൈൻ ഫ്രണ്ട് ഫ്ലോട്ട് ഡോട്ട് (കോൺസ്റ്റ് വെക്റ്റർ & എ, കോൺസ്റ്റ് വെക്റ്റർ & ബി); // സ്കെയിലർ ഉൽപ്പന്നം
};


അതിനാൽ നിങ്ങൾക്ക് a=b+c എന്ന് ലളിതമായി എഴുതാം, മടുപ്പോടെ a.x=b.x+c.x എന്ന് ടൈപ്പ് ചെയ്യരുത്; a.y=b.y+c.y; a.z=b.z+c.z; കൂടാതെ, ഈ വഴിയിൽ എപ്പോഴും എന്തെങ്കിലും ഉണ്ടായിരുന്നു. അല്ലെങ്കിൽ ഒരു മോശം കംപൈലർ വെക്റ്റർ അഡീഷൻ ഫംഗ്‌ഷനിലേക്കുള്ള കോളുകൾ കംപൈൽ ചെയ്‌തു, പ്രകടനം ഓവർഹെഡ് എഴുത്ത് സൗകര്യത്തേക്കാൾ കൂടുതലാണ്. എസ്എസ്ഇ ഉപയോഗിക്കുന്നത് വെക്റ്ററുകൾ ചേർക്കുന്നത് സൗകര്യപ്രദമാണെന്ന് മനസ്സിലായി, എന്നാൽ സ്കെയിലറും വെക്റ്റർ ഉൽപ്പന്നവും കണക്കാക്കുന്നത് തികച്ചും അസൗകര്യവും മന്ദഗതിയിലുമാണ്.
തുടർന്ന് ഒരു ചെറിയ അത്ഭുതം സംഭവിച്ചു: പുതിയ നിർദ്ദേശങ്ങൾ വെക്റ്റർ മാത്തമാറ്റിക്സ് ഉൾപ്പെടെയുള്ള എസ്എസ്ഇ, എസ്എസ്ഇ2 എന്നിവയ്ക്ക് ഒപ്റ്റിമൈസേഷൻ വളരെ എളുപ്പമാക്കും.
നമുക്ക് സൂക്ഷ്മമായി നോക്കാം.
ഏറ്റവും പ്രധാനപ്പെട്ട കാര്യം: ഒടുവിൽ ഒരു എസ്എസ്ഇ രജിസ്റ്ററിന്റെ ഘടകങ്ങൾ പരസ്പരം ഫലപ്രദമായി ചേർക്കുന്നത് സാധ്യമായി.


അതിനാൽ അധിക രജിസ്റ്ററുകൾ ഉപയോഗിക്കാതെ രണ്ട് വെക്റ്ററുകളുടെ സ്കെയിലർ ഉൽപ്പന്നം അല്ലെങ്കിൽ ഒരു വെക്റ്ററിന്റെ മാനദണ്ഡം കണക്കാക്കാൻ നിങ്ങൾക്ക് മൂന്ന് കമാൻഡുകൾ ഉപയോഗിക്കാം. തീർച്ചയായും, അത്തരം ഒരു തിരശ്ചീന കൂട്ടിച്ചേർക്കൽ കമാൻഡിന്റെ പ്രകടനത്തെക്കുറിച്ച് ആശങ്കകൾ നിലനിൽക്കുന്നു. കമാൻഡ് നടപ്പിലാക്കിയാൽ അത് വലുതായിരിക്കണമെന്നില്ല. ഈ നിർദ്ദേശം നടപ്പിലാക്കുന്നത് പ്രോസസർ പൈപ്പ്ലൈൻ പുനഃസജ്ജമാക്കില്ലെന്ന് നമുക്ക് പ്രതീക്ഷിക്കാം.
അതുപോലെ, നിങ്ങൾക്ക് ചേർക്കാൻ കഴിയില്ല, പക്ഷേ ഒരു രജിസ്റ്ററിന്റെ ഘടകങ്ങൾ കുറയ്ക്കുക.
ഒരേ SSE2 രജിസ്റ്ററിൽ ഉള്ള രണ്ട് സംഖ്യകൾ ചേർക്കാനും കുറയ്ക്കാനും ഇപ്പോൾ സാധിക്കും. രണ്ട് മൂലകങ്ങളുടെ സംയോജിത സങ്കലനത്തിനും കുറയ്ക്കുന്നതിനുമുള്ള ഒരു നിർദ്ദേശവും പ്രത്യക്ഷപ്പെട്ടു.

y2x2
ADDSUBPD
y1x1
=
y1+y2x1-x2

സങ്കീർണ്ണ സംഖ്യകളുടെ ഗുണനത്തിന്റെ സ്വഭാവമാണ് ഈ നിർദ്ദേശത്തിന്റെ രൂപം. (a+bi)*(c+di)=a*c-b*d+(b*c+a*d)i ഇപ്പോൾ SSE2-നുള്ള സങ്കീർണ്ണ സംഖ്യകളുള്ള കണക്കുകൂട്ടലുകളുടെ ഒപ്റ്റിമൈസേഷൻ ഗണ്യമായി ലളിതമാക്കിയിരിക്കുന്നു. സാരാംശത്തിൽ, SSE2 3DNow ന് സമാനമായി മാറിയിരിക്കുന്നു!, ഇത് കൂടുതൽ കൃത്യതയോടെ സംഖ്യകളിൽ മാത്രമേ പ്രവർത്തിക്കൂ.

പുതിയ നിർദ്ദേശങ്ങളുടെ ഒരു പട്ടിക ഇതാ.

നിർദ്ദേശങ്ങൾവിവരണം
തിരശ്ചീന രജിസ്റ്റർ പ്രവർത്തനങ്ങൾ
HADDPSഎസ്എസ്ഇ രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങളുടെ തിരശ്ചീന കൂട്ടിച്ചേർക്കൽ
HSUBPSഎസ്എസ്ഇ രജിസ്റ്ററുകളുടെ ഉള്ളടക്കത്തിന്റെ തിരശ്ചീനമായ കുറയ്ക്കൽ
HADDPDഒരു SSE2 രജിസ്റ്ററിന്റെ രണ്ട് ഘടകങ്ങളുടെ കൂട്ടിച്ചേർക്കൽ
HSUBPDSSE2 രജിസ്റ്ററിലെ മറ്റ് രണ്ട് ഘടകങ്ങളിൽ നിന്ന് ഒന്ന് കുറയ്ക്കുന്നു
എല്ലാ തരത്തിലും ഉപയോഗപ്രദമായ കമാൻഡുകൾ, ഡെവലപ്പർമാർ വളരെക്കാലമായി കാത്തിരിക്കുകയാണ്, ഓട്ടോമാറ്റിക്, മാനുവൽ ഒപ്റ്റിമൈസേഷൻ ഗൗരവമായി ലളിതമാക്കുന്നു.
ഡാറ്റ ലോഡ് കമാൻഡുകൾ
MOVSHDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, 2-ഉം 4-ഉം 32-ബിറ്റ് ഘടകങ്ങൾ മാത്രം പകർത്തുന്നു
MOVSLDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, 1, 2 32-ബിറ്റ് ഘടകങ്ങൾ മാത്രം പകർത്തുന്നു
MOVDDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, ഉറവിട രജിസ്റ്ററിന്റെ ആദ്യ പകുതി പകർത്തി ഇരട്ടിയാക്കുന്നു
സ്വയമേവയുള്ളതും മാനുവൽ ഒപ്റ്റിമൈസേഷനും ഉപയോഗപ്രദമാണ്.
സംയോജിത കൂട്ടിച്ചേർക്കൽ-വ്യവകലനം
ADDSUBPS(x1,y1,z1,w1) * (x2,y2,z2,w2) =
(x1-x2,y1+y1,z1-z2,w1+w2)
ADDSUBPD(x1, y1) * (x2, y2) =
(x1-x2, y1+y2)
സങ്കീർണ്ണമായ സംഖ്യകളുള്ള പ്രവർത്തനങ്ങൾ നടപ്പിലാക്കുന്നത് ഗണ്യമായി ലളിതമാക്കുന്നു. പ്രോഗ്രാമുകളുടെ ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷനിൽ സഹായിക്കുന്നു.

താരതമ്യേന അപൂർവമായ ഫൈൻ-ഗ്രെയിൻഡ് മാനുവലും ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷനും.
ഡാറ്റ പരിവർത്തനം
FISTTPഒരേയൊരു പുതിയ x87 നിർദ്ദേശം. കോപ്രോസസർ സ്റ്റാക്കിലെ ഉള്ളടക്കങ്ങൾ ഒരു പൂർണ്ണസംഖ്യ തരത്തിലേക്ക് വേഗത്തിൽ പരിവർത്തനം ചെയ്യുന്നു.
സമാഹരിക്കുന്ന സമയത്ത് ഒരു പ്രോഗ്രാം സ്വയമേവ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന് ഉപയോഗപ്രദമാണ്. ഒരു കാലത്ത്, ഈ നിർദ്ദേശം സ്റ്റാൻഡേർഡ് x87 നിർദ്ദേശ സെറ്റിലേക്ക് ചേർക്കാൻ അവർ മറന്നു, ഇപ്പോൾ ഈ ഒഴിവാക്കൽ ശരിയാക്കി.
മെച്ചപ്പെടുത്തിയ ഹൈപ്പർ-ത്രെഡിംഗ് പിന്തുണ
മോണിറ്റർ/MWAITപ്രോസസർ റൈറ്റ് ഇവന്റ് നിരീക്ഷിക്കുന്നു നിർദ്ദിഷ്ട ശ്രേണിമെമ്മറി, "ഡോർമന്റ്" ത്രെഡ് സജീവമാക്കുന്നു.
ഹൈപ്പർ-ത്രെഡിംഗ് സാങ്കേതികവിദ്യയെയും പൊതുവെ മൾട്ടി-ത്രെഡിംഗിനെയും പിന്തുണയ്ക്കുന്നതിനായി ഓപ്പറേറ്റിംഗ് സിസ്റ്റം പ്രോഗ്രാമുകളുടെയും സേവനങ്ങളുടെയും ഒപ്റ്റിമൈസേഷൻ ലളിതമാക്കുന്നു.

നവീകരണങ്ങളുടെ വിലയിരുത്തലും AMD x86-64 മായി താരതമ്യം ചെയ്യലും

ഇൻസ്ട്രക്ഷൻ സിസ്റ്റങ്ങളിലേക്കുള്ള കൂട്ടിച്ചേർക്കലുകൾ നോക്കുമ്പോൾ, പ്രെസ്‌കോട്ട് പ്രൊസസറിന്റെ ഇൻസ്ട്രക്ഷൻ സെറ്റ് കുറച്ച് യോജിപ്പും പൂർണ്ണതയും നേടിയിട്ടുണ്ടെന്ന് നമുക്ക് സുരക്ഷിതമായി പറയാൻ കഴിയും. നിങ്ങൾക്ക് അവനോടൊപ്പം ജീവിക്കാം നീണ്ട കാലം, സമൂലമായ കണ്ടുപിടുത്തങ്ങളുടെ വരവിനു മുമ്പ്. രജിസ്റ്ററുകളുടെ എണ്ണം വർദ്ധിക്കാത്തത് ഖേദകരമാണ്, എന്നാൽ x86 ആർക്കിടെക്ചർ മെഷീൻ നിർദ്ദേശ ഫോർമാറ്റിലെ പരിമിതികൾ കാരണം അനുയോജ്യത നഷ്ടപ്പെടാതെ ഇത് ചെയ്യാൻ പ്രയാസമാണ്. കാര്യക്ഷമമായ fisttp കൺവേർഷൻ കമാൻഡ് പോലെ എല്ലാത്തരം നല്ല ചെറിയ കാര്യങ്ങളും പൂർത്തിയായി. SIMD-ഒപ്റ്റിമൈസ് ചെയ്ത കോഡിന്റെ ഓട്ടോമാറ്റിക് ജനറേഷൻ വളരെ ലളിതമാക്കിയിരിക്കുന്നു. പ്രോസസ്സറിന്, അജ്ഞാത വിലയ്ക്ക് പുറമേ, ഒരു ദുർബലമായ പോയിന്റ് മാത്രമേ ഉണ്ടാകൂ - പൈപ്പ്ലൈനിന്റെ വലിയ ആഴം, അതിനാൽ, സോപാധിക ശാഖകൾക്ക് ശക്തമായ "ഇഷ്ടപ്പെടാത്തത്". എന്നിരുന്നാലും, പൈപ്പ്ലൈൻ നീളം കൂട്ടുന്നത് ഉയർന്ന ആവൃത്തികളിലേക്കുള്ള പരിവർത്തനത്തിന്റെ അനിവാര്യമായ ദോഷമാണ്. സമീപ വർഷങ്ങളിൽ ഇന്റലിൽ നിന്നുള്ള ഏറ്റവും മനോഹരമായ പ്രോസസറാണിതെന്ന് ഞാൻ വ്യക്തിപരമായി കരുതുന്നു. ഞങ്ങൾ ഇപ്പോൾ വൈദ്യുതി ഉപഭോഗത്തെക്കുറിച്ചോ തണുപ്പിക്കൽ ആവശ്യകതകളെക്കുറിച്ചോ സംസാരിക്കുന്നില്ല - ഇതിൽ പ്രശ്നങ്ങളൊന്നും ഉണ്ടാകില്ലെന്ന് നമുക്ക് പ്രതീക്ഷിക്കാം. വിലയെ സംബന്ധിച്ചിടത്തോളം, അത് അമിതമാകില്ലെന്ന് വിശ്വസിക്കാൻ കാരണമുണ്ട്. രണ്ടാമത്തെ ലെവൽ കാഷെയുടെ വലുപ്പം നോക്കാം - 1MB, അപ്പോൾ അനുബന്ധ സെലറോൺ എന്താണ് പ്രതിനിധീകരിക്കുന്നത്? ഇതിന് 512KB കാഷെ ഉണ്ടാകുമോ? ഇത് ഇനി ഒരു സെലറോണായിരിക്കില്ല, ഒരുതരം പോക്കറ്റ് രാക്ഷസനാണ്. പല ആപ്ലിക്കേഷനുകൾക്കും, 256KB കാഷെ മതിയാകും, അതിനാൽ ചിലവ് കുറയ്ക്കുന്നതിന് വലിയ മാർജിൻ ഉണ്ട്. ഒരു പുതിയ സാങ്കേതിക പ്രക്രിയയിലേക്കുള്ള മാറ്റം വലിയ നേട്ടങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നുവെന്ന് പ്രത്യേകം പറയേണ്ടതില്ല.
എന്നിരുന്നാലും, പ്രോസസറിന്റെ വില നാടകീയമായി വർദ്ധിപ്പിക്കാൻ കഴിയുന്ന ഒരു സാഹചര്യമുണ്ട്. അതിന് യോഗ്യരായ എതിരാളികൾ ഉണ്ടാകുമോ? അത്തരമൊരു എതിരാളിയുടെ മുന്നിൽ, AMD - അത്‌ലോൺ 64-ൽ നിന്നുള്ള ഒരു പുതിയ 64-ബിറ്റ് പ്രോസസർ കാണാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു. അതിനെക്കുറിച്ച് സവിശേഷതകൾഇതിനകം പലതും പറഞ്ഞിട്ടുണ്ട്, ഇത് എങ്ങനെ ഡവലപ്പർമാരെ ആകർഷിക്കുമെന്ന് നോക്കാം.
AMD ഒടുവിൽ SSE2 പിന്തുണ നടപ്പിലാക്കി, അത് നല്ലതാണ്. പ്രോഗ്രാമിൽ SSE2 ഉപയോഗിക്കുന്നതുകൊണ്ട് ഇപ്പോൾ ഇന്റൽ പ്രോസസ്സറുകൾക്ക് പ്രയോജനം ലഭിക്കില്ല. നിങ്ങൾക്കറിയാവുന്നതുപോലെ, അത്‌ലോൺ 64 ന് നിരവധി ഓപ്പറേറ്റിംഗ് മോഡുകൾ ഉണ്ട് - അനുയോജ്യത മോഡും 64-ബിറ്റ് മോഡും, ഇത് യഥാർത്ഥത്തിൽ എല്ലാ സാധ്യതകളും തുറക്കുന്നു. പുതിയ വാസ്തുവിദ്യഎഎംഡി x86-64. കോംപാറ്റിബിലിറ്റി മോഡിൽ, പുതിയ പ്രൊസസർ ഒരു സോഫ്റ്റ്‌വെയർ ഡെവലപ്പറുടെ വീക്ഷണകോണിൽ നിന്ന് 3DNow ഉള്ള പെന്റിയം 4 ആയി അവതരിപ്പിക്കുന്നു! കൂടാതെ SIMD-ഒപ്റ്റിമൈസ് ചെയ്യാത്ത കോഡിന്റെ വെറുപ്പുളവാക്കുന്ന നിർവ്വഹണവും ശാഖകളോടുള്ള വലിയ ഇഷ്ടക്കേടും പോലുള്ള ചില പ്രത്യേക പോരായ്മകളില്ല. പുതിയ എഎംഡി പ്രോസസർ സാധാരണ പെന്റിയം 4 ന് യോഗ്യമായ എതിരാളിയായിരിക്കുമെന്ന് നമുക്ക് സുരക്ഷിതമായി പറയാൻ കഴിയും, തീർച്ചയായും അത് റിംഗിൽ എത്തിക്കാൻ കഴിയും.
വിപുലമായ ആപ്ലിക്കേഷനുകൾ ഉൾക്കൊള്ളുന്ന ഇന്റഗ്രേറ്റഡ് ടെസ്റ്റുകളിൽ പുതിയ അത്‌ലോണിന്റെ പ്രകടനവുമായി പൊരുത്തപ്പെടുന്നതിന് ഒരു പരമ്പരാഗത പെന്റിയം 4 പ്രോസസറിന് വളരെ പ്രധാനപ്പെട്ട ക്ലോക്ക് നേട്ടം ആവശ്യമാണെന്ന് ഒരാൾക്ക് തീർച്ചയായും പ്രവചിക്കാൻ കഴിയും. അതെ, യഥാർത്ഥത്തിൽ, പ്രോസസർ ഇതുവരെ വിപണിയിൽ ഇല്ലെങ്കിലും, പ്രോട്ടോടൈപ്പുകളുടെ ധാരാളം ടെസ്റ്റുകൾ ഉണ്ട്, അവിടെ ഓരോ ഫ്രീക്വൻസി അനുപാതത്തിലും പ്രകടനം അത്ലൺ 64 ന്റെ ഇരട്ടി ഉയർന്നതാണ്.
എന്നാൽ പുതിയ എക്സ്ക്ലൂസീവ് 64-ബിറ്റ് മോഡ് ഡെവലപ്പർക്ക് എന്താണ് വാഗ്ദാനം ചെയ്യുന്നത്? എല്ലാറ്റിന്റെയും നല്ല പുനഃസംയോജനത്തിനു പുറമേ, മൂന്ന് പ്രധാന കാര്യങ്ങളുണ്ട് - രജിസ്റ്ററുകളുടെ എണ്ണം ഇരട്ടിയാക്കൽ, 64-ബിറ്റ് ഗണിതശാസ്ത്രം, ആപ്ലിക്കേഷന്റെ വെർച്വൽ അഡ്രസ് സ്പേസ് 2 ജിബിക്ക് അപ്പുറം വികസിപ്പിക്കൽ. 64-ബിറ്റ് ഗണിതശാസ്ത്രം അതിൽ തന്നെ മനോഹരമാണ്, എന്നാൽ ഇന്ന് ഇതിന് വളരെ ഇടുങ്ങിയ പ്രയോഗമുണ്ട്. ഡെസ്ക്ടോപ്പ് സിസ്റ്റങ്ങൾ. ബഹുഭൂരിപക്ഷം ആപ്ലിക്കേഷനുകൾക്കും, 32 ബിറ്റുകൾ മതിയാകും. 64-ബിറ്റ് ഇന്റിജർ അരിത്മെറ്റിക് ഉപയോഗിക്കുന്നതിന് വളരെ പ്രസക്തമായ ഒരു മേഖല എഎംഡി കണ്ടെത്തിയിട്ടുണ്ട് - ചില ക്രിപ്റ്റോഗ്രഫി ടാസ്ക്കുകളുടെ നിർവ്വഹണം ഗണ്യമായി ത്വരിതപ്പെടുത്തിയിരിക്കുന്നു.
വിലാസ സ്ഥലത്തിന്റെ വിപുലീകരണത്തിന് തീർച്ചയായും സമീപഭാവിയിൽ ആവശ്യക്കാരുണ്ടാകും ഡെസ്ക്ടോപ്പ് ആപ്ലിക്കേഷനുകൾ, എന്നാൽ വരും വർഷങ്ങളിൽ 2 ജിബിയിൽ കൂടുതൽ മെമ്മറി ശേഷിയുള്ള ധാരാളം പേഴ്സണൽ കമ്പ്യൂട്ടറുകൾ ഉണ്ടാകില്ല.
രജിസ്റ്ററുകളുടെ എണ്ണം ഇരട്ടിയാക്കുക മാത്രമാണ് ഇനി ബാക്കിയുള്ളത്. പ്രത്യക്ഷപ്പെടുക അധിക സവിശേഷതകൾഅനാവശ്യ മെമ്മറി ആക്സസ് ഇല്ലാതെ രജിസ്റ്ററുകളിൽ ഉപയോഗിച്ച വേരിയബിളുകൾ സംഭരിക്കുന്നതിന്. രജിസ്റ്ററുകൾ ഉപയോഗിച്ച് ഫംഗ്ഷൻ പാരാമീറ്ററുകൾ കൂടുതൽ കാര്യക്ഷമമായി കൈമാറാൻ സാധിക്കും. മാത്രമല്ല, ഡവലപ്പർ ഇതിനെക്കുറിച്ച് വിഷമിക്കേണ്ടതില്ല, ഒപ്റ്റിമൈസിംഗ് കംപൈലർ എല്ലാം ചെയ്യും. രജിസ്റ്ററുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുന്നത് കോഡിൽ കൂടുതൽ കാര്യക്ഷമമായി സ്വതന്ത്ര നിർദ്ദേശങ്ങൾ സ്ഥാപിക്കാൻ അനുവദിക്കും, ഇത് പ്രോസസർ കൂടുതൽ സാന്ദ്രമായി ലോഡുചെയ്യാൻ അനുവദിക്കും. ഇതും കംപൈലറിന്റെ ഹാർഡി തോളിൽ വീഴും. രണ്ടാമത്തേത് ഏറ്റവും പ്രധാനപ്പെട്ട നേട്ടമായി എനിക്ക് തോന്നുന്നു. കാര്യം അതാണ് ആധുനിക പ്രോസസ്സറുകൾമെമ്മറി ലോഡുചെയ്യാതെ തന്നെ സ്വാപ്പ് രജിസ്റ്ററുകൾ വളരെ കാര്യക്ഷമമായി ഓർഗനൈസുചെയ്യാൻ നിങ്ങളെ അനുവദിക്കുന്ന ഡിഫർഡ് റൈറ്റ് ബഫറുകൾ എന്ന് വിളിക്കപ്പെടുന്ന ധാരാളം എണ്ണം ഉണ്ട്. മെമ്മറിയിലേക്ക് അയച്ചതും ഉടൻ അഭ്യർത്ഥിച്ചതുമായ ഡാറ്റ മെമ്മറിയിൽ നിന്ന് പ്രതീക്ഷിക്കുന്നില്ല, പക്ഷേ ബഫറിൽ നിന്ന് തൽക്ഷണം ലോഡ് ചെയ്യുന്നു. പ്രെസ്‌കോട്ട്, അത്തരം ബഫറുകളുടെ എണ്ണം വർദ്ധിപ്പിച്ചു.
അതെ, സെർവർ സിസ്റ്റങ്ങളിൽ പുതിയ എഎംഡി പ്രോസസറിനായി നല്ല സാധ്യതകൾ നമുക്ക് സുരക്ഷിതമായി അനുമാനിക്കാം. ശാഖകൾ അവനെ ഭയപ്പെടുത്തുന്നില്ല, വിലാസ സ്ഥലം വലുതാണ്, മതിയായ രജിസ്റ്ററുകൾ ഉണ്ട്, അയാൾക്ക് പെട്ടെന്ന് എൻക്രിപ്റ്റ് ചെയ്യാൻ കഴിയും. ഒരു ഡാറ്റാബേസ് സെർവറിന് ഇതെല്ലാം മോശമല്ല. താരതമ്യേന കുറഞ്ഞ വില ഒരു നിശ്ചിത സ്ഥലത്ത് അനുയോജ്യമാക്കും.
എന്നിരുന്നാലും, അതിന്റെ സാധ്യതകൾ ഗണിതപരമായി ഭാരമുള്ളതായി പരിഗണിക്കാം ഗ്രാഫിക്സ് ആപ്ലിക്കേഷനുകൾപേഴ്സണൽ കമ്പ്യൂട്ടറുകൾക്ക്, പ്രാഥമികമായി ത്രിമാന കമ്പ്യൂട്ടർ ഗെയിമുകളിൽ. യഥാർത്ഥത്തിൽ, ഒരു ആധുനിക ഗെയിമിലെ പ്രകടനം എന്താണ്? രണ്ട് പ്രധാന ഘടകങ്ങളിൽ: ഉയർന്ന തലത്തിലുള്ള ഇന്റലിജന്റ് സീൻ പ്രോസസ്സിംഗ്, പോർട്ടൽ ടെക്നോളജി ഉപയോഗിച്ച് അദൃശ്യമായ പ്രാകൃതങ്ങൾ വെട്ടിമാറ്റൽ മുതലായവ, AI കണക്കുകൂട്ടൽ കൂടാതെ ശാരീരിക മാതൃക. ഒരു വീഡിയോ ആക്സിലറേറ്ററിലേക്ക് വേഗത്തിൽ ഡാറ്റ തള്ളാനുള്ള കഴിവാണ് രണ്ടാമത്തെ ഘടകം. വലിയ ക്ലോക്ക് വേഗതയും ഉയർന്ന ആവൃത്തിവിപിയു "ഫീഡിംഗ്" എന്ന പ്രശ്നത്തിൽ സിസ്റ്റം ബസ് ഇന്റലിൽ നിന്നുള്ള പുതിയ പ്രോസസർ പരാജയപ്പെടരുത്. ഗെയിം എഞ്ചിന്റെ പ്രകടനം തന്നെ, എല്ലാം കൂടുതൽ സങ്കീർണ്ണമാണ്. എഎംഡിക്ക് ശാഖകളോട് കൂടുതൽ വിശ്വസ്ത മനോഭാവമുണ്ട്, ഇത് ഇത്തരത്തിലുള്ള കോഡിൽ പലപ്പോഴും സംഭവിക്കാറുണ്ട്. ഒരു വലിയ സംഖ്യക്രമരഹിതമായ ശാഖകൾ ഏതെങ്കിലും ആവൃത്തി പ്രയോജനം റദ്ദാക്കിയേക്കാം. അവസാനമായി, 3DNow! ജ്യാമിതീയ കണക്കുകൂട്ടലുകൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിനുള്ള വളരെ സൗകര്യപ്രദമായ ഒരു കൂട്ടം നിർദ്ദേശങ്ങൾ കാണിക്കണം, അവയിൽ നിറഞ്ഞിരിക്കുന്നു ആധുനിക ഗെയിമുകൾ. മാത്രമല്ല, എഎംഡി അത്‌ലോൺ 64-ന് x86-64 ന്റെ പുതിയ കഴിവുകൾ ഉപയോഗിക്കുന്നതിന് ആപ്ലിക്കേഷനുകൾ വീണ്ടും കംപൈൽ ചെയ്യുന്നത് അഭികാമ്യമാണ്, 3DNow-നുള്ള ഒപ്റ്റിമൈസേഷൻ! ഒരു ഒപ്റ്റിമൈസിംഗ് കംപൈലർ വഴി സ്വയമേവ നിർമ്മിക്കപ്പെടും, ഡെവലപ്പർ പരിശ്രമം ആവശ്യമില്ല.
കാണിക്കരുത് ഇന്റൽ പ്രോസസർ പ്രെസ്‌കോട്ട് പുതിയത്ഒപ്റ്റിമൈസേഷനെ ഗണ്യമായി സുഗമമാക്കുന്ന സൗകര്യപ്രദമായ നിർദ്ദേശങ്ങൾ, എഎംഡി പ്രോസസറിന് ഞാൻ പ്രാഥമിക മുൻഗണന നൽകും, ഒറ്റനോട്ടത്തിൽ, പെന്റിയം 4-ൽ അന്തർലീനമായ വ്യക്തമായ ദുർബലമായ പോയിന്റുകൾ ഇല്ല. എന്നാൽ നമുക്ക് നോക്കാം, മുൻകൂട്ടി പറയാൻ പ്രയാസമാണ്.
ഇന്റൽ ഡെവലപ്പർമാർക്ക് പുതിയ നിർദ്ദേശങ്ങളിൽ നിന്ന് പരമാവധി വേഗത ലഭിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കാൻ ഒപ്റ്റിമൈസ് ചെയ്ത ഫീച്ചറുകളുടെ വിപുലമായ ശ്രേണി നൽകുന്നു. x86-64 ന്റെ കഴിവുകൾ പൂർണ്ണമായി പ്രയോജനപ്പെടുത്തുന്ന ലൈബ്രറികളുടെ ഒരു കൂട്ടം പ്രഖ്യാപിച്ചുകൊണ്ട് എഎംഡിയും ഈ പാത പിന്തുടർന്നു.
ഞാൻ വിചാരിച്ചത് ഇതാണ്, ഇന്റൽ പ്രെസ്‌കോട്ട് പ്രോസസറുകൾ അവതരിപ്പിക്കാൻ പോകുന്നുവെന്ന് വിചിത്രമായ കിംവദന്തികൾ ഉണ്ടായിരുന്നു എഎംഡി ആർക്കിടെക്ചർ x86-64, പ്രത്യേകിച്ചും അത് വിജയകരമാണെങ്കിൽ. ഇത് അൽപ്പം അവിശ്വസനീയമാണ്, ഇത് മുമ്പ് സംഭവിച്ചിട്ടില്ല. നേരെമറിച്ച്, പുതിയ അത്‌ലോണിൽ എഎംഡി ഉൾപ്പെടുത്തരുത്, കാരണം ഇത് പ്രോസസറുകളുടെ റിലീസ് ഇപ്പോഴും വൈകുന്നു? അധിക നിർദ്ദേശങ്ങൾപ്രെസ്കോട്ട് പ്രോസസർ? അപ്പോൾ എല്ലാം ഒപ്റ്റിമൈസ് ചെയ്തു ഇന്റൽ ലൈബ്രറികൾഎഎംഡി പ്രോസസറുകളിൽ സവിശേഷതകൾ മികച്ച രീതിയിൽ പ്രവർത്തിക്കും. പ്രെസ്‌കോട്ട് പ്രോസസറിന് സൗകര്യപ്രദമായ നിർദ്ദേശങ്ങൾ കാരണം ഒരു നേട്ടവും ഉണ്ടാകില്ല. മാത്രമല്ല, ഒറ്റനോട്ടത്തിൽ ഇത് ചെയ്യുന്നത് വളരെ ബുദ്ധിമുട്ടുള്ള കാര്യമല്ല; എഎംഡി പ്രോസസറുകൾ വളരെക്കാലമായി ഫ്ലെക്സിബിൾ 3DNow പ്രവർത്തനങ്ങൾ നടത്തുന്നു! പകരം, കൂടുതൽ അനുയോജ്യമായ ഒരു ആർക്കിടെക്ചർ കാരണം എഎംഡി സമാനമായ "തിരശ്ചീന" ഡാറ്റാ ഓപ്പറേഷനുകൾ അവതരിപ്പിക്കുമെന്ന് പ്രതീക്ഷിക്കാം. പ്രൊസസർ കോർ, ഒന്നാമതായി, കുറഞ്ഞ ആവൃത്തി, കൂടുതൽഎക്സിക്യൂട്ടിംഗ് മൊഡ്യൂളുകൾ മുതലായവ.
ഈ സുപ്രധാന ഒഴിവാക്കൽ ശരിയാക്കുമെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു, പ്രത്യേകിച്ചും എ‌എം‌ഡിക്ക് അതിന്റെ പ്രോസസ്സറുകളിൽ എസ്എസ്ഇ വിപുലീകരണങ്ങൾ നടപ്പിലാക്കേണ്ടിവരുമെന്നതിനാൽ, എല്ലായ്പ്പോഴും സംഭവിച്ചതുപോലെ.

MMX പൂർണ്ണമായി മാറ്റിസ്ഥാപിക്കുക എന്ന ലക്ഷ്യത്തോടെ SSE2 SSE നിർദ്ദേശ സെറ്റ് വികസിപ്പിക്കുന്നു. 70 നിർദ്ദേശങ്ങൾ മാത്രമുള്ള SSE-യിൽ SSE2 സെറ്റ് 144 പുതിയ നിർദ്ദേശങ്ങൾ ചേർത്തു.

പ്രത്യേകതകൾ

  • എസ്എസ്ഇ 2-ൽ എസ്എസ്ഇ എക്സ്റ്റൻഷൻ ഇൻപുട്ടിനൊപ്പം x86 ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) ഉപയോഗിക്കുന്നു, അവ ഓരോന്നും തുടർച്ചയായി 2 ഇരട്ട-പ്രിസിഷൻ ഫ്ലോട്ടിംഗ് പോയിന്റ് മൂല്യങ്ങളായി കണക്കാക്കുന്നു.
  • SSE2, സ്കെയിലർ, ബോക്‌സ്ഡ് ഡാറ്റാ തരങ്ങളിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്ന ഒരു ഇൻസ്ട്രക്ഷൻ സെറ്റ് ഉൾപ്പെടുന്നു.
  • SSE2-ൽ അതേ 128-ബിറ്റ് xmm രജിസ്റ്ററുകളിൽ ഇന്റിജർ ഡാറ്റയുടെ സ്ട്രീം പ്രോസസ്സിംഗിനുള്ള നിർദ്ദേശങ്ങൾ അടങ്ങിയിരിക്കുന്നു, ഈ വിപുലീകരണം വളരെ മുമ്പുള്ള MMX നിർദ്ദേശ ഗണത്തേക്കാൾ പൂർണ്ണസംഖ്യ കണക്കുകൂട്ടലുകൾക്ക് അനുയോജ്യമാക്കുന്നു.
  • എസ്എസ്ഇ2-ൽ രണ്ട് ഭാഗങ്ങൾ ഉൾപ്പെടുന്നു - എസ്എസ്ഇയുടെ തുടർച്ചയും എംഎംഎക്സിന്റെ തുടർച്ചയും.
    • എസ്എസ്ഇയുടെ തുടർച്ച യഥാർത്ഥ സംഖ്യകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു.
    • തുടർച്ച MMX പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു. SSE2-ൽ, MMX (64 ബിറ്റുകൾ -> 128 ബിറ്റുകൾ) അപേക്ഷിച്ച് രജിസ്റ്ററുകൾ ഇരട്ടിയായി. കാരണം പ്രബോധന നിർവ്വഹണത്തിന്റെ വേഗത മാറിയിട്ടില്ല; SSE2-നായി ഒപ്റ്റിമൈസ് ചെയ്യുമ്പോൾ, പ്രോഗ്രാമിന് പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് ലഭിക്കുന്നു. MMX-നായി പ്രോഗ്രാം ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, കമാൻഡ് സിസ്റ്റത്തിന്റെ സമാനത കാരണം SSE2-നുള്ള ഒപ്റ്റിമൈസേഷൻ താരതമ്യേന എളുപ്പമാണ്.
  • വിവരങ്ങളുടെ അനിശ്ചിത സ്ട്രീമുകൾ പ്രോസസ്സ് ചെയ്യുമ്പോൾ കാഷെ മലിനീകരണം കുറയ്ക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തിട്ടുള്ള നിരവധി കാഷെ മാനേജ്മെന്റ് നിർദ്ദേശങ്ങൾ SSE2-ൽ ഉൾപ്പെടുന്നു.
  • SSE2-ൽ നമ്പർ കൺവേർഷൻ കമാൻഡുകളിലേക്ക് സങ്കീർണ്ണമായ കൂട്ടിച്ചേർക്കലുകൾ ഉൾപ്പെടുന്നു

ലിങ്കുകൾ


x86 ഫാമിലി പ്രൊസസ്സറുകൾക്കുള്ള അടിസ്ഥാന നിർദ്ദേശ വിപുലീകരണ സെറ്റുകൾ
MMX | MMXEXT | എസ്എസ്ഇ | SSE2| SSE3 | SSSE3 | SSE4 | ATA | 3Dഇപ്പോൾ! | 3DNowExt | SSE5 | AVX | എഇഎസ്

വിക്കിമീഡിയ ഫൗണ്ടേഷൻ. 2010.

മറ്റ് നിഘണ്ടുവുകളിൽ "SSE2" എന്താണെന്ന് കാണുക:

    SSE2- SSE2, സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2, IA 32 SIMD (സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, മൾട്ടിപ്പിൾ ഡാറ്റ) ഇൻസ്ട്രക്ഷൻ സെറ്റുകളിൽ ഒന്നാണ്. 2001-ൽ പെന്റിയം 4-ന്റെ പ്രാരംഭ പതിപ്പുമായി ഇന്റൽ ആണ് SSE2 ആദ്യമായി അവതരിപ്പിച്ചത്. ഇത് മുമ്പത്തെ SSE ഇൻസ്ട്രക്ഷൻ സെറ്റ് വിപുലീകരിക്കുന്നു,… … വിക്കിപീഡിയ

    SSE2- (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die Verarbeitung von… … Deutsch Wikipedia

    SSE2- Saltar a navegación, búsqueda SSE2 es el acrónimo de Streaming Single Instruction Multiple Data Extensions 2 es uno de los conjuntos de instrucciones de la arquitectura IA 32 SIMD. Fue utilizada por Primera vez en la Primera versión del Pentium 4 ... Wikipedia Español

    SSE2- സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ 2 സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ 2, പൊതുവായി ചുരുക്കി SSE2. Elle est composée de 144 നിർദ്ദേശങ്ങൾ et fait son apparition avec le Pentium 4 d Intel. Elle gère des registres 128 bits pour les entiers et les flottants… … Wikipedia en Français

    SSE2- സ്ട്രീമിംഗ് സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, ഒന്നിലധികം ഡാറ്റ എക്സ്റ്റൻഷനുകൾ 2 (കമ്പ്യൂട്ടിംഗ്) … സംക്ഷിപ്ത നിഘണ്ടു

    എസ്എസ്ഇ 2- SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die Verarbeitung… … Deutsch Wikipedia

    സ്ട്രീമിംഗ് SIMD വിപുലീകരണങ്ങൾ 2- SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Intel Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die… …Deutsch Wikipedia

    SSE2 (ഇംഗ്ലീഷ് സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2, സ്ട്രീമിംഗ് SIMD പ്രോസസർ എക്സ്റ്റൻഷൻ) ഒരു പെന്റിയം 4 ആണ്. SSE2, x86 ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) ഉപയോഗിക്കുന്നു, അവ ഓരോന്നും 2 ആയി കണക്കാക്കുന്നു. ... ... വിക്കിപീഡിയ

    എഎംഡി പ്രോസസറുകളുടെ താരതമ്യം- ഈ ലിസ്റ്റ് അപൂർണ്ണമാണ്; ഇത് വിപുലീകരിച്ചുകൊണ്ട് നിങ്ങൾക്ക് സഹായിക്കാനാകും. പ്രോസസർ കോഡ് പേരുകളുടെ നിറങ്ങൾ ഒരേ കോർ സൂചിപ്പിക്കുന്നു. ആർച്ചി ടെക്‌ചർ ഫാമിലി കോഡ് നെയിം മോഡൽ ഗ്രൂപ്പ് സ്പീഡ് (MHz) സോക്കറ്റ് പ്രോസസ് (nm) കോറുകൾ FSB/HT (MHz) കാഷെ (KiB) മെമ്മറി കൺട്രോളർ ... വിക്കിപീഡിയ

    AMD അത്‌ലോൺ 64 മൈക്രോപ്രൊസസ്സറുകളുടെ പട്ടിക- ഈ ലിസ്റ്റ് അപൂർണ്ണമാണ്; ഇത് വിപുലീകരിച്ചുകൊണ്ട് നിങ്ങൾക്ക് സഹായിക്കാനാകും. എഎംഡിയിൽ നിന്നുള്ള അത്‌ലോൺ 64 മൈക്രോപ്രൊസസർ ഉപഭോക്തൃ വിപണിയെ ലക്ഷ്യമിട്ടുള്ള എട്ടാം തലമുറ സിപിയു ആണ്. ഉള്ളടക്കം 1 സിംഗിൾ കോർ ഡെസ്‌ക്‌ടോപ്പ് പ്രോസസ്സറുകൾ 1.1 അത്‌ലോൺ 64 ... വിക്കിപീഡിയ

പല ഉപയോക്താക്കളും, വിവിധ ആപ്ലിക്കേഷനുകൾ ഇൻസ്റ്റാൾ ചെയ്യുമ്പോൾ, സന്ദേശം നേരിടുന്നു "പ്രോസസർ SSE2 നിർദ്ദേശ സെറ്റിനെ പിന്തുണയ്ക്കുന്നില്ല". പഴയ ഹാർഡ്‌വെയർ ഉള്ള കമ്പ്യൂട്ടറുകളിൽ ഈ പിശക് സംഭവിക്കുകയും ഉപയോക്താക്കളെ ആശയക്കുഴപ്പത്തിലാക്കുകയും ചെയ്യുന്നു - വിൻഡോസ് പ്രശ്‌നങ്ങളില്ലാതെ പ്രവർത്തിക്കുന്നുണ്ടെന്ന് തോന്നുന്നു, പക്ഷേ പ്രോഗ്രാം ഇൻസ്റ്റാൾ ചെയ്യാൻ ആഗ്രഹിക്കുന്നില്ല. ഞങ്ങൾ ശ്രമിക്കും വ്യക്തമായ ഭാഷയിൽഇത് ഏത് തരത്തിലുള്ള SSE2 സാങ്കേതികവിദ്യയാണെന്നും ഒരു പിസിയിൽ അതിന്റെ പ്രവർത്തനങ്ങൾ എന്താണെന്നും പറയുക. Windows-ൽ SSE2 നിർദ്ദേശങ്ങൾക്കുള്ള പിന്തുണ നിങ്ങൾക്ക് പ്രവർത്തനക്ഷമമാക്കാനാകുമോ എന്നും നിങ്ങൾ കണ്ടെത്തും.

ഒരു കമ്പ്യൂട്ടറിലെ SSE2 എന്താണ്?

SSE2 സാങ്കേതികവിദ്യനിങ്ങളുടെ പ്രോസസറിൽ ഒരു കൂട്ടം നിർദ്ദേശങ്ങൾ നടപ്പിലാക്കുന്ന 32-ബിറ്റ് ആർക്കിടെക്ചറിലേക്കുള്ള ഒരു വിപുലീകരണമാണ്. നിർദ്ദേശങ്ങളുടെ കൂട്ടം കൂടുതൽ, സിസ്റ്റം അഭ്യർത്ഥനകൾ പ്രോസസ്സ് ചെയ്യുന്നതിനുള്ള പ്രോസസറിന് കൂടുതൽ കഴിവുണ്ട്. ഉദാഹരണത്തിന്, ആദ്യത്തെ CCE-യിലെ കമാൻഡുകളുടെ കൂട്ടം 70 ആയിരുന്നു, എന്നാൽ രണ്ടാമത്തെ പതിപ്പ് ഇതിനകം 144-നെ പിന്തുണയ്ക്കുന്നു.

എസ്എസ്ഇ2 നിർദ്ദേശങ്ങൾ മുൻകാല പ്രൊസസറുകൾക്ക് ലഭ്യമല്ല, ഇവയാണ്: എഎംഡി (അത്‌ലോൺ 64 വരെ), ഇന്റൽ (പെന്റിയം 4 വരെ), കൂടാതെ വിഐഎ സി3, ട്രാൻസ്മെറ്റാ ക്രൂസോ എന്നിവയും. പിന്നീടുള്ള എല്ലാ വരികളും പിന്തുണയ്ക്കുന്നു ഈ സാങ്കേതികവിദ്യ. ഇവിടെ മുഴുവൻ പട്ടികഉപകരണങ്ങൾ.

പ്രശ്നത്തെക്കുറിച്ച് എന്തുചെയ്യണം?

ഇതിനകം വ്യക്തമായത് പോലെ, "ഈ പ്രോഗ്രാമിന് SSE2 നിർദ്ദേശങ്ങൾ പിന്തുണയ്ക്കുന്ന ഒരു കമ്പ്യൂട്ടർ ആവശ്യമാണ്" എന്ന പിശക് സംഭവിക്കുന്നത്, അതിന്റെ "പുരാതനത" കാരണം അതിന്റെ നിർവ്വഹണം പ്രോസസ്സർ പിന്തുണയ്ക്കാത്ത ഒരു ആപ്ലിക്കേഷൻ ഇൻസ്റ്റാൾ ചെയ്യാൻ ശ്രമിക്കുമ്പോഴാണ്. ബ്രൗസറുകളുടെ നിലവിലെ പതിപ്പുകൾ (ഫയർഫോക്സ്, ഓപ്പറ, ക്രോം,) ഇൻസ്റ്റാൾ ചെയ്യുമ്പോൾ ഈ പ്രശ്നം പലപ്പോഴും സംഭവിക്കാറുണ്ട്. ഇന്റർനെറ്റ് എക്സ്പ്ലോറർ), മൂന്നാം കക്ഷി ആപ്ലിക്കേഷനുകൾ(ഓഫീസ്, സ്കൈപ്പ്, നോർട്ടൺ ആന്റിവൈറസ്മുതലായവ), അല്ലെങ്കിൽ Windows OS വീണ്ടും ഇൻസ്റ്റാൾ ചെയ്യുമ്പോൾ.


നിങ്ങൾക്ക് ലഭിച്ചെങ്കിൽ ഈ പിശക്, പിന്നെ കൂടുതൽ ചോയ്‌സ് ഇല്ല: ഹാർഡ്‌വെയർ അപ്‌ഡേറ്റ് ചെയ്യുക - ഇൻ അവസാന ആശ്രയമായി മദർബോർഡ്കൂടാതെ പ്രോസസ്സർ, അല്ലെങ്കിൽ കൂടുതൽ ഇൻസ്റ്റാൾ ചെയ്യുക മുമ്പത്തെ പതിപ്പ്സോഫ്റ്റ്വെയർ നിങ്ങളുടെ പിസിക്കായി പുതിയ ഭാഗങ്ങൾ വാങ്ങാൻ നിങ്ങൾ ആഗ്രഹിക്കുന്നില്ലെങ്കിൽ, പ്രോസസറിന്റെ ആവശ്യകതകളുമായി പൊരുത്തപ്പെടുന്ന നിങ്ങളുടെ പ്രോഗ്രാമിനായി പഴയ പതിപ്പുകൾ കണ്ടെത്തുക. ഉദാഹരണത്തിന്, SSE2 ആവശ്യമില്ലാത്ത ബ്രൗസർ പതിപ്പുകൾ: Opera 20.0.1387.91, Chrome 35.0.1870.2, 48 പതിപ്പിന് താഴെയുള്ള Firefox. പൂർണ്ണമായ ലിസ്റ്റ് ഇതാ.

ബ്രൗസറുകളുടെ പഴയ പതിപ്പുകളിൽ പല സൈറ്റുകളുടെയും എൻക്രിപ്ഷനും പ്രോട്ടോക്കോളുകളും പിന്തുണയ്ക്കില്ല എന്നത് ശ്രദ്ധിക്കുക. കൂടാതെ, അത്തരം സോഫ്‌റ്റ്‌വെയറുകളുടെ യാന്ത്രിക-അപ്‌ഡേറ്റ് പ്രവർത്തനരഹിതമാക്കാൻ മറക്കരുത്. അപ്‌ഡേറ്റുകൾ എങ്ങനെ അപ്രാപ്‌തമാക്കാം, ഇന്റർനെറ്റിൽ തിരയുക എന്നതിന് നിരവധി നിർദ്ദേശങ്ങളുണ്ട്.

SSE2 പ്രവർത്തനക്ഷമമാക്കാൻ കഴിയുമോ?

ഈ പിശക് പ്രത്യക്ഷപ്പെട്ടതിന് ശേഷം, സിസ്റ്റത്തിൽ ഈ "ഓപ്ഷൻ" പ്രവർത്തനക്ഷമമാക്കുന്നത് സാധ്യമാക്കുന്ന നിർദ്ദേശങ്ങൾക്കായി പല ഉപയോക്താക്കളും തിരയുന്നു; ചിലർ പതിവിലും കുറച്ചുകൂടി കാര്യങ്ങൾ മനസ്സിലാക്കുകയും ബയോസിലേക്ക് പോകുകയും ചെയ്യുന്നു. നിങ്ങളുടെ കമ്പ്യൂട്ടറിൽ CCE2 പ്രവർത്തനക്ഷമമാക്കാൻ അനുവദിക്കുന്ന പാച്ചുകളെക്കുറിച്ചുള്ള പരാമർശങ്ങൾ എവിടെയോ ഉണ്ട്, എന്നാൽ അധിക ലോഡിന് പുറമെ അവയ്ക്ക് യാതൊരു ഫലവുമില്ല. അത്തരം മോഡുകൾ പിശകിനുള്ള പരിഹാരമായി കാണപ്പെടുന്നു

നിങ്ങളുടെ പ്രോസസറിന്റെ സവിശേഷതകൾ കാണുന്നതിന് നിങ്ങൾക്ക് CPU-Z പ്രോഗ്രാം ഉപയോഗിക്കാം. നിർദ്ദേശങ്ങളുടെ വരിയിൽ SSE2 സൂചിപ്പിച്ചിട്ടില്ലെങ്കിൽ, ഒന്നും ചെയ്യാൻ കഴിയില്ല.


CPU-Z പ്രോഗ്രാം - പ്രോസസ്സർ സവിശേഷതകൾ പരിശോധിക്കുന്നു

ഉപസംഹാരം

മിക്കപ്പോഴും, പ്രിന്റിംഗ്, പരിമിതമായ ഇന്റർനെറ്റ് സർഫിംഗ്, ഡോക്യുമെന്റേഷൻ തുടങ്ങിയ ചില ആവശ്യങ്ങൾക്ക് മാത്രമേ കമ്പ്യൂട്ടർ ആവശ്യമുള്ളൂ - അതിനാൽ "പ്രോസസർ SSE2 പിന്തുണയ്ക്കുന്നില്ല" എന്ന പിശക് പരിഹരിക്കുന്ന സോഫ്റ്റ്വെയറിന്റെ ഉചിതമായ പതിപ്പ് ഡൗൺലോഡ് ചെയ്യാൻ നിങ്ങൾക്ക് സ്വയം പരിമിതപ്പെടുത്താം. എന്നാൽ ഏതൊരു ഹാർഡ്‌വെയറിനും ക്ഷീണിച്ച പോയിന്റ് ഉണ്ട്, അതിനാൽ നിങ്ങളുടെ പിസി ഹാർഡ്‌വെയർ അപ്‌ഡേറ്റ് ചെയ്യാൻ തയ്യാറാകുക.

ഒരു ദിവസം എനിക്ക് ഒരു ബജറ്റ് ആവശ്യമായിരുന്നു, മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ വിലകുറഞ്ഞതാണ് ഇന്റർനെറ്റിനുള്ള കമ്പ്യൂട്ടർ.ഒരു കാരണത്താൽ ഞാൻ അത് ബോൾഡായി എടുത്തുകാണിച്ചു, മുമ്പും ഇന്നുംഇന്റർനെറ്റ് സർഫിംഗിനല്ലാതെ മറ്റൊന്നിനും അനുയോജ്യമല്ലാത്ത ഒരു ദുർബലമായ പിസിയുടെ സവിശേഷതയുള്ള ഒരു പദമുണ്ടായിരുന്നു.

പിന്നെ എന്തിനാണ് ഈ പദം? വിൻഡോസ് എക്സ്പിയും sse2 പിന്തുണയ്ക്കാത്ത പ്രോസസ്സറുകളും ഉള്ള ഉപയോക്താക്കൾക്കായി എല്ലാ കമ്പനികളും അവരുടെ സോഫ്റ്റ്വെയർ അപ്‌ഡേറ്റ് ചെയ്യുന്നത് പെട്ടെന്ന് നിർത്തി എന്നതാണ് കാര്യം. അടിപൊളിയാണോ? അല്ല അങ്ങനെ ഒന്നും ഇല്ല! സങ്കടം പോലും.

പ്രോസസ്സർ sse2 പിന്തുണയ്ക്കുന്നില്ലെങ്കിൽ, നിങ്ങൾ:

  1. നിങ്ങൾക്ക് വിൻഡോസിന്റെ ഏറ്റവും പുതിയ പതിപ്പ് ഇൻസ്റ്റാൾ ചെയ്യാൻ കഴിയില്ല. അല്ലെങ്കിൽ, വിൻഡോസ് 7 പോലും ഇൻസ്റ്റാൾ ചെയ്യരുത്.
  2. അനാവശ്യമായ അമിഗോയും സഫാരിയും പോലും ഒരു ബ്രൗസറും ഇൻസ്റ്റാൾ ചെയ്യരുത്. XP ചിപ്പ് 2010-ന്റെ ഒരു ബിൽഡ് എനിക്കുണ്ടായതും എനിക്ക് ഇൻസ്റ്റാൾ ചെയ്യാൻ കഴിയുന്ന പഴയ ബ്രൗസറുകൾ ഉണ്ടായിരുന്നതും ഞാൻ ഭാഗ്യവാനായിരുന്നു.
  3. 30% സൈറ്റുകൾ തുറക്കുന്നതിൽ പരാജയപ്പെടുന്നു, ശേഷിക്കുന്ന 70 ൽ പകുതിയും ഭാഗികമായി പ്രവർത്തനരഹിതമായിരിക്കും.
  4. നിങ്ങൾക്ക് ഓൺലൈനിൽ സിനിമകൾ കാണാൻ കഴിയില്ല. പകുതി സൈറ്റുകളിൽ അവർ നിങ്ങൾക്ക് അയയ്‌ക്കും... അർത്ഥത്തിൽ അപ്‌ഡേറ്റ് ചെയ്യാൻ, എന്നാൽ രണ്ടാം പകുതിയിൽ, സിനിമയുടെ ഓരോ സെക്കൻഡും 2-5 സെക്കൻഡ് നീണ്ടുനിൽക്കും.

എനിക്ക് ഇത് വളരെക്കാലം പട്ടികപ്പെടുത്താം, പക്ഷേ ആവശ്യമില്ല. അങ്ങനെ എല്ലാം വ്യക്തമാണ്. അതിനാൽ - ഇന്റർനെറ്റ് കമ്പ്യൂട്ടറുകൾ വംശനാശം സംഭവിച്ചു.ദുർബലരും സാധാരണക്കാരും മാത്രം അവശേഷിച്ചു.

പ്രോസസർ sse2-നെ പിന്തുണയ്ക്കുന്നില്ല - ഞാൻ എന്തുചെയ്യണം?

ഇന്റർനെറ്റ് തെറ്റിദ്ധരിപ്പിക്കുന്ന വിവരങ്ങളാൽ നിറഞ്ഞിരിക്കുന്നു, ഉദാഹരണത്തിന്, sse2-ലെ പ്രോസസ്സർ പരിശോധനയെ മറികടക്കുന്നു. അസംബന്ധം, നിങ്ങൾക്ക് ഇത് മറികടക്കാൻ കഴിയില്ല, അല്ലെങ്കിൽ നിങ്ങൾക്ക് കഴിയും, എന്നാൽ നിങ്ങൾ ധാരാളം കോഡുകൾ മാറ്റേണ്ടതുണ്ട്, ഇത് ഓരോ പ്രോഗ്രാമിനും വെവ്വേറെയാണ്. ആ. അത് നിഷിദ്ധമാണ്! അമ്മ അനുവദിച്ചാൽ മാത്രമേ നിങ്ങൾക്ക് ശതമാനം മാറ്റാൻ കഴിയൂ, പക്ഷേ എന്റെ കാര്യത്തിൽ അങ്ങനെയല്ല.

sse2 ആവശ്യമില്ലാത്ത ഒരു ബ്രൗസർ ഡൗൺലോഡ് ചെയ്യുക

സുഹൃത്തുക്കളേ, നിങ്ങളോട് എനിക്ക് വളരെ ഖേദമുണ്ട്, അതിനാൽ ഞാൻ നിങ്ങളുമായി പഴയ ബ്രൗസറുകൾ പങ്കിടുന്നു (ഓപ്പറ, mozila firefox, google chrome) ഇൻസ്റ്റാളേഷൻ സമയത്ത് നിങ്ങൾ ഒരു പിശകും കാണരുത്. സൗജന്യമായി ഡൗൺലോഡ് ചെയ്യുക

മുലകുടിക്കുന്നവൻ ഒരു മാമോത്തല്ല, അവൻ വംശനാശം സംഭവിക്കുകയില്ല

കമ്പ്യൂട്ടറുകൾ നശിച്ചു, പക്ഷേ മുലകുടിക്കുന്നവർ ഒരിക്കലും ചെയ്തില്ല! വ്യക്തമായ ഒരു ഉദാഹരണം ഇതാ - . ഇത് ഒരു വെബ്‌മാസ്റ്റർ ആണെന്ന് തോന്നുന്നു, ഒരു പ്രോഗ്രാമർ എന്ന് പോലും ഒരാൾ പറഞ്ഞേക്കാം, പക്ഷേ ഇത് എഫ് ... വാങ്ങിയതാണ്. അതെങ്ങനെ ബ്രോ? അതിനെക്കുറിച്ച് ചിന്തിക്കുക, ഞാൻ അത് തുറന്നു, ഞാൻ കാണുന്നു - പിസി 1.8 GHz, 2 GB റാം, 512 വീഡിയോ, 500 വാട്ട് പവർ സപ്ലൈ, 120 HDD, കൂടാതെ ഇതെല്ലാം $20 ന്. ഞാൻ വേഗം ഓടി, കാരണം... അനലോഗുകൾ 2 മടങ്ങ് കൂടുതൽ ചെലവേറിയതാണ്, ഞാൻ അത് വാങ്ങി, ഇത് ഒരു പാഴായതായി ഞാൻ കരുതുന്നു, പക്ഷേ ഞാൻ പി…. ഞാൻ വീട്ടിൽ വന്നു, ഞാൻ എല്ലാം ഇൻസ്റ്റാൾ ചെയ്യാൻ ശ്രമിക്കുന്നു, പക്ഷേ എനിക്ക് എല്ലാത്തരം പിശകുകളും ലഭിക്കുന്നു, ഇത് വിറകാണെന്ന് ഞാൻ കരുതി, പക്ഷേ അത് sse2 ആയി മാറി. ഒറ്റവാക്കിൽ സങ്കടം.

2020 ജനുവരി വരെ. 2009-ൽ പുറത്തിറങ്ങിയ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിനായുള്ള പിന്തുണ പരിഷ്കരിക്കാൻ കമ്പനിക്ക് ഉദ്ദേശ്യമില്ലെങ്കിലും, പിന്തുണ പരിമിതപ്പെടുത്തുകയും സമീപകാല അപ്‌ഡേറ്റുകളിൽ കണ്ടെത്തിയ പ്രശ്നങ്ങൾ അവഗണിച്ച് വിൻഡോസിന്റെ പുതിയ പതിപ്പുകളിലേക്ക് അപ്‌ഗ്രേഡ് ചെയ്യാൻ ഉപയോക്താക്കളെ നിർബന്ധിക്കാൻ റെഡ്മണ്ട് ശ്രമിക്കുന്നതായി തോന്നുന്നു.

സാങ്കേതിക പിന്തുണാ ഏജന്റുകൾ ഉപയോക്താക്കൾക്ക് പിന്തുണാ സേവനങ്ങൾ നൽകില്ലെന്ന് മൈക്രോസോഫ്റ്റ് ഈ മാസം അറിയിച്ചു വിൻഡോസ് ഫോറങ്ങൾമൈക്രോസോഫ്റ്റ് കമ്മ്യൂണിറ്റി സൈറ്റിലെ 7, വിൻഡോസ് 8 എന്നിവ, ഈ ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളെ ഇപ്പോഴും കമ്പനി പിന്തുണയ്ക്കുന്നുണ്ടെങ്കിലും.

വിൻഡോസിനെക്കുറിച്ചുള്ള ജനപ്രിയ പുസ്തകങ്ങളുടെ രചയിതാവ് വുഡി ലിയോൺഹാർഡ് മറ്റൊരു സംഭവം റിപ്പോർട്ട് ചെയ്തു - ചില പ്രത്യേക തരം പ്രോസസ്സറുകളുള്ള ചില വിൻഡോസ് 7 സിസ്റ്റങ്ങൾക്കുള്ള പിന്തുണ മൈക്രോസോഫ്റ്റ് അവസാനിപ്പിച്ചു. 2018 മാർച്ചിലെ പാച്ച് ചൊവ്വാഴ്ച, Windows 7-നുള്ള മറ്റൊരു അപ്‌ഡേറ്റ് പുറത്തിറങ്ങി, SSE2-നെ പിന്തുണയ്‌ക്കാത്ത പ്രോസസ്സറുകളുള്ള ഉപകരണങ്ങളെ ബാധിക്കുന്ന ഒരു ബഗ് ഉണ്ടായിരുന്നു:

SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) നിർദ്ദേശങ്ങൾ പിന്തുണയ്ക്കാത്ത കമ്പ്യൂട്ടറുകളിൽ സ്റ്റോപ്പ് പിശക് സംഭവിക്കുന്നു.

2018 ഏപ്രിൽ, മെയ്, ജൂൺ മാസങ്ങളിലെ പാച്ചുകളുടെ അറിയപ്പെടുന്ന പ്രശ്നങ്ങളുടെ പട്ടികയിൽ ഈ പിശക് തുടർന്നു. ഈ പിശക് ഇല്ലാതാക്കുന്നതിനുള്ള പ്രവർത്തനങ്ങൾ നടക്കുന്നുണ്ടെന്ന് അടുത്തിടെ വരെ, മൈക്രോസോഫ്റ്റ് റിപ്പോർട്ട് ചെയ്തു:

മൈക്രോസോഫ്റ്റ് സൊല്യൂഷനുകൾ വികസിപ്പിക്കുന്നു, ഭാവിയിലെ പാച്ച് റിലീസുകളിൽ അപ്‌ഡേറ്റുകൾ നൽകും.

കഴിഞ്ഞ ആഴ്ച, വിൻഡോസ് 7 ജൂൺ അപ്‌ഡേറ്റ് നോട്ടുകൾ മാറി. അറിയപ്പെടുന്ന പ്രശ്‌നങ്ങളിൽ നിന്ന് കമ്പനി ഈ പിശക് നീക്കം ചെയ്‌തു, പക്ഷേ ഒന്നും നൽകിയില്ല അധിക വിവരംഈ വിഷയത്തിൽ. ബഗ് പരിഹരിച്ചോ?

ഈ പ്രശ്നം മനസിലാക്കാൻ, മുൻകാല അപ്‌ഡേറ്റുകൾക്കായി നിങ്ങൾ കുറിപ്പുകൾ തുറക്കേണ്ടതുണ്ട്, ഉദാഹരണത്തിന്, May KB4103718. ഈ സ്റ്റോപ്പ് പിശക് ലിസ്‌റ്റ് ചെയ്‌തിരിക്കുന്നത് നിങ്ങൾ ശ്രദ്ധിച്ചേക്കാം, പക്ഷേ പിശക് പരിഹരിക്കുന്നതിനുള്ള പ്രവർത്തനങ്ങൾ നടക്കുന്നു എന്നതിന് പകരം, SSE2 പിന്തുണയില്ലാത്ത ഉപകരണങ്ങളിൽ, നിങ്ങൾ പ്രോസസറിനെ കൂടുതൽ ആധുനികമായ ഒന്ന് ഉപയോഗിച്ച് മാറ്റിസ്ഥാപിക്കുകയോ വിർച്ച്വലൈസേഷൻ ഉപയോഗിക്കുകയോ ചെയ്യണമെന്ന് മൈക്രോസോഫ്റ്റ് ശ്രദ്ധിക്കുന്നു.

SSE2 പിന്തുണയ്ക്കുന്ന ഒരു പ്രൊസസർ ഉപകരണത്തിൽ ഇൻസ്റ്റാൾ ചെയ്യുക അല്ലെങ്കിൽ മെഷീൻ വിർച്ച്വലൈസേഷൻ ഉപയോഗിക്കുക.

മറ്റൊരു വിധത്തിൽ പറഞ്ഞാൽ, മൈക്രോസോഫ്റ്റ് നിശബ്ദമായി പൂർത്തിയാക്കി വിൻഡോസ് പിന്തുണ SSE2 പിന്തുണയ്ക്കാത്ത പ്രോസസ്സറുകളുള്ള ഉപകരണങ്ങൾക്കായി 7. ഈ പ്രശ്‌നം പരിഹരിക്കാൻ കോർപ്പറേഷന് പദ്ധതികളൊന്നുമില്ല, മാത്രമല്ല ഏറ്റവും പുതിയ അപ്‌ഡേറ്റിനായി കുറിപ്പുകളിൽ നിന്ന് വിവരങ്ങൾ നീക്കം ചെയ്യുകയും ചെയ്യുന്നു, അതിനാലാണ് ഉപയോക്താക്കളും ഭരണാധികാരികളും ഇരുട്ടിൽ കഴിയുന്നത്.

SSE2 പിന്തുണ - ആവശ്യമായ അവസ്ഥവേണ്ടി വിൻഡോസ് ഇൻസ്റ്റാളേഷനുകൾ 8 ഉം പുതിയ വിൻഡോസ് 10 സിസ്റ്റങ്ങളും, എന്നാൽ വിൻഡോസ് 7 ഇൻസ്റ്റാൾ ചെയ്യുന്നതിന് SSE2 ഒരിക്കലും ആവശ്യമായിരുന്നില്ല. ഔദ്യോഗിക പേജ്വിൻഡോസ് 7-നുള്ള സിസ്റ്റം ആവശ്യകതകളിൽ ഈ പരിമിതിയെക്കുറിച്ച് പരാമർശമില്ല.

ഈ മാറ്റം പെന്റിയം III പ്രൊസസറുകളുള്ള ഉപകരണങ്ങളെ ബാധിക്കുന്നു. അത്തരം ഉപകരണങ്ങളുടെ ആകെ എണ്ണം അജ്ഞാതമാണ്, എന്നാൽ ഇത് ഉപയോക്താക്കളെ ബുദ്ധിമുട്ടുള്ള അവസ്ഥയിൽ എത്തിക്കുന്നു. വിൻഡോസ് 7 സാധാരണ പോലെ പ്രവർത്തിക്കുന്നത് തുടരും, എന്നാൽ ഏറ്റവും പുതിയ പാച്ചുകൾ ഇൻസ്റ്റാൾ ചെയ്തിട്ടില്ലെങ്കിൽ, സിസ്റ്റം സ്വീകരിക്കില്ല ഏറ്റവും പുതിയ അപ്ഡേറ്റുകൾസുരക്ഷ.

ഹാർഡ്‌വെയർ അപ്‌ഗ്രേഡ് കൂടാതെ പുതിയ വിൻഡോസ് ഓപ്പറേറ്റിംഗ് സിസ്റ്റങ്ങളിലേക്ക് മൈഗ്രേറ്റ് ചെയ്യുന്നത് സാധ്യമല്ല, കാരണം അവയ്ക്ക് SSE2 പിന്തുണയും ആവശ്യമാണ്. ബാധിച്ച ഉപകരണങ്ങളുടെ ഉപയോക്താക്കൾക്ക് മൂന്ന് ഓപ്ഷനുകൾ അവശേഷിക്കുന്നു തുടർ പ്രവർത്തനങ്ങൾ: പിന്തുണയ്ക്കാത്ത ഒരു സിസ്റ്റം ഉപയോഗിക്കുന്നത് തുടരുക, നിങ്ങളുടെ പ്രോസസർ/പിസി നവീകരിക്കുക, അല്ലെങ്കിൽ Linux-ലേക്ക് മാറുക.

ഉപസംഹാരം

ആ നിമിഷത്തിൽ വിൻഡോസ് റിലീസ് 7 പെന്റിയം III ഇതിനകം കാലഹരണപ്പെട്ട ഒരു പ്രോസസറായി കണക്കാക്കപ്പെട്ടിരുന്നു. SSE2 പിന്തുണയില്ലാതെ പ്രോസസ്സറുകളുള്ള ഉപകരണങ്ങൾക്കായി ഒരു പാച്ച് വികസിപ്പിക്കുന്നതിനുള്ള സാധ്യത വിലയിരുത്തുന്നതിന് മൈക്രോസോഫ്റ്റ് ഒരു ചെലവ് വിശകലനം നടത്തി, ഒടുവിൽ പിസി ഡാറ്റയ്ക്കുള്ള പിന്തുണ ഉപേക്ഷിക്കാൻ തീരുമാനിച്ചു.

മൈക്രോസോഫ്റ്റ് പലപ്പോഴും ആരവങ്ങളില്ലാതെ രഹസ്യമായി പ്രവർത്തിക്കുന്നു. മാറ്റങ്ങൾ ഉപയോക്താക്കളോട് പരസ്യമായി അറിയിക്കുന്നതിനുപകരം, കമ്പനി ലേഖനത്തിൽ നിന്ന് അറിയപ്പെടുന്ന പ്രശ്നം നീക്കംചെയ്തു ഏറ്റവും പുതിയ അപ്ഡേറ്റ്, ഇത് നിരവധി ഉപയോക്താക്കളെ തെറ്റിദ്ധരിപ്പിക്കുന്നു.

ആളുകൾ ഓപ്പറേറ്റിംഗ് സിസ്റ്റത്തിനായി പണം നൽകി, 2020 വരെ പിന്തുണ ഉറപ്പുനൽകിയിരുന്നു. മൈക്രോസോഫ്റ്റ് അതിന്റെ ഉപയോക്താക്കളെ ബഹുമാനിക്കുകയും അതിന്റെ പ്രതിബദ്ധതകൾ പാലിക്കുകയും വേണം.

അക്ഷരത്തെറ്റ് കണ്ടെത്തിയോ? ഹൈലൈറ്റ് ചെയ്ത് Ctrl + Enter അമർത്തുക