പുതിയ ഇൻ്റൽ പ്രെസ്കോട്ട് പ്രോസസറുകളിൽ എസ്എസ്ഇ സാങ്കേതികവിദ്യയുടെ വികസനം. മറ്റ് നിഘണ്ടുവുകളിൽ "SSE2" എന്താണെന്ന് കാണുക

ആധുനിക പ്രോസസറുകളിൽ, അൽഗോരിതങ്ങൾ വേഗത്തിലാക്കാനും ഒപ്റ്റിമൈസ് ചെയ്യാനും നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്നു.

AMD64 (x86-64)

EM64T (x86-64)

വിപുലീകരിച്ച 3DNow!

IA-32 (x86-32)

MIMD

MISD

SIMD

SISD

SSE2

SSE3

SSE4

SSE4.1

SSE4.2

SSE4A

SSSE3

ഒരു മെഷീൻ നിർദ്ദേശത്തിൽ സ്ട്രീമിംഗ് ഓഡിയോ/വീഡിയോ ഡാറ്റ എൻകോഡിംഗ്/ഡീകോഡ് ചെയ്യുന്നതിനുള്ള സാധാരണ പ്രവർത്തനങ്ങൾ ചെയ്യുന്ന ഒരു അധിക നിർദ്ദേശങ്ങളുടെ വാണിജ്യ നാമമാണ് MMX (മൾട്ടീമീഡിയ എക്സ്റ്റൻഷനുകൾ). പെൻ്റിയം എംഎംഎക്സ് പ്രോസസറുകളിൽ ആദ്യം പ്രത്യക്ഷപ്പെട്ടു. 1990-കളുടെ ആദ്യ പകുതിയിൽ ഇസ്രായേലിലെ ഹൈഫയിലുള്ള ഇൻ്റലിൻ്റെ ലബോറട്ടറിയിൽ വികസിപ്പിച്ചെടുത്തു.

SIMD (സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, മൾട്ടിപ്പിൾ ഡാറ്റ) കമ്പ്യൂട്ടർ കമ്പ്യൂട്ടിംഗിൻ്റെ ഒരു തത്വമാണ്, അത് ഡാറ്റാ തലത്തിൽ സമാന്തരതയെ അനുവദിക്കുന്നു.

SSE (ഇംഗ്ലീഷ് സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ, പ്രൊസസറിൻ്റെ സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ) ഒരു SIMD (ഇംഗ്ലീഷ് സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, മൾട്ടിപ്പിൾ ഡാറ്റ, ഒരു നിർദ്ദേശം - നിരവധി ഡാറ്റ) ഇൻസ്ട്രക്ഷൻ സെറ്റാണ്, ഇൻ്റൽ വികസിപ്പിച്ചെടുത്തതും പെൻ്റിയം III സീരീസ് പ്രോസസറുകളിൽ ആദ്യമായി അവതരിപ്പിച്ചതുമാണ്. സമാനമായ 3DNow! നിർദ്ദേശ സെറ്റ് ഒരു വർഷം മുമ്പ് അവതരിപ്പിച്ച എഎംഡിയിൽ നിന്ന്. തുടക്കത്തിൽ, ഈ നിർദ്ദേശങ്ങളുടെ പേര് KNI എന്നായിരുന്നു, അത് Katmai പുതിയ നിർദ്ദേശങ്ങൾ (പെൻ്റിയം III പ്രോസസർ കോറിൻ്റെ ആദ്യ പതിപ്പിൻ്റെ പേരാണ് Katmai).

MMX-ൻ്റെ 2 പ്രധാന പ്രശ്‌നങ്ങളെ മറികടക്കാൻ SSE സാങ്കേതികവിദ്യ സാധ്യമാക്കി - MMX ഉപയോഗിക്കുമ്പോൾ, കോപ്രോസസർ നിർദ്ദേശങ്ങൾ ഒരേസമയം ഉപയോഗിക്കുന്നത് അസാധ്യമാണ്, കാരണം അതിൻ്റെ രജിസ്റ്ററുകൾ MMX-നായി ഉപയോഗിക്കുകയും യഥാർത്ഥ സംഖ്യകളിൽ പ്രവർത്തിക്കുകയും ചെയ്തു.

എസ്എസ്ഇയിൽ എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) പ്രോസസർ ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുന്നു, അവ ഓരോന്നും തുടർച്ചയായി 4 സിംഗിൾ-പ്രിസിഷൻ ഫ്ലോട്ടിംഗ് പോയിൻ്റ് മൂല്യങ്ങളായി കണക്കാക്കുന്നു. സ്കെയിലർ, ബോക്‌സ്ഡ് ഡാറ്റാ തരങ്ങളിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്ന ഒരു കൂട്ടം നിർദ്ദേശങ്ങൾ എസ്എസ്ഇയിൽ ഉൾപ്പെടുന്നു.

വ്യത്യസ്‌ത ഡാറ്റയിൽ ഒരേ ക്രമത്തിലുള്ള പ്രവർത്തനങ്ങൾ നടത്തേണ്ടിവരുമ്പോൾ പ്രകടന നേട്ടം കൈവരിക്കാനാകും.

ഡാറ്റയ്‌ക്കിടയിലുള്ള കമ്പ്യൂട്ടേഷണൽ പ്രക്രിയയെ സമാന്തരമാക്കിക്കൊണ്ടാണ് SIMD ബ്ലോക്കുകൾ നടപ്പിലാക്കുന്നത്. അതായത്, ഒന്നിലധികം ഡാറ്റ സ്ട്രീമുകൾ ഒരു ബ്ലോക്കിലൂടെ കടന്നുപോകുമ്പോൾ.

SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) എന്നത് ഇൻ്റൽ വികസിപ്പിച്ചതും പെൻ്റിയം 4 സീരീസ് പ്രോസസറുകളിൽ ആദ്യമായി അവതരിപ്പിച്ചതുമായ ഒരു SIMD (സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, മൾട്ടിപ്പിൾ ഡാറ്റ) നിർദ്ദേശങ്ങളാണ്.

എസ്എസ്ഇ 2, എസ്എസ്ഇ എക്സ്റ്റൻഷൻ ഇൻപുട്ടിനൊപ്പം x86 ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) ഉപയോഗിക്കുന്നു, അവ ഓരോന്നും തുടർച്ചയായി 2 ഇരട്ട-പ്രിസിഷൻ ഫ്ലോട്ടിംഗ് പോയിൻ്റ് മൂല്യങ്ങളായി കണക്കാക്കുന്നു. SSE2 സ്കെയിലർ, ബോക്‌സ്ഡ് ഡാറ്റാ തരങ്ങളിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്ന ഒരു ഇൻസ്ട്രക്ഷൻ സെറ്റ് ഉൾപ്പെടുന്നു. SSE2-ൽ അതേ 128-ബിറ്റ് xmm രജിസ്റ്ററുകളിൽ ഇൻ്റിജർ ഡാറ്റയുടെ സ്ട്രീം പ്രോസസ്സിംഗിനുള്ള നിർദ്ദേശങ്ങളും അടങ്ങിയിരിക്കുന്നു, ഇത് വളരെ നേരത്തെ പ്രത്യക്ഷപ്പെട്ട MMX നിർദ്ദേശ സെറ്റ് ഉപയോഗിക്കുന്നതിനേക്കാൾ ഈ വിപുലീകരണത്തെ പൂർണ്ണസംഖ്യ കണക്കുകൂട്ടലുകൾക്ക് കൂടുതൽ അഭികാമ്യമാക്കുന്നു.

ഒരേ തരത്തിലുള്ള ഒരു വലിയ കൂട്ടം ഡാറ്റയിൽ ഒരേ ക്രമത്തിലുള്ള പ്രവർത്തനങ്ങൾ നടത്തേണ്ടിവരുമ്പോൾ പ്രകടന നേട്ടം കൈവരിക്കാനാകും.

SSE, SSE2, x87 എന്നിവയുടെ പിൻഗാമിയായ ഇൻ്റലിൻ്റെ SIMD വിപുലീകരണത്തിൻ്റെ മൂന്നാമത്തെ പതിപ്പാണ് SSE3 (PNI - Prescott New Instruction). 2004 ഫെബ്രുവരി 2-ന് പെൻ്റിയം 4 പ്രൊസസറിൻ്റെ പ്രെസ്‌കോട്ട് കോറിൽ ആദ്യമായി അവതരിപ്പിച്ചു.2005-ൽ അത്‌ലോൺ 64 പ്രോസസറുകൾക്കായി (വെനീസ്, സാൻ ഡിയാഗോ കോറുകൾ) SSE3 നടപ്പിലാക്കാൻ AMD നിർദ്ദേശിച്ചു.

SSE3 സെറ്റിൽ 13 നിർദ്ദേശങ്ങൾ അടങ്ങിയിരിക്കുന്നു:

FISTTP (x87)

MOVSLDUP (SSE)

MOVSHDUP(SSE)

MOVDDUP (SSE2)

LDDQU (SSE/SSE2)

ADDSUBPD (SSE)

ADDSUBPD (SSE2)

HADDPS (SSE)

HSUBPS (SSE)

HADDPD (SSE2)

HSUBPD (SSE2)

- മോണിറ്റർ (എഎംഡിക്ക് എസ്എസ്ഇ3-ൽ തുല്യതയില്ല)

- MWAIT (AMD-ന് SSE3-ൽ തുല്യതയില്ല).

പെൻറിൻ സീരീസ് പ്രോസസറുകളിൽ ആദ്യം നടപ്പിലാക്കിയ ഇൻ്റൽ കോർ മൈക്രോ ആർക്കിടെക്ചർ നിർദ്ദേശ സെറ്റാണ് എസ്എസ്ഇ4 (എഎംഡിയുടെ എസ്എസ്ഇ4എയുമായി തെറ്റിദ്ധരിക്കേണ്ടതില്ല). 2006 സെപ്തംബർ 27 നാണ് ഇത് പ്രഖ്യാപിച്ചത്, എന്നാൽ വിശദമായ വിവരണം 2007 ലെ വസന്തകാലത്ത് മാത്രമാണ് ലഭ്യമായത്.

SSE4-ൽ 54 നിർദ്ദേശങ്ങൾ അടങ്ങിയിരിക്കുന്നു, അവയിൽ 47 എണ്ണം SSE4.1 ആയി തരംതിരിച്ചിട്ടുണ്ട് (അവ Penryn പ്രൊസസറുകളിൽ മാത്രമേ കാണപ്പെടുന്നുള്ളൂ). നെഹാലെം പ്രൊസസറുകളിൽ മുഴുവൻ നിർദ്ദേശങ്ങളും (SSE4.1, SSE4.2, അതായത് 47 + ശേഷിക്കുന്ന 7 നിർദ്ദേശങ്ങൾ) ലഭ്യമാകുമെന്ന് പ്രതീക്ഷിക്കുന്നു. SSE4 നിർദ്ദേശങ്ങളൊന്നും 64-ബിറ്റ് mmx രജിസ്റ്ററുകളിൽ പ്രവർത്തിക്കുന്നില്ല (128-ബിറ്റ് xmm0-15 ഉപയോഗിച്ച് മാത്രം).

പതിപ്പ് 10 മുതലുള്ള Intel C കംപൈലർ -QxS ഓപ്ഷൻ വ്യക്തമാക്കുമ്പോൾ SSE4 നിർദ്ദേശങ്ങൾ സൃഷ്ടിക്കുന്നു.

വീഡിയോ കോഡെക്കുകളിൽ ചലന നഷ്ടപരിഹാരം വേഗത്തിലാക്കുന്ന നിർദ്ദേശങ്ങൾ, WC മെമ്മറിയിൽ നിന്നുള്ള വേഗത്തിലുള്ള വായന, കംപൈലറുകൾ വഴി പ്രോഗ്രാമുകളുടെ വെക്‌ടറൈസേഷൻ ലളിതമാക്കുന്നതിനുള്ള നിരവധി നിർദ്ദേശങ്ങൾ എന്നിവ SSE4 ചേർത്തു. SSE4-ൽ ആദ്യമായി, xmm0 രജിസ്‌റ്റർ ചില നിർദ്ദേശങ്ങൾക്കുള്ള ഒരു വ്യവഹാരമായി ഉപയോഗിച്ചു.

SSE4.1 എന്നത് Intel-ൽ നിന്നുള്ള SSE4 നിർദ്ദേശങ്ങളുടെ ഒരു വിപുലീകരണമാണ്.

SSE4.1-ൽ ഉൾപ്പെടുത്തിയിരിക്കുന്ന നിർദ്ദേശങ്ങൾ ചുവടെ:

- വീഡിയോ വേഗത്തിലാക്കുക (3 നിർദ്ദേശങ്ങൾ)

- വെക്റ്റർ പ്രിമിറ്റീവ്സ് (5 നിർദ്ദേശങ്ങൾ)

- ഇൻസേർഷൻ/എക്‌സ്‌ട്രാക്ഷൻ (4 നിർദ്ദേശങ്ങൾ)

- സ്കെയിലർ വെക്റ്റർ ഗുണനം (2 നിർദ്ദേശങ്ങൾ)

- മിക്സിംഗ് (4 നിർദ്ദേശങ്ങൾ)

ബിറ്റ് ചെക്കുകൾ

- റൗണ്ടിംഗ് (2 നിർദ്ദേശങ്ങൾ)

WC മെമ്മറി വായിക്കുന്നു

SSE4.2 7 നിർദ്ദേശങ്ങൾ ഉൾക്കൊള്ളുന്നു.

- സ്ട്രിംഗ് പ്രോസസ്സിംഗ് (4 നിർദ്ദേശങ്ങൾ)

CRC32 എണ്ണുന്നു

- യൂണിറ്റ് ബിറ്റുകളുടെ ജനസംഖ്യ കണക്കാക്കുന്നു

- വെക്റ്റർ പ്രിമിറ്റീവ്സ്

SSE4A എന്നത് എഎംഡിയുടെ SSE4 നിർദ്ദേശങ്ങളുടെ ഒരു വിപുലീകരണമാണ്, ഇത് ഒരു കൂട്ടിച്ചേർക്കലായിട്ടല്ല, മറിച്ച് Intel-ൻ്റെ SSE4 നിർദ്ദേശങ്ങൾക്ക് പകരമായി രൂപകൽപ്പന ചെയ്തിട്ടുള്ളതാണ്.

SSSE3 (സപ്ലിമെൻ്റൽ സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ 3) എന്നത് നാലാമത്തെ ഇൻസ്ട്രക്ഷൻ സെറ്റ് വിപുലീകരണത്തിന് ഇൻ്റൽ നൽകിയിരിക്കുന്ന പദവിയാണ്. മുമ്പത്തേത് SSE3 എന്ന് നിയുക്തമാക്കുകയും ഇൻ്റൽ വിപുലീകരണ നമ്പർ വർദ്ധിപ്പിക്കുന്നതിന് പകരം മറ്റൊരു "S" ചേർക്കുകയും ചെയ്‌തു, ഒരുപക്ഷേ അവർ SSSE3 എന്നത് SSE3-യുടെ ലളിതമായ കൂട്ടിച്ചേർക്കലായി കണക്കാക്കിയതുകൊണ്ടാകാം. പലപ്പോഴും, SSSE3 എന്ന ഔദ്യോഗിക പദവി ഉപയോഗിക്കുന്നതിന് മുമ്പ്, ഈ പുതിയ ടീമുകളെ SSE4 എന്ന് വിളിച്ചിരുന്നു. ഇൻ്റൽ ആദ്യമായി ഈ പുതിയ നിർദ്ദേശങ്ങൾ പിന്തുണയ്ക്കാൻ ഉദ്ദേശിച്ച പ്രോസസറുകൾക്ക് ശേഷം അവയ്ക്ക് തേജസ് ന്യൂ ഇൻസ്ട്രക്ഷൻസ് (ടിഎൻഐ), മെറോം ന്യൂ ഇൻസ്ട്രക്ഷൻസ് (എംഎൻഐ) എന്നീ കോഡ് നാമങ്ങളും നൽകി. ഇൻ്റൽ കോർ മൈക്രോ ആർക്കിടെക്ചറിൽ അവതരിപ്പിച്ച SSSE3, Xeon 5100 സീരീസ് പ്രോസസറുകളിലും (സെർവർ, വർക്ക്‌സ്റ്റേഷൻ പതിപ്പുകൾ), ഇൻ്റൽ കോർ 2 പ്രോസസറുകളിലും (നോട്ട്ബുക്ക്, ഡെസ്ക്ടോപ്പ് പതിപ്പുകൾ) ലഭ്യമാണ്.

SSSE3 ലേക്ക് പുതിയത്, SSE3 യുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ, പായ്ക്ക് ചെയ്ത പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്ന 16 അദ്വിതീയ കമാൻഡുകളാണ്. അവയിൽ ഓരോന്നിനും 64-ബിറ്റ് (എംഎംഎക്സ്), 128-ബിറ്റ് (എക്സ്എംഎം) രജിസ്റ്ററുകളിൽ പ്രവർത്തിക്കാൻ കഴിയും, അതിനാൽ ഇൻ്റൽ അതിൻ്റെ മെറ്റീരിയലുകളിൽ 32 പുതിയ നിർദ്ദേശങ്ങൾ പരാമർശിക്കുന്നു.

അവയിൽ ചിലത് ഇതാ:

- അടയാളം ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു (2 നിർദ്ദേശങ്ങൾ)

ഷിഫ്റ്റുകൾ

- ബൈറ്റ് ഷഫിൾ ചെയ്യുന്നു

- ഗുണിക്കുക (2 നിർദ്ദേശങ്ങൾ)

- പൂർണ്ണസംഖ്യകളുടെ തിരശ്ചീന സങ്കലനം/കുറക്കൽ (4 നിർദ്ദേശങ്ങൾ)

3Dഇപ്പോൾ! - എഎംഡി കെ6 3ഡിയിൽ ആരംഭിക്കുന്ന എഎംഡി പ്രോസസറുകൾക്കായുള്ള അധിക എംഎംഎക്സ് എക്സ്റ്റൻഷൻ. 3DNow സൃഷ്ടിക്കുന്നതിനുള്ള കാരണം! മൾട്ടിമീഡിയ ഡാറ്റ പ്രോസസ്സിംഗ് മേഖലയിൽ ഇൻ്റൽ പ്രോസസറുകളെക്കാൾ മികവ് നേടാനുള്ള ആഗ്രഹമായിരുന്നു അത്. ഈ വിപുലീകരണം ഒരു എഎംഡി വികസനമാണെങ്കിലും, IBM, Cyrix എന്നിവയും മറ്റുള്ളവയും അവരുടെ പ്രോസസ്സറുകളിലേക്ക് ഇത് സംയോജിപ്പിച്ചിരിക്കുന്നു.

3DNow സാങ്കേതികവിദ്യ! 21 പുതിയ പ്രൊസസർ കമാൻഡുകളും സ്റ്റാൻഡേർഡ് MMX രജിസ്റ്ററുകളിൽ 32-ബിറ്റ് യഥാർത്ഥ തരങ്ങളും പ്രവർത്തിപ്പിക്കാനുള്ള കഴിവും അവതരിപ്പിച്ചു. MMX/3DNow-ലേക്ക് മാറുന്നത് ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന് പ്രത്യേക നിർദ്ദേശങ്ങളും ചേർത്തിട്ടുണ്ട്! (femms, ഇത് സ്റ്റാൻഡേർഡ് emms നിർദ്ദേശത്തെ മാറ്റിസ്ഥാപിക്കുന്നു) കൂടാതെ പ്രോസസ്സർ കാഷെ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു. അങ്ങനെ, 3DNow! പുതിയ പ്രോസസ്സർ ഓപ്പറേറ്റിംഗ് മോഡുകളും പുതിയ രജിസ്റ്ററുകളും അവതരിപ്പിക്കേണ്ട ആവശ്യമില്ലാതെ തന്നെ MMX സാങ്കേതികവിദ്യയുടെ കഴിവുകൾ വിപുലീകരിച്ചു.

3DNow പിന്തുണ പരിശോധിക്കുന്നു! പ്രൊസസർ.

നിങ്ങൾ 3DNow ഉപയോഗിച്ച് പ്രവർത്തിക്കാൻ തുടങ്ങുന്നതിനുമുമ്പ്! CPU അവരെ പിന്തുണയ്ക്കുന്നുവെന്ന് നിങ്ങൾ ഉറപ്പാക്കണം. ഇതിനായി CPUID നിർദ്ദേശം ഉപയോഗിക്കുന്നു. പരിശോധിക്കുന്നതിനുള്ള പൊതു നടപടിക്രമം ഇപ്രകാരമാണ്:

1. പ്രോസസ്സർ CPUID നിർദ്ദേശത്തെ പിന്തുണയ്ക്കുന്നുവെന്ന് ഉറപ്പാക്കുക. ഇല്ലെങ്കിൽ, CPU 3DNow-നെ പിന്തുണയ്ക്കുന്നില്ല!.

2. EAX = 0 ഉപയോഗിച്ച് cpuid നിർദ്ദേശം നടപ്പിലാക്കുക - അടുത്ത ഘട്ടത്തിന് ഇത് ആവശ്യമാണ്.

3. EAX മൂല്യം = 80000000h ഉള്ള CPUID എക്സിക്യൂട്ട് ചെയ്യുക. EAX-ൽ നിർദ്ദേശം നടപ്പിലാക്കിയ ശേഷം മൂല്യം 1-ൽ കുറവാണെങ്കിൽ, 3DNow! പിന്തുണയ്ക്കുന്നില്ല.

4. EAX = 80000001h ഉപയോഗിച്ച് CPUID എക്സിക്യൂട്ട് ചെയ്യുക. EDX രജിസ്റ്ററിൻ്റെ എക്സിക്യൂഷൻ ബിറ്റ് 31 1 ആയി സജ്ജീകരിച്ചിട്ടുണ്ടെങ്കിൽ, 3DNow! പിന്തുണച്ചു. അല്ലെങ്കിൽ - ഇല്ല.

ആമുഖം അടുത്തിടെ നടന്ന ഇൻ്റൽ ഡെവലപ്പേഴ്‌സ് ഫോറത്തിൽ, പേഴ്‌സണൽ കമ്പ്യൂട്ടറുകളിൽ ഉപയോഗിക്കുന്നതിനായി രൂപകൽപ്പന ചെയ്‌തിരിക്കുന്ന ഇൻ്റലിൻ്റെ പുതിയ പ്രൊസസറായ പ്രെസ്‌കോട്ട് ഔദ്യോഗികമായി അവതരിപ്പിച്ചു. ഇത് ഒരു അടുത്ത തലമുറ പ്രോസസറായി അവതരിപ്പിക്കുന്നു - ഒരു പുതിയ തലമുറ പ്രോസസർ. 90 നാനോമീറ്റർ സാങ്കേതികവിദ്യ ഉപയോഗിച്ചാണ് പ്രോസസർ നിർമ്മിച്ചിരിക്കുന്നത്, ഇത് 4-5 GHz ക്ലോക്ക് ഫ്രീക്വൻസികൾ നേടാൻ അനുവദിക്കും. രണ്ടാമത്തെ ലെവൽ കാഷെയുടെ വലുപ്പം 1MB ആയി വർദ്ധിപ്പിച്ചു - പ്രത്യക്ഷത്തിൽ, പുതിയ സാങ്കേതിക പ്രക്രിയയ്ക്ക് നന്ദി, ചെലവ് വീക്ഷണകോണിൽ നിന്ന് അത്തരമൊരു വർദ്ധനവ് ന്യായീകരിക്കപ്പെട്ടു. ആദ്യ ലെവൽ കാഷെയുടെ വലുപ്പവും ഇരട്ടിയായി, മെച്ചപ്പെട്ട സാങ്കേതികവിദ്യയുടെ നല്ല സ്വാധീനം ഇവിടെ ശ്രദ്ധേയമാണ്. സിസ്റ്റം ബസ് ഫ്രീക്വൻസി 800MHz ആയി വർദ്ധിച്ചു. പൊതുവേ, എല്ലാ പ്രോസസർ യൂണിറ്റുകളും ചെറിയ മെച്ചപ്പെടുത്തലുകൾക്ക് വിധേയമായിട്ടുണ്ട്. എന്നാൽ ഈ മിനുക്കിയ പെൻ്റിയം 4 സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് പുതിയതായി എന്താണ് കൊണ്ടുവരുന്നത്? വർദ്ധിച്ച കാഷെ തീർച്ചയായും നല്ലതാണ്; മെമ്മറിയിൽ നിന്ന് ഡാറ്റ വായിക്കുന്നതിനും എഴുതുന്നതിനുമുള്ള വേഗതയെക്കുറിച്ച് നിങ്ങൾ കുറച്ചുകൂടി ചിന്തിക്കേണ്ടതുണ്ട്, ഇത് പലപ്പോഴും ഗുരുതരമായ പ്രകടന പരിമിതപ്പെടുത്തുന്ന ഘടകമാണ്. പക്ഷേ, ഒരേപോലെ, ഇത് എല്ലാ പ്രശ്നങ്ങളും പരിഹരിക്കുന്നില്ല; ഡാറ്റയുടെ അളവ് വലുതായിരിക്കുമ്പോൾ, കാഷെ രണ്ട് മടങ്ങ് വർദ്ധിപ്പിക്കുന്നത് പ്രധാനമല്ല.
വർദ്ധിച്ച സിസ്റ്റം ബസ് ഫ്രീക്വൻസി ഇൻ്റലിൽ നിന്നുള്ള പുതിയ പ്രോസസർ തികച്ചും സന്തുലിതമാകുമെന്നും മൊത്തത്തിലുള്ള സിസ്റ്റം പ്രകടനത്തെ മന്ദഗതിയിലാക്കുന്ന വ്യക്തമായ തടസ്സങ്ങൾ ഉണ്ടാകില്ലെന്നും ഉറപ്പ് നൽകുന്നു. അത് പോലെ, അയ്യോ, ചില മുൻകാല പ്രോസസ്സറുകൾ ഉപയോഗിച്ച്, ആവൃത്തി വർദ്ധിപ്പിക്കുമ്പോൾ വേഗതയിൽ ആനുപാതികമായ വർദ്ധനവ് നൽകിയില്ല.
എന്നിരുന്നാലും, ഒരു പുതിയ സെവൻ-ലെയർ പ്രോസസർ ഡിസൈൻ പോലുള്ള ഒരു കാര്യം സോഫ്റ്റ്വെയർ ഡെവലപ്പർമാർക്ക് താൽപ്പര്യമുള്ളതല്ല. പുതിയ പ്രോസസർ കമാൻഡുകൾ എന്തൊക്കെയാണ് ലഭ്യമായത്, പരമാവധി പ്രകടനം നേടുന്നതിന് എന്ത് ഒപ്റ്റിമൈസേഷൻ ടെക്നിക്കുകൾ പ്രയോഗിക്കേണ്ടതുണ്ട്, അല്ലെങ്കിൽ കുറഞ്ഞത് പഴയതിനേക്കാൾ വേഗത കുറവല്ലെന്ന് ഉറപ്പാക്കുക എന്നത് അവർക്ക് വളരെ പ്രധാനമാണ്. ഇൻ്റലിൻ്റെ മുൻ പ്രൊസസറായ പെൻ്റിയം 4-ന് പ്രകടനം വർദ്ധിപ്പിക്കുന്നതിന് കാര്യമായ സോഫ്റ്റ്‌വെയർ ഒപ്റ്റിമൈസേഷൻ ആവശ്യമായിരുന്നു. ഒരു വിശാലമായ ക്ലാസ് ടാസ്‌ക്കുകളിൽ, പെൻ്റിയം 4 ഒരു പെൻ്റിയം III-നെ മറികടന്നു, തുല്യ ആവൃത്തിയിൽ മാത്രമല്ല, രണ്ട് മടങ്ങ് വരെ വളരെ കുറവാണ്. എന്തുകൊണ്ടാണ് ഇത് സംഭവിച്ചതെന്ന് ഞങ്ങൾ ചുവടെ വിശദമായി പരിശോധിക്കും; ആവൃത്തി വർദ്ധിപ്പിക്കുന്നതിന് കാമ്പിനെ ഗണ്യമായി മാറ്റേണ്ടതിൻ്റെ ആവശ്യകതയാണ് ആഗോള കാരണം എന്ന് നമുക്ക് ഉടനടി ശ്രദ്ധിക്കാൻ കഴിയും.
പൊതുവേ, പ്രോസസർ കോർ അടിസ്ഥാനപരമായ മാറ്റങ്ങൾക്ക് വിധേയമായിട്ടില്ല. പെൻ്റിയം 4 ഇഷ്ടപ്പെടാത്തതെല്ലാം - ഒന്നാമതായി, ശാഖകൾ - 90 നാനോമീറ്റർ സാങ്കേതിക പ്രക്രിയയിലെ പരിഷ്കാരങ്ങളാൽ പാരമ്പര്യമായി ലഭിച്ചു. അത് അൽപ്പം കൂടി തീവ്രമായി. ആവൃത്തി വർദ്ധിപ്പിക്കുന്നതിന്, പ്രെസ്‌കോട്ടിൻ്റെ പൈപ്പ്ലൈനിൻ്റെ ആഴം വർദ്ധിപ്പിച്ചു, അതിനാൽ പൈപ്പ്ലൈൻ റീസെറ്റിലേക്ക് നയിക്കുന്ന സോപാധിക ശാഖകളുടെ തെറ്റായി പ്രവചിക്കുമ്പോൾ ഒരാൾക്ക് വലിയ നഷ്ടം പ്രതീക്ഷിക്കാം.
എന്നാൽ ഒരു നല്ല വാർത്തയും ഉണ്ട്, പ്രധാന കാര്യം പ്രോസസർ നിർദ്ദേശങ്ങളുടെ കൂട്ടം വിപുലീകരിക്കുക എന്നതാണ്. MMX, SSE, SSE2 എന്നിവയുടെ ആമുഖം സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് സന്തോഷകരമായിരുന്നു, കാരണം പ്രോഗ്രാമുകൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിനുള്ള അധിക ജോലി അത് അവർക്ക് നൽകി. അല്ലെങ്കിൽ, പല പ്രോഗ്രാമുകളും വേഗത്തിൽ നടപ്പിലാക്കാൻ വിസമ്മതിച്ചു. എന്നിരുന്നാലും, പ്രെസ്‌കോട്ടിൽ പ്രത്യക്ഷപ്പെട്ട 13 പുതിയ നിർദ്ദേശങ്ങൾ ഡവലപ്പർമാരുടെ ഭാരം ഗണ്യമായി ലഘൂകരിക്കുന്നു.

MMX, 3DNow! SSE, SSE2 - പ്രവർത്തനത്തിൻ്റെയും ഒപ്റ്റിമൈസേഷൻ്റെയും തത്വം

പുതിയ നിർദ്ദേശങ്ങൾ നോക്കുന്നതിന് മുമ്പ്, പ്രോസസർ ഇൻസ്ട്രക്ഷൻ സെറ്റിലേക്കുള്ള മുൻ SIMD വിപുലീകരണങ്ങളുടെ ഒരു ഹ്രസ്വ അവലോകനം നമുക്ക് എടുക്കാം, ഒന്നാമതായി, ഒരു പ്രത്യേക സെറ്റ് നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുമ്പോൾ സാധ്യമായ പ്രകടന നേട്ടം ഞങ്ങൾ വിലയിരുത്തും. വിഷയവുമായി പരിചയമുള്ളവർക്ക് ഈ ഭാഗം ഒഴിവാക്കി പുതിയ പ്രെസ്‌കോട്ട് കമാൻഡുകളുടെ വിവരണത്തിലേക്ക് നേരിട്ട് പോകാം.
ഇപ്പോൾ, ചിലപ്പോഴൊക്കെ ടെസ്റ്റ് അവലോകനങ്ങൾ, തന്നിരിക്കുന്ന പ്രോഗ്രാം SSE-യ്‌ക്ക് നന്നായി ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്നുവെന്ന് പറയുന്നു, ഇതിന് നന്ദി, അത്തരമൊരു പ്രോസസർ നല്ല ഫലങ്ങൾ കാണിക്കുന്നു. എന്താണ് SSE? ഈ നിർദ്ദേശങ്ങളുടെ കൂട്ടത്തിൻ്റെ സ്വഭാവത്തെക്കുറിച്ച് പേര് തന്നെ സംസാരിക്കുന്നു. SSE - സ്ട്രീമിംഗ് SIMD വിപുലീകരണം. സ്ട്രീമിംഗ് SIMD വിപുലീകരണം. എന്താണ് SIMD? SIMD - സിംഗിൾ ഇൻസ്ട്രക്ഷൻ മൾട്ടിപ്പിൾ ഡാറ്റ. ഒരു നിർദ്ദേശം - നിരവധി ഡാറ്റ ഓപ്പറണ്ടുകൾ.
പ്രോസസ്സറുകൾ സാധാരണയായി എങ്ങനെ പ്രവർത്തിക്കുന്നു, ആദ്യത്തെ പെൻ്റിയമായ 486 പോലെയുള്ള പ്രോസസ്സറുകൾ എങ്ങനെ പ്രവർത്തിച്ചു? വെറും. നിരവധി രജിസ്റ്റർ സെല്ലുകളുണ്ട്, അവയിൽ നമ്പറുകൾ സംഭരിച്ചിരിക്കുന്നു, ഒരു സെല്ലിൽ ഒരു നമ്പർ അടങ്ങിയിരിക്കുന്നു, പ്രോസസ്സർ കമാൻഡുകൾ നടപ്പിലാക്കുന്നു: രണ്ട് രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങൾ ചേർക്കുക, നിങ്ങൾക്ക് ഒരു പുതിയ നമ്പർ ലഭിക്കും, ഈ നമ്പർ മൂന്നാമത്തെ രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങളുമായി താരതമ്യം ചെയ്യുക, കൂടുതലാണെങ്കിൽ, നിർദ്ദേശങ്ങളുടെ പട്ടികയിലൂടെ നീങ്ങുക. എന്നിരുന്നാലും, ഈ സമീപനത്തിലൂടെ, ഉൽപാദനക്ഷമത വർദ്ധിപ്പിക്കുന്നതിൽ ക്രമേണ ബുദ്ധിമുട്ടുകൾ ഉണ്ടാകാൻ തുടങ്ങി. മുൻ നിർദ്ദേശങ്ങളാൽ ആവശ്യമായ ഓപ്പറണ്ടുകൾ കണക്കാക്കുന്നതിന് മുമ്പ് പ്രോസസറിന് അടുത്ത നിർദ്ദേശം നടപ്പിലാക്കാൻ കഴിയില്ല എന്നതാണ് വസ്തുത. നിങ്ങൾക്ക് പ്രോസസറിൽ നൂറ് ഗുണന ബ്ലോക്കുകൾ പോലും സ്ഥാപിക്കാൻ കഴിയും, അത് വേഗത്തിൽ കണക്കാക്കില്ല, ഒരു ബ്ലോക്ക് മാത്രം എല്ലാ സമയത്തും പ്രവർത്തിക്കും, മറ്റുള്ളവർ അതിൻ്റെ കണക്കുകൂട്ടലുകളുടെ ഫലങ്ങൾക്കായി കാത്തിരിക്കും. അതിനാൽ, ഒരു ജോടി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചല്ല, ഒരേസമയം നിരവധി ജോഡികൾ ഉപയോഗിച്ച് പ്രവർത്തനങ്ങൾ നടത്തുക എന്ന ആശയം അവർ കൊണ്ടുവന്നു. പേഴ്സണൽ കമ്പ്യൂട്ടറുകളിലെ ആദ്യത്തെ ആധുനിക SIMD എക്സ്റ്റൻഷൻ്റെ ഉദാഹരണം ഉപയോഗിക്കുന്നത് എങ്ങനെയായിരിക്കും - MMX.

ഓപ്പറേഷൻഭാഗം 3ഭാഗം 2ഭാഗം 1ഭാഗം 0രജിസ്റ്റർ ചെയ്യുക
70 50 30 10 1 രജിസ്റ്റർ
+
80 60 40 20 2 രജിസ്റ്റർ
=
150 110 70 30 ഫലമായി

അതേ സമയം, ഒരു ജോടി സംഖ്യകളല്ല, നാല് ചേർക്കുന്നു. നിങ്ങൾക്ക് കുറയ്ക്കാനും ഗുണിക്കാനും കഴിയും. ഒരേസമയം നിരവധി ജോഡി ഓപ്പറണ്ടുകൾ, അവ ഓരോന്നും ഒരു രജിസ്റ്ററിലാണ്. ഈ സാങ്കേതികവിദ്യയുടെ ആമുഖം, ക്ലോക്ക് ഫ്രീക്വൻസി വർദ്ധിപ്പിക്കാതെ, കമ്പ്യൂട്ടിംഗ് മൊഡ്യൂളുകളുടെ എണ്ണം വർദ്ധിപ്പിച്ച് പ്രോസസ്സർ പ്രകടനം എളുപ്പത്തിൽ വർദ്ധിപ്പിക്കുന്നത് സാധ്യമാക്കുന്നു. കൂടുതൽ കൃത്യമായി പറഞ്ഞാൽ, മൊഡ്യൂളുകളുടെ എണ്ണമല്ല വർദ്ധിക്കുന്നത്, മറിച്ച് ഒരേസമയം നിരവധി ജോഡി ഓപ്പറണ്ടുകളുമായി പ്രവർത്തിക്കാനുള്ള കഴിവ് അവർ നേടുന്നു. എന്നാൽ പ്രോഗ്രാമിംഗിന് ഇത് പ്രധാനമല്ല.
എന്നിരുന്നാലും, SIMD സാങ്കേതികവിദ്യ ഉപയോഗിക്കുന്നതിന്, പ്രോഗ്രാം കോഡിൻ്റെ തലത്തിൽ തന്നെ പിന്തുണ ആവശ്യമാണ്. പ്രോസസ്സറിന് തന്നെ ഒരു രജിസ്റ്ററിൽ സമാനമായ പ്രവർത്തനങ്ങളുള്ള നിരവധി ഡാറ്റ സ്ഥാപിക്കാൻ കഴിയില്ല. പ്രോഗ്രാമർ, അവർ പറയുന്നതുപോലെ, ഒരു പ്രോഗ്രാം എഴുതുമ്പോൾ സ്വമേധയാ, പ്രോസസ്സർ മെമ്മറിയിൽ നിന്ന് അത്തരം ഡാറ്റ MMX രജിസ്റ്ററുകളിലേക്ക് ലോഡ് ചെയ്യുകയും അവ ഉപയോഗിച്ച് അത്തരം SIMD പ്രവർത്തനങ്ങൾ നടത്തുകയും ചെയ്യുന്നുവെന്ന് വ്യക്തമായി സൂചിപ്പിക്കണം. ഇത് ചെയ്യുന്നതിന്, അവൻ തന്നെ മെമ്മറിയിൽ ഡാറ്റ ശരിയായി തയ്യാറാക്കണം, അങ്ങനെ അത് രജിസ്റ്ററുകളിലേക്ക് നന്നായി യോജിക്കുന്നു. ചില സാഹചര്യങ്ങളിൽ, വളരെ കാര്യക്ഷമമായ SIMD നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുന്ന കോഡ് സ്വയമേവ സൃഷ്ടിക്കുന്ന പ്രത്യേക SIMD-ഒപ്റ്റിമൈസിംഗ് കംപൈലറുകൾ ഫലപ്രദമായി ഉപയോഗിക്കാൻ സാധിക്കും. പക്ഷേ, ഒരു ചട്ടം പോലെ, ഫലപ്രദമായ സമാഹാരത്തിനായി, ചില നിയമങ്ങൾക്ക് അനുസൃതമായി പ്രോഗ്രാം കോഡ് ഇതിനകം എഴുതിയിരിക്കണം.
എന്നാൽ എല്ലാ അൽഗോരിതങ്ങളും തത്വത്തിൽ, SIMD വിപുലീകരണങ്ങളുമായി നന്നായി പൊരുത്തപ്പെടുത്താൻ കഴിയില്ല. ഇനിപ്പറയുന്ന പദപ്രയോഗം കണക്കാക്കാൻ ശ്രമിക്കുക - (a+b*c)*d. മൂന്നിൽ താഴെ ടീമുകൾക്കൊപ്പം നിങ്ങൾക്ക് പോകാൻ കഴിയില്ല. ഫോമിൻ്റെ (x,y,z,w) നാല് വെക്റ്ററുകളുടെ ആകെത്തുക കണ്ടെത്താൻ ഇതേ മൂന്ന് കമാൻഡുകൾ ഉപയോഗിക്കാം. (x1+x2+x3+x4, y1+y1+y3+y4, z1+z2+z3+z4, w1+w2+w3+w4). SIMD ഓപ്പറേഷനുകൾ സാധാരണ പ്രവർത്തനങ്ങളുടെ ഏതാണ്ട് അതേ വേഗതയിൽ നടക്കുന്നുണ്ടെങ്കിൽ, പ്രോസസറിന് ഒന്നും ചെയ്യാനില്ലാത്തതിനാൽ യാഥാർത്ഥ്യമാണ്, SIMD-നായി നന്നായി ഒപ്റ്റിമൈസ് ചെയ്ത പ്രോഗ്രാമുകൾ എക്സിക്യൂട്ട് ചെയ്യുമ്പോൾ നിങ്ങൾക്ക് വേഗതയിൽ ഒന്നിലധികം വർദ്ധനവ് കാണാൻ കഴിയും.
ഒരു ഡവലപ്പറുടെ വീക്ഷണകോണിൽ നിന്ന്, നിരവധി തരം SIMD ഒപ്റ്റിമൈസേഷൻ ഉണ്ട്. നേരിട്ടുള്ള മാനുവൽ കോഡ് ഒപ്റ്റിമൈസേഷൻ, വളരെ കാര്യക്ഷമവും തികച്ചും അധ്വാനവും. വ്യത്യസ്ത അളവിലുള്ള വിജയത്തോടെ പ്രവർത്തിക്കുന്ന സാധാരണ കോഡ് സൃഷ്ടിക്കുന്നതിന് പകരം കംപൈലറിൻ്റെ "പ്രേരണ". സാധാരണ പൊതു പ്രവർത്തനങ്ങൾ നടത്തുന്ന പ്രോസസ്സർ നിർമ്മാതാക്കൾ നൽകുന്ന ഫംഗ്ഷനുകളുടെ പ്രീ-ഒപ്റ്റിമൈസ് ചെയ്ത ലൈബ്രറികളുടെ ഉപയോഗം. അവസാന ഓപ്ഷൻ ഏറ്റവും മികച്ചതാണെന്ന് വ്യക്തമാണ്.
SIMD വിപുലീകരണങ്ങൾ എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു, 3DNow-ൽ നിന്ന് MMX എങ്ങനെ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു! കൂടാതെ എസ്എസ്ഇ മുതലായവ? ഒന്നാമതായി, പിന്തുണയ്ക്കുന്ന ഡാറ്റയുടെ തരങ്ങൾ, രജിസ്റ്ററുകളുടെ വലുപ്പം, എണ്ണം, സാധ്യമായ പ്രവർത്തനങ്ങളുടെ സെറ്റുകൾ എന്നിവയിൽ അവ വ്യത്യാസപ്പെട്ടിരിക്കുന്നു. വ്യത്യസ്‌ത വിപുലീകരണങ്ങൾക്ക് മറ്റ് പരാമീറ്ററുകൾ കൂടുതലോ കുറവോ സമാനമായതിനാൽ ഡാറ്റാ തരമാണ് ഏറ്റവും പ്രധാനപ്പെട്ട വ്യത്യാസം.
പ്രോസസർ നിരവധി ഫോർമാറ്റുകളിൽ നമ്പറുകൾക്കൊപ്പം പ്രവർത്തിക്കുന്നു, പ്രാഥമികമായി ഡാറ്റ ഫ്ലോട്ടിംഗ് ഡെസിമൽ പോയിൻ്റ് നമ്പറുകളും പൂർണ്ണസംഖ്യകളും ആയി തിരിച്ചിരിക്കുന്നു. വ്യത്യസ്‌ത ജോലികൾക്ക് വ്യത്യസ്‌ത ഡാറ്റ പ്രാതിനിധ്യം ആവശ്യമാണ്. രണ്ടാമത്തെ പാരാമീറ്റർ ബൈറ്റുകളിലെ വലുപ്പമാണ്. ഫ്ലോട്ടിംഗ്-പോയിൻ്റ് ഡാറ്റ ചില കൃത്യതയോടെ ഏകപക്ഷീയമായ യഥാർത്ഥ സംഖ്യകളെ ഏകദേശമാക്കുന്നു; ഓരോ നമ്പറിനും കൂടുതൽ ബൈറ്റുകൾ അനുവദിച്ചാൽ കൃത്യത വർദ്ധിക്കും. ഒരു പൂർണ്ണസംഖ്യയിലേക്ക് കൂടുതൽ ബൈറ്റുകൾ അനുവദിച്ചാൽ, അത് ഉൾപ്പെടുന്ന മൂല്യങ്ങളുടെ വലിയ ശ്രേണി.

MMX

എംഎംഎക്സ് എക്സ്റ്റൻഷൻ വളരെക്കാലം മുമ്പ് പ്രത്യക്ഷപ്പെട്ടു, പേഴ്സണൽ കമ്പ്യൂട്ടറുകൾക്ക് സ്റ്റാൻഡേർഡ് ആയി. MMX എന്നാൽ മൾട്ടി മീഡിയ എക്സ്റ്റൻഷനുകൾ. മൾട്ടിമീഡിയ ഡാറ്റ, ഇമേജ്, ശബ്ദം എന്നിവയിൽ പ്രവർത്തിക്കാൻ രൂപകൽപ്പന ചെയ്ത ഒരു വിപുലീകരണം.
MMX സാങ്കേതികവിദ്യയുള്ള പ്രോസസ്സറുകൾക്ക് 8 MMX രജിസ്റ്ററുകൾ ഉണ്ട്, ഓരോന്നിനും 64 ബിറ്റുകൾ = 8 ബൈറ്റുകൾ വലിപ്പമുണ്ട്. MMX പൂർണ്ണസംഖ്യകളിൽ മാത്രമേ പ്രവർത്തിക്കൂ; 1, 2, 4 അല്ലെങ്കിൽ 8 ബൈറ്റുകളുടെ ഡാറ്റ വലുപ്പങ്ങൾ പിന്തുണയ്ക്കുന്നു. അതായത്, ഒരു MMX രജിസ്റ്ററിൽ 8, 4, 2 അല്ലെങ്കിൽ 1 ഓപ്പറാൻറ് അടങ്ങിയിരിക്കാം.


തുടങ്ങിയവ. MMX രജിസ്റ്ററുകളിൽ അടങ്ങിയിരിക്കുന്ന ഡാറ്റ, ഘടകങ്ങൾ അനുസരിച്ച് കൂട്ടിച്ചേർക്കാനും ഗുണിക്കാനും, കുറയ്ക്കാനും കഴിയും, കൂടാതെ മൾട്ടിമീഡിയ ആപ്ലിക്കേഷനുകൾക്ക് ആവശ്യമായ വിവിധ നിർദ്ദിഷ്ട പ്രവർത്തനങ്ങൾ നടത്താം, ഓവർഫ്ലോ ഇല്ലാതെ കൂട്ടിച്ചേർക്കൽ, ഗണിത ശരാശരി കണക്കാക്കൽ, ബിറ്റുകൾ ഉപയോഗിച്ച് ലോജിക്കൽ പ്രവർത്തനങ്ങൾ നടത്തുക. ബിറ്റ്വൈസ്, അല്ലെങ്കിൽ, xor. എന്നിരുന്നാലും, വിഭജിക്കുന്നത് അസാധ്യമാണ്, ഇപ്പോഴും നിയന്ത്രണങ്ങളുണ്ട്. എന്നാൽ പല പ്രവർത്തനങ്ങളും വേഗത്തിലുള്ള ക്രമത്തിൽ ചെയ്യാൻ കഴിയും, അതിലും കൂടുതൽ. എന്നിരുന്നാലും, പ്രത്യേകിച്ച് MMX-ൻ്റെ ഉപയോഗത്തിന് പ്രത്യേക മാനുവൽ ഒപ്റ്റിമൈസേഷൻ ആവശ്യമാണ്; ഒരു കമ്പൈലറും ഇവിടെ കാര്യമായി സഹായിക്കില്ല. ഉദാഹരണത്തിന്, MMX-ന്, വിവിധ ഓഡിയോ ഫയൽ കോഡെക്കുകൾ ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്നു, ഇവയുടെ അൽഗോരിതങ്ങൾ MMX-നൊപ്പം നന്നായി പ്രവർത്തിക്കുന്നു. മാത്രമല്ല, മുഴുവൻ പ്രോഗ്രാമും അല്ല, പ്രധാന ജോലി ചെയ്യുന്ന ഒരു ചെറിയ ഭാഗം, ഈ സാഹചര്യം ഒപ്റ്റിമൈസേഷൻ ലളിതമാക്കുന്നു.

SSE2 - പൂർണ്ണസംഖ്യ പ്രവർത്തനങ്ങൾ

പെൻ്റിയം 4-നൊപ്പം താരതമ്യേന അടുത്തിടെ വന്ന ഒരു നൂതനത്വത്തിലേക്ക് എപ്പോഴാണെന്ന് ദൈവത്തിനറിയാവുന്ന MMX-ൽ നിന്ന് ഞങ്ങൾ എങ്ങനെയാണ് പെട്ടെന്ന് കുതിച്ചത്? SSEയും 3DNow ഉം വിജയിച്ചു! SSE2 അടിസ്ഥാനപരമായി വ്യത്യസ്തമായ രണ്ട് ഭാഗങ്ങൾ ഉൾക്കൊള്ളുന്നു - SSE യുടെ തുടർച്ചയും MMX ൻ്റെ തുടർച്ചയും. SSE തുടർച്ച യഥാർത്ഥ സംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു, MMX തുടർച്ച പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു. SSE2-ൽ, MMX-നെ അപേക്ഷിച്ച് രജിസ്റ്ററുകൾ ഇരട്ടിയായി, അതായത്, അത് 8 അക്കങ്ങളല്ല, 16-നെ നിലനിർത്താൻ തുടങ്ങി. നിർദ്ദേശ നിർവ്വഹണത്തിൻ്റെ വേഗത മാറാത്തതിനാൽ, SSE2-നായി ഒപ്റ്റിമൈസ് ചെയ്യുമ്പോൾ, പ്രോഗ്രാമിന് എളുപ്പത്തിൽ ഇരട്ടി വർദ്ധനവ് ലഭിച്ചു. പ്രകടനത്തിൽ. ഇനിപ്പറയുന്ന സാഹചര്യവും ശ്രദ്ധിക്കേണ്ടതാണ്. MMX-നായി പ്രോഗ്രാം ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, കമാൻഡ് സിസ്റ്റത്തിൻ്റെ സമാനത കാരണം SSE2-നുള്ള ഒപ്റ്റിമൈസേഷൻ താരതമ്യേന എളുപ്പമാണ്.
അത്‌ലോൺ എക്‌സ്‌പി SSE2-നെ പിന്തുണയ്‌ക്കുന്നില്ല, അതിനാൽ എൻകോഡ് ചെയ്യുമ്പോൾ ആദ്യം പെൻ്റിയം 4 അത്‌ലോൺ എക്‌സ്‌പിയോട് തോറ്റപ്പോൾ രസകരമായ ഒരു ചിത്രം നിരീക്ഷിക്കാൻ കഴിയും, എന്നാൽ എസ്എസ്ഇ 2 നുള്ള കോഡെക് ഒപ്റ്റിമൈസ് ചെയ്‌തതിന് ശേഷം അത് വിജയിക്കാൻ തുടങ്ങി. SSE2-ൽ MMX വികസിപ്പിക്കുക എന്ന ആശയം ഒരു വിജയമായി കണക്കാക്കാം, കാരണം MMX-നായി ഒപ്റ്റിമൈസ് ചെയ്തിട്ടില്ലാത്ത പ്രോഗ്രാമുകൾ, ഒപ്റ്റിമൈസ് ചെയ്തവ ശരിയായി ഒപ്റ്റിമൈസ് ചെയ്തിരിക്കുന്നു. ചില സാധാരണ കോഡിംഗ് പ്രവർത്തനങ്ങൾ നടത്തുന്ന SSE2 നായി ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്ത ഫംഗ്ഷനുകളുടെ ഏതാണ്ട് സൗജന്യ ലൈബ്രറികൾ സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാർക്ക് നൽകുന്നതിൽ ഇൻ്റൽ സ്വയം വ്യതിരിക്തമാണ് എന്നത് ശ്രദ്ധിക്കേണ്ടതാണ്. പെൻ്റിയം 4 പ്രോസസറുകളുടെ പ്രകടനം "സംരക്ഷിക്കുന്നതിൽ" ഈ സാഹചര്യം ഒരു പ്രധാന പങ്ക് വഹിച്ചു.

എസ്.എസ്.ഇ

ഇനി നമുക്ക് SSE ഇൻസ്ട്രക്ഷൻ സെറ്റ് നോക്കാം. പെൻ്റിയം III പ്രൊസസറുകൾക്കൊപ്പം ഇത് പ്രത്യക്ഷപ്പെട്ടു, പക്ഷേ പെൻ്റിയം 4 പുറത്തിറങ്ങിയതിനുശേഷം പൂർണ്ണമായും പൂത്തു, അതിൽ എസ്എസ്ഇയുടെ ഉപയോഗം പ്രകടനത്തിൽ സമൂലമായ വർദ്ധനവ് നൽകി.
ജ്യാമിതീയ കണക്കുകൂട്ടലുകളിൽ, അതായത് 3D ഗ്രാഫിക്‌സ് ആപ്ലിക്കേഷനുകൾ, കമ്പ്യൂട്ടർ ഗെയിമുകൾ, 3DStudioMax പോലുള്ള എഡിറ്റർമാർ, കൂടാതെ മറ്റു പലതിലും ഉപയോഗിക്കുന്ന യഥാർത്ഥ-ടൈപ്പ് ഡാറ്റ ഉപയോഗിച്ചാണ് എസ്എസ്ഇ പ്രവർത്തിക്കുന്നത്. ക്വേക്ക് പോലുള്ള കമ്പ്യൂട്ടർ ഗെയിമുകളിൽ, വീഡിയോ ആക്‌സിലറേറ്ററുകൾ ഉപയോഗിച്ച് ട്രയാംഗിൾ ടെക്‌സ്‌ചറിംഗ് ചെയ്യാൻ തുടങ്ങിയതിനാൽ, പൂർണ്ണസംഖ്യകളുടെ കണക്കുകൂട്ടലുകളുടെ ആവശ്യമില്ല. ഒരു യഥാർത്ഥ വെക്റ്ററിനെ ഒരു യഥാർത്ഥ മാട്രിക്സ് കൊണ്ട് ഗുണിക്കുന്നത് പോലെയുള്ള ഫ്ലോട്ടിംഗ് പോയിൻ്റ് പ്രവർത്തനങ്ങളുടെ വേഗതയാണ് ആദ്യം വന്നത്. ഡെവലപ്പർക്ക് SSE എന്താണ് വാഗ്ദാനം ചെയ്യുന്നതെന്ന് ഇപ്പോൾ നോക്കാം.
എസ്എസ്ഇ നടപ്പിലാക്കുമ്പോൾ, x87 ആർക്കിടെക്ചറിൻ്റെ സ്റ്റാൻഡേർഡ് രജിസ്റ്ററുകൾക്ക് പുറമേ, 128 ബിറ്റ് വലുപ്പമുള്ള 8 പുതിയ വലിയ രജിസ്റ്ററുകൾ പ്രോസസറിന് ലഭിച്ചു, അവയിൽ ഓരോന്നിനും 4 32-ബിറ്റ് യഥാർത്ഥ സംഖ്യകൾ അടങ്ങിയിരിക്കുന്നു.

ഭാഗം 3ഭാഗം 2ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
രജിസ്റ്റർ 3
* * * * രജിസ്റ്റർ 2
2 55.9 -1.9ഇ101.567ഇ-6രജിസ്റ്റർ 1
0.7 -100.0 11.2 0.5 രജിസ്റ്റർ 0

ക്വാഡ്രപ്പിൾ ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ച്, നിങ്ങൾക്ക് ഇനിപ്പറയുന്ന പ്രവർത്തന ഘടകങ്ങൾ ഘടകം പ്രകാരം നിർവഹിക്കാൻ കഴിയും: രണ്ട് ക്വാഡ്രപ്പിൾ സംഖ്യകൾ ചേർക്കുക, കുറയ്ക്കുക, ഗുണിക്കുക, ഹരിക്കുക. 4 (പരസ്പരം) വർഗ്ഗമൂലങ്ങൾ ഒരേസമയം, കൃത്യമായി അല്ലെങ്കിൽ ഏകദേശം കണക്കാക്കുക. നിങ്ങൾക്ക് രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങൾ ഷഫിൾ ചെയ്യാനും രജിസ്റ്ററിൻ്റെ ഒരു ഭാഗത്ത് നിന്ന് മറ്റൊന്നിലേക്ക് ഡാറ്റ കൈമാറാനും സമാനമായ മറ്റ് ചില പ്രവർത്തനങ്ങൾ നടത്താനും കഴിയും. എന്നിരുന്നാലും, ഡാറ്റാ ചലനം അതിൻ്റെ കൂട്ടിച്ചേർക്കലിനേക്കാൾ വേഗതയുള്ളതല്ല, അതിനാൽ തയ്യാറാക്കിയതും ശരിയായി പായ്ക്ക് ചെയ്തതുമായ ഡാറ്റയിൽ മാത്രമേ എസ്എസ്ഇയുടെ ഫലപ്രദമായ ഉപയോഗം സാധ്യമാകൂ.
പെൻ്റിയം 4 പ്രോസസറിൽ, ഒരു SSE പ്രവർത്തനം സമാനമായ ഒരു സാധാരണ പ്രവർത്തനത്തോളം തന്നെ എടുക്കും. അതായത്, ഒപ്റ്റിമൈസേഷൻ ഉപയോഗിച്ച് നിങ്ങൾക്ക് പ്രകടനത്തിൽ 4 മടങ്ങ് വർദ്ധനവ് ലഭിക്കും. കൂടുതൽ കൃത്യമായി പറഞ്ഞാൽ, പുതിയ വലിയ രജിസ്റ്ററുകളുടെ ഉപയോഗം കാരണം. എന്നിരുന്നാലും, എല്ലാ കണക്കുകൂട്ടലുകളും എസ്എസ്ഇക്ക് ഫലപ്രദമായി ഒപ്റ്റിമൈസ് ചെയ്യാൻ കഴിയില്ല. ഒരു "നല്ല" പ്രശ്നത്തിൻ്റെ ഒരു ഉദാഹരണം ഒരു ചതുരാകൃതിയിലുള്ള മാട്രിക്സ് ഒരു ചതുരാകൃതിയിലുള്ള വെക്റ്റർ കൊണ്ട് ഗുണിക്കുക എന്നതാണ്. പ്രത്യേക ചെലവുകളില്ലാതെ നാലിരട്ടി ത്വരണം.
ഒന്നാമതായി, SSE യുടെ ഉപയോഗം ഒരു ത്രിമാന രംഗം സൃഷ്ടിക്കുന്ന ത്രികോണങ്ങളുടെ ശീർഷകങ്ങളുടെ പരിവർത്തനം നടത്തുമ്പോൾ ഏറ്റവും പുതിയ വീഡിയോ ആക്സിലറേറ്ററുകളുമായി വിജയകരമായി മത്സരിക്കാൻ ആധുനിക പ്രോസസ്സറുകളെ അനുവദിക്കുന്നു. മറ്റൊരു കാര്യം, പ്രോസസ്സറിന് മറ്റ് നിരവധി ജോലികൾ ഉണ്ട്, സാധ്യമെങ്കിൽ അത് അൺലോഡ് ചെയ്യുന്നതാണ് നല്ലത്, അങ്ങനെ അത് വീഡിയോ ആക്സിലറേറ്ററുമായി സമാന്തരമായി പ്രവർത്തിക്കുന്നു.
അത്‌ലോൺ എക്സ്പിയുടെ കാര്യമോ? യഥാർത്ഥത്തിൽ, സാധാരണ അത്‌ലോണുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പ്രധാന കണ്ടുപിടുത്തങ്ങളിലൊന്ന് എസ്എസ്ഇ സാങ്കേതികവിദ്യയുടെ ആമുഖമായിരുന്നു. സാധാരണ കോഡുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ നിങ്ങൾക്ക് ഏകദേശം 2x വേഗത പ്രതീക്ഷിക്കാം. എന്നിരുന്നാലും, അത്ലൺ എക്സ്പിയിൽ "മോശം" നടപ്പിലാക്കുന്നത് എസ്എസ്ഇ അല്ല, എന്നാൽ സാധാരണ കോഡിൻ്റെ നിർവ്വഹണം വളരെ കാര്യക്ഷമമാണ്. അതേ ആവൃത്തിയിൽ, SSE നിർദ്ദേശങ്ങൾ മാത്രം ഉപയോഗിച്ച്, Athlon XP, Pentium 4 എന്നിവയ്ക്ക് സമാനമായ പ്രകടനമുണ്ട്. സോപാധിക ജമ്പുകൾ നടത്തുമ്പോൾ അത്‌ലോൺ എക്‌സ്‌പിക്കും ഒരു നേട്ടമുണ്ട്, അതിനാൽ ഇത് ഇതിന് നന്നായി പ്രവർത്തിക്കുന്നു. എന്നാൽ പെൻ്റിയം 4 ഉയർന്ന ആവൃത്തികളിൽ എത്തുന്നു, ഇത് SIMD നിർദ്ദേശങ്ങൾ ഉപയോഗിക്കുമ്പോൾ, ചിലപ്പോൾ അത് കാര്യമായ വേഗത കൈവരിക്കാൻ അനുവദിക്കുന്നു.

3Dഇപ്പോൾ! കൂടാതെ 3 എഎംഡി സ്ട്രാറ്റജി തെറ്റുകൾ

എഎംഡിയിൽ നിന്നുള്ള പ്രോസസർ നിർദ്ദേശങ്ങളുടെ പ്രൊപ്രൈറ്ററി എക്സ്റ്റൻഷൻ - നമുക്ക് ഇപ്പോൾ ഒരർത്ഥത്തിൽ, എസ്എസ്ഇയുടെ ഒരു എതിരാളിയെ പരിഗണിക്കാം. SSE-യെ 3DNow-യുടെ എതിരാളി എന്ന് വിളിക്കുന്നത് കൂടുതൽ കൃത്യമായിരിക്കാം! കാരണം അത് പിന്നീട് പ്രത്യക്ഷപ്പെട്ടു. ഞാൻ നിങ്ങളെ ഓർമ്മിപ്പിക്കട്ടെ, 3DNow! ഇൻ്റൽ പെൻ്റിയം II ൻ്റെ എതിരാളികളായ AMD k6-2-3D ​​പ്രോസസറുകളിൽ ആദ്യമായി നടപ്പിലാക്കി. യഥാർത്ഥത്തിൽ, 3DNow ൻ്റെ ആമുഖം കാരണം അവർക്ക് ലഭിച്ചു! പ്രിഫിക്സ് അല്ലെങ്കിൽ, നിങ്ങൾക്ക് താൽപ്പര്യമുണ്ടെങ്കിൽ, പോസ്റ്റ്ഫിക്സ് 3D. എന്തുകൊണ്ട് 3DNow! നമുക്ക് അതിനെ SSE-യുടെ എതിരാളി എന്ന് സുരക്ഷിതമായി വിളിക്കാമോ? ഈ വിപുലീകരണങ്ങളുടെ വ്യത്യസ്ത "ബ്രാൻഡ്" അഫിലിയേഷനുകളിൽ മാത്രമല്ല പോയിൻ്റ്; എല്ലാത്തിനുമുപരി, അവ ഒരേ പ്രൊസസർ നിർമ്മാതാവിന് സൃഷ്ടിക്കാമായിരുന്നു. ഈ രണ്ട് വിപുലീകരണങ്ങളും യഥാർത്ഥ സംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു, ജ്യാമിതീയ ആപ്ലിക്കേഷനുകളിൽ ഉപയോഗിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തവയാണ്.
അതിനാൽ, 3DNow! ഈ വിപുലീകരണം എസ്എസ്ഇക്ക് പല തരത്തിൽ സമാനമാണ്, എന്നാൽ കാര്യമായ വ്യത്യാസങ്ങളുമുണ്ട്. 8 രജിസ്റ്ററുകളും ഉണ്ട്, എന്നാൽ അവ 128 ബിറ്റുകളല്ല, 64. അതനുസരിച്ച്, അവ 4 അക്കങ്ങളല്ല, മറിച്ച് 2 മാത്രമാണ്. എസ്എസ്ഇക്ക് സമാനമായ രജിസ്റ്ററുകളുള്ള ഒരു കൂട്ടം ഗണിത പ്രവർത്തനങ്ങളുണ്ട്. രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ മുതലായവ കൂട്ടിച്ചേർക്കുക-ഗുണിക്കുക-വിഭജിക്കുക. (വിപരീത) സ്ക്വയർ റൂട്ട്, കൃത്യമായതും വേഗതയേറിയതുമായ ഏകദേശം കണ്ടെത്തുന്നതിനുള്ള പ്രവർത്തനങ്ങളും ഉണ്ട്.

ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
* * രജിസ്റ്റർ 3
10000.1 6.7 രജിസ്റ്റർ 2
-0.5 1.5e7രജിസ്റ്റർ 1
2.0 1.0 രജിസ്റ്റർ 0

നിങ്ങൾ ഊഹിക്കുന്നതുപോലെ, 3DNow!-യ്‌ക്കായി പൂർണ്ണമായും ഒപ്റ്റിമൈസ് ചെയ്‌തിരിക്കുന്ന കോഡിൻ്റെ വിഭാഗങ്ങളിൽ, രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ച് ഒരേസമയം പ്രവർത്തനങ്ങൾ നിർവ്വഹിക്കുന്നതിനാൽ നിങ്ങൾക്ക് പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് പ്രതീക്ഷിക്കാം. ഇത് എസ്എസ്ഇ ഉപയോഗിക്കുന്നതിനേക്കാൾ കുറവാണെന്ന് തോന്നുന്നു. തീർച്ചയായും, നിങ്ങൾ ഒപ്റ്റിമൈസ് ചെയ്യാൻ പോകുകയാണെങ്കിൽ, പ്രത്യേകിച്ച് സ്വമേധയാ, പരമാവധി പ്രകടന വർദ്ധനവിനായി നോക്കുന്നതാണ് നല്ലത്. ഈ സാഹചര്യം, വിപണിയിൽ പരമ്പരാഗതമായി ഇൻ്റൽ പ്രോസസറുകളുടെ വലിയ പങ്ക്, 3DNow ൻ്റെ വ്യാപനം തടയുന്ന പ്രധാന ഘടകങ്ങളിലൊന്നായി മാറി! ഡെവലപ്പർമാർക്കിടയിൽ.
തീർച്ചയായും, SSE പ്രോസസ്സറുകളുടെ വലിയ വിഹിതത്തിൻ്റെ "ഷെയർ" ഘടകം 3DNow ൻ്റെ വിതരണത്തെ സ്വാധീനിക്കുന്നു! പരമാവധി. പ്രയോഗത്തിന് ക്ഷമിക്കണം. കൂടാതെ, പെൻ്റിയം III-ലെ എസ്എസ്ഇ ഉപയോഗത്തിൽ നിന്നുള്ള വർദ്ധനവ് - 3DNow ഉള്ള അത്‌ലോൺ പ്രൊസസറുകളുടെ മുൻ എതിരാളികൾ! - പെൻ്റിയം 4-ൽ ഉള്ളതിൻ്റെ പകുതിയോളം. 3DNow ഉപയോഗിക്കുന്നതിന് സമാനമാണ് പ്രഭാവം! എഎംഡി അത്‌ലോണിൽ.
എന്നിരുന്നാലും, 3DNow തമ്മിൽ ഒരു പ്രധാന വ്യത്യാസം കൂടിയുണ്ട്! നിങ്ങൾക്ക് ഒരു രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങൾ ഒരുമിച്ച് ചേർക്കാം. അതായത്, "ലംബമായ" പ്രവർത്തനങ്ങൾ മാത്രമല്ല, തിരശ്ചീനമായവയും നടത്തുക. രണ്ട് ത്രിമാന വെക്റ്ററുകളുടെ സ്കെയിലർ ഉൽപ്പന്നമായ - SSE-യിൽ അടിസ്ഥാന ജ്യാമിതീയ പ്രവർത്തനങ്ങളിൽ ഒന്ന് നടപ്പിലാക്കാൻ ശ്രമിക്കുക. നല്ലതൊന്നും വരില്ല. ഒരു നീണ്ട SSE രജിസ്റ്ററിൻ്റെ ഘടകങ്ങൾ ചേർക്കാൻ കഴിയില്ല; അധിക രജിസ്റ്ററുകൾ ഉപയോഗിക്കേണ്ടതാണ്. ഇത് ഏതെങ്കിലും എസ്എസ്ഇ ഇല്ലാത്തതിനേക്കാൾ വേഗത്തിൽ മാറില്ല, ഒരുപക്ഷേ മന്ദഗതിയിലായിരിക്കാം. ഒരു വെക്റ്ററിൻ്റെ മാനദണ്ഡവും പോയിൻ്റുകൾ തമ്മിലുള്ള ദൂരവും കണ്ടെത്തുമ്പോൾ ഉൾപ്പെടെ, സ്കെയിലർ ഉൽപ്പന്നം പലപ്പോഴും കണ്ടുമുട്ടുന്നു. ഇക്കാര്യത്തിൽ, 3DNow! കൂടുതൽ വഴക്കമുള്ളതിനാൽ കൂടുതൽ അഭികാമ്യമായി തോന്നുന്നു.
3DNow ന് അനുകൂലമായി സംസാരിക്കുന്ന മറ്റൊരു പ്രധാന സാഹചര്യം കംപൈലർ ഉപയോഗിച്ച് വളരെ ഫലപ്രദമായ ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷൻ്റെ സാധ്യതയാണ്. സ്വയമേവയുള്ള ഡാറ്റാ ഓർഗനൈസേഷനായി SSE വളരെ വലുതാണ് - രജിസ്റ്റർ വലുപ്പങ്ങൾ വലുതാണ്. ഫ്ലോട്ടിംഗ് പോയിൻ്റ് കണക്കുകൂട്ടലുകൾ നിറഞ്ഞ കോഡിൽ, നിങ്ങൾക്ക് പ്രകടനത്തിൽ ഏകദേശം ഒന്നര തവണ വർദ്ധനവ് സൗജന്യമായി ലഭിക്കും. എന്നാൽ എഎംഡി അത്തരമൊരു കംപൈലർ സൃഷ്‌ടിച്ചില്ല, അതേസമയം ഇൻ്റൽ എസ്എസ്ഇയെ പിന്തുണയ്‌ക്കുന്ന സ്വന്തം ഒപ്‌റ്റിമൈസിംഗ് കമ്പൈലറിനെ ശക്തമായി പ്രോത്സാഹിപ്പിക്കുകയായിരുന്നു, തീർച്ചയായും, ഏതെങ്കിലും 3DNow നെക്കുറിച്ചല്ല! അറിയാതെ. സ്‌പെക് പ്രോസസർ ടെസ്റ്റുകൾക്കായി (www.spec.org) സോഴ്‌സ് കോഡ് കംപൈൽ ചെയ്യാൻ എഎംഡി ഇൻ്റലിൻ്റെ കംപൈലർ ഉപയോഗിച്ചു. ഞങ്ങൾക്ക് സ്വന്തമായി ഇല്ല; ടെസ്റ്റ് ആപ്ലിക്കേഷൻ്റെ പരമാവധി പ്രകടനം നേടുന്നതിന് ഞങ്ങൾ ഏറ്റവും കാര്യക്ഷമമായ കംപൈലർ ഉപയോഗിക്കേണ്ടതുണ്ട്.
ഡവലപ്പർമാർ, സ്വാഭാവികമായും, പ്രോഗ്രാമുകൾ കൂടുതൽ ഒപ്റ്റിമൈസ് ചെയ്യാൻ ശ്രമിച്ചില്ല, കൂടാതെ ഏറ്റവും സാധാരണമായ ഇൻ്റൽ പ്രോസസറുകൾക്ക് ആവശ്യമുള്ള ഒപ്റ്റിമൈസേഷനിൽ ഇതിനകം തന്നെ ധാരാളം ബുദ്ധിമുട്ടുകൾ ഉണ്ട്. ഒന്നുകിൽ SIMD ഒപ്റ്റിമൈസേഷൻ ഇല്ലായിരുന്നു, അപ്പോൾ അത്‌ലോൺ പ്രോസസർ മികച്ച പ്രകടനം കാഴ്ചവച്ചു, പ്രത്യേകിച്ച് പെൻ്റിയം 4 നെ അപേക്ഷിച്ച്. അല്ലെങ്കിൽ SSE(2) ന് ഒപ്റ്റിമൈസേഷൻ ഉണ്ടായിരുന്നു, തുടർന്ന് താരതമ്യേന പറഞ്ഞാൽ അത്‌ലോൺ നഷ്ടപ്പെട്ടു.
3DNow ഉപയോഗിച്ച് AMD ഗൌരവമായി കണക്കുകൂട്ടിയെന്ന് നമുക്ക് പറയാം!, തീർച്ചയായും, ആദ്യ അവതരണത്തിൽ ഒരു പ്രത്യേക പ്രാദേശിക പ്രഭാവം ഉണ്ടായിരുന്നു. പ്രധാനമായും പരസ്യംചെയ്യൽ, ഒപ്റ്റിമൈസ് ചെയ്ത ജനപ്രിയ ആപ്ലിക്കേഷനുകൾക്കിടയിൽ, ഓപ്പൺജിഎൽ ഡ്രൈവറുകൾ മാത്രമേ ശ്രദ്ധിക്കാൻ കഴിയൂ, അതിൽ വേഗതയിൽ ഗണ്യമായ വർദ്ധനവ് നിരീക്ഷിക്കപ്പെട്ടു. അവർക്ക് അവരുടെ കമാൻഡ് എക്സ്റ്റൻഷൻ "ഭേദിക്കാൻ" കഴിയാത്തതിനാൽ, അവരുടെ പ്രോസസറുകളിൽ എല്ലാ ഇൻ്റൽ പുതുമകളും കർശനമായി നടപ്പിലാക്കുന്നത് നല്ലതാണ്. ഉപയോഗിക്കാത്ത 3DNow-ന് പകരം ഞങ്ങൾ ഇത് നടപ്പിലാക്കും! അത്‌ലോൺ XP SSE2 കമാൻഡ് സിസ്റ്റം ഉപയോഗിക്കുന്നു, അത് അത്ര കാര്യക്ഷമമല്ലെങ്കിലും. പ്രോസസർ സുവർണ്ണ നിറമായിരിക്കും, മിക്കവാറും ദുർബലമായ പോയിൻ്റുകളൊന്നുമില്ല.
മുന്നോട്ട് നോക്കുമ്പോൾ, എഎംഡിയെ അതിൻ്റെ പ്രോസസറുകൾക്കായുള്ള ഒരു കംപൈലറിനെക്കുറിച്ച് വിഷമിക്കാൻ ജീവിതം ഒടുവിൽ നിർബന്ധിച്ചുവെന്ന് ഞാൻ പറയും. കാരണം പുതിയ എഎംഡി x86-64 ആർക്കിടെക്ചറിന് പുതിയ ഫീച്ചറുകൾ പ്രയോജനപ്പെടുത്തുന്നതിന് നിലവിലുള്ള ആപ്ലിക്കേഷനുകൾ വീണ്ടും കംപൈൽ ചെയ്യേണ്ടതുണ്ട്. AMD അത്‌ലോൺ 64 പ്രോസസറുകളും 3DNow നിലനിർത്തുന്നു, അതിനാൽ SSE, 3DNow എന്നിവയ്‌ക്കായുള്ള ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷൻ്റെ ഫലപ്രാപ്തി താരതമ്യം ചെയ്യാൻ കഴിയും! ഇത് ശരിക്കും രസകരമായിരിക്കും.

SSE2

അവസാനമായി, നമുക്ക് SSE2 നോക്കാം - x86-അനുയോജ്യമായ പേഴ്സണൽ കമ്പ്യൂട്ടർ മാർക്കറ്റിൽ നിലവിൽ ലഭ്യമായ ഏറ്റവും പുതിയ SIMD വിപുലീകരണം. പൂർണ്ണസംഖ്യ ഘടകത്തെക്കുറിച്ച് നമ്മൾ നേരത്തെ ചർച്ച ചെയ്തിട്ടുണ്ട്. എന്നാൽ SSE2 പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നതിനുള്ള നിർദ്ദേശങ്ങൾ മാത്രമല്ല ഉൾപ്പെടുത്തിയത്. അതേ 8 വലിയ 128-ബിറ്റ് രജിസ്റ്ററുകൾ ഇപ്പോൾ നാല് 32-ബിറ്റ് യഥാർത്ഥ സംഖ്യകളല്ല, രണ്ട് 64-ബിറ്റ് ഹൈ-പ്രിസിഷൻ യഥാർത്ഥ സംഖ്യകൾ ഉൾക്കൊള്ളുന്നതായി വ്യാഖ്യാനിക്കാം. സാധാരണ കൃത്യതയുള്ള കണക്കുകൂട്ടലുകൾ വലിയ പിശകുകളിലേക്ക് നയിക്കുന്ന സന്ദർഭങ്ങളിൽ വർദ്ധിച്ച കൃത്യതയുള്ള സംഖ്യകൾ ഉപയോഗിക്കുന്നു. എല്ലാ പ്രവർത്തനങ്ങളും എസ്എസ്ഇയിൽ നിന്ന് ഏറ്റെടുത്തു, അവ പ്രവർത്തിക്കുന്നത് നാല് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചല്ല, രണ്ട് ജോഡി ഓപ്പറണ്ടുകൾ ഉപയോഗിച്ചാണ്. ശരിയാണ്, സ്ക്വയർ റൂട്ടിൻ്റെ ഏകദേശ കണക്കുകൂട്ടൽ സ്വാഭാവികമായും അപ്രത്യക്ഷമായി.

ഭാഗം 1ഭാഗം 0
രജിസ്റ്റർ 7
രജിസ്റ്റർ 6
രജിസ്റ്റർ 5
രജിസ്റ്റർ 4
രജിസ്റ്റർ 3
* * രജിസ്റ്റർ 2
-1.5ഇ10 0.00001 രജിസ്റ്റർ 1
1e-25 5.5 രജിസ്റ്റർ 0

ഇത് 3DNow! ൻ്റെ ഒരു അനലോഗ് ആയി മാറി, എന്നാൽ ഒരു രജിസ്റ്ററിലെ ഉള്ളടക്കങ്ങൾ ഒരുമിച്ച് ചേർക്കുന്നതിനുള്ള വഴക്കമുള്ള പ്രവർത്തനമില്ലാതെ.
വേഗതയുടെ കാര്യമോ? ഒരു ഗവേഷകൻ ഒരിക്കൽ എന്നോട് ചോദിച്ചു, എസ്എസ്ഇയുടെ കണക്കുകൂട്ടൽ പ്രവർത്തനം എങ്ങനെ മികച്ച രീതിയിൽ ഒപ്റ്റിമൈസ് ചെയ്യാൻ കഴിയുമെന്ന്; മാഗ്നിറ്റ്യൂഡ് ആക്സിലറേഷൻ്റെ ക്രമം കൈവരിക്കാൻ കഴിയുമെന്ന് അദ്ദേഹം എവിടെയോ കേട്ടിരുന്നു. ഏത് തരത്തിലുള്ള ഡാറ്റയാണ് ഇത് ഉപയോഗിക്കുന്നത്? കണക്കുകൂട്ടലുകളുടെ കൃത്യതയെക്കുറിച്ച് ഒരിക്കൽ കൂടി ഉറപ്പാക്കാൻ, വർദ്ധിച്ച കൃത്യതയോടെ അത് മാറി. തുടർന്ന് അവൻ ഒപ്റ്റിമൈസേഷനായി SSE2 ഉപയോഗിക്കുകയും പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് "മാത്രം" കൊണ്ട് തൃപ്തിപ്പെടുകയും വേണം.
കണക്കുകൂട്ടൽ പ്രോഗ്രാമുകളുടെ പ്രകടനം വിലയിരുത്തുന്നതിന് നിങ്ങൾക്ക് ഒരു ലളിതമായ നിയമം നേടാനാകും: പ്രോഗ്രാം എസ്എസ്ഇ2-നായി പ്രത്യേകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, അത് ലോൺ എക്സ്പിയുമായി താരതമ്യപ്പെടുത്തുമ്പോൾ പെൻ്റിയം 4 പ്രോസസറുകളിൽ അത് കൂടുതലോ കുറവോ വേഗത്തിൽ പ്രവർത്തിക്കും. ഏറ്റവും ഉയർന്ന ആവൃത്തിയിൽ വാറ്റിയെടുക്കുക. പ്രത്യേക ഒപ്റ്റിമൈസേഷൻ ഇല്ലെങ്കിൽ, അനുബന്ധ റേറ്റിംഗ് ഉള്ള അത്ലോൺ XP പ്രോസസറിന് അത് നഷ്ടപ്പെടും.

പുതിയ പ്രെസ്കോട്ട് നിർദ്ദേശങ്ങൾ

പ്രെസ്‌കോട്ട് പ്രോസസറിൽ നടപ്പിലാക്കുന്ന സാധാരണ സെറ്റ് കമാൻഡുകളിലെ പുതുമകൾ പരിചയപ്പെടാനും അവയുടെ ഉപയോഗക്ഷമത വിലയിരുത്താനുമുള്ള സമയമാണിത്.
ഒന്നാമതായി, നമുക്ക് യഥാർത്ഥത്തിൽ എന്താണ് വേണ്ടത്? ഞാൻ ഉദ്ദേശിക്കുന്നത് പ്രാഥമികമായി സോഫ്റ്റ്‌വെയർ ഡെവലപ്പർമാരെയാണ്.
ത്രിമാന പ്രോഗ്രാമുകളുടെ മിക്കവാറും എല്ലാ ഡെവലപ്പർമാർക്കും, പ്രാഥമികമായി കമ്പ്യൂട്ടർ ഗെയിമുകൾ, ഒരു ചെറിയ സ്വപ്നമുണ്ട്: ജ്യാമിതീയ വസ്തുക്കൾ, വെക്റ്ററുകൾ, മെട്രിക്സുകൾ എന്നിവയെ പ്രതിനിധീകരിക്കുന്ന ക്ലാസുകളുടെ സൗകര്യപ്രദവും വേഗതയേറിയതുമായ ഒരു ലൈബ്രറി ഉണ്ടായിരിക്കുക.

ക്ലാസ് വെക്റ്റർ
{
ഫ്ലോട്ട് x,y,z;

പൊതു:

ഇൻലൈൻ സുഹൃത്ത് വെക്റ്റർ ഓപ്പറേറ്റർ +(കോൺസ്റ്റ് വെക്റ്റർ &എ, കോൺസ്റ്റ് വെക്റ്റർ &ബി); //കൂടാതെ

ഇൻലൈൻ ഫ്ലോട്ട് മാനദണ്ഡം () കോൺസ്റ്റ്; // വെക്റ്റർ നീളം
ഇൻലൈൻ ഫ്ലോട്ട് norm2() const; // വെക്റ്റർ നീളം ചതുരാകൃതിയിലുള്ളത്

ഇൻലൈൻ ഫ്രണ്ട് ഫ്ലോട്ട് ഡോട്ട് (കോൺസ്റ്റ് വെക്റ്റർ & എ, കോൺസ്റ്റ് വെക്റ്റർ & ബി); // സ്കെയിലർ ഉൽപ്പന്നം
};


അതിനാൽ നിങ്ങൾക്ക് a=b+c എന്ന് ലളിതമായി എഴുതാം, മടുപ്പോടെ a.x=b.x+c.x എന്ന് ടൈപ്പ് ചെയ്യരുത്; a.y=b.y+c.y; a.z=b.z+c.z; കൂടാതെ, ഈ വഴിയിൽ എപ്പോഴും എന്തെങ്കിലും ഉണ്ടായിരുന്നു. അല്ലെങ്കിൽ ഒരു മോശം കംപൈലർ വെക്റ്റർ അഡീഷൻ ഫംഗ്‌ഷനിലേക്കുള്ള കോളുകൾ കംപൈൽ ചെയ്‌തു, പ്രകടനം ഓവർഹെഡ് എഴുത്ത് സൗകര്യത്തേക്കാൾ കൂടുതലാണ്. എസ്എസ്ഇ ഉപയോഗിക്കുന്നത് വെക്റ്ററുകൾ ചേർക്കുന്നത് സൗകര്യപ്രദമാണെന്ന് മനസ്സിലായി, എന്നാൽ സ്കെയിലറും വെക്റ്റർ ഉൽപ്പന്നവും കണക്കാക്കുന്നത് തികച്ചും അസൗകര്യവും മന്ദഗതിയിലുമാണ്.
തുടർന്ന് ഒരു ചെറിയ അത്ഭുതം സംഭവിച്ചു: പുതിയ നിർദ്ദേശങ്ങൾ വെക്റ്റർ മാത്തമാറ്റിക്സ് ഉൾപ്പെടെയുള്ള എസ്എസ്ഇ, എസ്എസ്ഇ2 എന്നിവയ്ക്ക് ഒപ്റ്റിമൈസേഷൻ വളരെ എളുപ്പമാക്കും.
നമുക്ക് സൂക്ഷ്മമായി നോക്കാം.
ഏറ്റവും പ്രധാനപ്പെട്ട കാര്യം: ഒടുവിൽ ഒരു എസ്എസ്ഇ രജിസ്റ്ററിൻ്റെ ഘടകങ്ങൾ പരസ്പരം ഫലപ്രദമായി ചേർക്കുന്നത് സാധ്യമായി.


അധിക രജിസ്റ്ററുകൾ ഉപയോഗിക്കാതെ രണ്ട് വെക്റ്ററുകളുടെ സ്കെയിലർ ഉൽപ്പന്നം അല്ലെങ്കിൽ വെക്റ്ററിൻ്റെ മാനദണ്ഡം കണക്കാക്കാൻ നിങ്ങൾക്ക് മൂന്ന് കമാൻഡുകൾ ഉപയോഗിക്കാം. തീർച്ചയായും, അത്തരം ഒരു തിരശ്ചീന കൂട്ടിച്ചേർക്കൽ കമാൻഡിൻ്റെ പ്രകടനത്തെക്കുറിച്ച് ആശങ്കകൾ നിലനിൽക്കുന്നു. കമാൻഡ് നടപ്പിലാക്കിയാൽ അത് വലുതായിരിക്കണമെന്നില്ല. ഈ നിർദ്ദേശം നടപ്പിലാക്കുന്നത് പ്രോസസർ പൈപ്പ്ലൈൻ പുനഃസജ്ജമാക്കില്ലെന്ന് നമുക്ക് പ്രതീക്ഷിക്കാം.
അതുപോലെ, നിങ്ങൾക്ക് ചേർക്കാൻ കഴിയില്ല, പക്ഷേ ഒരു രജിസ്റ്ററിൻ്റെ ഘടകങ്ങൾ കുറയ്ക്കുക.
ഒരേ SSE2 രജിസ്റ്ററിൽ ഉള്ള രണ്ട് സംഖ്യകൾ ചേർക്കാനും കുറയ്ക്കാനും ഇപ്പോൾ സാധിക്കും. രണ്ട് മൂലകങ്ങളുടെ സംയോജിത സങ്കലനത്തിനും കുറയ്ക്കുന്നതിനുമുള്ള ഒരു നിർദ്ദേശവും പ്രത്യക്ഷപ്പെട്ടു.

y2x2
ADDSUBPD
y1x1
=
y1+y2x1-x2

സങ്കീർണ്ണ സംഖ്യകളുടെ ഗുണനത്തിൻ്റെ സ്വഭാവമാണ് ഈ നിർദ്ദേശത്തിൻ്റെ രൂപം. (a+bi)*(c+di)=a*c-b*d+(b*c+a*d)i ഇപ്പോൾ SSE2-നുള്ള സങ്കീർണ്ണ സംഖ്യകളുള്ള കണക്കുകൂട്ടലുകളുടെ ഒപ്റ്റിമൈസേഷൻ ഗണ്യമായി ലളിതമാക്കിയിരിക്കുന്നു. സാരാംശത്തിൽ, SSE2 3DNow ന് സമാനമായി മാറിയിരിക്കുന്നു!, ഇത് കൂടുതൽ കൃത്യതയോടെ സംഖ്യകളിൽ മാത്രമേ പ്രവർത്തിക്കൂ.

പുതിയ നിർദ്ദേശങ്ങളുടെ ഒരു പട്ടിക ഇതാ.

നിർദ്ദേശങ്ങൾവിവരണം
തിരശ്ചീന രജിസ്റ്റർ പ്രവർത്തനങ്ങൾ
HADDPSഎസ്എസ്ഇ രജിസ്റ്ററുകളുടെ ഉള്ളടക്കങ്ങളുടെ തിരശ്ചീന കൂട്ടിച്ചേർക്കൽ
HSUBPSഎസ്എസ്ഇ രജിസ്റ്ററുകളുടെ ഉള്ളടക്കത്തിൻ്റെ തിരശ്ചീനമായ കുറയ്ക്കൽ
HADDPDഒരു SSE2 രജിസ്റ്ററിൻ്റെ രണ്ട് ഘടകങ്ങളുടെ കൂട്ടിച്ചേർക്കൽ
HSUBPDSSE2 രജിസ്റ്ററിലെ മറ്റ് രണ്ട് ഘടകങ്ങളിൽ നിന്ന് ഒന്ന് കുറയ്ക്കുന്നു
എല്ലാ അർത്ഥത്തിലും, ഡവലപ്പർമാർ വളരെക്കാലമായി കാത്തിരിക്കുന്ന ഉപയോഗപ്രദമായ കമാൻഡുകൾ, ഓട്ടോമാറ്റിക്, മാനുവൽ ഒപ്റ്റിമൈസേഷൻ ഗൗരവമായി ലളിതമാക്കുന്നു.
ഡാറ്റ ലോഡ് കമാൻഡുകൾ
MOVSHDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, 2-ഉം 4-ഉം 32-ബിറ്റ് ഘടകങ്ങൾ മാത്രം പകർത്തുന്നു
MOVSLDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, 1, 2 32-ബിറ്റ് ഘടകങ്ങൾ മാത്രം പകർത്തുന്നു
MOVDDUPഡെസ്റ്റിനേഷൻ രജിസ്റ്ററിലേക്ക് ഡാറ്റ ലോഡ് ചെയ്യുന്നു, ഉറവിട രജിസ്റ്ററിൻ്റെ ആദ്യ പകുതി പകർത്തി ഇരട്ടിയാക്കുന്നു
സ്വയമേവയുള്ളതും മാനുവൽ ഒപ്റ്റിമൈസേഷനും ഉപയോഗപ്രദമാണ്.
സംയോജിത കൂട്ടിച്ചേർക്കൽ-വ്യവകലനം
ADDSUBPS(x1,y1,z1,w1) * (x2,y2,z2,w2) =
(x1-x2,y1+y1,z1-z2,w1+w2)
ADDSUBPD(x1, y1) * (x2, y2) =
(x1-x2, y1+y2)
സങ്കീർണ്ണമായ സംഖ്യകളുള്ള പ്രവർത്തനങ്ങൾ നടപ്പിലാക്കുന്നത് ഗണ്യമായി ലളിതമാക്കുന്നു. പ്രോഗ്രാമുകളുടെ ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷനിൽ സഹായിക്കുന്നു.

താരതമ്യേന അപൂർവമായ ഫൈൻ-ഗ്രെയിൻഡ് മാനുവലും ഓട്ടോമാറ്റിക് ഒപ്റ്റിമൈസേഷനും.
ഡാറ്റ പരിവർത്തനം
FISTTPഒരേയൊരു പുതിയ x87 നിർദ്ദേശം. കോപ്രോസസർ സ്റ്റാക്കിലെ ഉള്ളടക്കങ്ങൾ ഒരു പൂർണ്ണസംഖ്യ തരത്തിലേക്ക് വേഗത്തിൽ പരിവർത്തനം ചെയ്യുന്നു.
സമാഹരിക്കുന്ന സമയത്ത് ഒരു പ്രോഗ്രാം സ്വയമേവ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന് ഉപയോഗപ്രദമാണ്. ഒരു കാലത്ത്, ഈ നിർദ്ദേശം സ്റ്റാൻഡേർഡ് x87 നിർദ്ദേശ സെറ്റിലേക്ക് ചേർക്കാൻ അവർ മറന്നു, ഇപ്പോൾ ഈ ഒഴിവാക്കൽ ശരിയാക്കി.
മെച്ചപ്പെടുത്തിയ ഹൈപ്പർ-ത്രെഡിംഗ് പിന്തുണ
മോണിറ്റർ/MWAITനിർദ്ദിഷ്ട മെമ്മറി ശ്രേണിയിലേക്ക് പ്രോസസ്സർ റൈറ്റ് ഇവൻ്റ് നിരീക്ഷിക്കുകയും "സ്ലീപ്പിംഗ്" ത്രെഡ് സജീവമാക്കുകയും ചെയ്യുന്നു.
ഹൈപ്പർ-ത്രെഡിംഗ് സാങ്കേതികവിദ്യയെയും പൊതുവെ മൾട്ടി-ത്രെഡിംഗിനെയും പിന്തുണയ്ക്കുന്നതിനായി ഓപ്പറേറ്റിംഗ് സിസ്റ്റം പ്രോഗ്രാമുകളുടെയും സേവനങ്ങളുടെയും ഒപ്റ്റിമൈസേഷൻ ലളിതമാക്കുന്നു.

നവീകരണങ്ങളുടെ വിലയിരുത്തലും AMD x86-64 മായി താരതമ്യം ചെയ്യലും

ഇൻസ്ട്രക്ഷൻ സിസ്റ്റങ്ങളിലേക്കുള്ള കൂട്ടിച്ചേർക്കലുകൾ നോക്കുമ്പോൾ, പ്രെസ്‌കോട്ട് പ്രൊസസറിൻ്റെ ഇൻസ്ട്രക്ഷൻ സെറ്റ് കുറച്ച് യോജിപ്പും പൂർണ്ണതയും നേടിയിട്ടുണ്ടെന്ന് നമുക്ക് സുരക്ഷിതമായി പറയാൻ കഴിയും. സമൂലമായ പുതുമകൾ പ്രത്യക്ഷപ്പെടുന്നതുവരെ നിങ്ങൾക്ക് വളരെക്കാലം ജീവിക്കാൻ കഴിയും. രജിസ്റ്ററുകളുടെ എണ്ണം വർദ്ധിക്കാത്തത് ഖേദകരമാണ്, എന്നാൽ x86 ആർക്കിടെക്ചർ മെഷീൻ നിർദ്ദേശ ഫോർമാറ്റിലെ പരിമിതികൾ കാരണം അനുയോജ്യത നഷ്ടപ്പെടാതെ ഇത് ചെയ്യാൻ പ്രയാസമാണ്. കാര്യക്ഷമമായ fisttp കൺവേർഷൻ കമാൻഡ് പോലെ എല്ലാത്തരം നല്ല ചെറിയ കാര്യങ്ങളും പൂർത്തിയായി. SIMD-ഒപ്റ്റിമൈസ് ചെയ്ത കോഡിൻ്റെ ഓട്ടോമാറ്റിക് ജനറേഷൻ വളരെ ലളിതമാക്കിയിരിക്കുന്നു. പ്രോസസ്സറിന്, അജ്ഞാത വിലയ്ക്ക് പുറമേ, ഒരു ദുർബലമായ പോയിൻ്റ് മാത്രമേ ഉണ്ടാകൂ - പൈപ്പ്ലൈനിൻ്റെ വലിയ ആഴം, അതിനാൽ, സോപാധിക ശാഖകൾക്ക് ശക്തമായ "ഇഷ്ടപ്പെടാത്തത്". എന്നിരുന്നാലും, പൈപ്പ്ലൈൻ നീളം കൂട്ടുന്നത് ഉയർന്ന ആവൃത്തികളിലേക്കുള്ള പരിവർത്തനത്തിൻ്റെ അനിവാര്യമായ ദോഷമാണ്. സമീപ വർഷങ്ങളിൽ ഇൻ്റലിൽ നിന്നുള്ള ഏറ്റവും മനോഹരമായ പ്രോസസറാണിതെന്ന് ഞാൻ വ്യക്തിപരമായി കരുതുന്നു. ഞങ്ങൾ ഇപ്പോൾ വൈദ്യുതി ഉപഭോഗത്തെക്കുറിച്ചോ തണുപ്പിക്കൽ ആവശ്യകതകളെക്കുറിച്ചോ സംസാരിക്കുന്നില്ല - ഇതിൽ പ്രശ്നങ്ങളൊന്നും ഉണ്ടാകില്ലെന്ന് നമുക്ക് പ്രതീക്ഷിക്കാം. വിലയെ സംബന്ധിച്ചിടത്തോളം, അത് അമിതമാകില്ലെന്ന് വിശ്വസിക്കാൻ കാരണമുണ്ട്. രണ്ടാമത്തെ ലെവൽ കാഷെയുടെ വലുപ്പം നോക്കാം - 1MB, അപ്പോൾ അനുബന്ധ സെലറോൺ എന്താണ് പ്രതിനിധീകരിക്കുന്നത്? ഇതിന് 512KB കാഷെ ഉണ്ടാകുമോ? ഇത് ഇനി ഒരു സെലറോണായിരിക്കില്ല, ഒരുതരം പോക്കറ്റ് രാക്ഷസനാണ്. പല ആപ്ലിക്കേഷനുകൾക്കും, 256KB കാഷെ മതിയാകും, അതിനാൽ ചിലവ് കുറയ്ക്കുന്നതിന് വലിയ മാർജിൻ ഉണ്ട്. ഒരു പുതിയ സാങ്കേതിക പ്രക്രിയയിലേക്കുള്ള മാറ്റം വലിയ നേട്ടങ്ങൾ വാഗ്ദാനം ചെയ്യുന്നുവെന്ന് പ്രത്യേകം പറയേണ്ടതില്ല.
എന്നിരുന്നാലും, പ്രോസസറിൻ്റെ വില നാടകീയമായി വർദ്ധിപ്പിക്കാൻ കഴിയുന്ന ഒരു സാഹചര്യമുണ്ട്. അതിന് യോഗ്യരായ എതിരാളികൾ ഉണ്ടാകുമോ? അത്തരമൊരു എതിരാളിയുടെ മുഖത്ത്, എഎംഡിയിൽ നിന്ന് ഒരു പുതിയ 64-ബിറ്റ് പ്രോസസർ കാണാൻ ഞങ്ങൾ ആഗ്രഹിക്കുന്നു - അത്ലോൺ 64. അതിൻ്റെ സാങ്കേതിക സവിശേഷതകളെ കുറിച്ച് ഇതിനകം തന്നെ ധാരാളം പറഞ്ഞിട്ടുണ്ട്, അത് എങ്ങനെ ഡവലപ്പർമാരെ ആകർഷിക്കുമെന്ന് നമുക്ക് നോക്കാം.
AMD ഒടുവിൽ SSE2 പിന്തുണ നടപ്പിലാക്കി, അത് നല്ലതാണ്. പ്രോഗ്രാമിൽ SSE2 ഉപയോഗിക്കുന്നതുകൊണ്ട് ഇപ്പോൾ ഇൻ്റൽ പ്രോസസ്സറുകൾക്ക് പ്രയോജനം ലഭിക്കില്ല. നിങ്ങൾക്കറിയാവുന്നതുപോലെ, അത്‌ലോൺ 64 ന് നിരവധി ഓപ്പറേറ്റിംഗ് മോഡുകൾ ഉണ്ട് - അനുയോജ്യത മോഡും 64-ബിറ്റ് മോഡും, ഇത് യഥാർത്ഥത്തിൽ പുതിയ എഎംഡി x86-64 ആർക്കിടെക്ചറിൻ്റെ എല്ലാ സാധ്യതകളും തുറക്കുന്നു. കോംപാറ്റിബിലിറ്റി മോഡിൽ, പുതിയ പ്രൊസസർ ഒരു സോഫ്റ്റ്‌വെയർ ഡെവലപ്പറുടെ വീക്ഷണകോണിൽ നിന്ന് 3DNow ഉള്ള പെൻ്റിയം 4 ആയി അവതരിപ്പിക്കുന്നു! കൂടാതെ SIMD-ഒപ്റ്റിമൈസ് ചെയ്യാത്ത കോഡിൻ്റെ വെറുപ്പുളവാക്കുന്ന നിർവ്വഹണവും ശാഖകളോടുള്ള വലിയ ഇഷ്ടക്കേടും പോലുള്ള ചില പ്രത്യേക പോരായ്മകളില്ല. പുതിയ എഎംഡി പ്രോസസർ സാധാരണ പെൻ്റിയം 4 ന് യോഗ്യമായ എതിരാളിയായിരിക്കുമെന്ന് നമുക്ക് സുരക്ഷിതമായി പറയാൻ കഴിയും, തീർച്ചയായും അത് റിംഗിൽ എത്തിക്കാൻ കഴിയും.
വിപുലമായ ആപ്ലിക്കേഷനുകൾ ഉൾക്കൊള്ളുന്ന ഇൻ്റഗ്രേറ്റഡ് ടെസ്റ്റുകളിൽ പുതിയ അത്‌ലോണിൻ്റെ പ്രകടനവുമായി പൊരുത്തപ്പെടുന്നതിന് ഒരു പരമ്പരാഗത പെൻ്റിയം 4 പ്രോസസറിന് വളരെ പ്രധാനപ്പെട്ട ക്ലോക്ക് നേട്ടം ആവശ്യമാണെന്ന് ഒരാൾക്ക് തീർച്ചയായും പ്രവചിക്കാൻ കഴിയും. അതെ, യഥാർത്ഥത്തിൽ, പ്രോസസർ ഇതുവരെ വിപണിയിൽ ഇല്ലെങ്കിലും, പ്രോട്ടോടൈപ്പുകളുടെ ധാരാളം ടെസ്റ്റുകൾ ഉണ്ട്, അവിടെ ഓരോ ഫ്രീക്വൻസി അനുപാതത്തിലും പ്രകടനം അത്ലൺ 64 ൻ്റെ ഇരട്ടി ഉയർന്നതാണ്.
എന്നാൽ പുതിയ എക്സ്ക്ലൂസീവ് 64-ബിറ്റ് മോഡ് ഡെവലപ്പർക്ക് എന്താണ് വാഗ്ദാനം ചെയ്യുന്നത്? എല്ലാറ്റിൻ്റെയും നല്ല പുനഃസംയോജനത്തിനു പുറമേ, മൂന്ന് പ്രധാന കാര്യങ്ങളുണ്ട് - രജിസ്റ്ററുകളുടെ എണ്ണം ഇരട്ടിയാക്കൽ, 64-ബിറ്റ് ഗണിതശാസ്ത്രം, ആപ്ലിക്കേഷൻ്റെ വെർച്വൽ അഡ്രസ് സ്പേസ് 2 ജിബിക്ക് അപ്പുറം വികസിപ്പിക്കൽ. 64-ബിറ്റ് ഗണിതശാസ്ത്രം അതിൽ തന്നെ മികച്ചതാണ്, എന്നാൽ ഇന്ന് ഇതിന് ഡെസ്ക്ടോപ്പ് സിസ്റ്റങ്ങളിൽ വളരെ ഇടുങ്ങിയ പ്രയോഗമുണ്ട്. ബഹുഭൂരിപക്ഷം ആപ്ലിക്കേഷനുകൾക്കും, 32 ബിറ്റുകൾ മതിയാകും. 64-ബിറ്റ് ഇൻ്റിജർ അരിത്മെറ്റിക് ഉപയോഗിക്കുന്നതിന് വളരെ പ്രസക്തമായ ഒരു മേഖല എഎംഡി കണ്ടെത്തിയിട്ടുണ്ട് - ചില ക്രിപ്റ്റോഗ്രഫി ടാസ്ക്കുകളുടെ നിർവ്വഹണം ഗണ്യമായി ത്വരിതപ്പെടുത്തിയിരിക്കുന്നു.
സമീപഭാവിയിൽ ഡെസ്‌ക്‌ടോപ്പ് ആപ്ലിക്കേഷനുകളിൽ അഡ്രസ് സ്‌പേസ് വിപുലീകരിക്കുന്നത് തീർച്ചയായും ആവശ്യക്കാരായിരിക്കും, എന്നാൽ വരും വർഷങ്ങളിൽ 2 ജിബിയിൽ കൂടുതൽ മെമ്മറിയുള്ള പേഴ്‌സണൽ കമ്പ്യൂട്ടറുകൾ ഉണ്ടാകാനിടയില്ല.
രജിസ്റ്ററുകളുടെ എണ്ണം ഇരട്ടിയാക്കുക മാത്രമാണ് ഇനി ബാക്കിയുള്ളത്. അനാവശ്യമായ മെമ്മറി ആക്സസ് ഇല്ലാതെ രജിസ്റ്ററുകളിൽ ഉപയോഗിച്ച വേരിയബിളുകൾ സംഭരിക്കുന്നതിന് അധിക അവസരങ്ങൾ ദൃശ്യമാകുന്നു. രജിസ്റ്ററുകൾ ഉപയോഗിച്ച് ഫംഗ്ഷൻ പാരാമീറ്ററുകൾ കൂടുതൽ കാര്യക്ഷമമായി കൈമാറാൻ സാധിക്കും. മാത്രമല്ല, ഡവലപ്പർ ഇതിനെക്കുറിച്ച് വിഷമിക്കേണ്ടതില്ല, ഒപ്റ്റിമൈസിംഗ് കംപൈലർ എല്ലാം ചെയ്യും. രജിസ്റ്ററുകളുടെ എണ്ണം വർദ്ധിപ്പിക്കുന്നത് കോഡിൽ കൂടുതൽ കാര്യക്ഷമമായി സ്വതന്ത്ര നിർദ്ദേശങ്ങൾ സ്ഥാപിക്കാൻ അനുവദിക്കും, ഇത് പ്രോസസർ കൂടുതൽ സാന്ദ്രമായി ലോഡുചെയ്യാൻ അനുവദിക്കും. ഇതും കംപൈലറിൻ്റെ ഹാർഡി തോളിൽ വീഴും. രണ്ടാമത്തേത് ഏറ്റവും പ്രധാനപ്പെട്ട നേട്ടമായി എനിക്ക് തോന്നുന്നു. ആധുനിക പ്രോസസ്സറുകൾക്ക് ധാരാളം അലസമായ റൈറ്റ് ബഫറുകൾ ഉണ്ട് എന്നതാണ് വസ്തുത, ഇത് മെമ്മറി ലോഡുചെയ്യാതെ തന്നെ സ്വാപ്പ് രജിസ്റ്ററുകൾ വളരെ കാര്യക്ഷമമായി സംഘടിപ്പിക്കുന്നത് സാധ്യമാക്കുന്നു. മെമ്മറിയിലേക്ക് അയച്ചതും ഉടൻ അഭ്യർത്ഥിച്ചതുമായ ഡാറ്റ മെമ്മറിയിൽ നിന്ന് പ്രതീക്ഷിക്കുന്നില്ല, പക്ഷേ ബഫറിൽ നിന്ന് തൽക്ഷണം ലോഡ് ചെയ്യുന്നു. പ്രെസ്‌കോട്ട്, അത്തരം ബഫറുകളുടെ എണ്ണം വർദ്ധിപ്പിച്ചു.
അതെ, സെർവർ സിസ്റ്റങ്ങളിൽ പുതിയ എഎംഡി പ്രോസസറിനായി നല്ല സാധ്യതകൾ നമുക്ക് സുരക്ഷിതമായി അനുമാനിക്കാം. ശാഖകൾ അവനെ ഭയപ്പെടുത്തുന്നില്ല, വിലാസ സ്ഥലം വലുതാണ്, മതിയായ രജിസ്റ്ററുകൾ ഉണ്ട്, അയാൾക്ക് പെട്ടെന്ന് എൻക്രിപ്റ്റ് ചെയ്യാൻ കഴിയും. ഒരു ഡാറ്റാബേസ് സെർവറിന് ഇതെല്ലാം മോശമല്ല. താരതമ്യേന കുറഞ്ഞ വില ഒരു നിശ്ചിത സ്ഥലത്ത് അനുയോജ്യമാക്കും.
എന്നിരുന്നാലും, പേഴ്സണൽ കമ്പ്യൂട്ടറുകൾക്കായുള്ള, പ്രാഥമികമായി ത്രിമാന കമ്പ്യൂട്ടർ ഗെയിമുകളിൽ, കമ്പ്യൂട്ടേഷണലി ഹെവി ഗ്രാഫിക്സ് ആപ്ലിക്കേഷനുകളിൽ അതിൻ്റെ സാധ്യതകൾ പരിഗണിക്കാം. യഥാർത്ഥത്തിൽ, ഒരു ആധുനിക ഗെയിമിലെ പ്രകടനം എന്താണ്? രണ്ട് പ്രധാന ഘടകങ്ങളിൽ: ഉയർന്ന തലത്തിലുള്ള ഇൻ്റലിജൻ്റ് സീൻ പ്രോസസ്സിംഗ്, പോർട്ടൽ സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് അദൃശ്യമായ പ്രാകൃതങ്ങൾ വെട്ടിമാറ്റൽ, മുതലായവ, AI കണക്കുകൂട്ടൽ, ഭൗതിക മാതൃക. ഒരു വീഡിയോ ആക്സിലറേറ്ററിലേക്ക് വേഗത്തിൽ ഡാറ്റ തള്ളാനുള്ള കഴിവാണ് രണ്ടാമത്തെ ഘടകം. വലിയ ക്ലോക്ക് സ്പീഡും ഉയർന്ന സിസ്റ്റം ബസ് ഫ്രീക്വൻസിയും VPU "ഫീഡിംഗ്" പ്രശ്നത്തിൽ ഇൻ്റലിൽ നിന്നുള്ള പുതിയ പ്രോസസർ പരാജയപ്പെടാൻ അനുവദിക്കരുത്. ഗെയിം എഞ്ചിൻ്റെ പ്രകടനം തന്നെ, എല്ലാം കൂടുതൽ സങ്കീർണ്ണമാണ്. എഎംഡിക്ക് ശാഖകളോട് കൂടുതൽ വിശ്വസ്ത മനോഭാവമുണ്ട്, ഇത് ഇത്തരത്തിലുള്ള കോഡിൽ പലപ്പോഴും സംഭവിക്കാറുണ്ട്. ക്രമരഹിതമായ ഒരു വലിയ എണ്ണം ശാഖകൾക്ക് ഏത് ഫ്രീക്വൻസി നേട്ടവും ഓഫ്‌സെറ്റ് ചെയ്യാൻ കഴിയും. അവസാനമായി, ആധുനിക ഗെയിമുകൾ നിറഞ്ഞ ജ്യാമിതീയ കണക്കുകൂട്ടലുകൾ ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിനുള്ള വളരെ സൗകര്യപ്രദമായ നിർദ്ദേശങ്ങളുടെ ഒരു കൂട്ടം 3DNow! മാത്രമല്ല, എഎംഡി അത്‌ലോൺ 64-ന് x86-64 ൻ്റെ പുതിയ കഴിവുകൾ ഉപയോഗിക്കുന്നതിന് ആപ്ലിക്കേഷനുകൾ വീണ്ടും കംപൈൽ ചെയ്യുന്നത് അഭികാമ്യമാണ്, 3DNow-നുള്ള ഒപ്റ്റിമൈസേഷൻ! ഒരു ഒപ്റ്റിമൈസിംഗ് കംപൈലർ വഴി സ്വയമേവ നിർമ്മിക്കപ്പെടും, ഡെവലപ്പർ പരിശ്രമം ആവശ്യമില്ല.
ഇൻ്റൽ പ്രെസ്‌കോട്ട് പ്രോസസർ ഒപ്റ്റിമൈസേഷനെ ഗണ്യമായി സുഗമമാക്കുന്ന പുതിയ സൗകര്യപ്രദമായ നിർദ്ദേശങ്ങൾ അവതരിപ്പിച്ചിട്ടില്ലെങ്കിൽ, പെൻ്റിയം 4-ൽ അന്തർലീനമായ വ്യക്തമായ ദുർബലമായ പോയിൻ്റുകൾ ഇല്ലാത്ത എഎംഡി പ്രൊസസറിന് ഞാൻ പ്രാഥമിക മുൻഗണന നൽകുമായിരുന്നു. മുൻകൂട്ടി പറയാൻ.
ഇൻ്റൽ ഡെവലപ്പർമാർക്ക് പുതിയ നിർദ്ദേശങ്ങളിൽ നിന്ന് പരമാവധി വേഗത ലഭിക്കുന്നുണ്ടെന്ന് ഉറപ്പാക്കാൻ ഒപ്റ്റിമൈസ് ചെയ്ത ഫീച്ചറുകളുടെ വിപുലമായ ശ്രേണി നൽകുന്നു. x86-64 ൻ്റെ കഴിവുകൾ പൂർണ്ണമായി പ്രയോജനപ്പെടുത്തുന്ന ലൈബ്രറികളുടെ ഒരു കൂട്ടം പ്രഖ്യാപിച്ചുകൊണ്ട് എഎംഡിയും ഈ പാത പിന്തുടർന്നു.
ഞാൻ ചിന്തിച്ചത് ഇതാണ്: പ്രെസ്കോട്ട് പ്രോസസറുകളിൽ ഇൻ്റൽ എഎംഡി x86-64 ആർക്കിടെക്ചർ അവതരിപ്പിക്കാൻ പോകുന്നുവെന്ന് വിചിത്രമായ കിംവദന്തികൾ ഉണ്ടായിരുന്നു, പ്രത്യേകിച്ചും അത് വിജയകരമാണെങ്കിൽ. ഇത് അൽപ്പം അവിശ്വസനീയമാണ്, ഇത് മുമ്പ് സംഭവിച്ചിട്ടില്ല. നേരെമറിച്ച്, എഎംഡി, പ്രോസസറുകളുടെ റിലീസ് ഇനിയും വൈകുന്നതിനാൽ, പുതിയ അത്‌ലോണിൽ അധിക പ്രെസ്‌കോട്ട് പ്രൊസസർ നിർദ്ദേശങ്ങൾ ഉൾപ്പെടുത്താത്തത് എന്തുകൊണ്ട്? അപ്പോൾ ഇൻ്റലിനായി ഒപ്റ്റിമൈസ് ചെയ്ത എല്ലാ ഫംഗ്ഷൻ ലൈബ്രറികളും എഎംഡി പ്രോസസറുകളിൽ നന്നായി പ്രവർത്തിക്കും. പ്രെസ്‌കോട്ട് പ്രോസസറിന് സൗകര്യപ്രദമായ നിർദ്ദേശങ്ങൾ കാരണം ഒരു നേട്ടവും ഉണ്ടാകില്ല. മാത്രമല്ല, ഒറ്റനോട്ടത്തിൽ ഇത് ചെയ്യുന്നത് വളരെ ബുദ്ധിമുട്ടുള്ള കാര്യമല്ല; എഎംഡി പ്രോസസറുകൾ വളരെക്കാലമായി ഫ്ലെക്സിബിൾ 3DNow പ്രവർത്തനങ്ങൾ നടത്തുന്നു! പകരം, കൂടുതൽ അനുയോജ്യമായ പ്രോസസർ കോർ ആർക്കിടെക്ചർ കാരണം, എഎംഡി സമാനമായ "തിരശ്ചീന" ഡാറ്റാ ഓപ്പറേഷനുകൾ അവതരിപ്പിക്കുമെന്ന് പ്രതീക്ഷിക്കാം, ഒന്നാമതായി, കുറഞ്ഞ ആവൃത്തി, ഒരു വലിയ എണ്ണം എക്സിക്യൂഷൻ മൊഡ്യൂളുകൾ മുതലായവ.
ഈ സുപ്രധാന ഒഴിവാക്കൽ ശരിയാക്കുമെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു, പ്രത്യേകിച്ചും എഎംഡിക്ക് അതിൻ്റെ പ്രോസസ്സറുകളിൽ എസ്എസ്ഇ വിപുലീകരണങ്ങൾ നടപ്പിലാക്കേണ്ടിവരുമെന്നതിനാൽ, എല്ലായ്പ്പോഴും സംഭവിച്ചതുപോലെ.

എല്ലാവർക്കും ഹലോ, പ്രോസസർ പിന്തുണയ്ക്കുന്ന എസ്എസ്ഇ നിർദ്ദേശങ്ങൾ എങ്ങനെ കണ്ടെത്താം എന്നതിനെക്കുറിച്ച് ഇന്ന് നമ്മൾ സംസാരിക്കും. എന്നാൽ എന്താണ് SSE നിങ്ങൾക്ക് അറിയാമോ? എനിക്കറിയില്ല, എനിക്കറിയില്ല എന്നല്ല, അതെന്താണെന്ന് എനിക്ക് മനസ്സിലാക്കാൻ പോലും കഴിയില്ല. ശരി, അതായത്, ഇത് അതിൻ്റെ പ്രവർത്തനം ഒപ്റ്റിമൈസ് ചെയ്യുന്നതിന് ആവശ്യമായ ഒരു പ്രോസസർ നിർദ്ദേശമാണെന്ന് ഞാൻ മനസ്സിലാക്കുന്നു, അതായത്, അതേ ആവൃത്തിയിൽ ഈ നിർദ്ദേശമുള്ള പ്രോസസ്സറിന് കൂടുതൽ കമാൻഡുകൾ പ്രോസസ്സ് ചെയ്യാൻ കഴിയും. എന്നാൽ ഇത് അങ്ങനെയാണ്, ഏകദേശം പറഞ്ഞാൽ, പറഞ്ഞാൽ ...

എസ്എസ്ഇയെക്കുറിച്ച്, ജീവിതത്തിൽ എവിടെയാണ് ഇത് ആവശ്യമെന്ന് എനിക്കറിയില്ല, ഒരുപക്ഷേ ഗെയിമുകൾക്ക്? ഹൈപ്പർ-ത്രെഡിംഗ് എന്താണെന്ന് എനിക്കറിയാം (ഇത് ഒരു പ്രോസസർ നിർദ്ദേശമല്ലെങ്കിലും, ഇത് ഒരു സാങ്കേതികവിദ്യയാണ്), VT-x, VT-d എന്താണ്, EM64T എന്താണെന്ന് എനിക്കറിയാം, എന്നാൽ SSE എന്താണെന്ന് എനിക്കറിയില്ല! ശരി, ഇവർ പൈസ് ആണ്

ചുരുക്കത്തിൽ, സുഹൃത്തുക്കളേ, ഈ വിഷയത്തിൽ ഒരു ചെറിയ കുഴപ്പമുണ്ടെന്ന് ഞാൻ ഉടൻ തന്നെ നിങ്ങളോട് പറയും, സ്റ്റാൻഡേർഡ് വിൻഡോസ് ടൂളുകൾ ഉപയോഗിച്ച്, എസ്എസ്ഇ പോലുള്ള ഒരു കാര്യം ഉണ്ടോ ഇല്ലയോ എന്ന് കണ്ടെത്താൻ കഴിയില്ല എന്നതാണ്. ഇവിടെ നിങ്ങൾ ഒരു പ്രത്യേക പ്രോഗ്രാം ഡൗൺലോഡ് ചെയ്യേണ്ടതുണ്ട്. എന്നാൽ വിഷമിക്കേണ്ട, ഈ സൂപ്പർ ഡ്യൂപ്പർ പ്രോഗ്രാം സൗജന്യമാണ്, ഭാരം വളരെ കുറവാണ്, കമ്പ്യൂട്ടർ ലോഡ് ചെയ്യുന്നില്ല, എന്നാൽ അതേ സമയം ഇത് MEGA ഉപയോഗപ്രദമാണ്, അതിൻ്റെ പേര് CPU-Z ആണ് (വഴി, നിങ്ങൾക്ക് ഇത് ഡൗൺലോഡ് ചെയ്യാം ഇവിടെ: cpuid.com/softwares/cpu-z.html , ഇതാണ് ഔദ്യോഗിക വെബ്സൈറ്റ്).

അതിനാൽ സുഹൃത്തുക്കളേ, CPU-Z ഡൗൺലോഡ് ചെയ്തു, അത് ഇൻസ്റ്റാൾ ചെയ്ത ശേഷം അത് സമാരംഭിച്ചു. ഉടൻ തന്നെ നിങ്ങൾ എല്ലാം കണ്ടെത്തും, ഈ എസ്എസ്ഇകളിൽ എത്രയെണ്ണം എനിക്കുണ്ട്:

ഒന്നല്ല, രണ്ടല്ല, ആറ്, കൊള്ളാം!

വഴിയിൽ, നിങ്ങൾക്ക് കാണാനാകുന്നതുപോലെ, ഇവിടെ ഇപ്പോഴും ധാരാളം ഉപയോഗപ്രദമായ വിവരങ്ങൾ ഉണ്ട്, കണ്ടോ? നിങ്ങളുടെ പ്രോസസിനെക്കുറിച്ച് നിങ്ങൾക്ക് അടിയന്തിരമായി എന്തെങ്കിലും കണ്ടെത്തണമെങ്കിൽ, നിങ്ങൾ പെട്ടെന്ന് CPU-Z സമാരംഭിക്കുക, ശ്ശോ, നിങ്ങൾക്ക് ആവശ്യമുള്ളതെല്ലാം നിങ്ങളുടെ വിരൽത്തുമ്പിലാണ്! CPU-Z പ്രോഗ്രാം ഒരു തരത്തിലുള്ളതാണെന്ന് ഞാൻ നിങ്ങളോട് പറയുന്നു! എന്നെ വിശ്വസിക്കുന്നില്ലേ? ശരി, പ്രശ്‌നമില്ല, ഞാനിത് ഇപ്പോൾ തന്നെ തെളിയിക്കും. നോക്കൂ, ഈ അല്ലെങ്കിൽ ആ മെമ്മറി സ്റ്റിക്ക് എപ്പോഴാണ് പുറത്തിറങ്ങിയതെന്ന് നിങ്ങൾക്കറിയാമോ? ശരി, അതായത്, ഫാക്ടറിയിൽ റിലീസ് ചെയ്ത തീയതി, അങ്ങനെ പറയാൻ. അല്ലെങ്കിൽ നിങ്ങൾക്ക് താൽപ്പര്യമില്ലേ? ശരി, ചില ആളുകൾക്ക് വളരെ താൽപ്പര്യമുണ്ട്, പക്ഷേ ഉദാഹരണത്തിന്, എനിക്ക് വളരെ താൽപ്പര്യമുണ്ട്! കൂടാതെ CPU-Z പ്രോഗ്രാമിന് അത്തരം വിവരങ്ങൾ കാണിക്കാൻ കഴിയും! അതിനാൽ സുഹൃത്തുക്കളേ, നോക്കൂ, ഞങ്ങൾ CPU-Z സമാരംഭിച്ചു, SPD ടാബിലേക്ക് പോകുക, അവിടെ നിങ്ങൾ ബ്രാക്കറ്റുള്ള (ഇടതുവശത്ത്) സ്ലോട്ട് തിരഞ്ഞെടുക്കുക, അതായത്, അത് ഇൻസ്റ്റാൾ ചെയ്തിരിക്കുന്ന കണക്റ്റർ തിരഞ്ഞെടുത്ത് തിരഞ്ഞെടുത്ത ബ്രാക്കറ്റിലെ വിവരങ്ങൾ നോക്കുക. നാലാമത്തെ സ്ലോട്ടിൽ എനിക്ക് ഒരു 8 ഗിഗ് സ്റ്റിക്ക് ഉണ്ട്, CPU-Z പ്രോഗ്രാം കാണിച്ച വിവരമാണിത്:

2014-ലെ 30-ാം വാരത്തിലാണ് എൻ്റെ ബാർ പുറത്തിറങ്ങിയതെന്ന് ഇവിടെ നിങ്ങൾക്ക് കാണാം. എൻ്റെ നിർമ്മാതാവ് ഹ്യുണ്ടായ് ഇലക്ട്രോണിക്സ് ആണെന്നും എഴുതിയിട്ടുണ്ട്, അതാണ് ഹൈനിക്സ് ബാറിനെ വിളിക്കുന്നത്

ശരി, ചുരുക്കത്തിൽ, സിപിയു-ഇസഡ് സൂപ്പർ ആണ്, ഒരു കമ്പ്യൂട്ടറിൻ്റെയോ ലാപ്‌ടോപ്പിൻ്റെയോ ഹാർഡ്‌വെയറിനെക്കുറിച്ചുള്ള ഏറ്റവും പ്രധാനപ്പെട്ട വിവരങ്ങൾ നിങ്ങൾക്ക് വേഗത്തിൽ കാണണമെങ്കിൽ, അത് ഗ്യാഗുകളില്ലാതെ എല്ലാം കാണിക്കും! ചുരുക്കത്തിൽ, ഞാൻ ഇത് ശുപാർശചെയ്യുന്നു സുഹൃത്തുക്കളെ!

കൂടാതെ, എസ്എസ്ഇയെക്കുറിച്ച് എന്തെങ്കിലും എഴുതാൻ ഞാൻ മറന്നു. SSE പ്രവർത്തനക്ഷമമാക്കാനോ പ്രവർത്തനരഹിതമാക്കാനോ കഴിയില്ല. കാരണം ഈ നിർദ്ദേശം നിലവിലുണ്ട് അല്ലെങ്കിൽ ഇല്ല. ഉദാഹരണത്തിന്, ഹൈപ്പർ-ത്രെഡിംഗ് പ്രവർത്തനക്ഷമമാക്കാം/അപ്രാപ്തമാക്കാം, എന്നാൽ എസ്എസ്ഇക്ക് കഴിയില്ല!

അത്രയേയുള്ളൂ സുഹൃത്തുക്കളെ, ഇവിടെ നിങ്ങൾക്ക് എല്ലാം വ്യക്തമായിരുന്നുവെന്ന് ഞാൻ പ്രതീക്ഷിക്കുന്നു, എന്തെങ്കിലും തെറ്റുണ്ടെങ്കിൽ, ഞാൻ ക്ഷമ ചോദിക്കുന്നു. സത്യസന്ധമായി, ഈ വിവരം നിങ്ങൾക്ക് ഉപയോഗപ്രദമായിരുന്നോ? അതെ എന്ന് ഞാൻ പൂർണ്ണഹൃദയത്തോടെ പ്രതീക്ഷിക്കുന്നു! ജീവിതത്തിൽ നിങ്ങൾക്ക് ഭാഗ്യം, നിങ്ങൾ ആരോഗ്യവാനായിരിക്കട്ടെ, അസുഖം വരാതിരിക്കട്ടെ, ഭാഗ്യം

09.12.2016

MMX പൂർണ്ണമായി മാറ്റിസ്ഥാപിക്കുക എന്ന ലക്ഷ്യത്തോടെ SSE2 SSE നിർദ്ദേശ സെറ്റ് വികസിപ്പിക്കുന്നു. 70 നിർദ്ദേശങ്ങൾ മാത്രമുള്ള SSE-യിൽ SSE2 സെറ്റ് 144 പുതിയ നിർദ്ദേശങ്ങൾ ചേർത്തു.

പ്രത്യേകതകൾ

  • എസ്എസ്ഇ 2, എസ്എസ്ഇ എക്സ്റ്റൻഷൻ ഇൻപുട്ടിനൊപ്പം x86 ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) ഉപയോഗിക്കുന്നു, അവ ഓരോന്നും തുടർച്ചയായി 2 ഇരട്ട-പ്രിസിഷൻ ഫ്ലോട്ടിംഗ് പോയിൻ്റ് മൂല്യങ്ങളായി കണക്കാക്കുന്നു.
  • SSE2 സ്കെയിലർ, ബോക്‌സ്ഡ് ഡാറ്റാ തരങ്ങളിൽ പ്രവർത്തനങ്ങൾ നടത്തുന്ന ഒരു ഇൻസ്ട്രക്ഷൻ സെറ്റ് ഉൾപ്പെടുന്നു.
  • SSE2-ൽ അതേ 128-ബിറ്റ് xmm രജിസ്റ്ററുകളിൽ ഇൻ്റിജർ ഡാറ്റയുടെ സ്ട്രീം പ്രോസസ്സിംഗിനുള്ള നിർദ്ദേശങ്ങൾ അടങ്ങിയിരിക്കുന്നു, ഈ വിപുലീകരണം വളരെ മുമ്പുള്ള MMX നിർദ്ദേശ ഗണത്തേക്കാൾ പൂർണ്ണസംഖ്യ കണക്കുകൂട്ടലുകൾക്ക് അനുയോജ്യമാക്കുന്നു.
  • എസ്എസ്ഇ2-ൽ രണ്ട് ഭാഗങ്ങൾ ഉൾപ്പെടുന്നു - എസ്എസ്ഇയുടെ തുടർച്ചയും എംഎംഎക്സിൻ്റെ തുടർച്ചയും.
    • എസ്എസ്ഇയുടെ തുടർച്ച യഥാർത്ഥ സംഖ്യകൾ ഉപയോഗിച്ച് പ്രവർത്തിക്കുന്നു.
    • തുടർച്ച MMX പൂർണ്ണസംഖ്യകളിൽ പ്രവർത്തിക്കുന്നു. SSE2-ൽ, MMX (64 ബിറ്റുകൾ -> 128 ബിറ്റുകൾ) അപേക്ഷിച്ച് രജിസ്റ്ററുകൾ ഇരട്ടിയായി. കാരണം പ്രബോധന നിർവ്വഹണത്തിൻ്റെ വേഗത മാറിയിട്ടില്ല; SSE2-നായി ഒപ്റ്റിമൈസ് ചെയ്യുമ്പോൾ, പ്രോഗ്രാമിന് പ്രകടനത്തിൽ ഇരട്ടി വർദ്ധനവ് ലഭിക്കുന്നു. MMX-നായി പ്രോഗ്രാം ഇതിനകം ഒപ്റ്റിമൈസ് ചെയ്തിട്ടുണ്ടെങ്കിൽ, കമാൻഡ് സിസ്റ്റത്തിൻ്റെ സമാനത കാരണം SSE2-നുള്ള ഒപ്റ്റിമൈസേഷൻ താരതമ്യേന എളുപ്പമാണ്.
  • വിവരങ്ങളുടെ അനിശ്ചിത സ്ട്രീമുകൾ പ്രോസസ്സ് ചെയ്യുമ്പോൾ കാഷെ മലിനീകരണം കുറയ്ക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തിട്ടുള്ള നിരവധി കാഷെ മാനേജ്മെൻ്റ് നിർദ്ദേശങ്ങൾ SSE2-ൽ ഉൾപ്പെടുന്നു.
  • SSE2-ൽ നമ്പർ കൺവേർഷൻ കമാൻഡുകളിലേക്ക് സങ്കീർണ്ണമായ കൂട്ടിച്ചേർക്കലുകൾ ഉൾപ്പെടുന്നു

ലിങ്കുകൾ


x86 ഫാമിലി പ്രൊസസ്സറുകൾക്കുള്ള അടിസ്ഥാന നിർദ്ദേശ വിപുലീകരണ സെറ്റുകൾ
MMX | MMXEXT | എസ്എസ്ഇ | SSE2| SSE3 | SSSE3 | SSE4 | ATA | 3Dഇപ്പോൾ! | 3DNowExt | SSE5 | AVX | എഇഎസ്

വിക്കിമീഡിയ ഫൗണ്ടേഷൻ. 2010.

മറ്റ് നിഘണ്ടുവുകളിൽ "SSE2" എന്താണെന്ന് കാണുക:

    SSE2- SSE2, സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2, IA 32 SIMD (സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, മൾട്ടിപ്പിൾ ഡാറ്റ) ഇൻസ്ട്രക്ഷൻ സെറ്റുകളിൽ ഒന്നാണ്. 2001-ൽ പെൻ്റിയം 4-ൻ്റെ പ്രാരംഭ പതിപ്പുമായി ഇൻ്റൽ ആണ് SSE2 ആദ്യമായി അവതരിപ്പിച്ചത്. ഇത് മുമ്പത്തെ SSE ഇൻസ്ട്രക്ഷൻ സെറ്റ് വിപുലീകരിക്കുന്നു,… … വിക്കിപീഡിയ

    SSE2- (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die Verarbeitung von… … Deutsch Wikipedia

    SSE2- Saltar a navegación, búsqueda SSE2 es el acrónimo de Streaming Single Instruction Multiple Data Extensions 2 es uno de los conjuntos de instrucciones de la arquitectura IA 32 SIMD. Fue utilizada por Primera vez en la Primera versión del Pentium 4 ... Wikipedia Español

    SSE2- സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ 2 സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷൻ 2, പൊതുവായി ചുരുക്കി SSE2. Elle est composée de 144 നിർദ്ദേശങ്ങൾ et fait son apparition avec le Pentium 4 d Intel. Elle gère des registres 128 bits pour les entiers et les flottants… … Wikipedia en Français

    SSE2- സ്ട്രീമിംഗ് സിംഗിൾ ഇൻസ്ട്രക്ഷൻ, ഒന്നിലധികം ഡാറ്റ എക്സ്റ്റൻഷനുകൾ 2 (കമ്പ്യൂട്ടിംഗ്) … സംക്ഷിപ്ത നിഘണ്ടു

    എസ്എസ്ഇ 2- SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die Verarbeitung… … Deutsch Wikipedia

    സ്ട്രീമിംഗ് SIMD വിപുലീകരണങ്ങൾ 2- SSE2 (സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2) ist eine x86 Befehlssatzerweiterung, die Intel mit dem Intel Pentium 4 einführte. ഡൈ മിറ്റ് SSE eingeführten 128 Bit Register können in SSE2 auch mit MMX Operationen verwendet werden. SSE2 ermöglicht die… … Deutsch Wikipedia

    SSE2 (ഇംഗ്ലീഷ് സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകൾ 2, സ്ട്രീമിംഗ് SIMD പ്രോസസർ എക്സ്റ്റൻഷൻ) ഒരു പെൻ്റിയം 4 ആണ്. SSE2, x86 ആർക്കിടെക്ചറിൽ ഉൾപ്പെടുത്തിയിട്ടുള്ള എട്ട് 128-ബിറ്റ് രജിസ്റ്ററുകൾ (xmm0 മുതൽ xmm7 വരെ) ഉപയോഗിക്കുന്നു, അവ ഓരോന്നും 2 ആയി കണക്കാക്കുന്നു. ... ... വിക്കിപീഡിയ

    എഎംഡി പ്രോസസറുകളുടെ താരതമ്യം- ഈ ലിസ്റ്റ് അപൂർണ്ണമാണ്; ഇത് വിപുലീകരിച്ചുകൊണ്ട് നിങ്ങൾക്ക് സഹായിക്കാനാകും. പ്രോസസർ കോഡ് പേരുകളുടെ നിറങ്ങൾ ഒരേ കോർ സൂചിപ്പിക്കുന്നു. ആർച്ചി ടെക്‌ചർ ഫാമിലി കോഡ് നെയിം മോഡൽ ഗ്രൂപ്പ് സ്പീഡ് (MHz) സോക്കറ്റ് പ്രോസസ് (nm) കോറുകൾ FSB/HT (MHz) കാഷെ (KiB) മെമ്മറി കൺട്രോളർ ... വിക്കിപീഡിയ

    AMD അത്‌ലോൺ 64 മൈക്രോപ്രൊസസ്സറുകളുടെ പട്ടിക- ഈ ലിസ്റ്റ് അപൂർണ്ണമാണ്; ഇത് വിപുലീകരിച്ചുകൊണ്ട് നിങ്ങൾക്ക് സഹായിക്കാനാകും. എഎംഡിയിൽ നിന്നുള്ള അത്‌ലോൺ 64 മൈക്രോപ്രൊസസർ ഉപഭോക്തൃ വിപണിയെ ലക്ഷ്യമിട്ടുള്ള എട്ടാം തലമുറ സിപിയു ആണ്. ഉള്ളടക്കം 1 സിംഗിൾ കോർ ഡെസ്‌ക്‌ടോപ്പ് പ്രോസസ്സറുകൾ 1.1 അത്‌ലോൺ 64 ... വിക്കിപീഡിയ

SSE2 നിർദ്ദേശങ്ങൾ സ്ട്രീമിംഗ് SIMD എക്സ്റ്റൻഷനുകളുടെ ഒരു ചുരുക്കെഴുത്താണ് 2. പെൻ്റിയം 4 പ്രോസസറുകളിൽ മാത്രം പ്രത്യക്ഷപ്പെട്ടു. SSE2 സാങ്കേതികവിദ്യ 144 നിർദ്ദേശങ്ങൾ ഉൾക്കൊള്ളുന്ന നിർദ്ദേശങ്ങളുടെ ഒരു കൂട്ടമാണ്, അവ എല്ലാ ആധുനിക പ്രോഗ്രാമുകൾക്കും അത്യന്താപേക്ഷിതമാണ്.

ഈ സാങ്കേതികവിദ്യകളുടെ പിന്തുണയില്ലാതെ, നിങ്ങൾക്ക് വിൻഡോസിൻ്റെ നിലവിലെ പതിപ്പോ അല്ലെങ്കിൽ ഏതെങ്കിലും ആധുനിക ബ്രൗസറോ പോലും ഇൻസ്റ്റാൾ ചെയ്യാൻ കഴിയില്ല. ഇൻസ്റ്റാളേഷൻ സമയത്ത്, പ്രോസസ്സർ SSE2 പിന്തുണയ്ക്കുന്നില്ലെങ്കിൽ നിങ്ങൾ ഒരു പിശക് കാണും - ഈ പ്രോഗ്രാമിന് SSE2 നിർദ്ദേശങ്ങൾ പിന്തുണയ്ക്കുന്ന ഒരു കമ്പ്യൂട്ടർ ആവശ്യമാണ്. ഇത് കൂടുതൽ വിശദമായി നോക്കാം.

SSE2 എങ്ങനെ പ്രവർത്തനക്ഷമമാക്കാം

നിങ്ങളുടെ പ്രോസസ്സർ ഈ സാങ്കേതികവിദ്യയെ പിന്തുണയ്ക്കുന്നില്ലെങ്കിൽ, നിങ്ങൾക്ക് ഇത് പ്രവർത്തനക്ഷമമാക്കാൻ കഴിയില്ല. നിങ്ങളുടെ മോഡൽ ഇതിലും പുതിയതാണെന്ന് ഉറപ്പാക്കുക:

  • IA-32
  • അത്‌ലോൺ 64 വരെയുള്ള എല്ലാ എഎംഡി പ്രൊസസറുകളും sse2 പിന്തുണയ്ക്കുന്നില്ല
  • പെൻ്റിയം 1, 2, 3. മുകളിൽ പറഞ്ഞതുപോലെ, പിന്തുണ 4-ൽ മാത്രം പ്രത്യക്ഷപ്പെട്ടു.
  • ട്രാൻസ്മെറ്റ ക്രൂസോ
  • VIA C3

മറ്റെല്ലാവർക്കും ഇതിനകം നിർദ്ദേശ സെറ്റ് പിന്തുണയുണ്ട്.

കൂടാതെ, പിന്തുണ ലഭ്യമാണെന്ന് ഉറപ്പാക്കാൻ, "CPU-Z" പ്രോഗ്രാം ഇൻസ്റ്റാൾ ചെയ്യുക. sse2 പിന്തുണയ്ക്കുന്നുണ്ടോ എന്ന് മനസിലാക്കാൻ പ്രോഗ്രാം ഉപയോഗിക്കുന്നതിന്, "നിർദ്ദേശങ്ങൾ" കോളം ശ്രദ്ധിക്കുക. നിങ്ങളുടെ പ്രോസസർ പിന്തുണയ്ക്കുന്ന സാങ്കേതികവിദ്യകൾ ഇത് ലിസ്റ്റ് ചെയ്യണം.

ബയോസിൽ ഇത് പ്രവർത്തനക്ഷമമാക്കാൻ, ഇനിപ്പറയുന്നവ ചെയ്യുക:

കമ്പ്യൂട്ടർ പുനരാരംഭിക്കുക, അത് ഓണാകുന്ന നിമിഷത്തിൽ, Del അല്ലെങ്കിൽ F1 പലതവണ അമർത്തുക (മദർബോർഡിനെ ആശ്രയിച്ച്). നിങ്ങൾ BIOS-ൽ പ്രവേശിക്കാൻ കഴിഞ്ഞതിന് ശേഷം, "SSE ട്വീക്കുകൾ" എന്നതിലേക്ക് പോകുക, തുടർന്ന് നിങ്ങൾ "SSE പ്രവർത്തനക്ഷമമാക്കുക" സജ്ജീകരിക്കേണ്ടതുണ്ട്. F10, Y, എൻ്റർ അമർത്തുക.

പ്രോസസ്സർ SSE2 പിന്തുണയ്ക്കുന്നില്ല

Windows XP-ന് കീഴിൽ നിർമ്മിച്ച പ്രോഗ്രാമുകളുടെ കഴിവുകൾ നിങ്ങൾ കണക്കിലെടുക്കുന്നില്ലെങ്കിൽ തീർച്ചയായും നിങ്ങളുടെ കമ്പ്യൂട്ടർ ഉപയോഗപ്രദമല്ല. നിങ്ങൾ മറ്റെല്ലാം ഇൻസ്റ്റാൾ ചെയ്യേണ്ടതില്ല.

ഇത് മതിയെന്ന് തോന്നുന്നു, പക്ഷേ അങ്ങനെയല്ല. നിങ്ങൾക്ക് ഇനി ഇൻ്റർനെറ്റിൽ സുഖമായി സർഫ് ചെയ്യാനാകില്ല. സൈറ്റുകളിൽ പകുതിയും നിങ്ങൾക്കായി തുറക്കില്ല, രണ്ടാമത്തേത് അറിയിപ്പുകൾ പ്രദർശിപ്പിക്കും, അതുവഴി നിങ്ങളുടെ ബ്രൗസർ അപ്ഡേറ്റ് ചെയ്യും.

എന്നിരുന്നാലും, നിങ്ങൾക്ക് മറ്റൊരു കമ്പ്യൂട്ടർ വാങ്ങാൻ കഴിയുന്നില്ലെങ്കിൽ, നിങ്ങൾക്ക് ഇപ്പോഴും ഇതിൽ പ്രവർത്തിക്കാം.

sse2 പരിശോധന എങ്ങനെ മറികടക്കാം

ഇത് ചെയ്യാൻ കഴിയും, എന്നാൽ ഓരോ പ്രോഗ്രാമിനും പ്രത്യേകം ബൈപാസ് ചെയ്യേണ്ടത് ആവശ്യമാണ്. ഇൻ്റർനെറ്റിൽ "SSE2 എമുലേറ്ററിൽ" ധാരാളം തെറ്റായ വിവരങ്ങൾ ഉണ്ട് - അത് നിലവിലില്ല. വൈറസുകൾ ഡൗൺലോഡ് ചെയ്യുന്നതിനും എസ്എംഎസ് സബ്‌സ്‌ക്രൈബുചെയ്യുന്നതിനും മറ്റും നിങ്ങളെ ആകർഷിക്കുന്നു. ചെക്ക് മറികടക്കാൻ, ഓരോ പ്രോഗ്രാമിലെയും മിക്ക കോഡുകളും നിങ്ങൾ വീണ്ടും എഴുതേണ്ടതുണ്ട്, അതിനുശേഷം അത് ശരിയായി പ്രവർത്തിക്കില്ല. നിങ്ങൾ മനസ്സിലാക്കുന്നതുപോലെ, ഇത് ചെയ്യേണ്ടതില്ല, കാരണം ഇത് സമയം പാഴാക്കുന്നു.

SSE2 പിന്തുണയില്ലാത്ത പ്രോസസ്സറിനുള്ള ബ്രൗസറുകൾ

നിങ്ങളെപ്പോലെ വളരെക്കാലമായി, SSE2 കാരണം എൻ്റെ ലാപ്‌ടോപ്പ് മാറ്റാൻ ഞാൻ ആഗ്രഹിച്ചില്ല, പക്ഷേ അവർ എന്നെ പരാജയപ്പെടുത്തി (പിശകുകളും അറിയിപ്പുകളും). ഈ നിർദ്ദേശങ്ങൾ ആവശ്യമില്ലാത്ത ബ്രൗസറുകൾ (Google Chrome, Mozilla firefox, Opera) ഇപ്പോഴും എൻ്റെ പക്കലുണ്ട്. ഇവിടെ ഞാൻ നിങ്ങളുമായി പങ്കിടുന്നു - ഡൗൺലോഡ്

ശ്രദ്ധിക്കുക, ഈയിടെയായി, സ്പാമർമാർ, പതിപ്പ് കാലഹരണപ്പെട്ടതാണെന്നും ഒരു ലിങ്ക് ഉപേക്ഷിക്കുന്നുവെന്നും എൻ്റെ പേരിൽ ആരോപിക്കപ്പെടുന്ന അഭിപ്രായങ്ങളിൽ എഴുതുന്നു - ഞാൻ ഇത് ചെയ്യുന്നില്ല. ഞാൻ ഫയൽ വീണ്ടും അപ്‌ലോഡ് ചെയ്യുകയാണെങ്കിൽ, ലേഖനത്തിലെ ലിങ്ക് ഞാൻ മാറ്റും. അതിനാൽ ഭയമില്ലാതെ ഡൗൺലോഡ് ചെയ്യാം.

പിന്തുണ ആവശ്യമില്ലാത്ത പ്രോഗ്രാമുകൾ എവിടെ നിന്ന് ലഭിക്കും

നിങ്ങളുടെ നാഡീവ്യൂഹം പരീക്ഷിക്കാനും ഈ പ്രോസസ്സർ ഉപയോഗിക്കുന്നത് തുടരാനും നിങ്ങൾ തീരുമാനിക്കുകയാണെങ്കിൽ, നിങ്ങൾക്ക് ഒരു കൂട്ടം നിർദ്ദേശങ്ങൾ ആവശ്യമില്ലാത്ത പ്രോഗ്രാമുകൾ ആവശ്യമാണ്. വിൻഡോസ് എക്സ്പിയുടെ ഏത് ബിൽഡിലും നിങ്ങൾക്ക് അവ ലഭിക്കും. ആഡ്-ഓണിൽ പ്രോഗ്രാമുകൾ അടങ്ങിയിരിക്കുന്ന അസംബ്ലി ഡൗൺലോഡ് ചെയ്‌ത് അവ നിങ്ങളുടെ ആരോഗ്യത്തിനായി ഉപയോഗിക്കുക.