Яка серія карта geforce 9600 gt. Визначаємо серію продукту відеокарт Nvidia

На момент появи у продажу на початку 2008 року графічний прискорювач моделі GeForce 9600 від компанії NVidia належав до рішень середнього класу та дозволяв вирішувати більшість завдань. При цьому використання найбільш просунутого технологічного процесусуттєво скорочувало його енергоспоживання. Ну а вартість таких адаптерів була цілком демократична і дозволяла їх використовувати в складі. обчислювальних системсереднього рівня.

Ніша прискорювача

Графічні прискорювачі компанії NVidia на початку 2008 року розподілялися так:

    До рішень початкового класу належали 8600 GT. Дуже скромні характеристики та дуже низькі тактові частоти забезпечували мінімально допустимий рівеньпродуктивність. При цьому вартість таких відеокарт перебувала в межах від 100 до 120 доларів.

    До рішень середнього класу належали 8800GT, 8800GTS та GeForce 9600 з приставкою GT. Ці адаптери мали досить схожі характеристики і вартість, але використання покращеної технології виробництва та підвищені тактові частоти дозволяли розглянутому рішенню без особливих проблем випереджати своїх конкурентів.

    Флагманським акселератором був 8800 Ultra. Гідної конкуренції рішення середнього класу йому не могли скласти, але й вартість у нього була значно вищою.

Комплектація

У комплект поставки компанія NVidia включала в цьому випадку таке:

    Графічний адаптер.

    Гарантійний талон.

    Компакт-диск, на якому було записано весь необхідний софт та документацію в електронному вигляді.

    Інструкція користувача.

    Перехідник DVI TO HDMI.

    Спеціальний перехідник для організації електроживлення прискорювача через додатковий 6-контактний роз'єм.

Специфікації чіпа

G94 - це кодове позначення графічного чіпа, який лежав в основі GeForce 9600. Характеристики його вказують на те, що до його складу входило 505 млн. транзисторних компонентів. Тактова частота даного напівпровідникового елемента дорівнювала 650 МГц, а виготовлявся він за нормами 65-нм техпроцесу. Його попередники серії 8ХХХ, у свою чергу, вироблялися за нормами 80 нм та мали найгірші характеристикищодо енергоефективності. Кількість блоків обробки шейдерів становило 64 штуки, які частота в номінальному режимі дорівнювала 1625 МГц. Модуль розтеризації було включено до складу адаптера всього 16 штук, а кількість TMU для кожного конвеєра - 32.

Пам'ять

Єдиний тип пам'яті, у зв'язку з яким міг працювати аналізований графічний прискорювач, - це GDDR3. Номінальна ефективна частота мікросхем дорівнювала 1800 МГц. Об'єм відеобуфера міг дорівнювати 512 Мб або 1 Гб. Розрядність шини підключення оперативної пам'ятідо графічного процесора дорівнювала 256 біт. Все раніше перераховане дозволяло отримати пропускну здатність лише на рівні 57,6 Гб/сек.

Комунікації

Адаптер GeForce 9600 встановлюється у слот розширення PCI Expressу виконанні 16Х. У базовому виконанні такий адаптер повинен комплектуватись двома цифровими. портами DVI. Але деякі виробники могли доповнювати їх аналоговим VGA або цифровим HDMI. Тому обладнання з позиції портів залежить від конкретної моделі, і цей аспект необхідно враховувати перед покупкою.

Енергоспоживання. Температурний режим

Застосування передової технології виробництва напівпровідникової основи процесора дозволило суттєво знизити рівень споживаної потужності. Відеокарта NVidia GeForce 9600 GT має тепловий пакет 95 Вт. Звичайно, в рекомендовані 75 Вт, достатні для роботи відеопідсистем без додаткового електропостачання, це число не вписується, але для графічних рішень такого класу така організація харчування типова. Максимальна температура для даного продукту встановлена ​​виробником на позначці 105 0 С. У штатному режимі це значення не перевищує 60 0 С, в режимі розгону і при вирішенні найбільш вимогливих завдань вона може підвищитися до 75 0 С.

Тести. Порівняння з аналогами

Відеокарта GeForce 9600 є рішенням середнього рівня і її найбільш раціонально порівнювати з аналогічними рішеннями. Оскільки прямі конкуренти від компанії АМД вироблялися за застарілим на той момент техпроцесом, порівнювати їх з 9600 GT недоцільно з тієї причини, що при порівнянні швидкодії споживана потужність у них буде значно вище. З переліку компанії NVidia цей адаптер можна порівняти з 8800 GTS і 8800 GT. Тестовий стендбазувався на наборі системної логіки Р35, оперативна пам'ять була стандарту DDR2 з частотою 800 МГц, і її обсяг дорівнював 2 Гб (2 модулі по 1 Гб для того, щоб контролер ОЗУ функціонував в двоканальному режимі, за рахунок цього забезпечувався приріст швидкодії близько 10-15%). У синтетичному тесті 3DMark06 адаптери набрали такі умовні бали в режимі 1600Х1200:

Швидше за все, на момент проведення даного тестуне було проведено повну оптимізацію драйверів, і показники пізнішої відеокарти через це були несуттєво занижені. З іншого боку, різниця не така вже й велика між ними. Кардинально змінюється розташування сил у грі Gears Of War. У цьому випадку ми отримуємо таку кількість fps при 1280Х1024:

Різниця, звичайно, в один кадр в секунду не настільки вже й велика, але вона все ж таки виводить свіжіший прискорювач у лідери цього тесту. Наведені раніше результати вказують на те, що за 9600 GT ховається трохи модифікований 8800 GT, який виготовлений за новим техпроцесом. Різниця між цими відеокартами мінімальна. Причому в деяких випадках представник більш раннього покоління оминає свою оновлену модифікацію.

Вартість

На початку продажу NVidia GeForce 9600 можна було придбати за ціною 150-170 доларів. З урахуванням позиціонування та технічних специфікаційподібний підхід до ціноутворення було виправдано. Зараз такий прискорювач можна придбати за ціною від 1500 (були у використанні рішення) до 3000 (абсолютно нові акселератори) рублів. Купувати такий адаптер для нового ПК зараз є недоцільним. Нові інтегровані відеоприскорювачі мають рівний рівень швидкодії, і їх додатково набувати не потрібно. А ось для ремонту старого ПК такий акселератор все ж таки можна купити.

технологія (нм)90 80 65/55 транзисторів (М)681 289 210 754 505 314 універсальних процесорів128 32 16 128 64 32 текстурних блоків32 16 8 64 32 16 блоків блендінгу24 8 16 8 шина пам'яті384 (64х6)128 (64х2)256 (64х4)128 (64х2) типи пам'ятіDDR, GDDR2, GDDR3, GDDR4 системна шина чіпаPCI-Express 16хPCI-Express 2.0 16х RAMDAC2 х 400МГц інтерфейсиTV-Out
TV-In (потрібний чіп захоплення)
2 x DVI Dual Link
HDTV-OutTV-Out
TV-In (потрібний чіп захоплення)
2 x DVI Dual Link
HDTV-Out
HDMITV-Out
TV-In (потрібний чіп захоплення)
2 x DVI Dual Link
HDTV-Out
HDMI
DisplayPort вершинні шейдери4.0 піксельні шейдери4.0 точність піксельних обчисленьFP32 точність вершинних обчисленьFP32 формати текстурFP32)
FP16
I8
DXTC, S3TC
3Dc формати рендерингуFP32
FP16
I8
10
інші MRTє АнтіаліасінгTAA (AA прозорих полігонів)
CSAA 2x-16x
генерація Z2х у режимі без кольору буфер шаблонівдвосторонній технології тінейапаратні карти тіней
оптимізації геометричних тіней

Специфікації референсних карток на базі сімейства G8X

картачіп
шина
блоків ALU/TMUчастота ядра (МГц)частота пам'яті (МГц)обсяг пам'яті (Мбайт)ПСП (Гбайт)тексель рейт (Мтекс)філ
рейт (Мпікс)
GeForce 8500 GTG86
PEG16х
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16х
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16х
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16х
96/24 500 800(1600) 320 GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16х
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16х
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16х
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256MBG92
PEG16х
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16х
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16х
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800 GSG92
PEG16х
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16х
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16х
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16х
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16х
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16х
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16х
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16х
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16х
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16х
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
картачіп
шина
блоків ALU/TMUчастота ядра (МГц)частота пам'яті (МГц)обсяг пам'яті (Мбайт)ПСП (Гбайт)тексель рейт (Мтекс)філ
рейт (Мпікс)

Подробиці: G80, сімейство GeForce 8800

Специфікації G80

  • Офіційна назва чіпа GeForce 8800
  • Кодове ім'я G80
  • Технологія 90 нм
  • 681 мільйон транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин та пікселів, а також інших можливих видів даних
  • Апаратна підтримка останніх нововведень DirectX 10, у тому числі і нової шейдерної моделі – Shader Model 4.0, генерації геометрії та запису проміжних даних із шейдерів (stream output)
  • 384 біт шина пам'яті, 6 незалежних контролерів шириною 64 біта, підтримка GDDR4
  • Частота ядра 575 ГГц (GeForce 8800 GTX)
  • 128 скалярних ALU з плаваючою точкою (цілочисленні та плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD+MUL без втрати тактів)
  • ALU працюють на більш ніж подвоєній частоті (1.35 ГГц для 8800 GTX)
  • 32 текстурні блоки, підтримка FP16 та FP32 компонент у текстурах
  • 64 блоки білінійної фільтрації (тобто можлива безкоштовна чесна трилінійна фільтрація, а також удвічі ефективніша за швидкістю анізотропна фільтрація)
  • - Розмір блоку планування - 8х4 (32) пікселя.
  • 6 широких блоків ROP (24 пікселя) з підтримкою режимів антиаліасингу до 16 семплів на піксель у тому числі при форматі FP16 або FP32 буфера кадру (тобто можливі HDR+AA). Кожен блок складається з масиву гнучко конфігурованих ALU та відповідає за генерацію та порівняння Z, MSAA, блендинг. Пікова продуктивністьвсієї підсистеми до 96 MSAA відліків (+ 96 Z) за такт, у режимі без кольору (Z only) – 192 відліки за такт.
  • Всі інтерфейси винесені на зовнішній додатковий чіп NVIO (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Дуже хороша масштабованість архітектури, можна по одному блокувати або прибирати контролери пам'яті та ROP (всього 6), шейдерні блоки (всього 8 блоків TMU+ALU)

Специфікації референсної картки GeForce 8800 GTX

  • Частота ядра 575 МГц
  • Частота універсальних процесорів 1350 МГц
  • Кількість текстурних блоків – 32, блоків блендингу – 24
  • Об'єм пам'яті 768 мегабайт
  • Пропускна спроможність пам'яті 86.4 гігабайти в сек.
  • Теоретична максимальна швидкістьзабарвлення 13.8 гігапікселя в с.
  • Теоретична швидкість вибірки текстур 18.4 гігатекселя в с.
  • SLI роз'єм
  • Шина PCI-Express 16х
  • Рекомендована ціна $599

Специфікації референсної картки GeForce 8800 GTS

  • Частота ядра 500 МГц
  • Частота універсальних процесорів 1200 МГц
  • Кількість універсальних процесорів 96
  • Кількість текстурних блоків – 24, блоків блендингу – 20
  • Тип пам'яті GDDR3, 1.1 нс (штатна частота 2*900 МГц)
  • Об'єм пам'яті 640 мегабайт
  • Теоретична максимальна швидкість забарвлення 10.0 гігапікселя за секунду.
  • Теоретична швидкість вибірки текстур 12.0 гігатекселя в с.
  • Два DVI-I роз'єми (Dual Link, підтримується висновок у дозволах до 2560х1600)
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $449

Архітектура

На переходи на уніфіковані графічні архітектури ми чекали довго. Тепер можна констатувати факт – з появою GeForce 8800 цей перехід стався, і критична вершина вже пройдена. Далі піде поступовий спуск подібних архітектур у середній та бюджетний сегменти та їх подальший розвиток, аж до злиття з багатоядерними процесорними архітектурами у далекій перспективі. Отже, знайомимося з першою уніфікованою архітектурою від NVIDIA:

Перед нами уся діаграма чіпа. Чіп складається з 8 універсальних обчислювальних блоків (шейдерних процесорів) і хоча NVIDIA говорить про 128 процесорів, заявляючи, що кожне ALU є таким, це дещо невірно - одиниця виконання команд - такий процесорний блок, в якому згруповані 4 TMU і 16 ALU. Усього, таким чином, ми маємо 128 ALU і 32 TMU, але гранулярність виконання становить 8 блоків, кожен з яких в один момент може займатися своєю справою, наприклад, виконувати частину вершинного або піксельного або геометричного шейдера над блоком з 32 пікселів (або блоком з відповідного числа вершин та інших примітивів). Усі розгалуження, переходи, умови тощо. застосовуються цілком до одного блоку і таким чином логічніше, його і називати шейдерним процесором, нехай і дуже широким.

Кожен такий процесор має власний кеш першого рівня, в якому тепер зберігаються не тільки текстури, але й інші дані, які можуть бути запрошені шейдерним процесором. Важливо розуміти, що основний потік даних, наприклад пікселі або вершини, які і проходять обробку, рухаючись по колу під керуванням сірого кардинала (блоку, позначеного на схемі Thread Processor) - не кешуються, а йдуть потоком, в чому і полягає основна краса сьогоднішніх графічних архітектур - відсутність цілком випадкового доступу лише на рівні оброблюваних примітивів.

Крім керуючого блоку і 8 обчислювальних шейдерних процесорів є 6 блоків ROP, що виконують визначення видимості, запис в буфер кадру і MSAA (сині, поруч з блоками кеша L2) згруповані з контролерами пам'яті, чергами запису і кешем другого рівня.

Таким чином, ми отримали дуже широку (8 блоків, що обробляють порції по 32 пікселі кожен) архітектуру, здатну плавно масштабуватися в обидві сторони. Додавання або видалення контролерів пам'яті та шейдерних процесорів відповідним чином масштабуватиме пропускну здатність усієї системи, не порушуючи балансу і не створюючи вузьких місць. Це логічне та гарне рішення, що реалізує основний плюс уніфікованої архітектури – автоматичний баланс та високий ККД використання наявних ресурсів.

Крім шейдерних блоків та ROP в наявності набір керуючих та адміністративних блоків:

  • Блоки, що запускають на виконання дані тих чи інших форматів (Vertex, Geometry і Pixel Thread Issue) - своєрідні воротарі, які готують дані для числодробилки в шейдерних процесорах відповідно до формату даних, поточного шейдера та його стану, умов розгалужень і т.д.
  • Setup/Raster/ZCull - блок, що перетворює вершини на пікселі - тут виконується установка, розтеризація трикутника на блоки по 32 пікселя, попередній блоковий HSR.
  • Input Assembler - блок, що вибирає геометричні та інші вихідні дані з пам'яті системи або локальної пам'яті, що збирає з потоків вихідні структури даних, які підуть ззовні на вхід нашої "каруселі". А на виході, після багатьох кіл під керуванням вершинного, геометричного, піксельного шейдера та налаштувань блендингу, ми отримаємо готові (і згладжені, якщо потрібно) пікселі з ROP блоків.

До речі, невеликий відступ: добре видно, що в майбутньому ці блоки набудуть загальнішого характеру і не будуть так зав'язані на конкретні види шейдерів. Тобто. перетворяться просто на універсальні блоки, що здійснюють запуск даних на обчислення та конверсію форматів - наприклад, від одного шейдера до іншого, від вершинного до піксельного і т.д. Жодних принципових змінв архітектуру це вже не внесе, діаграма виглядатиме і працюватиме практично також, за винятком меншої кількості спеціальних «сірих» блоків. Вже зараз всі три блоки Thread Issue є, швидше за все (реально) одним блоком із загальною функціональністю та контекстними доповненнями:

Шейдерний процесор та його TMU/ALU

Отже, у кожному з 8 шейдерних блоків є 16 скалярних ALU. Що, знову ж таки, дає нам потенційну можливість збільшити ККД їх навантаження аж до 100%, незалежно від коду шейдера. ALU працюють на подвоєній частоті і таким чином відповідають або перевершують (залежно від операцій у шейдері) 8 чотирикомпонентних векторних ALU старого зразка (G70) на рівній базовій частотіядра. NVIDIA наводить такий розрахунок пікової продуктивності:

Однак він дійсний для самого невигідного для інших варіантів, коли мають місце два множення. У реальному житті варто поділити цю перевагу у півтора рази або близько того. Але, в будь-якому випадку, ці скалярні ALU за рахунок вищої тактової частоти та їх числа обженуть всі чіпи, що існували раніше. За винятком, можливо, SLI конфігурації G71, у разі не найвигідніших для нової архітектуришейдерів.

Цікаво, що точність всіх ALU складає FP32 і, з урахуванням нової архітектури, ми не передбачаємо жодної переваги для шейдерів FP16 зі зниженою точністю. Ще один цікавий момент - підтримка обчислень у цілісному форматі. Цей пункт потрібний для реалізації SM4. При реалізації арифметики дотримано стандарту IEEE 754, що робить її придатною для серйозних неігрових обчислень - наукових, статистичних, економічних та ін.

Тепер про взаємодію текстурних блоків та ALU в рамках одного шейдерного блоку:

Операція вибірки та фільтрації текстур не потребує ресурсів ALU і тепер може здійснюватися повністю паралельно математичним обчисленням. Генерація ж текстурних координат (на схемі - А) Як і раніше забирає частину часу ALU. Це логічно, якщо ми хочемо використовувати транзистори чіпа на всі 100%, адже генерація текстурних координат потребує стандартних плаваючих операцій і заводити для неї окремі ALU було б необачно.

Самі собою текстурні модулі мають таку конфігурацію:

В наявності 4 модулі для адресації текстур TA (визначення за координатами точної адреси для вибірки) та вдвічі більше модулів для білінійної фільтрації TF. Чому так? Це дозволяє при помірному витрачанні транзисторів забезпечити безкоштовну чесну трилінійну фільтрацію або вдвічі знизити падіння швидкості анізотропної фільтрації. Швидкість на звичайних дозволах, у звичайній фільтрації і без АА давно не має сенсу – і попереднє покоління прискорювачів чудово справляється у таких умовах. Новим чіпом підтримуються і FP16/FP32 формати текстур, а також SRGB гама корекція на вході (TMU) та виході (ROP).

Наведемо специфікації шейдерної моделі нових процесорів, що відповідає вимогам SM4:

Наявні значні кількісні та якісні зміни - все менше і менше обмежень для шейдерів, все більше і більше спільного з CPU. Поки що без особливого довільного доступу (така операція з'явилася в SM4, - пункт Load Op на діаграмі, але її ефективність для загальних цілей поки що сумнівна, особливо в перших реалізаціях), але немає сумнівів, що незабаром і цей аспект буде розвинений, як була розвинена за ці 5 років підтримка FP форматів – від перших проб у NV30 до тотального, наскрізного FP32 конвеєра у всіх режимах зараз – у G80.

Як ми пам'ятаємо, крім 8 шейдерних блоків, є 6 блоків ROP:

На діаграмі показані два окремих шляхи для Z і C, проте реально це просто один набір ALU, які діляться на дві групи при обробці пікселів з кольором, або діють як одна група при обробці в режимі Z-Only, таким чином збільшуючи пропускну здатність вдвічі. В наш час немає сенсу вважати окремі пікселі – їх і так достатньо, важливіше порахувати скільки MSAA семплів може бути оброблено за такт. Відповідно, при MSAA 16х чіп може видавати 6 повноцінних пікселів за такт, при 8х – 12 і т.д. Цікаво, що масштабованість роботи з буфером кадрів на висоті – як ми пам'ятаємо, кожен блок ROP працює з власним контролером пам'яті та не заважає сусіднім.

І нарешті є повноцінна підтримка FP32 і FP16 форматів буфера кадрів разом з антиаліасингом, тепер немає жодних обмежень для фантазії розробників, і HDR протягом усього конвеєра не потребує зміни загальної послідовності побудови кадру навіть у режимі AA.

CSAA

З'явився і новий метод згладжування. CSAA. Незабаром на сайті буде його докладне дослідження, а поки що відзначимо, що цей метод багато в чому схожий на підхід ATI і також має справу з псевдостохастичними патернами та поширенням відліків на сусідні геометричні зони (відбувається розмазування пікселя, пікселі не мають різкого кордону, а як би переходять один в інший з так званою AA, покриваючи якусь зону). Причому кольори відліків і глибина зберігаються окремо від інформації про їхнє розташування і таким чином на один піксель може припадати 16 відліків, але, наприклад, всього 8 обчислених значень глибини - що додатково заощаджує пропускну здатність і такти.

Відомо, що класичний MSAA в режимах більших ніж 4х стає дуже вимогливим з точки зору пам'яті, у той час як якість зростає все менше і менше. Новий метод коригує це, дозволяючи отримувати 16х режим згладжування, помітно якісніший ніж MSAA 16х, з обчислювальними витратами, порівнянними з 4х MSAA.

NVIO

Ще одна новація в G80 - винесені за межу основного чіпа прискорювача інтерфейси. За них тепер відповідає окремий чіп під назвою NVIO:

У цьому чипі інтегровані:

  • 2*400 МГц RAMDAC
  • 2 * Dual Link DVI (або LVDS)
  • HDTV-Out

Підсистема виведення виглядає так:

Точність у своїй завжди становить 10 біт на компоненту. Зрозуміло, в середньому сегменті і тим більше в бюджетних рішеннях окремий зовнішній чіп може не зберегтися, але для дорогих карток у такому рішенні більше плюсів, ніж мінусів. Інтерфейси займають значну площу чіпа, сильно залежить від перешкод, вимагають особливого харчування. Усунувши всі ці проблеми за допомогою зовнішнього чіпа, можна виграти як вихідні сигнали і гнучкість конфігурації, а також не ускладнювати розробку і так складного чіпа з урахуванням оптимальних режимів для вбудованих RAMDAC.

Подробиці: G84/G86, сімейства GeForce 8600 та 8500

Специфікації G84

  • Офіційна назва чіпа GeForce 8600
  • Кодове ім'я G84
  • Технологія 80 нм
  • 289 мільйонів транзисторів
  • Частота ядра до 675 МГц (GeForce 8600 GTS)
  • ALU працюють на більш ніж подвоєній частоті (1.45 ГГц для GeForce 8600 GTS)
  • 16 текстурних блоків, підтримка FP16 та FP32 компонент у текстурах
  • 16 блоків білінійної фільтрації (порівняно з G80 немає можливості безкоштовної трилінійної фільтрації та більш ефективної за швидкістю анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних та вершинних шейдерах
  • Запис результатів до 8 буферів кадру одночасно (MRT)

Специфікації референсної картки GeForce 8600 GTS

  • Частота ядра 675 МГц
  • Частота універсальних процесорів 1450 МГц
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 256 мегабайт
  • Пропускна спроможність пам'яті 32.0 гігабайти в сек.
  • Теоретична максимальна швидкість забарвлення 5.4 гігапікселя за сек.
  • Теоретична швидкість вибірки текстур 10.8 гігатекселя в с.
  • Енергоспоживання до 71 Вт
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $199-229

Специфікації референсної картки GeForce 8600 GT

  • Частота ядра 540 МГц
  • Частота універсальних процесорів 1180 МГц
  • Кількість універсальних процесорів 32
  • Кількість текстурних блоків 16 (див. синтетику), блоків блендингу 8
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 256 мегабайт
  • Пропускна спроможність пам'яті 22.4 гігабайти в сек.
  • Теоретична максимальна швидкість забарвлення 4.3 гігапікселя за сек.
  • Теоретична швидкість вибірки текстур 8.6 гігатекселя в с.
  • Енергоспоживання до 43 Вт
  • SLI роз'єм
  • Шина PCI-Express 16х
  • Рекомендована ціна $149-159

Специфікації G86

  • Офіційна назва чіпа GeForce 8500
  • Кодове ім'я G86
  • Технологія 80 нм
  • 210 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин та пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, у тому числі і нової шейдерної моделі Shader Model 4.0, генерації геометрії та запису проміжних даних з шейдерів (stream output)
  • 128-біт шина пам'яті, два незалежні контролери шириною 64 біта
  • Частота ядра до 450 МГц (GeForce 8500 GT)
  • ALU працюють на подвоєній частоті (900 МГц для GeForce 8500 GT)
  • 16 скалярних ALU з плаваючою точкою (цілочисленні та плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD+MUL без втрати тактів)
  • 8 текстурних блоків, підтримка FP16 та FP32 компонент у текстурах
  • 8 блоків білінійної фільтрації (порівняно з G80, немає можливості безкоштовної трилінійної фільтрації та більш ефективної за швидкістю анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних та вершинних шейдерах
  • 2 широкі блоки ROP (8 пікселів) з підтримкою режимів антиаліасингу до 16 семплів на піксель, у тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігурованих ALU та відповідає за генерацію та порівняння Z, MSAA, блендинг. Пікова продуктивність усієї підсистеми до 32 MSAA відліків (+ 32 Z) за такт, в режимі без кольору (Z only) 64 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, HDTV) інтегровані на чіп (на відміну від винесених на зовнішній додатковий чіп NVIO у GeForce 8800)

Специфікації референсної картки GeForce 8500 GT

  • Частота ядра 450 МГц
  • Частота універсальних процесорів 900 МГц
  • Ефективна частота пам'яті 800 МГц (2*400 МГц)
  • Тип пам'яті DDR2
  • Об'єм пам'яті 256/512 мегабайт
  • Пропускна спроможність пам'яті 12.8 гігабайта на сек.
  • Теоретична максимальна швидкість забарвлення 3.6 гігапікселя за секунду.
  • Теоретична швидкість вибірки текстур 3.6 гігатекселя в с.
  • Енергоспоживання до 40 Вт
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600)
  • SLI роз'єм
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, опціональна підтримка HDCP
  • Рекомендована ціна $89-129

Архітектура G84 та G86

Вже за специфікаціями видно, що G84 це щось середнє між однією четвертою і однією третьою частин флагмана лінійки G80. З точки зору кількості універсальних процесорів виходить чверть, а з точки зору кількості блоків ROP і контролера пам'яті третину. З текстурниками складніше, це начебто не чверть, а й не половина, про це ми поговоримо нижче. G86, у свою чергу, взагалі щось цікаве обчислювальної потужностівсього лише 1/8 від G80, а по ROP все та ж 1/3. Очевидно, NVIDIA не поспішає спускати в low-end чіпи, швидкі обчислювально.

Основне питання тут - а чи достатньо буде цієї четвертинки і 1/8 для того, щоб скласти гідну конкуренцію нинішнім рішенням і майбутнім чіпам AMD? Чи не надто сильно урізали в NVIDIA кількість блоків? Причому, не сказати, щоб за кількістю транзисторів обидва чіпи були надто маленькі... У G84 майже половина транзисторів G80, у G86 майже третина. Схоже, що рішення компромісне, якби вони залишали половину блоків G80, то чіп був би занадто дорогим у виробництві, та й становив би успішну конкуренцію своїм GeForce 8800 GTS.

Найближчим часом, швидше за все, на основі технології 65 нм можна буде зробити більш продуктивні чіпи для середнього та нижнього цінових діапазонів, а зараз поки що вийшло так. Ми розглянемо питання продуктивності нових чіпів у синтетичних та ігрових тестах, але вже зараз можна сказати, що G84 та G86 можуть бути не надто швидкими через малу кількість ALU, вони, швидше за все, будуть приблизно нарівні з поточними рішеннями схожої з ними ціни.

На архітектурі G84 і G86 ми не будемо зупинятися надто докладно, змін у порівнянні з G80 тут небагато, в силі залишається все сказане в огляді GeForce 8800 з поправкою на кількісні характеристики. Але все ж таки опишемо основні моменти, які стоять нашої уваги і наведемо кілька слайдів, присвячених архітектурним специфікаціям нових чіпів.

G80 складається з восьми універсальних обчислювальних блоків (шейдерних процесорів), NVIDIA вважає за краще говорити про 128 процесорів. Одиниця виконання команд, судячи з усього, це процесорний блок цілком, у якому згруповані 4 TMU і 16 ALU. Кожен з блоків одночасно може виконувати частину вершинного, піксельного або геометричного шейдера над блоком з 32 пікселів, вершин або інших примітивів, також може займатися фізичними розрахунками. Кожен процесор має свій кеш першого рівня, в якому зберігаються текстури та інші дані. Крім керуючого блоку та обчислювальних шейдерних процесорів присутні шість блоків ROP, що виконують визначення видимості, запис у буфер кадру та MSAA, згруповані з контролерами пам'яті, чергами запису та кешем другого рівня.

Ця архітектура здатна масштабуватися в обидві сторони, що було зроблено у нових рішеннях. Ми вже згадували про це красиве рішення, що реалізує основний плюс уніфікованої архітектури - автоматичний баланс і високий ККД використання наявних ресурсів у статті GeForce 8800. Там же передбачалося, що рішення середнього рівня складатиметься з половини обчислювальних блоків, а рішення на основі двох шейдерних процесорів та одного ROP стане бюджетним. На жаль, якщо в GeForce 8800 було вісім процесорів, що становлять 32 TMU та 128 ALU, у нових чіпах їх кількість урізала сильніше, ніж ми передбачали спочатку. Зважаючи на все, схема G84 виглядає так:

Тобто все залишилося незмінним, крім кількості блоків і контролерів пам'яті. Є невеликі зміни, пов'язані з текстурними блоками та помітні на цьому малюнку, але про це ми поговоримо далі. Цікаво, куди пішло стільки транзисторів, якщо лише 32 процесори в G84 залишили? У G84 майже половина транзисторів, порівняно з G80, при значно зниженому числі каналів пам'яті, ROP і шейдерних процесорів. Та й у G86 транзисторів дуже багато, при всього лише 16 процесорах.

Цікаво також, наскільки якісно реальних додаткахбалансуватиметься навантаження між виконанням вершинних, піксельних та геометричних шейдерів, адже кількість універсальних виконавчих блоків стала тепер значно меншою. Тим більше, що сама по собі уніфікована архітектура ставить нові завдання перед розробниками, при її використанні доведеться думати про те, як ефективно використовувати загальну потужність між вершинними, піксельними та геометричними шейдерами. Наведемо простий приклад - упор у піксельні розрахунки. У цьому випадку збільшення навантаження на вершинні блоки в традиційній архітектурі не призведе до падіння продуктивності, а в уніфікованій викличе зміну балансу та зменшення кількості ресурсів для піксельних розрахунків. Ми обов'язково розглянемо питання продуктивності, а зараз продовжимо дослідження змін в архітектурі G84 та G86.

Шейдерний процесор та TMU/ALU

Схема шейдерних блоків та оцінка їх пікової обчислювальної продуктивності G80 наводилася у відповідній статті, для G84 та G86 схема не змінилася, а їх продуктивність перерахувати нескладно. ALU в чіпах також працюють на подвоєній частоті і вони скалярні, що дозволяє досягти високого ККД. Ніяких відмінностей немає і за функціональністю, точність усіх ALU складає FP32, є підтримка обчислень у цілочисленному форматі, а при реалізації дотримано стандарту IEEE 754, важливого для наукових, статистичних, економічних та інших обчислень.

А ось текстурні модулі в порівнянні із застосованими в G80 змінилися, NVIDIA запевняє, що у нових чіпах було зроблено архітектурні зміни для збільшення продуктивності уніфікованих процесорів. У G80 кожен текстурник міг обчислювати чотири текстурні адреси та виконувати вісім операцій текстурної фільтрації за такт. Стверджується, що у нових чіпах перше число було збільшено вдвічі, і він здатний більшу вдвічі кількість текстурних вибірок. Тобто текстурні модулі G84 і G86 мають наступну конфігурацію (для порівняння зліва наведена схема блоку G80):

За словами NVIDIA, тепер кожен з блоків має вісім модулів адресації текстур (визначення за координатами точної адреси для вибірки) TA і така сама кількість модулів білінійної фільтрації (TF). G80 мав чотири модулі TA і вісім TF, що дозволяло при зниженій витраті транзисторів забезпечити «безкоштовну» трилінійну фільтрацію або вдвічі знизити падіння швидкості при анізотропній фільтрації, що корисно саме для прискорювачів верхнього рівня, де анізотропна фільтрація використовується користувачами майже завжди. Ми перевіримо правильність цієї інформації у практичній частині, обов'язково подивіться аналіз відповідних синтетичних тестів, оскільки вони суперечать цим даним.

Вся решта функціональності текстурних блоків однакова, підтримуються формати текстур FP16/FP32 та ін. Тільки якщо на G80 фільтрація FP16 текстур також була на повній швидкості через подвоєну кількість блоків фільтрації, у рішеннях середнього та нижнього рівнів такого вже немає (знову ж, при умови, якщо вищезгадані зміни дійсно є).

Блоки ROP, запис у буфер кадру, згладжування

Блоки ROP, яких у G80 було шість штук, а нових чіпах стало по два, не змінилися:

Кожен із блоків обробляє по чотири пікселі (16 субпікселів), всього виходить 8 пікселів за такт для кольору та Z. У режимі тільки Z обробляється вдвічі більша кількість семплів за один такт. При MSAA 16х чіп може видавати два пікселі за такт, при 4х 8 і т.д. Як і в G80, є повноцінна підтримка FP32 та FP16 форматів буфера кадрів спільно з антиаліасингом.

Підтримується відомий за GeForce 8800 новий метод згладжування Coverage Sampled Antialiasing (CSAA), який був докладно описаний у відповідному матеріалі:

Коротко, суть методу така, що кольори відліків і глибина зберігаються окремо від інформації про їхнє розташування, на один піксель може припадати по 16 відліків і всього 8 обчислених значень глибини, що заощаджує пропускну здатність та такти. CSAA дозволяє обійтися передачею та зберіганням одного значення кольору або Z на кожен субпіксель, уточнюючи усереднене значення екранного пікселя за рахунок більше детальної інформаціїпро те, як цей піксель перекриває краї трикутників. У результаті, новий метод дозволяє отримувати режим згладжування 16х, помітно якісніший ніж MSAA 4х, з обчислювальними витратами, які можна порівняти з ним. А в окремих випадках, у яких метод CSAA не працює, виходить звичайний MSAA меншою мірою, а не повна відсутність антиаліасингу.

PureVideo HD

Переходимо до найцікавіших змін. Виявляється, у G84 і G86 є нововведення, що вигідно відрізняють їх навіть від G80! Це стосується вбудованого відеопроцесора, який у нових чіпах отримав розширену підтримку PureVideo HD. Заявлено, що ці чіпи повністю розвантажують центральний процесор системи при декодуванні всіх типів поширених відео, у тому числі найбільш «важкого» формату H.264.

У G84 та G86 використовується Нова модельпрограмованого PureVideo HD відеопроцесора, потужніша, порівняно із застосованою в G80, і включає так званий BSP двигун. Новий процесорпідтримує декодування H.264, VC-1 та MPEG-2 форматів з роздільною здатністю до 1920x1080 та бітрейтом до 30-40 Мбіт/с, він виконує всю роботу з декодування CABAC та CAVLC даних апаратно, що дозволяє відтворювати всі існуючі HD-DVD та Blu -Ray диски навіть на середніх за потужністю одноядерних ПК.

Відеопроцесор у G84/G86 складається з кількох частин: сам Video Processor другого покоління (VP2), що виконує завдання IDCT, компенсації руху та видалення артефактів блочності для MPEG2, VC-1 та H.264 форматів, що підтримує апаратне декодування другого потоку; потоковий процесор (BSP), що виконує завдання статистичного декодування CABAC і CAVLC для формату H.264, а це одні з найбільш трудомістких розрахунків; движок декодування захищених даних AES128, призначення якого зрозуміло з його назви він займається розшифровкою відеоданих, що використовуються в захисті від копіювання на Blu-ray і HD- DVD диски. Ось так виглядають відмінності в мірі апаратної підтримки декодування відео на різних відеочіпах:

Блакитним кольоромвиділені завдання, що виконуються відеочіпом, а зеленим центральним процесором. Як бачите, якщо попереднє покоління допомагало процесору тільки в частині завдань, то новий відеопроцесор, що застосовується в останніх чіпах, робить завдання сам. Ефективність рішень ми перевіримо у майбутніх матеріалах щодо дослідження ефективності апаратного декодування відео, NVIDIA ж наводить у матеріалах такі цифри: при використанні сучасного двоядерного процесораі програмного декодування даних, відтворення дисків Blu-ray і HD-DVD з'їдає до 90-100% процесорного часу, при апаратному декодуванні на відеочіпі минулого покоління на тій же системі до 60-70%, а з новим движком, який вони розробили для G84 і G86 - лише 20%. Це, звичайно, не схоже на заявлене повністю апаратне декодування, але все ж таки на дуже і дуже ефективне.

На момент анонсу нові можливості, що з'явилися в PureVideo HD, працюють лише в 32-бітній версії Windows Vista, а підтримка PureVideo HD в Windows XP з'явиться тільки влітку. Що стосується якості відтворення відео, постобробки, деінтерлейсингу і т.п., то з цим у NVIDIA справи покращилися ще GeForce 8800, а нові чіпи нічим особливо не відрізняються в цьому плані.

CUDA, неігрові та фізичні розрахунки

У статті по GeForce 8800 згадувалося, що пікова продуктивність плаваючої арифметики, що збільшилася, у нових прискорювачів і гнучкість уніфікованої шейдерної архітектури, стали достатні для розрахунку фізики в ігрових додаткахі навіть більше серйозних завдань: математичного та фізичного моделювання, економічних та статистичних моделей та розрахунків, розпізнавання образів, обробки зображень, наукової графікита багато іншого. Для цього було випущено спеціальний API, орієнтований на обчислення, який зручний для адаптації та розробки програм, що перекладають обчислення на GPU CUDA (Compute Unified Device Architecture).

Докладніше про CUDA написано у статті про G80, ми зупинимося на ще одному модному напрямку останнім часом підтримці фізичних розрахунків на GPU. NVIDIA називає подібну свою технологію Quantum Effects. Декларується, що всі відеочіпи нового покоління, включаючи G84 і G86, що розглядаються сьогодні, непогано підходять для розрахунків подібного роду, дозволяючи перенести частину навантаження з CPU на GPU. Як конкретні приклади наводяться симуляції диму, вогню, вибухів, динаміки волосся та одягу, вовни та рідин, та багато іншого. Але поки що більше хочеться написати про інше. Про те, що поки що нам показують тільки картинки з тестових додатків з великою кількістю фізичних об'єктів, що розраховуються відеочіпами, а іграми з такою підтримкою навіть поки і не пахне.

Підтримка зовнішніх інтерфейсів

Як ми пам'ятаємо, у GeForce 8800 нас дещо здивувало ще одне несподіване нововведення – додатковий чіп, що підтримує винесені за межі основного зовнішні інтерфейси. У разі топових відеокарт цими завданнями займається окремий чіп під назвою NVIO, в якому інтегровано: два 400 МГц RAMDAC, два Dual Link DVI (або LVDS), HDTV-Out. Вже тоді ми припускали, що в середньому та нижньому сегментах окремий зовнішній чіп навряд чи збережеться, так і вийшло насправді. У G84 та G86 підтримка всіх зазначених інтерфейсів вбудована у сам чіп.

На GeForce 8600 GTS встановлюються два Dual Link DVI-I виходи з підтримкою HDCP, це перша відеокарта на ринку з подібними можливостями (HDCP та Dual Link спільно). Щодо HDMI, підтримка цього роз'єму апаратно реалізована повністю і може бути виконана виробниками на картах спеціального дизайну. А ось у GeForce 8600 GT та 8500 GT підтримка HDCP та HDMI опціональна, але вони цілком можуть бути реалізовані окремими виробниками у своїй продукції.

Подробиці: G92, сімейство GeForce 8800

Специфікації G92

  • Кодове ім'я чіпа G92
  • Технологія 65 нм
  • 754 мільйони транзисторів (більше, ніж у G80)
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин та пікселів, а також інших видів даних
  • Частота ядра 600 МГц (GeForce 8800 GT)
  • ALU працюють на більш ніж подвоєній частоті (1.5 ГГц для GeForce 8800 GT)
  • 112 (це для GeForce 8800 GT, а всього, ймовірно, 128) скалярних ALU з плаваючою точкою (цілочисленні і плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD+MUL без втрати тактів)
  • 56 (64) блоків текстурної адресації з підтримкою FP16 та FP32 компонент у текстурах (пояснення див. нижче)
  • 56 (64) блоків білінійної фільтрації (як і в G84 і G86, немає безкоштовної трилінійної фільтрації та більш ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних та вершинних шейдерах
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, HDTV) інтегровані на чіп (на відміну від винесених на зовнішній додатковий чіп NVIO у GeForce 8800)

Специфікації референсної картки GeForce 8800 GT 512MB

  • Частота ядра 600 МГц
  • Ефективна частота пам'яті 1.8 ГГц (2*900 МГц)
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 512 мегабайт
  • Енергоспоживання до 110 Вт
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $249

Специфікації референсної картки GeForce 8800 GT 256MB

  • Частота ядра 600 МГц
  • Частота універсальних процесорів 1500 МГц
  • Кількість універсальних процесорів 112
  • Кількість текстурних блоків 56, блоків блендингу 16
  • Ефективна частота пам'яті 1.4 ГГц (2*700 МГц)
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 256 мегабайт
  • Пропускна спроможність пам'яті 44.8 гігабайта на сек.
  • Теоретична максимальна швидкість забарвлення 9.6 гігапікселя за сек.
  • Теоретична швидкість вибірки текстур до 33.6 гігатекселя в с.
  • Енергоспоживання до 110 Вт
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $199

Специфікації референсної картки GeForce 8800 GTS 512MB

  • Частота ядра 650 МГц
  • Кількість універсальних процесорів 128
  • Ефективна частота пам'яті 2.0 ГГц (2*1000 МГц)
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 512 мегабайт
  • Пропускна спроможність пам'яті 64.0 гігабайти в сек.
  • Теоретична швидкість вибірки текстур до 41.6 гігатекселя в с.
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP
  • Рекомендована ціна $349-399

Архітектура чіпа G92

Архітектурно G92 від G80 відрізняється не сильно. По тому, що нам відомо, можна сказати, що G92 - це флагман лінійки (G80), переведений на новий техпроцес, з невеликими змінами. NVIDIA вказує у своїх матеріалах, що чіп має 7 великих шейдерних блоків і, відповідно, 56 текстурних блоків, а також по чотири широкі ROP, число транзисторів у чіпі викликає підозри про те, що вони щось не домовляють. В анонсованих спочатку рішеннях задіяні не всі блоки, що існують у чіпі фізично, їх кількість у G92 більша, ніж активних у GeForce 8800 GT. Хоча збільшена складність чіпа пояснюється включенням до його складу раніше окремого чіпа NVIO, а також відеопроцесори нового покоління. З іншого боку, кількість транзисторів вплинули і ускладнені блоки TMU. Також, цілком імовірно, було збільшено кеші збільшення ефективності використання 256-битной шини пам'яті.

На цей раз, щоб скласти гідну конкуренцію відповідним чіпам AMD, в NVIDIA вирішили залишити в mid-end чіпі досить велика кількістьблоків. Підтвердилося наше припущення з огляду G84 та G86, що на основі технології 65 нм випустять набагато більш продуктивні чіпи для середнього цінового діапазону. Архітектурних змін у чіпі G92 небагато, і ми не будемо на цьому зупинятися докладно. Все сказане вище про рішення із серії GeForce 8 залишається в силі, ми повторимо лише деякі основні моменти, присвячені архітектурним специфікаціям нового чіпа.

Для нового рішення NVIDIA у своїх документах наводить таку схему:

Тобто з усіх змін тільки зменшена кількість блоків і деякі зміни в TMU, про які написано далі. Як зазначено вище, є сумніви в тому, що фізично це так і є, але даємо опис, виходячи з того, що пише NVIDIA. G92 складається з семи універсальних обчислювальних блоків (шейдерних процесорів), NVIDIA традиційно говорить про 112 процесорів (принаймні, у перших рішеннях GeForce 8800 GT). Кожен із блоків, у якому згруповані 8 TMU та 16 ALU, може виконувати частину вершинного, піксельного або геометричного шейдера над блоком із 32 пікселів, вершин або інших примітивів, може займатися й іншими (неграфічними) розрахунками. Кожен процесор має свій кеш першого рівня, в якому зберігаються текстури та інші дані. Крім керуючого блоку та обчислювальних шейдерних процесорів присутні чотири блоки ROP, що виконують визначення видимості, запис у буфер кадру та MSAA, згруповані з контролерами пам'яті, чергами запису та кешем другого рівня.

Універсальні процесори та TMU

Схема шейдерних блоків та оцінка їх пікової обчислювальної продуктивності G80 наводилася у відповідній статті, для G92 вона не змінилася, їх продуктивність перерахувати нескладно, виходячи зі змін тактовою частотою. ALU в чіпах працюють на більш ніж подвоєній частоті, вони скалярні, що дозволяє досягти високого ККД. Про функціональні відмінності поки невідомо, чи доступна точність розрахунків FP64 у цьому чипі чи ні. Точно є підтримка обчислень у цілочисленному форматі, а при реалізації всіх обчислень дотримано стандарту IEEE 754, важливого для наукових, статистичних, економічних та інших розрахунків.

Текстурні модулі G92 не такі, як у G80, вони повторюють рішення TMU в G84 і G86, в яких були зроблені архітектурні зміни для збільшення продуктивності. Нагадаємо, що в G80 кожен текстурник міг обчислювати по чотири текстурні адреси та виконувати по вісім операцій текстурної фільтрації за такт, а в G84/G86 TMU здатна на більшу вдвічі кількість текстурних вибірок. Тобто, кожен з блоків має вісім модулів адресації текстур (визначення за координатами точної адреси для вибірки) TA і така сама кількість модулів білінійної фільтрації (TF):

Не варто думати, що 56 блоків GeForce 8800 GT в реальних застосуваннях будуть сильнішими за 32 блоки в GeForce 8800 GTX. При включеній трилінійної та/або анізотропної фільтрації останні будуть швидше, тому що вони зможуть виконати трохи більше роботи з фільтрації текстурних вибірок. Ми перевіримо цю інформацію у практичній частині, зробивши аналіз результатів відповідних синтетичних тестів. Решта функціональності текстурних блоків не змінилася, підтримуються формати текстур FP16, FP32 та інші.

Блоки ROP, запис у буфер кадру, згладжування

Блоки ROP самі по собі також не змінилися, але їхня кількість стала іншою. У G80 було шість ROP, а в новому рішенні їх стало чотири для зниження собівартості виробництва чіпів і PCB відеокарт. Також це урізання може бути пов'язане з тим, щоб не створювати надто сильної конкуренції. існуючим рішеннямверхнього рівня.

Кожен із блоків обробляє по чотири пікселі або 16 субпікселів, і всього виходить 16 пікселів за такт для кольору та Z. У режимі тільки Z обробляється вдвічі більша кількість семплів за один такт. При MSAA 16х чіп може видавати два пікселі за такт, при 4х 8 і т.д. Як і в G80, повноцінно підтримуються формати буфера кадрів FP32 та FP16 спільно з антиаліасингом.

Підтримується відомий за попередніми чіпами серії новий метод згладжування Coverage Sampled Antialiasing (CSAA). А ще одним нововведенням стало те, що в GeForce 8800 GT було оновлено алгоритм антиаліасингу напівпрозорих поверхонь (transparency antialiasing). На вибір користувача пропонувалися два варіанти: мультисемплінг (TRMS) і суперсемплінг (TRSS), перший відрізнявся дуже гарною продуктивністю, але ефективно працював далеко не у всіх іграх, а другий був якісним, але повільним. У GeForce 8800 GT декларується новий метод мультисемплінгу напівпрозорих поверхонь, що покращує його якість та продуктивність. Цей алгоритм дає майже таке ж поліпшення якості, як і суперсемплінг, але відрізняється високою продуктивністю лише на кілька відсотків гірше для режиму без включеного антиаліасингу напівпрозорих поверхонь.

PureVideo HD

Однією з очікуваних змін у G92 став вбудований відеопроцесор другого покоління, відомий за G84 і G86, який отримав розширену підтримку PureVideo HD. Вже відомо, що цей варіант відеопроцесора майже повністю розвантажує CPU при декодуванні всіх типів відеоданих, у тому числі "важких" форматів H.264 та VC-1.

Як і в G84/G86, в G92 використовується нова модель програмованого PureVideo HD відеопроцесора, що включає так званий BSP двигун. Новий процесор підтримує декодування H.264, VC-1 та MPEG-2 форматів з роздільною здатністю до 1920x1080 та бітрейтом до 30-40 Мбіт/с, виконуючи роботу з декодування CABAC та CAVLC даних апаратно, що дозволяє відтворювати всі існуючі HD-DVD та Blu -Ray диски навіть на середніх за потужністю одноядерних ПК. Декодування VC-1 не таке ефективне, як H.264, але воно все ж таки підтримується новим процесором.

Докладніше про відеопроцесор другого покоління можна прочитати в частині, присвяченій чіпам G84 і G86. Робота сучасних відеорішень була частково перевірена в останньому матеріалі з дослідження ефективності апаратного декодування відео.

PCI Express 2.0

Зі справжніх нововведень у G92 можна виділити підтримку шини PCI Express 2.0. Друга версія PCI Express збільшує стандартну пропускну здатність вдвічі, з 2.5 Гбіт/с до 5 Гбіт/с, в результаті, по роз'єму x16 можна передавати дані на швидкості до 8 ГБ/с у кожному напрямку, на відміну від 4 ГБ/с версії 1.x. При цьому дуже важливо, що PCI Express 2.0 сумісний з PCI Express 1.1, і старі відеокарти працюватимуть у нових системних платах, та нові відеокарти з підтримкою другої версії залишаться працездатними у платах без його підтримки. За умови достатності зовнішнього живленняі збільшення пропускної спроможності інтерфейсу, природно.

Для забезпечення зворотної сумісності з існуючими PCI Express 1.0 та 1.1 рішеннями специфікація 2.0 підтримує як 2.5 Гбіт/с, так і 5 Гбіт/с швидкості передачі. Зворотна сумісність PCI Express 2.0 дозволяє використовувати попередні рішення з 2.5 Гбіт/с в 5.0 Гбіт/с слотах, які будуть працювати на меншій швидкості, а пристрій, розроблений за специфікаціями версії 2.0, може підтримувати і 2.5 Гбіт/с та 5 Гбіт/с швидкості . Теоретично із сумісністю все добре, а на практиці з деякими поєднаннями системних плат і карт розширення можливе виникнення проблем.

Підтримка зовнішніх інтерфейсів

Як і слід було очікувати, наявний на платах GeForce 8800 додатковий чіп NVIO, що підтримує винесені за межі основного зовнішні інтерфейси (два 400 МГц RAMDAC, два Dual Link DVI (або LVDS), HDTV-Out), даному випадкубув включений до складу самого чіпа, підтримка всіх зазначених інтерфейсів вбудована сам G92.

На відеокартах GeForce 8800 GT зазвичай встановлюють два Dual Link DVI-I виходи із підтримкою HDCP. Що стосується HDMI, підтримка цього роз'єму реалізована повністю, вона може бути виконана виробниками на картах спеціального дизайну, які можуть бути випущені пізніше. Хоча наявність роз'єму HDMI на відеокарті абсолютно необов'язково, його успішно замінить перехідник з DVI на HDMI, який додається в комплекті більшості сучасних відеокарт.

На відміну від відеокарт серії RADEON HD 2000 компанії AMD, GeForce 8800 GT не містить вбудований аудіочип, необхідний підтримки передачі звуку по DVI за допомогою перехідника на HDMI. Подібна можливість передачі відео- та аудіосигналу по одному роз'єму затребувана, перш за все, на картах середнього та нижчого рівнів, які встановлюються в невеликі корпуси медіацентрів, а GeForce 8800 GT навряд чи підходить на цю роль.

Подробиці: G94, сімейство GeForce 9600

Специфікації G94

  • Кодове ім'я чіпа G94
  • Технологія 65 нм
  • 505 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин та пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, у тому числі шейдерної моделі Shader Model 4.0, генерації геометрії та запису проміжних даних з шейдерів (stream output)
  • 256-біт шина пам'яті, чотири незалежні контролери шириною по 64 біти
  • Частота ядра 650 МГц (GeForce 9600 GT)
  • ALU працюють на більш ніж подвоєній частоті (1.625 ГГц у GeForce 9600 GT)
  • 64 скалярних ALU з плаваючою точкою (цілочисленні та плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD+MUL без втрати тактів)
  • 32 блоки текстурної адресації з підтримкою FP16 та FP32 компонент у текстурах
  • 32 блоки білінійної фільтрації (як і в G84 і G92, це дає збільшену кількість білінійних вибірок, але без безкоштовної трилінійної фільтрації та ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних та вершинних шейдерах
  • 4 широкі блоки ROP (16 пікселів) з підтримкою режимів антиаліасингу до 16 семплів на піксель, у тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігурованих ALU та відповідає за генерацію та порівняння Z, MSAA, блендинг. Пікова продуктивність всієї підсистеми до 64 MSAA відліків (+ 64 Z) за такт, в режимі без кольору (Z only) 128 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)

Специфікації референсної картки GeForce 9600 GT

  • Частота ядра 650 МГц
  • Частота універсальних процесорів 1625 МГц
  • Кількість універсальних процесорів 64
  • Кількість текстурних блоків 32, блоків блендингу 16
  • Ефективна частота пам'яті 1.8 ГГц (2*900 МГц)
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 512 мегабайт
  • Пропускна спроможність пам'яті 57.6 гігабайта на сек.
  • Теоретична максимальна швидкість забарвлення 10.4 гігапікселя за сек.
  • Теоретична швидкість вибірки текстур до 20.8 гігатекселя в с.
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • Енергоспоживання до 95 Вт
  • Рекомендована ціна $169-189

Архітектура G94

З архітектурної точки зору G94 відрізняється від G92 лише кількісними характеристиками, у нього менше виконавчих блоків: ALU і TMU. Та й від G8x відмінностей не так багато. Як було написано в попередніх матеріалах, лінійка чіпів G9x є трохи модифікованою лінійкою G8x, переведеною на новий техпроцес з невеликими архітектурними змінами. Новий mid-end чіп має 4 великі шейдерні блоки (всього 64 ALU) і 32 текстурні блоки, а також чотири широкі ROP.

Отже, архітектурних змін у чіпі небагато, майже про всіх написано вище, і все раніше сказане для попередніх рішень залишається чинним. А тут наведемо лише основну діаграму чіпа G94:

Текстурні блоки G94 точно такі ж, що і в G84/G86 і G92, вони вміють вибирати вдвічі більше білінійно відфільтрованих вибірок з текстур, порівняно з G80. Але 32 текстурних блоки GeForce 9600 GT в реальних додатках не працюватимуть швидше, ніж 32 блоки у GeForce 8800 GTX лише через більшу робочу частоту GPU. Таке може спостерігатися тільки при вимкненій трилінійної та анізотропної фільтрації, що буває вкрай рідко, тільки в тих алгоритмах, де застосовуються невідфільтровані вибірки, наприклад, parallax mapping.

Ще однією з переваг G9x і GeForce 9600 GT зокрема, компанія NVIDIA вважає якусь нову технологію стиснення, реалізовану в блоках ROP, яка, за їх оцінкою, працює на 15% ефективніша за ту, що використовувалась у попередніх чіпах. Очевидно, це якраз ті самі архітектурні модифікації в G9x, призначені для забезпечення більшої ефективностіроботи 256-бітної шини пам'яті, порівняно з 320/384-бітною, про які ми писали раніше. Звичайно, в реальних додатках такої великої різниці не буде, навіть за даними самої NVIDIA приріст від нововведень у ROP найчастіше становить лише близько 5%.

Незважаючи на всі зміни в архітектурі G9x, що додають складності чіпу, про які ми ще поговоримо нижче, кількість транзисторів у чіпі досить велика. Ймовірно, така складність GPU пояснюється включенням до його складу раніше окремого чіпа NVIO, відеопроцесора нового покоління, ускладнення блоків TMU та ROP, а також інших прихованих модифікацій: зміна розмірів кешів тощо.

PureVideo HD

У G94 вбудований той самий відеопроцесор другого покоління, відомий за G84/G86 і G92, що відрізняється покращеною підтримкою PureVideo HD. Він майже повністю розвантажує CPU при декодуванні більшості поширених типів відеоданих, у тому числі H.264, VC-1 і MPEG-2, з роздільною здатністю до 1920x1080 і бітрейтом до 30-40 Мбіт/с, виконуючи роботу з декодування повністю апаратно. І хоча декодування VC-1 у рішень NVIDIAне таке ефективне, як H.264, невелика частинапроцесу використовує потужності центрального процесораАле це все одно дозволяє відтворювати всі існуючі HD DVD і Blu-Ray диски навіть на середніх за потужністю комп'ютерах. Детальніше про відеопроцесор другого покоління можна прочитати в наших оглядах G84/G86 і G92, посилання на які наведені на початку статті.

Ну а ми відзначимо програмні покращення PureVideo HD, які були присвячені виходу GeForce 9600 GT. З останніх нововведень PureVideo HD можна відзначити двопотокове декодування, динамічна змінаконтрастності та колірної насиченості. Ці зміни не виняткові для GeForce 9600 GT і в нових версіях драйверів, починаючи з ForceWare 174, вони введені для всіх чіпів, що підтримують повне апаратне прискорення за допомогою PureVideo HD. Окрім відеокарти, що розглядається сьогодні, в цей список входять: GeForce 8600 GT/GTS, GeForce 8800 GT і GeForce 8800 GTS 512.

Динамічне покращення контрастності досить часто використовується в побутовій техніці, телевізорах та відеоплеєрах, воно може покращити зображення з неоптимальною експозицією (поєднання витримки та діафрагми). Для цього після декодування кожного кадру аналізується його гістограма, і якщо у кадру невдала контрастність, гістограма перераховується і застосовується до зображення. Ось приклад (ліворуч - початкове зображення, праворуч - оброблене):

Приблизно те саме стосується і динамічного поліпшення колірної насиченості, що з'явилося в PureVideo HD. Побутова техніка також дуже давно застосовує деякі покращують зображення алгоритми, на відміну від комп'ютерних моніторів, які відтворюють все як є, що в багатьох випадках може викликати занадто тьмяну і неживу картинку. Автоматичний баланс компонент кольору у відеоданих, що розраховується також кожен новий кадр, покращує сприйняття картинки людиною, трохи скоригувавши насиченість її кольорів:

Двопотокове декодування дозволяє прискорювати декодування та постобробку двох різних потоків відеоданих одночасно. Це може бути корисно при виведенні в таких режимах, як «картинка-в-картинці», які використовуються в деяких Blu-Ray і HD DVD дисках (наприклад, друге зображення може показувати режисера фільму, що дає свої коментарі до показів в основному вікні сцен ), такими можливостями забезпечені видання фільмів WAR та Resident Evil: Extinction.

Ще одним корисним нововведенням останньої версії PureVideo HD стала можливість одночасної роботи оболонки Aero в операційній системі Windows Vista під час відтворення апаратно прискореного відео у віконному режимі, що раніше не було можливо. Не сказати щоб це дуже сильно хвилювало користувачів, але можливість приємна.

Підтримка зовнішніх інтерфейсів

Підтримка зовнішніх інтерфейсів у GeForce 9600 GT аналогічна GeForce 8800 GT, за винятком інтегрованої підтримки DisplayPort, що з'явилася, хіба що. Додатковий чіп NVIO, що є на платах GeForce 8800, що підтримує винесені за межі основного зовнішні інтерфейси в G94 також був включений до складу самого чіпа.

На референсних відеокартах GeForce 9600 GT встановлено два Dual Link DVI виходуз підтримкою HDCP. Підтримка HDMI та DisplayPort реалізована апаратно у чіпі, і ці порти можуть бути виконані партнерами NVIDIA на картах спеціального дизайну. Причому, як запевняє NVIDIA, на відміну від G92, підтримка DisplayPort тепер вбудована в чіп і зовнішніх трансмітерів не потрібні. Взагалі, роз'єми HDMI та DisplayPort на відеокарті необов'язкові, їх можуть замінити прості перехідники з DVI на HDMI або DisplayPort, які іноді трапляються у комплекті з сучасними відеокартами.

Подробиці: G96, сімейства GeForce 9400 та 9500

Специфікації G96

  • Кодове ім'я чіпа G96
  • Технологія 65 нм
  • 314 мільйонів транзисторів
  • Уніфікована архітектура з масивом загальних процесорів для потокової обробки вершин та пікселів, а також інших видів даних
  • Апаратна підтримка DirectX 10, у тому числі шейдерної моделі Shader Model 4.0, генерації геометрії та запису проміжних даних з шейдерів (stream output)
  • 128-біт шина пам'яті, два незалежні контролери шириною по 64 біти
  • Частота ядра 550 МГц
  • ALU працюють на більш ніж подвоєній частоті (1.4 ГГц)
  • 32 скалярних ALU з плаваючою точкою (цілочисленні та плаваючі формати, підтримка FP 32-біт точності в рамках стандарту IEEE 754, MAD+MUL без втрати тактів)
  • 16 блоків текстурної адресації з підтримкою FP16 та FP32 компонент у текстурах
  • 16 блоків білінійної фільтрації (як і для G92, це дає збільшену кількість білінійних вибірок, але без безкоштовної трилінійної фільтрації та ефективної анізотропної фільтрації)
  • Можливість динамічних розгалужень у піксельних та вершинних шейдерах
  • 2 широкі блоки ROP (8 пікселів) з підтримкою режимів антиаліасингу до 16 семплів на піксель, у тому числі при FP16 або FP32 форматі буфера кадру. Кожен блок складається з масиву гнучко конфігурованих ALU та відповідає за генерацію та порівняння Z, MSAA, блендинг. Пікова продуктивність усієї підсистеми до 32 MSAA відліків (+ 32 Z) за такт, в режимі без кольору (Z only) 64 відліку за такт
  • Запис результатів до 8 буферів кадру одночасно (MRT)
  • Всі інтерфейси (два RAMDAC, два Dual DVI, HDMI, DisplayPort) інтегровані на чіп

Специфікації референсної картки GeForce 9500 GT

  • Частота ядра 550 МГц
  • Кількість універсальних процесорів 32
  • Кількість текстурних блоків 16, блоків блендингу 8
  • Ефективна частота пам'яті 1.6 ГГц (2*800 МГц)
  • Тип пам'яті GDDR2/GDDR3
  • Об'єм пам'яті 256/512/1024 мегабайт
  • Теоретична швидкість вибірки текстур до 8.8 гігатекселів у с.
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDMI та DisplayPort з HDCP

Специфікації референсної картки GeForce 9400 GT

  • Частота ядра 550 МГц
  • Частота універсальних процесорів 1400 МГц
  • Кількість універсальних процесорів 16
  • Кількість текстурних блоків 8, блоків блендингу 8
  • Ефективна частота пам'яті 1.6 ГГц (2*800 МГц)
  • Тип пам'яті GDDR2
  • Об'єм пам'яті 256/512 мегабайт
  • Пропускна спроможність пам'яті 25.6 гігабайта на сек.
  • Теоретична максимальна швидкість забарвлення 4.4 гігапікселя за сек.
  • Теоретична швидкість вибірки текстур до 4.4 гігатекселів у с.
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDMI та DisplayPort з HDCP

Архітектура G96

Архітектурно G96 - рівно половина чіпа G94, який, у свою чергу, відрізняється від G92 лише кількісними характеристиками. У G96 вдвічі менше всіх виконавчих блоків: ALU, TMU і ROP. Новий відеочіп призначений для вирішення найнижчого цінового діапазону, і має два великі шейдерні блоки (всього 32 ALU) і 16 текстурних блоків, а також вісім ROP. Ще у нього урізана шина пам'яті, з 256-бітною до 128-бітної, якщо порівнювати з G94 та G92. Усі апаратні можливості залишилися незмінними, відмінності лише у продуктивності.

Подробиці: G92b, сімейство GeForce GTS 200

Специфікації референсної відеокарти GeForce GTS 250

  • Частота ядра 738 МГц
  • Частота універсальних процесорів 1836 МГц
  • Кількість універсальних процесорів 128
  • Кількість текстурних блоків 64, блоків блендингу 16
  • Ефективна частота пам'яті 2200 (2*1100) МГц
  • Тип пам'яті GDDR3
  • Об'єм пам'яті 512/1024/2048 мегабайт
  • Пропускна спроможність пам'яті 70.4 ГБ/с
  • Теоретична максимальна швидкість забарвлення 11.8 гігапікселів за сек.
  • Теоретична швидкість вибірки текстур до 47.2 гігатекселів у с.
  • Два DVI-I Dual Link роз'єми, підтримується висновок у дозволах до 2560х1600
  • Подвійний SLI роз'єм
  • Шина PCI Express 2.0
  • TV-Out, HDTV-Out, підтримка HDCP, HDMI, DisplayPort
  • Енергоспоживання до 150 Вт (один 6-штирковий роз'єм)
  • Двослотове виконання
  • Рекомендована ціна $129/$149/$169

Загалом-то, ця «нова» відеокарта на основі 55 нм чіпа G92 не відрізняється від GeForce 9800 GTX+ нічим. Вихід нової моделі може бути частково виправданий установкою на неї не 512 мегабайт відеопам'яті, як у 9800 GTX+, а гігабайта, що сильно впливає на продуктивність у важких режимах з максимальними налаштуваннями якості, високими дозволами з увімкненим повноекранним згладжуванням. А є ще двогігабайтні варіанти, але це вже більша маркетингова перевага, ніж реальна.

У таких умовах старші версії GeForce GTS 250 дійсно має бути відчутно швидше за GeForce 9800 GTX+ через збільшений обсяг пам'яті. А деякі найбільш сучасні ігриотримають перевагу навіть не у найвищих дозволах. Все б нічого, але тільки деякі виробники карт випустили GeForce 9800 GTX + з гігабайтом пам'яті ще раніше...

Виробництво відеочіпів G92b за 55 нм технологічним нормам та помітне спрощення дизайну PCB дозволило компанії NVIDIA зробити рішення, аналогічне GeForce 9800 GTX за характеристиками, але з меншою ціною та зниженим споживанням енергії та тепловиділенням. І тепер, щоб забезпечити GeForce GTS 250 електроживленням, на платі встановлено лише один 6-штирковий PCI-E роз'єм живлення. Ось і всі основні відмінності від 9800 GTX+.

У більшості випадків при використанні відеокарти не виникає проблем із пошуком та встановленням необхідного програмного забезпечення. Воно або поставляється разом із пристроєм, або зовсім встановлюється автоматично, за допомогою «Диспетчер пристроїв».

Труднощі починаються тоді, коли ми змушені шукати драйвери самостійно. Не всі виробники розуміють сподівання користувачів і часто ставлять нас у глухий кут незрозумілими термінами та назвами параметрів. Ця стаття допоможе розібратися, як дізнатися серію продукту відеокарти Nvidia.

На офіційному сайті Nvidia, в розділі ручного пошуку драйверів, ми бачимо список, в якому необхідно вибрати серію (покоління) продуктів.

Саме на цьому етапі і виникають труднощі у новачків, тому що ніде явно немає цієї інформації. Докладно розберемо, як визначити, до якого покоління відноситься відеокарта, яка встановлена ​​у Вашому комп'ютері.

Визначення моделі

Спочатку потрібно з'ясувати модель відеоадаптера, для чого можна скористатися як системними засобами Windows, так і сторонніми програмаминаприклад, .

Після того, як ми визначили, яка ж відеокарта стоїть у нас в комп'ютері, не важко дізнатися її покоління. Пройдемося за номерами серій, починаючи з найсучасніших.

20 серія

Двадцята серія відеокарт побудована на чіпах із архітектурою Turing. На момент оновлення даного матеріалу (див. дату) лінійка складається із трьох адаптерів. Це RTX 2080Ti, RTX 2080і RTX 2070.

10 серія

До десятої серії продуктів належать графічні адаптери на архітектурі Pascal. Сюди входять GT 1030, GTX 1050 - 1080Ti. Сюди включені Nvidia Titan X (Pascal) та Nvidia Titan Xp.

900 серія

Дев'ятисота серія включає лінійку пристроїв попереднього покоління Maxwell. Це GTX 950 - 980Ti, а також GTX Titan X.

700 серія

Сюди увійшли адаптери на чіпах Kepler. З цього покоління (якщо дивитись зверху вниз) починається різноманіття моделей. Це офісні GT 705 - 740(5 моделей), ігрові GTX 745 - 780Ti(8 моделей) та три GTX Titan, Titan Z, Titan Black.

600 серія

Також досить плідна «родина» з назвою Kepler. Це GeForce 605, GT 610 - 645, GTX 645 - 690.

500 серія

Це відеокарти на архітектурі Fermi. Модельний ряд складається з GeForce 510, GT 520 – 545 та GTX 550Ti – 590.

400 серія

Графічні процесори чотирьохсот лінійки також засновані на чіпах Fermiта представлені такими відеокартами як GeForce 405, GT 420 - 440, GTS 450і GTX 460 – 480.

300 серія

Архітектура цієї серії називається Tesla, її моделі: GeForce 310 та 315, GT 320 – 340.

200 серія

Ці ГПУ також мають ім'я Tesla. Карти, що входять до лінійки, такі: GeForce 205 та 210, G210, GT 220 – 240, GTS 240 та 250, GTX 260 – 295.

100 серія

Сота серія відеокарт Nvidiaтак само побудована на мікроархітектурі Teslaі включає адаптери G100, GT 120 - 140, GTS 150.

9 серія

Дев'яте покоління графічних процесорів GeForceбазується на чіпах G80і G92. Модельний ряд розбитий на п'ять груп: 9300, 9400, 9500, 9600, 9800 . Відмінності в назвах полягає лише у додаванні літер, що характеризують призначення та внутрішню начинку пристрою. Наприклад, GeForce 9800 GTX+.

8 серія

У цій лінійці використовуються ті ж чіпи G80, та асортимент карток відповідний: 8100, 8200, 8300, 8400, 8500, 8600, 8800 . Після цифр йдуть літерні позначення: GeForce 8800 GTX.

7 серія

Сьома серія, побудована на процесорах G70і G72, має у своєму складі відеокарти GeForce 7200, 7300, 7600, 7800, 7900і 7950 з різними літерами.

6 серія

Покоління «зелених» карток під номером 6 працює на архітектурі NV40і включає адаптери GeForce 6200, 6500, 6600, 6800та їх модифікації.

5 FX

Лінійка 5 FXбазується на мікрочіпах NV30і NV35. Склад моделей такий: FX 5200, 5500, PCX 5300, GeForce FX 5600, 5700, 5800, 5900, 5950, виконаних у різних варіантахкомплектації.

Моделі відеокарт із літерою М

Усі відеокарти, що мають наприкінці назви букву "М", є модифікаціями ГПУ для мобільних пристроїв(Ноутбуки). Сюди входять: 900M, 800M, 700M, 600M, 500M, 400M, 300M, 200M, 100M, 9M, 8M. Наприклад, картка GeForce 780Mвідноситься до сьомої серії.

На цьому наша коротка екскурсія по поколінням та моделям графічних адаптерів Nvidia закінчена.

Останнім часом компанія AMD помітно активізувала свої дії на ринку відеокарт середнього і вищого середнього цінового діапазону - клас дискретних відеокарт, що найбільш купується. Звичайно, NVIDIA не могла залишати цей факт поза увагою, але чесно скажемо, "симетрична відповідь" вражає.

Вступ

Почалося все досить прозаїчно – з оновлення лінійки середнього рівня графічних чіпсетів NVIDIA. Втім, незважаючи на той самий " порядковий номервідеокарти, що і у флагманської лінійки, адаптер на базі нового GPU, що отримав індекс G92, все ж таки позиціонується розробником саме як middle-end рішення.

Насамперед, G92 виробляється за новим 65-нм техпроцесу, що дозволило підняти частоти до 600-650 МГц за чіпом (стандартні для G80 дорівнюють 575 МГц) і при цьому зменшити енергоспоживання. Крім частоти збільшилася і кількість уніфікованих процесорів - до 112 штук проти 96-ти GeForce 8800 GTS 640/320 MB (GeForce 8600 згадувати взагалі немає сенсу). Порівняння зі 128-ю процесорами в чіпі GeForce 8800 GTX/Ultra було б некоректно, оскільки це топові відеокарти, які за ціною відрізняються від 8800 GT 512 Мб дуже сильно, хоча по швидкодії новий middle-end іноді дотягує і до флагмана компанії.

Далі NVIDIA відмовилася від експериментів з 320- та 384-бітною шиною пам'яті, на даний момент 256 біт цілком достатньо для процесора такої потужності, а на ціну кінцевого продукту цей параметр впливає дуже помітно. Залишилось додати, що стандартною частотоюпам'яті GeForce 8800 GT 512 Мб вважається 1800 МГц (ефективна), а як інтерфейс використовується PCI Express 2.0, який, як ми вже знаємо, розкривається у всій красі при використанні "тандемів" відеокарт (у випадку з NVIDIA - режим SLI).

Але після представлення дорогих (щодо) відеокарт середнього рівня на базі G92 утворилася порожнеча між GeForce 8800 GT та GeForce 8600 GTS, яку потрібно було чимось заповнити. І для цих цілей якраз підходить новий графічний процесор G94, який спочатку призначений для middle-end-акселераторів ціною до 200 доларів, в яку вже непогано вписуються. ATI Radeon 3870/3850.

NVIDIA GeForce 9600 GT

Отже, що ж є GeForce 9600 GT на базі G94, представлений 21 лютого цього року? Перше, що привертає увагу - Нова серіялінійки GeForce. Як ми пам'ятаємо, NVIDIA спочатку представляла чіпсет high-end класу, а пізніше - більш доступні рішення. В даному випадку серія GeForce 9xxx почала свій відлік саме з рішення середнього рівня, причому з дуже привабливою ціною. Далі йде зовнішній вигляд графічного процесора - кристал розгорнутий на 45°.

Та й нарешті, технічні характеристики, які не сильно відрізняються від таких відомого нам G92. Фактично G94 можна назвати похідним від старшого GPU: той же 65-нм техпроцес, завдяки чому вдалося підняти частоту ядра до 650 МГц; архітектура, що запозичила все найкраще з G80 та G84; 256-бітний інтерфейс пам'яті; підтримка шини PCI Express 2.0; новий відеопроцесор PureVideo HD, який відповідає за обробку відео високої чіткості.

Відеокарта GeForce 9600 GT GeForce 8800 GTX GeForce 8800 GT GeForce 8600 GTS
Ядро G94 G80 G92 G84
Число транзисторів, млн. 505 681 754 289
Техпроцес, нм 65 90 65 80
Число потокових процесорів 64 128 112 32
Число TMU 32* 32 56* 16*
Число ROP 16 24 16 8
Частота ядра/процесорів, МГц 650/1650 575/1350 600/1500 675/1450
Тип пам'яті GDDR3 GDDR3 GDDR3 GDDR3
Частота пам'яті DDR, МГц 1800 1800 1800 2000
Шина пам'яті, біт 256 384 256 128
Об'єм пам'яті, МБ 512 768 512 256
Пропускна спроможність пам'яті, ГБ/с 57,6 86,4 57,6 32
Інтерфейс PCI Express 2.0 PCI Express PCI Express 2.0 PCI Express
Підтримувана версія DirectX 10 10 10 10
Енергоспоживання, Вт 95 177 115 71

* - дані TMU відрізняються від таких у G80

Істотною відмінністю є зменшена кількість потокових процесорів, а значить, і транзисторів – у G94 стрим-процесорів всього 64 (у G92 – 112), причому функціонують вони на частоті 1625 МГц, транзисторів – близько 505 млн. Також скоротилася кількість текстурних блоків до 32 ( у G92 їх 56), але через архітектурні особливості вони не зможуть працювати швидше 32 TMU у G80. Швидше, швидкість роботи TMU у новому чіпі можна прирівняти до 16 текстурників флагмана компанії, але лише умовно. Число ROP залишилося незмінним порівняно з G92 - ті самі 16 штук. Як бачимо за характеристиками, нове доступне рішеннясереднього класу має вдвічі більшу кількість функціональних блоків і шину пам'яті на відміну від GeForce 8600 GTS, який незабаром має спуститися до рівня "кому за 100, але немає ще 150", доларів, звичайно. Тепер щодо пам'яті. Як і GeForce 8800 GT, нові акселератори підтримують 512 МБ GDDR3 частотою 1800 МГц, що з 256-бітною шиною дає можливість перекачування даних до 57,6 ГБ в секунду – раніше небачена швидкість для подібних рішень.

Дизайн PCB еталонних карт на базі GeForce 9600 GT трохи спрощений у порівнянні з GeForce 8800 GT, але розведення пам'яті залишилося незмінним. Силова обв'язка також трохи скинула у вазі – заявлене енергоспоживання становить лише 95 Вт, але, незважаючи на підтримку PCI-E 2.0, карти оснащуються додатковим роз'ємом живлення. Референсна система охолодження є все той же однослотовий кулер, що накриває плату цілком, з вентилятором великого діаметра, як на СО другий ревізії від GeForce 8800 GT. Монтажні отвори сумісні з такими на GeForce 7900, так що замінити в разі необхідності систему охолодження на альтернативну не складе труднощів.

Варто також відзначити підтримку новим GPU інтерфейсів HDMI та DisplayPort, причому останній реалізований у самому чіпі, на відміну від G92. Самі порти можуть бути виконані або на картах спеціального дизайну або за допомогою перехідника, що підключається до одного з двох Dual Link DVI. Для передачі звуку транзитом на картах передбачений спеціальний роз'єм.

Тепер настав час закріпити нашу теоретичну частину практичної, на прикладі відеокарти від Zotac.

Zotac GeForce 9600 GT AMP!

Компанія Zotac з'явилася на ринку порівняно недавно і в Україні відома далеко не всім. Втім, значну частину побоювань знімає той факт, що Zotac полягає у групі PC Partner, яка, у свою чергу, повинна бути відома вам за брендом Sapphire, що спеціалізується на продуктах з чіпами AMD як "полум'яний двигун". Відповідно, Zotac - це приблизно те саме, але з упором на продукцію NVIDIA.

Карта Zotac GeForce 9600 GT, що потрапила до нас на тестування, відноситься до серії AMP!, головною відмінністю якої є більш високі робочі частоти щодо референсних. У нашому випадку частотна формула мала вигляд 725/1750/2000 МГц (чіп, шейдерний блок та пам'ять відповідно) проти 650/1650/1800 МГц для рекомендованих розробником частот. Система охолодження відеоакселератора є копією еталонного зразка, щойно фірмова наклейка виділяє кулер на тлі конкурентів. Рівень шуму виявився незначним, щоправда, за старту системи вентилятор розкручується на повну. Що дійсно порадувало, так це температура екземпляра - карта була куди холодніше, ніж звичайні рішення на базі GeForce 8800 GT.

Упаковка відеокарти Zotac GeForce 9600 GT AMP! аскетична, але з надійним картонним "боксом", що дозволяє не турбуватися про збереження акселератора при перенесенні.

Комплект поставки нічим особливим похвалитися не може, зате покупець отримує ТВ-кабель, перехідники DVI/D-Sub та DVI/HDMI, конектор для підключення до цифрового виходу аудіокарти, та й обов'язкові атрибути: диск з драйверами та мануал.

До того ж додається ще й перехідник для живлення з двох "молексів" на один шестипіновий PCI-E. Тестова конфігурація

Для тестів використовувалася система на базі материнської плати ECS P35T-A (чіпсет Intel P35), процесора Core 2 Extreme QX6700 та двох планок DDR2-800 по 1 ГБ виробництва Hynix. Все це добро справлялося операційною системою Windows Vista Enterprise з усіма оновленнями зараз. Як опоненти були обрані Zotac GeForce 8800 GT AMP! (Робочі частоти 700/1675/2000 МГц) та ECS N8800GTS-640MX з референсними характеристиками.

Як бачите на знімку зверху, GeForce 9600 GT та GeForce 8800 GT ідентичні за розмірами, як і системи охолодження.

Як бенчмарки були взяті такі програми:

  • 3Dmark"06. Традиційний тестовий пакетбез якого, як без рук. Тестування проводилося у двох режимах: 1280х1024 без додаткових опцій та у 1600х1200 з 8х антиаліасингом та 16х анізотропією, максимум того, що дозволяє 3Dmark"06;
  • Gears of War. Гра від Epic, творців двигуна Unreal Engine 3, і, власне, на цьому двигуні і заснована. Рясне використання постефектів, бамп-меппінг та повсюдне використання карт зміщення для малювання персонажів. Загалом саме такими будуть найближчі шутери, портовані з Xbox 360, а їх готується до виходу чимало. Налаштування - повний максимум при роздільній здатності 1280х1024, тільки вертикальна синхронізація відключена;
  • Lost Planet: Extreme Conditions. Хоча сама гра і не виправдала всіх очікувань, буйство погодних ефектів та тіні від DirectX 10 викликають повагу. Налаштування, як і в попередньому випадку, максимальні, роздільна здатність 1280х768 (широкоформатний);
  • Supreme Commander. Для бенчмарку важливо те, що в SC на вільно масштабованій карті, розміром до 80х80 км, вміщається кілька тисяч юнітів, не дуже обділених полігонами. Все це приправлено реалістичними тінями та десятками різних вибухів (благо, підривати в цій грі є що). У роздільній здатності 1280х1024 і восьмиразовим згладжуванням SC здатний змусити "замислитися" будь-яку відеокарту. Неабияке навантаження лягає і на процесор, але в нас із цим більш-менш гаразд;
  • Crysis. Без коментарів, мабуть. Єдиний "чистий" DirectX 10 шутер на РС коментарів дійсно не потребує. Налаштування High.

Просто "з інтересу" була проведена перевірка продуктивності вбудованим засобом Windows Vista, але вона всім карткам видала 5.9 бала, так що говорити тут нема про що.

Результати

Цікаві результати, включи в тестування GeForce 8600 GTS - було б з чого посміятися. А тут, як бачите, просто говорити нема про що - продуктивний DirectX 10 по розумною ціною(Сподіватимемося, що ажіотаж не підніме ціни до небес). Звичайно, не варто забувати, що "цвях програми" має заводський розгін, як і представник GeForce 8800 GT. Та й тестування є попереднім. Але навіть з такими показниками вже стає цікаво хто вийде переможцем на ринку middle-end рішень.

Висновки

Зрозуміло, що невтішним результат буде, перш за все, для попереднього покоління відеокарт NVIDIA. Коли є GeForce 8800 GT 512 Мб, який і дешевше (принаймні, так було задумано) і швидше за GeForce 8800 GTS 640 Мб, то думати тут нічого - вибір очевидний. Але тут, як чорт з табакерки, з'являється GeForce 9600 GT, який начебто повинен бути відеокартою "середнього класу", але при цьому він впритул наближається до "еліти". Так, до GeForce 8800 Ultra новачок не дотягне навіть за гарному розгоніАле ж ця відеокарта майже втричі дешевше і набагато економічніше (а значить - і тихіше)! Питання "а чи не зібрати у себе SLI" стає ще більш актуальним.

GeForce 8600 GTS/GT забутий як страшний сон, у нас тепер новий middle-end з ціною до $200, який дозволить насолодитися ігровим процесом без будь-яких гальм при більш агресивних налаштуваннях. Власне, як це й було за часів GeForce 7600.

Не можемо не відзначити бренд Zotac. Продукція компанії сподобалася практично всім - якістю, і комплектацією, і зручністю установки драйверів, і зовнішнім виглядом. При цьому нічого заздалегідь зайвого, але все необхідне на місці. Загалом якщо ціна на Zotac 9600 GT AMP! не сильно перевищуватиме вартість аналогічних пропозицій, то дана картастане відмінним виборомдля вимогливого користувача.

Дев'яте покоління відеокарт від Nvidia з'явилося на початку 2008 року. Центром уваги стане чіпсет середньої цінової категорії – GeForce 9600 GT. Характеристики, результати тестів, загальне враження від стабільності - все це ви зможете знайти нижче. В результаті зможете визначитися з вибором

Історія появи

У 2008 році, коли AMD займалися випуском бюджетних відеокарт, у компанії Nvidia були тільки екземпляри топового варіанту. Тим самим вони позбавили себе найбільшого сегмента споживачів. Постало питання про створення конкурента для Radeon 3800 Series. Насамперед спробували зайняти цю нішу за допомогою слабшої версії топової відеокарти GeForce 8800. був зменшений до кумедних 256 МБ. І плату було випущено у продаж. Однак серед користувачів ПК ця модифікація відеокарти не набула популярності.

Прибуток від продажів був дуже малий. Все тому, що вартість такого топового чіпа досить висока, щоб урізати його показники і продавати за низькою ціною. В результаті, на передній план вийшла дев'ята серія. Спочатку виробництво планувалося розпочати не раніше, ніж за рік. Зокрема, це стосується першої GT. Характеристики відеокарти знаходяться на середньому рівні: між 8600 та 8800 GTS. З модельного ряду AMD конкурентом стала серія 3800.

Девізом для підвищення продажів 9600 GT стала така фраза: хороша продуктивністьза малі гроші. З огляду ви дізнаєтеся, чи підтвердилося твердження з приводу відеокарти Nvidia 9600 GT, характеристики якої вражають. Цей графічний чіп став справжнім основоположником цілого покоління нових чіпсетів, які принесли ще більшу популярність компанії та значно розширили клієнтську базу серед покупців заліза. hi-end класу, і у середньому ціновому сегменті.

Nvidia 9600 GT: Технічні характеристики

Отже, розберемося, що ж є ця відеокарта. Основою неї став чіпсет 8800 GTS. Тільки урізаний за параметрами. Оскільки 8800 GTS була лише проміжною розробкою, технології якої застосували пізніше в 9800. Базою для карти став чіпсет G94, той же, що і в 8800 серії. Ви запитаєте: чому тоді вона коштує набагато дешевше і на чому економить виробник? Відповідь досить проста. У 9600 GT урізано кількість потокових процесів удвічі порівняно зі старшою моделлю. Це дозволило суттєво знизити ціну. Але приріст продуктивності було досягнуто рахунок використання однакових шин з розрядністю 256 біт. Це дозволило вийти на більш високі показники частоти процесора та обробки шейдерів.

За словами 9600 GT, характеристики якої урізані, продуктивніше 8800 серії на цілих 15%. Ось уже прорив у технологіях! Трохи згодом ми на практичних тестах визначимо: правда це чи ні. Також відеокарта оснащується 512 Мб вбудованої пам'яті, підтримкою режиму SLI (одночасне підключеннядо системи до трьох однакових відеокарт, що працюють паралельно). Вона має інтерфейс DirectX 10 і всі необхідні роз'єми для підключення моніторів, виведення зображення на телевізор і так далі.

Зовнішній огляд відеокарти

Плата стала дещо меншою за свого попередника в основному за рахунок спрощення технології. Це дозволяє встановлювати їх у досить тісні бюджетні корпуси. Адже 9600 GT (характеристики middle-end рівня) має відповідати своєму класу, як не крути. По всій площі плати є безліч отворів, які призначені для покращення тепловіддачі. Зверху вона закрита пластиковим корпусом з радіатором та одним кулером. Цього цілком достатньо підтримки стабільно низької температури навіть за високих навантаженнях.

Результати тестування

Для проведення тестів в іграх було встановлено наступний стенд. Процес від Intel – Core 2 Duo, двоядерний із частотою по 3 Гц на кожне ядро. Крім того, були в наявності 4 Гб оперативної пам'яті, жорсткий диск об'ємом 750 Гб та блок живлення Acbel на 500 Вт. Тестування проводилося в іграх, які були актуальні на момент випуску відеокарти 9600 GT. Характеристики стендового комп'ютера також відповідають на той час.

За основу взято показники в іграх Crysis, Call of Duty 4, Bioshock, Lost Planet. Всі вони запускалися за допомогою DirectX 10 і на максимальних налаштуванняхз роздільною здатністю Full-HD. Перша гра (Crysis) повелася зовсім погано - всього 10 кадрів в секунду. Дається взнаки бюджетність моделі відеокарти. У Call of Duty 4 та Bioshock гра видає стабільні 40 кадрів за секунду на максимальних налаштуваннях. Це вже добре для середнього цінового сегментавідеочіпів. У Lost Planet комфортно було грати на середніх чи низьких налаштуванняхз максимальною роздільною здатністю екрана.

Енергоспоживання та розгін

Перейдемо до енергоспоживання. Інженери Nvidia примудрилися знизити витрати електроенергії на цілих 15%. Творці показують усіма способами приналежність до середнього класу відеокарт Nvidia 9600 GT: характеристики, енергоспоживання, продуктивність знаходяться на хорошому рівні за свою ціну. Не забули творці відеокарти та про аматорів поекспериментувати над своїм залізом. Розгінні можливості вирішили не чіпати. Тому на свій страх і ризик власники можуть спробувати створити із плати із середньою продуктивністю справжнього монстра та підкорювача сучасних ігор.