Dmi не менее 10 гт с qpi. Параметры разгона оперативной памяти. Наличие кэша L3 и изменение иерархии кэш-памяти процессора

Официальный анонс Intel Core i7, первых процессоров архитектуры Nehalem, стал одним из главных событий в мире высоких технологий прошедшего 2008 года. Чем больше появлялось разнообразной информации касательно нового поколения CPU, тем чаще в кругах специалистов звучало мнение, что Nehalem с точки зрения эволюции настольных процессоров является шагом вперед и, одновременно, в сторону, если хотите — разбегом перед решительным прыжком.

Разработчики Core i7 заложили в него прочный технологический фундамент, частично пожертвовав производительностью в краткосрочной перспективе. Практическая ценность таких новшеств как вторая редакция технологии Hyper-Threading и тесно связанная с ней сложная иерархия кэш-памяти сегодня проявляется лишь частично. С одной стороны, в этом есть доля вины софтверных компаний, не заботящихся об оптимизации программ под многопоточные вычисления, а с другой стороны сказывается четкая серверная направленность микроархитектуры Nehalem.

Впрочем, оставим историко-философский аспект разработки Nehalem любителям околонаучных дискуссий и перейдем к непосредственному изучению Core i7. Начнем с теории и закончим практикой. Что из этого приятное, а что — полезное, решать нашим читателям.

Процессорный кристалл Core i7

Процессор Core i7 (Bloomfield, 45 нм) включает в себя: четыре физических ядра, распределенных на 8 виртуальных потоков с помощью технологии Intel Hyper-Threading, трехуровневый массив ячеек кэш-памяти, новый системный интерфейс Quick Path Interconnect, интегрированный контроллер памяти DDR3, блок очереди команд (на схеме — «Queue») и блок операций ввода-вывода («Miscellaneous I/O»). Кроме того, в структуре серверных четырехъядерников Nehalem EP найдет применение второй порт QPI для связи между двумя и более процессорами на одной материнской плате.


В отличие от Core 2 Quad — мультичипового модуля из пары Core 2 Duo, дизайн Core i7 изначально предполагает наличие четырех ядер в одном процессорном кристалле. Количество физических ядер легко варьируется в зависимости от намеченной цели. Например, во второй половине 2009 г. Intel планирует выпуск восьмиядерных CPU Nehalem EP, а вначале 2010-го — двухъядерных процессоров Havendale LGA1156 с интегрированной графикой.


Строение каждого из четырех ядер спроектировано согласно нижеприведенной схеме:


Ширина конвейера Intel Core i7, как и у представителей микроархитектуры Core 2, составляет 4 инструкции за такт. Во избежание перенасыщения очереди команд в многопоточном режиме, расширены основные буферы операций:
  • reservation station (буфер резервирования операций) — с 32 до 36 μops;
  • load buffers (буферы загрузки операций) — с 32 до 48 μops;
  • store buffers (буферы хранения операций) — с 20 до 32 μops;
  • out of order scheduling window (буфер внеочередного выполнения операций) — с 96 до 128 μops.

Intel Hyper-Threading Technology

Спустя четыре года после маловыразительного дебюта технологии Hyper-Threading (HT) в структуре настольных процессоров Pentium 4 (Northwood), специалисты Intel вернулись к концепции многопоточной обработки данных.


Эффективность HT по-прежнему зависит от конкретного приложения. Программы, использующие большой объем разнотипного кода (например, базы данных), практически идеально подходят Core i7, в тоже время основная масса игр демонстрирует 0,5-2-процентное падение фреймрейта. Впрочем, список программного обеспечения, адаптированного к особенностям Hyper-Threading, будет неуклонно расширяться.

Новая иерархия кэш-памяти, Integrated Memory Controller и Quick Path Interconnect

Встроенный контроллер оперативной памяти (IMC), разделяемый кэш третьего уровня и высокоскоростной интерфейс QPI (аналог HyperTransport) — все это было пройдено в процессорах AMD K8/K8L/K10 и теперь плавно перекочевали в ядро Bloomfield.

С переносом контроллера памяти из северного моста в тело CPU уменьшилась зависимость процессора от постоянного увеличения объема кэш-памяти. Иерархия кэша в Core i7 целиком подчинена многопоточным вычислениям: унифицированный L2 кэш урезан до 256 килобайт на каждое ядро, а основной акцент сделан на 8 МБ разделяемого кэша третьего уровня. Последний содержит все инструкции и данные из L1/L2 cache для уменьшения трафика запросов.


Ввиду того, что инженерам Intel изначально не удавалось поднять тактовую частоту Core i7 до конкурентоспособного уровня, латентность L1 кэша была увеличена по отношению к Core 2 на базе Penryn с 3 до 4 тактов. Данный маневр частично повлиял на итоговую производительность. Кэш-память второго уровня, наоборот, стала быстрее и экономичнее: вместо 15 тактов на выполнение одной операции уходит 11 тактов.

Встроенный контроллер оперативной памяти процессоров Core i7 поддерживает трехканальный (192-bit), двухканальный (128-bit) и одноканальный (64-bit) режимы работы памяти. В плане эффективности первые два смотрятся наиболее предпочтительно. Сразу отметим невозможность появления в будущем материнских плат для Core i7 со слотами DDR2: в отличие от AMD Phenom II, контроллер памяти Bloomfield поддерживает только модули стандарта DDR3.

С приходом процессоров нового поколения заканчивается эра системной шины FSB. На смену ей приходит высокоскоростной интерфейс Quick Path Interconnect (QPI):


QPI обеспечивает одновременный обмен данных в обоих направлениях (от CPU к северному мосту и от северного моста к CPU), что выгодно отличает его от Front Side Bus. Суммарная пропускная способность QPI достигает 25,6 GB/s — как минимум, в 2 раза выше, чем у FSB.

Чипсет для процессоров Core i7

Процессоры Intel Core i7 предназначены для работы с материнскими платами, оснащенными разъемом LGA1366, первые из которых будут основаны на чипсете Intel X58 Express (Tylersburg). Новый набор системной логики состоит из северного моста X58 IOH и южного моста ICH10/ICH10(R).


Материнские платы c 1366-контактным процессорным разъемом официально поддерживают модули оперативной памяти DDR3 частотой 800/1066 МГц, однако на практике Core i7 успешно взаимодействует и с более быстрыми комплектами RAM. Количество слотов DDR3 обычно варьируется от трех до шести.

Intel X58 Express программно совместим с технологиями NVIDIA SLI и ATI CrossFire. Впрочем, поддержка нескольких видеокарт GeForce связана с затратным для производителя материнских плат процессом сертификации. Так что присутствие NVIDIA SLI является лишь опцией для материнских плат премиум-класса. Подробнее о конфигурациях SLI можно прочитать в одном из наших предыдущих материалов.

Южный мост ICH10(R) сегодня широко используется в составе чипсета Intel P45 Express, поэтому его возможности хорошо известны энтузиастам.Процессоры Intel Core i7

Основные моменты архитектуры Nehalem мы рассмотрели и теперь перейдем к готовым изделиям на ее базе. Новые процессоры поначалу будут представлены на рынке высокоуровневыми моделями, что и не удивительно. Обычно выход очередных решений подразумевает продукты hi-end-класса, так как производителю необходимо удовлетворить спрос на новинки и, в какой-то степени, покрыть расходы на разработку. Да и производители материнских плат не против подзаработать на этом поприще.


На данный момент времени компания Intel предлагает всего три модели процессоров на базе ядра Bloomfield, которые отличаются между собой рабочей частотой ядер и частотой шины QPI: Core i7-920 (2,66 ГГц), Core i7-940 (2,93 ГГц) и Core i7-965 Extreme Edition (3,2 ГГц).
Intel Core i7-965 Extreme Edition Intel Core i7-940 Intel Core i7-920
Разъем LGA1366 LGA1366 LGA1366
Техпроцесс 45-нм, с применением high-k диэлектриков 45-нм, с применением high-k диэлектриков
Число ядер 4 (8 потоков) 4 (8 потоков) 4 (8 потоков)
Номинальная частота 3,20 ГГц 2,93 ГГц 2,66 ГГц
Объем L1 кэша 4 x (32+32) КБ 4 x (32+32) КБ 4 x (32+32) КБ
Объем L2 кэша 4 x 256 КБ 4 x 256 КБ 4 x 256 КБ
Объем L3 кэша 8 МБ 8 МБ 8 МБ
Множитель 24х, свободный 22х, заблокирован на повышение
Поддерживаемый тип памяти DDR3 800/1066/1333 DDR3 800/1066 DDR3 800/1066
Пропускная способность QPI 6,4 ГТ/с 4,8 ГТ/с 4,8 ГТ/с
Номинальное напряжение 1,20 В 1,20 В 1,20 В
TDP 130 Вт 130 Вт 130 Вт
Стоимость $999 $562 $284

Процессор Core i7-965 Extreme Edition, как видно из его названия, рассчитан на энтузиастов и оверклокеров и кроме высокой частоты имеет полностью разблокированный множитель, что позволяет его разгонять без проведения серьезных манипуляций с шиной QPI и остальными компонентами системы.

Что касается самой шины QPI, то ее частота формируется за счет умножения определенного коэффициента на частоту тактового генератора, равную в номинале 133 МГц.


Ее также называют опорной частотой шины QPI, QPI bclk или просто Bclk (утилита CPU-Z определяет ее как Bus Speed). По своему назначению она полностью соответствует частоте тактового генератора в современной платформе AMD — за счет нее формируется частоты ядер, кэш-памяти, контроллера памяти и частота системной памяти. Например, частота Core i7-920 получается умножением коэффициента 20х на 133 МГц. Естественно, при разгоне CPU путем повышения Bclk будут расти частоты всех блоков процессора, шины QPI и памяти, что может сказаться на их стабильной работе. Частота шины QPI для процессоров Intel Core i7-920 и Core i7-940 составляет 2,4 ГГц, что эквивалентно пропускной способности 4800 мегатранзакций в секунду (или 4,8 ГТ/с). Для Core i7-965 EE это значение соответствует 3,2 ГГц или 6,4 ГТ/с. Зная частоту QPI можно без проблем высчитать коэффициент умножения шины у каждого из процессоров: для Core i7-920 и Core i7-940 он равен 18, для Core i7-965 EE — 24.

Но частота шины Quick Path Interconnect не единственная проблема, с которой можно будет столкнуться при разгоне обычных Core i7. Дело в том, что в новых CPU кэш третьего уровня и контроллер памяти (данная часть процессора называется Uncore) работает на отличной от процессора частоте — по рекомендации Intel, частота этих блоков должна быть в два раза выше эффективной частоты памяти. Данный параметр изменяется в настройках BIOS Setup материнской платы (коэффициентом или выбором частоты).


Отслеживать значения Uncore можно при помощи все той же утилиты CPU-Z — за это отвечает параметр NB Frequency в закладке Memory.

Из поддерживаемой памяти для младших Core i7 заявлена только DDR3-800/1066 (коэффициенты 6х, 8х), для Core i7-965 Extreme Edition этот список расширен до DDR3-1333 (коэффициент 10х).

За счет переноса части северного моста в CPU, его размеры несколько увеличились, как и количество контактов — теперь их 1366, а сам процессор стал немного продолговатым по сравнению с Core 2.



Процессорный разъем также претерпел изменений и кроме увеличенных размеров и количества контактов обзавелся усилительной пластиной с обратной стороны материнской платы, которая прижимается четырьмя болтами.



Из-за расширения функциональности тепловой пакет новых процессоров достаточно высок — 130 Вт, хотя и меньше на шесть ватт, чем у топовых Core 2 Quad с 12 МБ кэшем. При этом напряжение питания новинок составляет 1,2 В. Несмотря на это, для Core i7 теперь необходимы новые системы охлаждения, так как расстояние между монтажными отверстиями на материнских платах увеличилось с 72 до 80 мм относительно платформы LGA775. Соответственно увеличились и габариты кулеров. Обладателям коробочных версий Core i7 на этот счет особо переживать не придется, но при разгоне необходимо будет подыскать что-то поэффективней (или новое крепление для «суперкулеров»), так как процессоры на базе ядра Bloomfield имеют достаточно горячий нрав.

Для слежения за состоянием процессора, в нем был размещен специальный микроконтроллер Power Control Unit (PCU), который отвечает за мониторинг и регулирование показателей напряжения, силы тока и температуры ядер.


Кроме того, Core i7 обладает технологией Turbo Boost, которая позволяет автоматически увеличить частоту процессора при недостаточной загрузке ядер путем поднятия коэффициента умножения CPU на один пункт (при номинальной Bclk разгон составляет 133 МГц) или на два пункта, но только для одного ядра.


Единственное условие работы «турбированного режима» — уровень TDP не должен превышать номинального значения. Частота нашего тестового процессора Core i7-920 с активированной технологией Turbo Boost во время прохождения тестов равнялась 2800 МГц, что соответствовало «слабому» разгону. На основании этого можно предположить, что режим Turbo Mode работает не только при слабой нагрузке на процессор.


Если при разгоне уровень TDP превысит 130 Вт коэффициент умножения CPU будет снижаться до того уровня, пока не нормализуется состояние процессора. В связи с этим для достижения высокой частоты придется либо отодвигать порог срабатывания защиты (на материнской плате Intel есть отдельные пункты для управления уровнем TDP и силы тока, проходящей через процессор) либо отключать защиту вовсе (например, на платах ASUS).

Наличие официального авторазгона будет полезно при работе технологии Hyper-Threading (или Simultaneous Multithreading — SMT, технология «одновременной мультипоточности»), так как некоторые приложения не способны задействовать все возможности процессора, а порой включение HT влечет за собой падение производительности системы. И в этом случае поднятие частоты CPU компенсирует этот недостаток. Как и ранее во времена Pentium 4 HT, операционная система видит логические и физические ядра как отдельные, и для процессоров Core i7 это количество достигает восьми штук.


При необходимости технологию Hyper-Threading, а также Turbo Boost можно отключить и тем самым перевести процессор в режим обычного четырехъядерного CPU.

Для установки Core i7 необходимы новые материнские платы с разъемом LGA1366 на базе единственного пока набора системной логики под новую платформу — Intel X58 Express. Данный чипсет является высокоуровневым решением, и ждать дешевых продуктов на его основе пока не стоит, хотя он сам в производстве выходит не дороже X48. Тем более что некоторые производители материнских плат смогут сертифицировать свои решения для поддержки технологии SLI, либо установить дополнительный чип nForce 200 для этой цели, а это уже точно скажется на цене готового изделия.

В качестве компаньона для нашего тестового процессора Core i7-920 использовалась материнская плата ASUS Rampage II Extreme, которая является продолжением серии Republic of Gamers и правопреемницей Rampage Extreme на базе Intel X48 Express. Нашей целью не было серьезное изучение данного продукта, так как основной темой статьи является новая платформа в целом. Но мы все же постараемся максимально рассмотреть ASUS Rampage II Extreme как представителя X58.

Модель
Чипсет Intel X58 + ICH10R
Socket LGA1366
Процессоры
QPI, МГц 3200/2400
Память 6 DIMM DDR3 SDRAM 1800(O.C.)/1600(O.C.)/1333/1066/800 (12 GB max)
Слоты PCI-E 3 PCI Express x16 (режимы 16+16+1 и 16+8+8)
2 PCI Express x1 (один для звуковой карты))
Слоты PCI 1
Количество подключаемых вентиляторов 8 (1x 4-pin, 7x 3-pin)
Порты USB 2.0 12 (6 разъемов на задней панели)
Порты PS/2 1
Порт LPT -
Порт COM -
Порты FireWire 2 (1 разъем на задней панели)
ATA-133 1 канал (два устройства, JMicron 363)
Serial ATA 6 каналов SATA II (ICH10R) + 1 канал SATA II + 1 eSATA (JMicron 363)
RAID 0, 1, 5, 10
Встроенный звук SupremeFX X-Fi на базе ADI AD2000B (7.1, HDA)
S/PDIF Коаксиальный + оптический
Встроенная сеть 2х Marvell 88E8056 (Gigabit Ethernet)
BIOS AMI BIOS
Форм-фактор ATX
Размеры, мм 305х269
Дополнительно Кнопки Power, Reset, Clear CMOS, управление LCD-Poster, возможность снятия показаний напряжений и световая индикация уровня напряжений основных узлов платы


Материнская плата поставляется в крупной коробке, выполненной в непривычной для ASUS красной гамме, на что сразу обратит внимание потенциальный покупатель. Хотя, для нашего рынка это не столь актуально, так как комплектующие либо лежат на витрине магазина уже распакованными, либо пылятся на складе пока не выпишет менеджер. Для удобства переноски коробка снабжена пластиковой ручкой.



Как и у всех плат серии ROG упаковка Rampage II Extreme имеет откидывающуюся крышку с информацией о продукте, под которой скрывается окошко, через которое можно увидеть материнскую плату.


Комплект поставки разделен по двум коробкам: в одной находится плата, во второй — аксессуары к ней.


В коробке можно обнаружить следующее:
  • Инструкцию;
  • Диск с драйверами и ПО;
  • Шесть кабелей SATA;
  • Один переходник питания на два SATA-устройства;
  • Один кабель IDE;
  • Брикет с двумя USB и одним FireWire-портом;
  • Три выносных термосенсора;
  • Гибкий SLI-мостик;
  • Мостик для 3-Way SLI;
  • Два переходника для подключения мультиметра;
  • Набор коннекторов ASUS Q-Connector;
  • Вентилятор;
  • LCD-Poster;
  • Звуковая карта SupremeFX X-Fi
  • Задняя планка I/O с подсветкой.


Как видите, комплект не маленький, но и плата самая дорогая на рынке среди решений на базе Intel X58 Express. Пусть не удивляет наличие SLI-мостиков в комплекте — Rampage II Extreme поддерживает помимо технологии CrossFire еще и SLI «программным» методом.

Плата выполнена на текстолите фирменного черного цвета и по размерам чуть шире стандартных ATX-решений. Оформление Rampage II Extreme сделано в одном стиле, в отличие от недавних высокоуровневых продуктов компании, в которых соседствовали радиаторы различных «цветов и красок».



На обратной стороне платы прикручена та самая усилительная пластина, о которой мы упоминали в описании Socket 1366. Тут же расположена часть элементов от подсистемы питания процессора, которые позволяют снять тепловую нагрузку с лицевой стороны платы.


Подсистема питания процессора построена по 16-фазной схеме с использованием дросселей в броневых сердечниках и конденсаторов с твердым электролитом. Первое позволяет избавиться от высокочастотного писка катушек под нагрузкой системы, второе скажется на длительности эксплуатации изделия в жестких условиях. Такие же элементы установлены во всех цепях питания платы. Для питания памяти предусмотрено три фазы, силовые транзисторы которых расположены возле южного моста. Они охлаждаются общим радиатором для микросхем чипсета, объединенным посредством тепловой трубки с системой охлаждения силовых элементов питания процессора. При необходимости можно установить комплектный вентилятор на один из радиаторов MOSFET.


Кроме того, в подсистеме питания процессора и памяти также используются высококачественные конденсаторы производства Fujitsu емкостью 1000 мкФ, рассчитанные на напряжение 3 В.


Возле северного моста расположен модуль VTT CPU Power Card, отвечающий за питание контроллера памяти и шины QPI (часть северного моста в процессоре, которая называется Uncore, но у плат ASUS в BIOS Setup за это отвечает параметр QPI/DRAM).


Модуль представляет собой небольшую платку с отдельным трехфазным контроллером питания. Для охлаждения элементов установлен небольшой радиатор с логотипом серии Republic of Gamers и с синей подсветкой, которую без проблем можно отключить.


Радиатор над северным мостом является съемным и вместо него можно установить совместимый с ASUS Rampage II Extreme водоблок — пока это лишь MCW-NBMAX от Swiftech.


Передача тепла от чипсета радиатору происходит через медную вставку, но судя по отпечатку на термопасте, прижим с одной стороны оставляет желать лучшего, так что, при установке водоблока придется следить за качеством монтажа.


В связи с использованием трехканального контроллера памяти в Core i7, материнские платы для этих процессоров будут оснащаться шестью, четырьмя или тремя слотами DIMM. На рассматриваемой плате установлено шесть разъемов, а максимальный объем памяти DDR3-800/1066/1333/1600 может достигать 12 ГБ. Можно использовать и два модуля — тогда будет функционировать лишь двухканальный режим, но после покупки ASUS Rampage II Extreme желательно обновить BIOS платы, так как с первой версией микрокода (достаточно часто продолжительное время на рынке присутствуют продукты со старой версией BIOS) наблюдаются проблемы с совместимостью с некоторыми комплектами памяти. Например, может теряться объем одной планки, как бы ни вставлялись модули в плату.


Рядом с разъемами DIMM расположены органы управления разгоном платы и кнопки включения/отключения и сброса системы.


Для удобства разгона необходимо подключить LCD-Poster к разъему возле задней панели, после чего будет возможность наблюдать за своими действиями на ЖК-экране.


Возле задней панели также есть разъем для подключения подсветки задней планки.


Пожалуй, одна из значимых «фишек» платы заключается в возможности снять показатели напряжений на основных компонентах системы при помощи обычного мультиметра, для чего выведены контакты возле органов управления разгоном. Тут же есть небольшие разъемы, куда можно подключить пару комплектных переходников для вольтметра.


В связи с возможностью установки трех видеокарт все разъемы для подключения периферии расположены по краям платы. Шесть разъемов SATA (ICH10R), и разъем IDE развернуты на 90°. Единственный канал параллельного интерфейса реализован за счет внешнего контроллера JMicron 363, который дополнительно поддерживает два канала SATA, разъем одного из которых установлен рядом с остальными, а второй канал выведен на заднюю панель в виде eSATA.


Рядом с ними распаяны чипы iROG, которые расширяют возможности системы при разгоне, контроле напряжений, управлении светодиодной индикацией состояния платы, среди которых уровень подаваемого напряжения на процессор, память и чипсет.


С нижнего края платы возле гребенок USB расположены две микросхемы BIOS и джампер Clear CMOS.


Для расширения функциональности дополнительно к трем разъемам PCI-E x16 на плате присутствуют один слот PCI, два PCI-E x1, один из которых отведен под звуковую карту SupremeFX X-Fi.


Графические интерфейсы способны работать в режиме «16+16+1» при установке двух видеокарт и «16+8+8» — при установки трех. Синие слоты снабжены удобными защелками, чего не скажешь о старых моделях материнских плат серии ROG, да и не только этой.


Задняя панель выглядит немного пустовато: один PS/2 для клавиатуры, шесть портов USB (еще шесть в виде гребенки на плате), по одному eSATA и FireWire и два RJ45, реализованных за счет двух гигабитных контроллеров Marvell 88E8056. Есть кнопка сброса настроек BIOS.


Звуковая подсистема выполнена на базе HDA-кодека ADI AD2000B и поддерживает технологии Creative EAX Advanced HD 4.0, X-Fi Crystalizer, X-Fi CMSS-3D.BIOS платы ASUS Rampage II Extreme

Учитывая переход на новую платформу, BIOS Setup материнских плат на базе Intel X58 Express обзавелся множеством неизвестных ранее параметров, которые в значительной степени влияют на уровень разгона и производительность процессоров Core i7. Естественно, от продукта к продукту наименование тех или иных параметров будет отличаться, но эффект при их изменениях будет один и тот же.

При входе в BIOS платы ASUS Rampage II Extreme, основанный на микрокоде AMI, нас сразу же приветствует раздел Extreme Tweaker, в котором сосредоточены все тонкие настройки системы, необходимые при разгоне. Ранее в платах ASUS первым пунктом стоял раздел Main, что вряд ли можно было назвать удобным, особенно при частой смене настроек во время разгона.


В данном разделе сразу же бросаются в глаза «статические» надписи желтого цвета, которые отображают текущие рабочие частоты процессора и памяти, напряжения и температуру CPU, микросхем чипсета, благодаря чему не надо перемещаться по всем разделам BIOS или перегружать систему, чтобы посмотреть те или иные значения.

Первый пункт в Extreme Tweaker отвечает за возможность разгона процессора до более производительной модели. Например, наш Core i7-920 можно повысить в «звании» до Core i7-940 или Core i7-965. Так как коэффициент умножения у младших моделей процессоров нового поколения заблокирован, то повышение частоты CPU происходит за счет увеличения частоты тактового генератора.


Аналогичная ситуация происходит и при выборе не поддерживаемого процессором режима работы памяти (DDR3-1600/1333), но при этом коэффициент CPU снижается до необходимого значения, при котором его частота будет приблизительно равна номинальной.


Следующий пункт — Ai Overclockers Tuner, знакомый по ранее выпускавшимся материнским платам ASUS, позволяет выбрать возможность настраивать все параметры системы вручную, использовать настройки X.M.P. (Extended Memory Profiles, интеловский «аналог» EPP, но для памяти DDR3) или же описанные выше режимы повышения частоты процессора или памяти.


В CPU Configuration собрана вся информация о процессоре и настройки различных функций и технологий, которые он поддерживает. Параметры Hardware Prefetcher и Adjacent Cashe Line Prefetch рекомендуется не отключать, так как произойдет падение производительности системы. При разгоне процессора параметр Turbo Mode, отвечающий за работу технологии Turbo Boost необходимо будет отключать. Также можно будет отключить CPU TM Function, но при этом придется следить за температурным режимом процессора.


Пункт DRAM Frequency позволяет выбрать режим работы памяти — для Core i7-920 и Core i7-940 это DDR3-800 и DDR3-1066. Для «экстремальной» версии Core i7 этот список значительно расширен, вплоть до DDR3-2133.


Настройки таймингов памяти сосредоточены в разделе DRAM Timing Control. Список внушительный, а с учетом Command Rate (значения 1T, 2T или 3T) — даже больше чем на платах ASUS на базе чипсетов X48/P45.


EPU II Phase Control отвечает за режимы функционирования «энергетического юнита», который управляет подсистемой питания платы.


BIOS платы ASUS Rampage II Extreme позволяет настраивать всевозможные напряжения в широких пределах с определенным безопасным уровнем, и для обхода последнего имеется параметр Extreme OV, благодаря которому на процессор можно подать до опасных 2,5 В.



Такое же напряжение можно подать и на память, но уже без активации Extreme OV. Правда, после перехода порога в 1,65 В появится предупреждение о возможности повреждения процессора при столь высоком напряжении. По технической документации на новые CPU максимально допустимым напряжением для памяти является около 1,85 В, при повышении которых уже идет большая нагрузка на встроенный контроллер памяти.


Достаточно давно известный по материнским платам ASUS параметр Load-Line Calibration, позволяющий избежать просадки напряжения на процессоре при его разгоне нашел применение и здесь. Также появился параметр CPU Differential Amplitude, который должен прибавить стабильности при разгоне процессора. Остальные напряжения, в том числе на северном и южном мостах занесены в следующую таблицу:
Параметр Диапазон изменений
CPU Voltage 0,85000-2,50000 В, с шагом 0,00625 В
CPU PLL Voltage 1,81592-2,50492 В, с шагом 0,01325 В
QPI/DRAM Core Voltage 1,20000-2,50000 В, с шагом 0,00625 В
IOH Voltage 1,11341-2,19991 В, с шагом 0,01325 В
IOH PCIE Voltage 1,51106-2,78306 В, с шагом 0,01325 В
ICH Voltage 1,11341-2,00116 В, с шагом 0,01325 В
ICH PCIE Voltage 1,51106-2,05431 В, с шагом 0,01325 В
DRAM Bus Voltage 1,51106-2,50492 В, с шагом 0,01325 В

Теперь перейдем к следующим не менее интересным разделам. В NorthBridge Chipset Configuration имеется настройка режимов работа второго и третьего разъема PCI-E x16 — это либо «x8+x8», либо «x16+x1».


В разделе LCD Poster and LED Control находятся настройки выносного ЖК-экрана и светодиодной индикации на материнской плате.


Раздел мониторинга разделен на четыре подраздела: напряжение питания, температура компонентов платы, скорость вращения вентиляторов и управление последними.


Мониторинг напряжений достаточно обширный — здесь собраны полностью все настраиваемые значения, плюс напряжения по трем основным линиям, выдаваемые блоком питания.


Мониторинг температур отслеживает показатели процессора, материнской платы и микросхем чипсета. Также здесь можно настроить порог срабатывания защиты при перегреве.


Количество сохраняемых профилей с настройками системы увеличилось до восьми — ранее в платах ASUS была возможность сохранить лишь пару профилей. Кроме того, в Rampage II Extreme теперь можно каждый профиль называть по своему усмотрению, чего так не хватало в старых решениях данного производителя.


Ну и под конец расскажем о возможностях обновления BIOS материнской платы. Итак, можно ипользовать утилиты AFUDOS для DOS или ASUS Update для Windows. Первый вариант предпочтительней и для него не обязательно пользоваться флоппи-дисководом. Достаточно воспользоваться возможностями EZ Flash в BIOS и обычной «флешкой», с предварительно сохраненной версией микрокода.


В случае повреждения или не правильной перепрошивки микрокода можно сделать откат на старую версию благодаря второй микросхеме с BIOS.

Так как использовался инженерный образец Intel Core i7-920, в котором заблокированы некоторые множители (для розничных процессоров все коэффициенты умножения, кроме процессорного на повышение, компания Intel решила разблокировать) нам не были доступны пункты UCLK Frequency и QPI Link Data Rate в разделе Extreme Tweaker, отвечающие за частоту контроллера памяти и L3-кэш, а также за частоту шины QPI. При тестировании и разгоне данные параметры устанавливались автоматически.
Разгон процессоров Core i7

Разгон процессоров нового поколения поначалу может показаться достаточно сложным занятием из-за появления неизвестных ранее параметров, которые необходимо настраивать для повышения частоты CPU. Но платформа Nehalem в плане разгона ничем не отличается от современной платформы AMD, а по сравнению с LGA775 имеет незначительные изменения. В этой статье мы не раз упоминали о некоторых параметрах, критичных при разгоне Intel Core i7 и в данном разделе попытаемся свести все вместе и на примере тестового процессора продемонстрировать возможности новых CPU.

Итак, в первую очередь следует отметить отказ инженеров Intel от системной шины Front Side Bus, которая служила верой и правдой не один десяток лет для связи процессора с чипсетом. Вместо нее теперь используется шина QPI с реальной частотой 2,4 или 3,2 ГГц, в зависимости от процессора, которая формируется за счет умножения коэффициента 18х или 24х на частоту тактового генератора, равную 133 МГц. Она также называется опорной частотой или просто Bclk, за счет которой формируются частоты ядра процессора, контроллера памяти и кэш-памяти третьего уровня (данный блок называется Uncore), а также частота памяти DDR3.

Ранее частота процессора формировалась за счет умножения определенного коэффициента на реальную частоту FSB, и разгон осуществлялся методом поднятия последней, так как множитель на процессорах Intel был заблокирован в сторону повышения (кроме версий Extreme Edition). Для новых CPU в этом плане ничего не изменилось — вместо FSB мы повышаем значение Bclk. При этом, естественно, пропорционально увеличиваются частоты шины QPI, блока Uncore и памяти. Если сравнивать с платформой конкурента, то у K8/K10 изначально предусмотрены низкие коэффициенты умножения основных блоков процессора, памяти и шины, благодаря чему частоту ядер можно повышать независимо от всего остального. С процессорами Core i7 дела обстоят несколько иначе. Минимальный множитель для шины QPI у новых процессоров Intel равен 18х, для контроллера памяти и L3-кэша — 16х, для памяти можно установить 6х (коэффициент «эффективный»), что соответствует 800 МГц. В итоге при увеличении частоты тактового генератора, скажем, до 200 МГц, частота процессора Core i7-920 составит 4 ГГц, шины QPI — 3,6 ГГц (7,2 ГТ/с, в BIOS Setup некоторых материнских плат может отображаться эффективная частота, например 7200 МГц), блока Uncore — 3,2 ГГц, а памяти будет равна 1200 МГц. Можно предположить, что изначально высокие множители станут преградой для достижения максимального разгона процессоров Core i7. Но как показывает практика из появившихся в Сети различных обзоров новой платформы, как раз с этим никаких проблем не наблюдается. Высокочастотная память DDR3 уже давно представлена на рынке, а стабильность остальных узлов системы может быть достигнута за счет повышения напряжения питания. Максимально рекомендуемое напряжение, подаваемое на процессор составляет 1,55 В (номинал 1,2 В), на контроллер памяти, шины QPI и кэш L3 — 1,35 В, для памяти это значение соответствует известным 1,65 В. При необходимости так же можно поднять напряжение CPU PLL (при разгоне Core 2 Quad в значительной степени влияло на результат) с 1,8 до 1,88 В. Конечно, процессору Core i7-965 Extreme Edition в плане разгона повезло куда больше — достаточно повышать коэффициент умножения и напряжение питания самого CPU.

Для информации все частоты и множители процессоров, шины QPI, контроллера памяти и L3-кэша, а также самой памяти занесены в таблицу:

Модель Частота процессора/множитель Частота Uncore/множитель Частота памяти/множитель Частота шины QPI/множитель
Core i7-965 EE 3,2 ГГц / 12-24 и выше 2,66 ГГц / 16-20 и выше 1333 МГц / 6, 8, 10 и выше 3,2 ГГц (6,4 ГТ/с) / 18, 20, 24
2,93 ГГц / 12-22 2,13 ГГц / 16 и выше 1066 МГц / 6, 8 и выше 2,4 ГГц (4,8 ГТ/с) / 18
2,66 ГГц / 12-20 2,13 ГГц / 16 и выше 1066 МГц / 6, 8 и выше 2,4 ГГц (4,8 ГТ/с) / 18

* — «Эффективный» множитель. Реальный составляет 3х, 4х, 5х и выше.


Технически, каждый из этих множителей может быть уменьшен до 2х, но где происходит блокировка — на уровне процессора или материнской платы — пока сказать сложно. Возможно, со временем мы точно сможем ответить на этот вопрос, а пока перейдем к остальным нюансам разгона новейших CPU от Intel.

Следующим важным пунктом является технология Turbo Boost, которая активируется при недостаточной загрузке всех ядер и повышает частоту процессора за счет увеличения множителя на один-два пункта. Достигнув при разгоне, например, предельных 4 ГГц система станет крайне нестабильной с Turbo Boost из-за более высокой частоты процессора во время слабой нагрузки. Поэтому данную технологию лучше отключать. Если же уровень разгона не превышает 3,5 ГГц, то можно попытаться оставить Turbo Boost в активном режиме, при этом следить за стабильностью системы при выполнении однопоточных задач.

И последний момент, на который необходимо обратить внимание при повышении частоты процессоров архитектуры Nehalem. Компания Intel ввела механизм защиты Core i7 от «переразгона», который тесно связан с Turbo Boost. Если тепловыделение или проходящий ток через процессор превысит 130 Вт или 100 А, будет задействован режим троттлинга, при котором начнет снижаться коэффициент умножения CPU. Естественно, данная «забота» будет мешать при разгоне, и для ее обхода достаточно отключить функцию CPU TM Function в решениях от ASUS или установить порог TDP и силы тока в материнской плате от Intel (для процессоров Core i7-965 EE). После этого необходимо тщательно следить за температурой процессора, так как нынешний степпинг C0 ядра Bloomfield обладает горячим нравом при повышении частоты и напряжения. Кроме того, для охлаждения Core i7, работающего в нештатных режимах, необходимо использовать высокопроизводительный кулер, иначе предел разгона будет ниже ожидаемого уровня, так как максимальная температура, при которой включается защита CPU, равна 100 °C.

Вот, пожалуй, и все, что необходимо знать для разгона процессоров на базе архитектуры Nehalem. Осталось практически закрепить полученные знания и для выяснения разгонного потенциала процессора Intel Core i7-920, который попал на тестирование, была собрана следующая конфигурация:

  • Оперативная память: Team Xtreem Dark TXDD2048M1866HC8DC (2x1024 МБ, DDR3-1866);
  • Видеокарта: Zotac GeForce 9600GT AMP!;
  • Блок питания: Silver Power SP-S850 (850 Вт).
Для охлаждения процессора использовался кулер Noctua NH-U12P с отдельным фирменным креплением LGA1366 Mounting-Kit, выпущенным специально для платформы Nehalem и предлагаемым пользователям систем охлаждения Noctua бесплатно .


В качестве вентиляторов применялись Akasa AK-183-L2B и Foxconn PV122512L с частотой вращения около 1700 об/мин, так как пара Noctua NF-P12 (1300 об/мин) были не в состоянии справиться с охлаждением радиатора при высоких частотах Core i7.

Чтобы при разгоне не было никаких препятствий технология Turbo Boost отключалась, напряжение питания на процессоре устанавливалось в значение 1,4 В, CPU PLL — 1,88 В, на контроллере памяти и шины QPI (QPI/DRAM Core Voltage) выставлялось на уровне 1,35 В. На модулях памяти напряжение питания равнялось 1,65 В, при этом тайминги составляли 7-7-7-21, а коэффициент — 6х. Тестом на стабильность использовалась утилита OCCT v.2.01 с часовым прогоном.

С такими настройками удалось достичь всего 3700 МГц, и дальнейший рост уперся в банальный перегрев — даже при таком уровне разгона температура процессора составляла 96 °C. И это на открытом стенде!


Частота тактового генератора равнялась 185 МГц, Uncore и памяти — 2960 и 1110 МГц соответственно. Шина QPI немногим отличалась от стандартной частоты у процессора Core i7-965 EE.


Теперь становится ясно, почему пресс-киты для тестирования выдавались с кулерами Thermalright Ultra 120 Extreme — процессоры Core i7 попросту не смогли бы пройти тест на разгон. Потенциал ядра Bloomfield в плане тепловыделения просто поражает. Уже начинаем представлять, как толпы разъяренных фанатов Core i7 сметают с полок системы водяного охлаждения по 200 долларов за штуку…

А как же 4 ГГц, которые так легко получают на воздушном охлаждении? Для нашего экземпляра Core i7-920 данная частота стала возможной после отключения технологии Hyper-Threading и повышения напряжения питания до уровня 1,42 В.


Максимальная температура в таком режиме составила всего лишь 89 градусов Цельсия, что значительно лучше, чем предыдущий результат. Но даже почти 90 °C можно назвать слишком высокой температурой. Возможно, с выходом нового степпинга ядра данная проблема будет исправлена, как это обычно происходит после обкатки технологии производства процессорных кристаллов.

Частота Bclk равнялась «магическим» 200 МГц, которой ранее не могли достичь счастливые обозреватели, получившие задолго до официального анонса архитектуры Nehalem экземпляры Core i7 и выражавшие после тестов свое недовольство в новостной ленте различных сайтов. Но, как оказалось, новые процессоры без проблем покоряют данную частоту. Главное знать, где и что настраивать для достижения желаемого результата.

С повышением частоты тактового генератора до 200 МГц значительно увеличились частоты шины QPI и Uncore — до 3600 и 3200 МГц. Память при этом функционировала на 1200 МГц.


Дальнейший разгон успехом не увенчался — Bclk хоть и удавалось поднять до 205 МГц, тест на стабильность процессор уже не проходил. Даже после повышения напряжения питания на CPU и контроллере памяти. Скорее всего, частота в 4 ГГц является пределом для тестового Core i7-920.Тестовые конфигурации

Что же, пора заканчивать затянувшуюся историю о новой платформе Nehalem. А для этого как раз подойдут сравнительное тестирование системы на базе Core i7 с представителями предыдущего поколения. В качестве процессоров для платформы LGA775 использовались Core 2 Duo E8200 и Core 2 Quad Q9400, работающие на частоте 2,66 ГГц. Первый из них является самым производительным двухъядерным решением на такой частоте, а второй на момент проведения тестирования оказался единственным доступным вариантом, обладающим четырьмя ядрами. Нет смысла говорить, что локальный рынок фактически «заморожен», поставки сократились, а продажи резко упали. И на этой ниве собрать высокопроизводительный тестовый стенд становится проблематично. Но как показало наше тестирование, даже Core 2 Quad Q9400 в некоторых задачах может спокойно конкурировать с Core i7, работающим на одинаковой с ним частоте.

Характеристики сравниваемых процессоров занесены в представленную ниже таблицу.

Процессор Intel Core i7-920 Intel Core 2 Quad Q9400 Intel Core 2 Duo E8200
Архитектура Nehalem Penryn Penryn
Ядро Bloomfield Yorkfield Wolfdale
Разъем LGA1366 LGA775 LGA775
Техпроцесс 45 нм 45 нм 45 нм
Степпинг C0 R0 C0
Количество транзисторов 731 млн. 2 х 410 млн. 410 млн
Площадь ядра 263 кв.мм 2 х 107 кв.мм 107 кв.мм
Число ядер 4 (8 потоков) 4 2
Номинальная частота 2,66 ГГц 2,66 ГГц 2,66 ГГц
Объем L1 кэша 4 x (32+32) КБ 4 x (32+32) КБ 2 x (32+32) КБ
Объем L2 кэша 4 x 256 КБ 2 x 3 МБ 6 МБ
Объем L3 кэша 8 МБ - -
Множитель 20х, заблокирован на повышение 8х, заблокирован на повышение
Hyper-Threading + - -
Поддерживаемый тип памяти DDR3 800/1066 - -
Шина QPI (4,8 ГТ/с) FSB (1333 МГц) FSB (1333 МГц)
Номинальное напряжение 1,20 В 1,20 В 1,20 В
TDP 130 Вт 95 Вт 65 Вт
Средняя стоимость $328 $294 $181


Система на базе Core i7-920 была собрана с тем же составом, что и при разгоне, за исключением видеокарты, памяти и блока питания:
  • Процессор: Intel Core i7-920 (2,66 ГГц, 8 МБ кэш L3);
  • Материнская плата: ASUS Rampage II Extreme (Intel X58);
  • Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
  • Оперативная память: Aeneon AEH860UD00-10F (3x2048 МБ, DDR3-1066, 6-6-6-18);
  • Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);


Все настройки BIOS Setup платы, кроме основных таймингов памяти и напряжений, выставлялись по умолчанию. Кроме того, Core i7-920 разгонялся до 3540 МГц (опорная частота 177 МГц, напряжение 1,4 В), память при этом работала с коэффициентом 6х, что соответствовало 1062 МГц. Тайминги оставались прежними. Также использовалось несколько режимов работы системы, а именно:
  1. «2,66/8/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading активирована, трехканальный режим, Turbo Boost включен;
  2. «2,66/4/3/T» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost включен;
  3. «2,66/4/3/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
  4. «2,66/4/2/noT» — стандартная частота процессора (2666 МГц), технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен;
  5. «3,54/8/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading активирована, трехканальный режим, Turbo Boost отключен;
  6. «3,54/4/3/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, трехканальный режим, Turbo Boost отключен;
  7. «3,54/4/2/noT» — разгон процессора до 3540 МГц, технология Hyper-Threading деактивирована, двухканальный режим, Turbo Boost отключен.
Такое количество комбинаций позволит выяснить о необходимости использования технологий Hyper-Threading и Turbo Boost, а также трехканального доступа к памяти.

«Конкурирующая» система имела следующий вид:

  • Процессор №1: Core 2 Quad Q9400 (2,66 ГГц, 6 МБ кэш L2);
  • Процессор №2: Core 2 Duo E8200 (2,66 ГГц, 6 МБ кэш L2);
  • Материнская плата: ASUS Rampage Formula (Intel X48);
  • Кулер: Noctua NH-U12P с креплением LGA1366 Mounting-Kit;
  • Оперативная память: Team Xtreem Dark TXDD4096M1066HC5-D (2x2048 МБ, DDR2-1066, 5-5-5-15);
  • Видеокарта: Leadtek WinFast GTX 280;
  • Жёсткий диск: Samsung HD252HJ (250 ГБ, SATA2);
  • Блок питания: Seasonic SS-600HM (600 Вт).
Как и в случае с первой системой настройки платы устанавливались в автоматическом режиме, все напряжения и тайминги — вручную. Оба процессора разгонялись до частоты 3544 МГц (FSB 443 МГц, напряжение питания 1,375 В), память при этом функционировала на частоте 1068 МГц с таймингами 5-5-5-15.

В качестве операционной системы использовалась Windows Vista Ultimate x86 c SP1. Драйверы для систем были следующие:

  • X58: Intel Chipset Software Installation Utility 9.1.0.1007;
  • X58: SoundMAX Audio Driver v6.10.1.6480;
  • X48: Intel Chipset Software Installation Utility 8.3.0.1013;
  • X48: SoundMAX Audio Driver V6.10.01.6280;
  • Общие: ForceWare 180.48.
Брандмауэр и Windows Defender отключались, файл подкачки устанавливался в размере 3072 МБ. Настройки видеодрайвера не изменялись.

Результаты тестирования в прикладном ПО

Синтетика

Начнем, пожалуй, с синтетического пакета PCMark’05, который пользовался особой популярностью во времена противостояния Pentium 4 и Athlon 64, хотя и не отражал реальной картины производительности обеих платформ. Но рассматриваемые в материале системы полностью на базе процессоров Intel, так что, ни о каком «читерстве» и речи быть не может.



Итак, общий балл и результаты по процессорному тесту оказались предсказуемы, так как PCMark’05 чувствителен к многоядерным решениям и высокой частоте. Верхние строчки рейтинга занимает разогнанный Core i7-920 с различными режимами работы, следом идет Core 2 Quad Q9400, работающий на частоте 3,54 ГГц. Разогнанный Core 2 Duo E8200 в процессорном тесте показал примерно такой же результат, как и Core i7-920 без разгона и с активированной технологией Turbo Boost. Но уже в номинальном режиме двухъядерный CPU, естественно, показывает самый низкий результат.


В тесте памяти распределение по результатам закономерное, учитывая встроенный контроллер памяти у Bloomfield, и только Core 2 Duo E8200 показывает более высокий балл, чем Core 2 Quad Q9400.

Подсистема памяти




По той же причине Core i7 демонстрируют высокую производительность подсистемы памяти в Lavalys Everest, которая при разгоне процессора еще больше повышается, особенно при записи. Судя по всему, более высокая частота контроллера способствует росту этого показателя. Переход к двухканальному режиму не так существенно отражается на ПСП, как могло бы показаться. С возможностями Core i7 при записи смогли потягаться Core 2 Duo и Core 2 Quad лишь после повышения частоты, и то, за счет именно FSB, работающей на эффективных 1772 МГц.


Латентность памяти уменьшилась почти в два раза по сравнению с процессорами прошлого поколения, и это несмотря на использование DDR3. Переход к двухканальному режиму даже предпочтительнее в этом плане и можно сразу предположить о более высоком быстродействии в некоторых приложениях систем с двумя модулями памяти.

Архивирование



Оптимизированный под многопоточность архиватор 7-Zip (использовался словарь в 32 МБ) склонен к большему количеству ядер, чем к высокой частоте. Использование HT позволяет увеличить производительность при архивировании до более высокого уровня по сравнению с разогнанным процессором с этой отключенной технологией. При компрессии четырехъядерный Core 2 Quad Q9400 смотрится достойно на фоне Core i7, но только с повышением частоты, хотя уже при декомпрессии способен на равных потягаться с новым CPU.


Встроенный в архиватор WinRAR определяет быстродействие подсистемы «процессор-память» и всегда был неплохим мерилом производительности этой связки, но c Core i7-920 ведет себя странным образом: при частоте 3,54 ГГц с двухканальным режимом результат такой же, как и при «турбированных» 2,66 ГГц и задействованных трех каналах. Естественно, незначительное падение пропускной способности памяти при двух каналах не может так сильно отразиться на результатах. Возможно, с выходом новой версии данная проблема будет исправлена.

Рендеринг



В CINEBENCH 10 при рендеринге сцены с использованием одного CPU все режимы работы процессоров выстроились аккуратной лесенкой: Core 2 в номинале, Core i7 без Turbo Boost и с ним же, разогнанные Core 2 и Core i7. Количество задействованных каналов памяти в системе с Bloomfield особой роли не играет. Переход к мультиядерному тесту немного меняет картину и на первое место становится именно количество ядер в процессоре, а уже потом — частота.


А вот в тесте видеокарты все кардинально меняется и система на новой платформе набирает в полтора раза меньше баллов, чем на базе Core 2 Duo и Core 2 Quad. Что это, ахиллесова пята архитектуры Nehalem или попросту проблемы микрокода BIOS платы или драйверов? Будем надеяться на последнее.



Результаты в POV версии 3.7 beta 29 аналогичны CINIBENCH за исключением того, что при активации Hyper-Threading происходит падение производительности на Core i7 и его место на графике занимает четырехъядерный процессор архитектуры Penryn. Подобная проблема наблюдалась еще с Pentium 4 HT, который показывал более низкое быстродействие, когда одновременно обрабатываемые потоки были чувствительны к размеру кэшей. В случае активирования Hyper-Threading, объем кэш-памяти каждого физического ядра делится пополам и при слабой оптимизации кода программ под эту технологию как раз и будет наблюдаться падение производительности.

Работа с видео


Для кодирования видео все средства хороши: и количество ядер и их частота. Программой Virtual Dub кодировался ролик MPG2 объемом 0,97 ГБ при помощи кодека DivX 6.8.5, который поддерживает несколько ядер. Использование HT положительным образом сказалось на производительности, хотя и не значительно. Процессоры Core 2 лишь с разгоном могут конкурировать с новинкой от Intel.


Еще один тест по кодированию видео — x264 HD Benchmark, благосклонно отнесся к процессору новой архитектуры и безразлично к технологии Hyper-Threading. На графике представлен средний FPS по первому проходу версии 0.58.819M.

Кроме того, были сняты показания температуры во время прохождения всех четырех прогонов этого теста. Напоминаем, что при разгоне напряжение питания на процессоре Core i7-920 было 1,4 В, на остальных — 1,375 В.


Как ни странно, самым холодным оказался Core 2 Quad Q9400. Даже при увеличении частоты его температура не превышала 56 градусов Цельсия. Весьма горячий степпинг Core 2 Duo E8200 позволил ему нагреться при разгоне до 64 °C. Такая же температура у Core i7-920, работающего на номинальной частоте с отключенным Turbo Boost. Активирование HT значительно повышает температуру CPU, особенно при поднятии частоты. Как уже отмечалось выше, нынешняя ревизия Bloomfield отличается высоким тепловыделением и при повышении частоты и напряжения этот показатель сильно увеличивается. Поэтому для работы в нештатных режимах придется позаботиться о производительной системе охлаждения.

Математические расчеты


Fritz Chess Benchmark рассчитывает количество ходов за определенное время и, как и в случае с 7-Zip, решающим является количество логических/физических ядер и их частота.



Бенчмарк wPrime хорошо оптимизирован под многопоточность и в большей степени реагирует именно на количество ядер. Идеальная картина низкой производительности E8200 относительно своих четырехъядерных оппонентов наблюдается и здесь. И если так было бы во всех приложениях, то можно было бы заявить о приходе эры «квадов» в декстопные системы. Но, увы…


Утилита Super PI никакой поддержкой мультиядерности не обладает и полностью зависит от архитектурных особенностей процессора и его частоты, а также от подсистемы памяти. Лидирует по расчету 1-млн. знака числа Пи Core i7-920 на частоте 3,54 ГГц с результатами в 11 секунд. Следом за ним расположился Core 2 Duo E8200, за счет более емкого кэша, и Core 2 Quad Q9400, работающие на той же частоте, что и Core i7. Далее расположение мест идет таким же образом.Результаты тестирования в игровых приложениях

Ну и, конечно же, игры. Использовались известные синтетические тестовые пакеты от Futuremark Corp., а также небольшое количество игр, при тестировании в которых снималось несколько результатов. Один был при разрешении 1024х768 и среднем качестве, а два — при 1280х1024, 1600х1200 и высоком качестве.

Синтетика


В 3DMark 2001SE (который через пару лет отметит свой первый десяток лет) быстродействие Core i7 и Core 2 Duo практически одинаковое. Core 2 Quad отстает от них за счет меньшего кэша, и будь на его месте Q9450 с 12 МБ кэш-памяти второго уровня, возможно, расстановка сил немного изменилась бы. Использование двух каналов памяти благоприятно сказывается на производительности новой платформы.



Пакет 3DMark’06 в должной мере поддерживает многопоточность, что отразилось на результатах Core i7-920 с Hyper-Threading. Естественно, четырехъядерный процессор на базе архитектуры Penryn никаких шансов не оставил своему двухъядерному собрату, несмотря на два раза меньший L2-кэш, относящийся к каждой паре ядер.



3DMark Vantage еще больше реагирует на количество ядер. При номинальной частоте Core i7 все также опережает своих оппонентов за счет архитектурных особенностей. Следующий график не такой показательный, как предыдущие, но дает почву для дальнейших размышлений.


Итак, разница в GPU-тесте между режимами работы процессоров составляет доли процентов. Если же присмотреться к графику, то система с Bloomfield в большинстве случаев занимает последние строчки. К чему бы это?

Игры


Известный фейк о поддержке многопоточности в игре F.E.A.R. перекочевал и на ее продолжение Extraction Point, что делает игру сугубо измерителем потенциала процессора, как одноядерного решения. И если с Core i7 и так все ясно, то Core 2 Duo E8200 благодаря своему 6-мегабайтному кэшу второго уровня становится производительней четырехъядерного процессора.


Аппетиты движков Unreal Tournament становятся все умереннее и умереннее. Добавим современные тенденции и получим рост производительности 50% при переходе с двухъядерного процессора на платформу Nehalem. А если еще и разогнать… Core i7-920, то более 200 кадров в секунду обеспечены. Хотя, Core 2 Quad Q9400 тоже не промах при разгоне.



При использовании графики с максимальным качеством рост производительности уже не такой стремительный, а с повышением разрешения между разогнанным и не разогнанным Core i7 разница начинает нивелироваться. И, конечно же, обладателям мониторов с большей диагональю станет все равно, какой именно процессор у них установлен.


Вышедший осенью прошлого года шутер Far Cry 2 уже в полной мере поддерживает четырехъядерные процессоры, что видно по результатам.



Только вот незадача — опять непонятное падение производительности на системе с Bloomfield. Даже разогнанный двухъядерный E8200 показывает больший результат, чем Core i7-920, работающий на частоте 3,54 ГГц. Причем, минимальный FPS на последнем ниже, чем у оппонентов.


Математические расчеты берут свое и Core i7 в CPU тесте игры Crysis на 20-50% производительней процессоров предыдущего поколения. Лишь при разгоне Core 2 Quad Q9400 может конкурировать с новичком.



Ой, а мы это уже где-то видели: опять падение производительности на Core i7 при переходе к высоким разрешениям и качественной графике. Может, архитектура Nehalem вовсе и не игровая? Или это все та же проблема «BIOS-драйвера»? Пока сказать сложно, что именно является проблемой. Возможно, это как-то связано только с нашей системой и с другими в этом плане все в порядке. А для подтверждения этого факта необходимо провести исследование на платах других производителей, что и будет сделано в следующий раз.




В X3: Terran Conflict есть зачатки поддержки многоядерности и распределение мест по результатом как и положено, от Core 2 Duo до Core i7.


Процессорозависимая игра World in Conflict отлично отреагировала на новую архитектуру, что дало 50% прибавку к производительности при переходе со старой платформы на Nehalem. Использование Hyper-Threading немного сказалось на производительности, чего не скажешь о двухканальном доступе к памяти: в отличие от некоторых программ, играм достаточно пропускной способности двухканального режима.



С повышением качества и разрешения расстановка сил нисколько не изменилась, только Core 2 Quad Q9400 при разгоне «затесался» среди режимов работы Core i7-920 в номинале.

Выводы

В свое время выход архитектуры AMD64 и процессоров на ее базе назвали «Бархатной революцией». Об архитектуре Nehalem у нас сложилось схожее впечатление: если разработку Core 2 можно было действительно охарактеризовать как революционную, то Core i7 в ближайшем рассмотрении оказался «бархатным». Пойдя по пути своего конкурента, компания Intel отказалась от использования шины FSB, интегрировала в кристалл процессора кэш-память третьего уровня и контроллер памяти, причем, трехканальный. Давно забытая технология Hyper-Threading снова нашла место под солнцем, и для ее поддержки процессоры «научились» себя разгонять благодаря функции Turbo Boost. Теперь нет необходимости повышать частоту системной шины, пропускная способность памяти стала избыточной, а для дальнейшего развития платформы осталось лишь наращивать частоту самого процессора. Проектировать наборы системной логики стало легче, так как часть северного моста перекочевала в CPU, а учитывая планы Intel по выпуску процессора с графическим ядром, интегрированные чипсеты также лишатся своей основной функции, если и вовсе не исчезнут.

С другой стороны, мы имеем дело с переходом на совершенно другую платформу, которая требует материнские платы с разъемом LGA1366 на базе чипсета Intel X58 Express, стоимость которых выше решений на Intel X48. Добавим сюда необходимость использования дорогой памяти стандарта DDR3 (правда, для большинства задач достаточно использования двухканального режима), цену на сами процессоры, и получим просто нереальные цифры. Здесь как раз можно провести параллели с выходом платформы AMD64, которая хоть и поддерживала распространенные тогда память DDR и видеокарты AGP, доступной многим стала спустя год своего присутствия на рынке.

Но, несмотря на высокую стоимость старших моделей Core i7, самый доступный процессор на базе архитектуры Nehalem вполне реально может стать сердцем системы энтузиаста или даже рабочей станции. И для последней есть все основания: Core i7-920 силен в математических расчетах, архивировании, кодировании видео и рендеринге. За счет архитектурных особенностей и технологий Hyper-Threading и Turbo Boost новый процессор производительней четырехъядерных Core 2, работающих на равной или более высокой частоте.

Для оверклокеров платформа Nehalem станет очередным инструментом для самовыражения и покорения рейтингов ORB и hwbot.org . Особенности разгона Core i7 дают повод для новых исследований в этой области, а высокое тепловыделение процессоров при повышении частоты и напряжения станет «катализатором» для поиска новых и эффективных систем охлаждения. Введенная компанией Intel защита от переразгона в большинстве случаев обходится средствами материнских плат, благодаря чему частоты порядка 4 ГГц можно достичь без особых усилий.

А как же тогда геймеры? - спросите вы. А никак. Игры, которые сильно зависят от производительности процессора и оптимизированные под большое количество ядер, действительно будут чувствовать себя куда лучше на платформе Nehalem. Это в большей степени стратегии, симуляторы, шутеры с графикой, не особо нагружающей видеокарты. Если же движок «стрелялки» может похвастаться поддержкой модных технологий и эффектов, то разница от используемой платформы сводится к нулю. И в таком случае нет необходимости разбираться в математике, чтобы понять о целесообразности перехода на новую платформу.

Но как бы там ни было, выход Nehalem стал большим шагом в будущее. Наконец-то такой консервативный разработчик как Intel избавился от архаизмов в виде системной шины и контроллера памяти в чипсете. Сам же узаконил разгон в своих процессорах, хоть и незначительный. И, подчеркиваем, впервые получил право для чипсета поддерживать технологию NVIDIA SLI, которая была прерогативой сугубо калифорнийской компании. Теперь материнские платы на базе X58 смогут поддерживать как CrossFire, так и SLI, а это уже дает широкий выбор для постройки мультичиповых конфигураций.

Благодарим следующие компании за предоставленное тестовое оборудование:

  • Представительство Intel за процессор Core i7-920;
  • Представительство ASUS за материнские платы ASUS Rampage II Extreme и Rampage Formula;
  • Eletek за память Team Xtreem Dark TXDD2048M1866HC8DC и TXDD4096M1066HC5-D;
  • Leadtek Research за видеокарту Leadtek WinFast GTX 280;
  • Квазар-Микро за видеокарту Zotac GeForce 9600GT AMP!;
  • MaxPoint за блок питания Silver Power SP-S850;
  • Синтекс за блок питания Seasonic SS-600HM;
  • Мастер Групп за процессор Intel Core 2 Quad Q9400 и память Aeneon AEH860UD00-10F;
  • Noctua за кулер Noctua NH-U12P, крепление LGA1366 Mounting-Kit и термопасту Noctua NT-H1.

Системная шина играет ключевую роль во взаимодействии CPU с остальными компонентами компьютера. Intel разработала для своих новых многоядерных процессоров скоростной и экономичный интерфейс QPI. Последовательная шина QPI позволила ликвидировать многие "узкие места. В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI.

Основное достоинство нового интерфейса QPI - это сочетание высокой пропускной способности - до 15 Гбит/с и низкого энергопотребления (не более 5,0 мВт на каждый гигабит в секунду при пропускной способности 15 Гбит/с). При скорости передачи данных 5 Гбит/с новый интерфейс Intel обладает уровнем энергопотребления не более 2,7 мВт на каждый гигабит в секунду. Эти результаты сегодня являются рекордными с точки зрения эффективности работы современных приёмников данных Теоретически, Intel может повысить пропускную способность существующих интерфейсов в три раза, довольствуясь только 25% уровня энергопотребления нынешних интерфейсов.

Главный параметр системы, влияющий на частоту практически всех узлов системы - частота тактового генератора - Host Clock Frequency (при конфигурировании задаётся на первом же экране раздела «Performance»). Штатное значение этой частоты - 133 МГц, однако некоторые платы предлагают широкие возможности для её увеличения, например, до 240 МГц (пределы медных линий см. на рис. 1).

Частота шины QPI формируется за счет умножения определенного коэффициента на частоту тактового генератора, равную в номинале 133 МГц. Ее также называют опорной частотой шины QPI - QPI bclk или просто Bclk (есть, например, специальная утилита «CPU-Z», которая определяет ее как Bus Speed). За счет Bclk формируются частоты ядер процессора, кэш-памяти, контроллера памяти и частота системной памяти.

Рис. 1.

Таким образом, в современных системах на процессорах Intel в Core i7 частота 133 МГц - это просто частота тактового генератора, формирующего все остальные частоты.

Аналогичным образом формируется и частота шины памяти, которая использует свой собственный набор множителей.Для частоты шины памяти процессоры Core i7 предложат несколько доступных множителей. Например, процессор Core i7-965 Extreme Edition предлагает выбор между 6x, 8x, 10x и 12x, что означает поддержку этим процессором памяти DDR3-800/1067/1333/1600 SDRAM.

Интерфейс QPI, связывающий процессор с северным мостом (и другими процессорами см. рис. 2), также использует эту частоту в качестве базовой, умножая её на свой собственный коэффициент. Частота интерфейса QPI будет варьироваться на разных моделях CPU. Так, в Core i7-965 Extreme Edition эта шина работает на частоте 3,2 ГГц, в то время как на Core i7-940 и i7-920 её частота понижена до 2,4 ГГц.

Рис. 2.

Что касается возможности разгона шины QPI, то почти все процессоры будут ею обладать в полной мере. Множитель частоты шины QPI - от 4x до 64x (но процессоры Core i7 920 -2.66 ГГц и Core i7 940 - 2.93 ГГц не будут позволять повышать множитель, определяющий тактовую частоту ядер и, соответственно, технология Intel Dynamic Speed Technology ими тоже поддерживаться не будет).

Частота шины QPI для процессоров Intel Core i7-920 и Core i7-940 составляет 2,4 ГГц, что эквивалентно пропускной способности 4800 мегатранзакций в секунду (или 4,8 ГТ/с). Для Core i7-965 EE это значение соответствует 3,2 ГГц или 6,4 ГТ/с. Зная частоту QPI можно высчитать коэффициент умножения шины у каждого из процессоров: для Core i7-920 и Core i7-940 он равен 18, для Core i7-965 EE - 24. Но частота шины Quick Path Interconnect не единственная проблема, с которой можно будет столкнуться при разгоне Core i7. При разгоне CPU путем повышения Bclk будут расти частоты всех блоков процессора, шины QPI и памяти, что может нарушить их стабильную работу.

В новых CPU кэш третьего уровня и контроллер памяти (данная часть процессора называется Uncore) работает на отличной от процессора частоте (по рекомендации Intel, частота этих блоков должна быть в два раза выше эффективной частоты памяти). Данный параметр изменяется в настройках BIOS Setup материнской платы (коэффициентом или выбором частоты). Отслеживать значения Uncore можно, например, при помощи все той же утилиты CPU-Z - за это отвечает параметр NB Frequency в закладке Memory.

Значительного повышения эффективности новой шины удалось добиться за счёт динамического управления частотой и напряжением принимающего и передающего чипов, а также некоторых других нововведений. Кроме того, компания также разработала чип-диспетчер, который позволяет аппаратно распределять потоки между ядрами процессора. Производительность симулированного 64-ядерного процессора при его помощи удалось повысить в два раза. Все эти новые разработки Intel приведут к появлению еще более эффективных и экономичных многоядерных процессоров. Новая технологии приёма/передачи данных, которая будет использоваться в многопроцессорных системах следующего поколения, требующих не только повышенной пропускной способности канала ввода/вывода, но и более эффективного с точки зрения потребляемой мощности интерфейса передачи информации.

Шина QPI, является аналогом шины HyperTransport от AMD, и тоже предназначена для связи процессора с другими компонентами. Она призвана обеспечить согласованный обмен данными между небольшими группами локальных процессоров, а также взаимодействие между банками памяти (даже не обязательно одного типа) в распределенных системах, включающих не более 128 процессоров. QPI обеспечивает меньшие задержки и более высокую производительность, по сравнению с HyperTransport.

Шина QuickPath дебютировала в рамках серверной платформы Tylersburg, которая использует процессоры поколения Nehalem с разделяемым кэшем третьего уровня и поддержкой "виртуальной многоядерности", в частности, система на базе двух четырёхъядерных процессоров сможет имитировать работу шестнадцати процессорных ядер.

Ключевой особенностью новой архитектуры является применение концепции масштабируемой разделяемой памяти (scalable shared memory). В рамках новой архитектуры каждый CPU будет иметь собственную выделенную память, к которой он будет обращаться напрямую, через свой интегрированный контроллер памяти.

В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QuickPath Interconnect. Как и шина HyperTransport, применяемая в процессорах компании AMD, QPI будет использовать последовательную связь по схеме "точка-точка" (point-to-point), что обеспечит высокую скорость при малой латентности. Итак, основными ключевыми характеристиками Intel QuickPath Architecture являются:

Производительность каналов QuickPath Interconnect до 6,4 гигатранзакций в секунду (благодаря чему общая пропускная способность может достигать 25,6 Гбайт/сек)

QPI уменьшает количество служебной информации, необходимой для функционирования многопроцессорных систем (что, соответственно, позволяет повысить скорость передачи полезных данных);

Реализация контроля при помощи циклического избыточного кода (CRC) и повторной передачи при обнаружении ошибок на канальном уровне (что позволяет обеспечить целостность данных без ощутимого влияния на производительность);

Возможность реализации высокоуровневых функций обеспечения надежности, готовности и удобства обслуживания (RAS, Reliability, Availability and Serviceability) благодаря реконфигурации каналов в случае повреждения отдельных участков, поддержке "горячей замены". При нарушении сигнала в одной или нескольких из линий контроллер шины может автоматически перенастроить QPI на ширину 15 и даже 5 бит, не теряя работоспособности, таким образом, серверы, например, на базе мощных процессоров Xeon 5500 будут обладать повышенной устойчивостью к сбоям шины (рис. 3). При организации шины с различной шириной линий, управ-лением потоком данных занимает-ся специальный агент QPI, который распределяет поток данных перед тем, как от-править его по различным физи-ческим линиям, а при приеме аналогичный агент собирает разные потоки данных в один (рис. 3).

Рис. 3. Пример конфигурирования 20 каналов в четыре группы по 5 каналов

В случае, если процессору потребуется доступ к выделенной памяти другого CPU, он сможет связаться с ней посредством одного из каналов QPI (рис. 2). Шина QPI использует последовательную связь по схеме "точка-точка" (point-to-point), что обеспечивает высокую скорость при малой латентности.

Рис. 4. Архитектурные особенности процессоров Core i7 с шиной QPI

Серверные модели оборудованы двумя (и более) линиями QPI (рис. 4), что позволяет выделить всем критичным направлениям (например, связь двух процессоров между собой и каждого из них с северным мостом) по собственному соединению. В любом случае, производительности QuickPath Interconnect вполне достаточно, чтобы обеспечить нормальную работу платформ с несколькими CPU. Интерфейс QPI в 2-3 раза эффективнее и к тому же не обременен взаимодействием с оперативной памятью (этим занимается встроенный контроллер памяти DDR3).

Рис. 5. Принципы организации шины QuickPath Interconnect (каждую отдельную дифференциальную пару называют линией. 20 линий для обмена плюс линии синхронизации в каждом направлении образуют 84-х контактный интерфейс)

Специальный последовательный интерфейс с топологией точка-точка, именованный как QPI (QuickPath Interconnect) с технической точки зрения представляет собой два 20-битных соединения, ориентированных на передачу данных в прямом и обратном направлении (рис. 5). Из 20 битного соединения 16 бит предназначаются для передачи данных, оставшиеся четыре - носят вспомогательный характер, они используются протоколом и коррекцией ошибок. Таким образом, QPI является последовательной, высокоскоростной двунаправленной шиной. Ее ширина в каждую сторону (передача и прием) составляет по 20 бит (20 отдельных пар линий), при этом 16 бит отводится для передачи данных, две линии зарезервированы для передачи служебных сигналов и еще две - для передачи кодов коррекции ошибок CRC. C учетом еще двух пар линий, используемых для сигналов синхронизации (одна на прием и одна на передачу), получаем, что шина QPI состоит из 42 пар линий, то есть является 84-контактной. Это соединение представляет собой пару из двух шин функционирующих в режиме полного дуплекса, снабженных задающей тактовую частоту линией.

Базовый физический уровень состоит из двойного симплексного канала, осуществляющего функции приемной и передающей пары (т. е. по сути реализован дуплексный коммуникационный канал). На физическом уровне шина об-разована двумя парами проводников: одна пара служит для передачи данных, а вторая - для их приема (рис. 6. Две такие пары позволяют организовать двунаправленную линию передачи данных, если полосы пропускания не-достаточно, то для того, что-бы обеспечить большую пропус-кную способность, поддержива-ется не одна, а несколько таких двунаправленных линий связи. Этот уровень интерфейса определяет операцию и особенности индивидуальных сигналов линий шины QPI.

Физический уровень содержит все необходимые схемы для выполнения интерфейсных операций обмена данными, включая драйвер и входные/входные буферы, параллельное-последо-вательное и последовательно-параллельное преобразование, схему(ы) ФАПЧ и схемs согласования импеданса. Кроме того, он включает также логиче-ские функции, связанные с инициализацией и поддержкой интерфейса.

Логическая часть физического уровня обеспечивает соединение со уровнем связи и управляет потоком информации между ними (вперед и назад). А также управляет инициализацией и конфигурированием канала связи и управляет шириной информационной магистрали в операции обмена.

Рис. 6. Общая блок-схема физического уровня

Физический интерфейс шины отличается простотой реализации, в нем используются низковольтные, дифференциальные сигналы (рис. 7). Для передачи сигналов используются две линии, по которым синхронно передается прямой и инверсный сигнал. Для мобильных систем могут использоваться сигналы снижающие энергопотребление шиной, на линиях шины обеспечивается низкий уровень перекрестных помех.

Рис. 7. Принципы физической реализации линий связи шины

Физический уровень разделен на две секции. Аналоговая (или электрическая) секция управляет передачей цифровых данных. Эта секция формирует соответствующие аналоговые уровни сигналов с надлежащим выбором времени относительно сигнала синхронизации и затем принимает сигналы данных на другом конце и преобразовывает их обратно в цифровые данные. Этот уровень ответственен за сигналы и специфические детали выполнения операции обмена между двумя агентами. Этот уровень непосредственно управляет передачей сигналов данных на проводах шины, включает электрические уровни, рассчитывая аспекты, и решает логические проблемы, возникающие при посылке и получении каждого бита информации по параллельным шинам. Передача сигналов в обе стороны выполняется на высокой скорости в дифференциальном виде по 20 отдельным парам в одном цикле шины, реализующем одну операцию обмена. Отдельная линия синхронизации сопровождает свой набор из 20 пар линий передачи данных.

Интерфейс Intel® QuickPath чтобы для обеспечения передачи всей номенклатуры сигналов одной шины QPI, работающей в ее полной ширине, на физическом уровне использует восемьдесят четыре линии и соответственно 84 контакта. В некоторых случаях, связь может осуществляться в половине или четверти ширины шины, например, чтобы уменьшить расход энергии или из-за отказов на линии. Единицу информации, переданной в каждой единице времени физическим слоем называют phit, который является акронимом для физической единицы. Например, каждый phit может содержать 20 бит информации. Типичные скорости передачи сигналов связи в текущих продуктах обеспечивают в операциях обмена в 6.4 GT/s для систем с короткими связями между компонентами, и 4.8 GT/s для более длинных связей, используемых в больших мультипроцессорных системах. Управ-лением потоком данных занимает-ся специальный «агент», который распределяет поток данных перед тем, как от-править его по различным физи-ческим линиям, а при приеме аналогичный агент собирает разные потоки данных в один.

Для обмена информацией между компонентами системы используются пакеты. Пакетная связь начинается на канальном уровне для реализации функций управления каналом. Паке-ты формируются для того, чтобы надежно перенести информацию от передающего к принимающему компоненту. Поскольку па-кеты передаются через соответствующие уровни, они дополняются вспомогательной информацией, необходимой для обработки пакета на соответствующем уровне. На принимающей стороне происходит обратный процесс, и пакет преоб-разовывается обратно, начиная с физического уровня и далее, до формата, в котором он может быть обрабо-тан принимающим устройством.

Рис. 8. Типовая обобщенная структура пакета и состав пакета для разных уровней

Физический уровень принимает с линий связи кадр проверяет его корректность и выделяет из него пакет. Физическим уровнем биты phits и биты контроля циклического избыточного кода не контролируются. Физический уровень объединяет phits в пакеты, и передает пакеты на уровень связи. Каждый пакет, состоит из 80 бит (рис. 8). Рис. 9 иллюстрирует возможности физического уровня передачи информации кадра по шине QPI.

Рис. 9. Физический уровень Intel® QPI (Phit) требует для передачи 20 физических линий передач.

Поддержка ассиметричных связей и хорошая масштабируемость по скорости, по ширине шины, частоте и направлению, позволяет разработчикам систем выбирать решение полностью соответствующее их задачам. Широкая полоса пропускания позволяет в проектируемых многопроцессорных системах легко добавлять новые высокопроизводительные компоненты. Использование шины QPI позволяет сократить время на разработку этих проектов, так как добавление в систему новых чипов не вызывает проблем.

ВведениеМы продолжаем знакомство с процессорами – носителями новой микроархитектуры Nehalem. Вслед за теоретическим материалом и статьей, посвящённой анализу производительности систем , построенных на базе процессоров семейства Core i7, мы решили несколько подробнее осветить вопрос, особенно волнующий энтузиастов – разгон. И хотя многие пользователи всё ещё не осознают те преимущества, которые можно получить, разгоняя свой компьютер, армия оверклокеров неуклонно увеличивается. Этому способствует не только общее повышение интереса к новым технологиям, но и тот факт, что производители компьютерного оборудования поворачиваются к занимающимся разгоном потребителем, что называется, «лицом». Стараясь привлечь в свой лагерь большее число сторонников, многие производители аппаратных компонентов добавляют новые функции, позволяющие облегчить раскрытие недокументированных возможностей оборудования. И даже компания Intel, ещё несколько лет тому назад рьяно боровшаяся с оверклокерской идеологией, сегодня сменила гнев на милость. Теперь она не только не отрицает возможность использования собственных процессоров в нештатном режиме, но и, напротив, поощряет оверклокеров, повсеместно приглашая их на различные мероприятия и адаптируя для них собственные процессоры и материнские платы.

В этом свете нам кажется, что появление новой микроархитектуры вполне может выступить очередным катализатором процесса популяризации разгона, так как системы, в основе которых лежат процессоры Core i7, разгонять стало, с одной стороны, проще, а с другой – ещё интереснее. К тому же, произошедшие платформенные изменения, такие как внедрение новой схемы управления питанием, перенос в процессор контроллера памяти и отказ от шины FSB, делают разгон и более доступным, поскольку влияние на его результаты со стороны самого капризного компонента системы – материнской платы – становится меньше.

Чтобы придать сегодняшней статье большую практическую ценность, при её подготовке мы отказались от использования инженерных образцов комплектующих, собрав систему из уже появившихся в продаже серийных процессора, материнской платы, памяти и кулера. В качестве же основного объекта для разгона мы избрали Core i7-920, самого дешёвого представителя семейства Nehalem. Итогом нашего исследования станет конкретный рецепт: каким образом из этого процессора (стоимостью около 10 тысяч рублей ) можно выжать производительность, ощутимо превышающую быстродействие одного из самых дорогих процессоров на рынке – Core i7-965 Extreme Edition.

В этой статье мы старались раскрыть все премудрости разгона LGA1366-систем максимально подробно. Тем не менее, мы предполагаем, что читатели уже имеют базовые понятия в части строения Nehalem систем. Если же вы знакомитесь с новой платформой впервые, то для начала мы всё же рекомендуем обратиться к нашей статье «».

Частоты и коэффициенты

Процедура разгона систем, основанных на процессорах семейства Core i7, хотя и нова, не так уж и трудна. По нашему убеждению, разгонять системы на новых процессорах не сложнее, чем платформы, в основе которых лежат четырёхъядерные процессоры прошлого поколения, Core 2 Quad. Однако при этом необходимо понимать, что поскольку одним из основных изменений, привнесённых микроархитектурой Nehalem, стал принципиально новый дизайн платформы, разгон Core i7 требует совершенно иного подхода.

Так, в общем случае разгон старых LGA775-систем выполняется путём повышения частоты процессорной шины. Вслед за её ростом неминуемо поднимается частота процессора и памяти, пропорционально связанные с частотой FSB множителями и делителями. При этом коэффициент умножения процессора определяется штатной частотой процессора, но при желании может быть и изменён в сторону уменьшения. Исключение здесь составляют процессоры серии Extreme Edition, снабжённые свободно изменяемым множителем, дающим возможность разгона через простую установку коэффициента умножения выше его номинального значения. Делитель же, связывающий частоты FSB и памяти, определяется северным мостом чипсета, в котором в LGA775-системах расположен контроллер памяти. Современные наборы системной логики обладают широкими возможностями по установке различных делителей для частоты памяти, что даёт возможность её относительно гибкого изменения, в том числе и независимого от процессора разгона.

В LGA1366-платформах, использующих новые процессоры Core i7, ситуация обстоит совершенно иначе. Ведь мало того, что эти процессоры оборудованы 8-мегабайтной разделяемой L3 кэш-памятью и имеют встроенный контроллер памяти, они ещё и используют принципиально новый последовательный интерфейс для соединения с чипсетом. В результате, системы нового поколения лишены традиционной шины FSB, игравшей ранее определяющее значение для формирования частот всех частей системы. Вместо этого ключевое значение получила так называемая базовая частота, BCLK, которая сама по себе, в чистом виде, не имеет никакого приложения. Однако через частоту BCLK с использованием множителей в LGA1366-платформе задаются частоты всех основных функциональных узлов. В число таких частот входят:

Частота процессора , на которой непосредственно работают процессорные ядра.
Частота встроенного в процессор северного моста , также называемая Uncore clock или UCLK. На этой частоте тактуется процессорный 8-мегабайтный L3 кэш и встроенный в процессор трёхканальный контроллер DDR3 SDRAM.
Частота работы DDR3 памяти .
Частота интерфейса QPI , связывающего процессор с чипсетом.

Для получения этих четырёх основных частот в процессорах Core i7 используется четыре различных множителя. Иными словами:

[Частота CPU ] = BCLK x [Множитель процессора ].
[Частота Uncore ] = BCLK x [Множитель Uncore ].
[Частота памяти ] = BCLK x [Множитель памяти ].
[Частота QPI ] = BCLK x [Множитель QPI ].


Все четыре участвующих в приведённых соотношениях коэффициента умножения независимы, за исключением множителей для памяти и встроенного в процессор северного моста: [Множитель Uncore ] должен быть как минимум вдвое больше, чем [Множитель памяти ].

Номинальное значение BCLK для любых процессоров Core i7 равно 133 МГц. Однако производные частоты различаются в зависимости от конкретной модели. Ниже приводится таблица, описывающая штатные, определённые спецификацией, значения частот для модельного ряда Core i7, который на данный момент состоит из трёх моделей:



Хотя для каждой модели процессора спецификация чётко определяет значения всех основных частот, на самом деле Intel предлагает несколько большую свободу в части изменения коэффициентов, их задающих. Фактически, жёстко ограничивается сверху лишь процессорный множитель и множитель для частоты шины QPI, остальные же коэффициенты умножения в серийных процессорах можно изменять в достаточно широких пределах. Следующая таблица описывает доступные для разных моделей диапазоны (штатные значения множителей выделены жирным шрифтом).



Таким образом, разгон процессоров Core i7, за исключением экстремально дорогой модели Core i7-965 Extreme Edition, выполняется единственным методом – поднятием базовой частоты BCLK. Однако установка её в значения, превышающие штатные 133 МГц, приводит к одновременному увеличению свыше штатных частот всех узлов системы, включая L3 кэш, память и шину QPI. Плохая новость здесь заключается в том, что скомпенсировать пропорциональный рост второстепенных частот выбором пониженных множителей можно лишь для DDR3 SDRAM, так как все процессоры, кроме старшей модели, уже используют минимально возможные значения множителей для частот Uncore и QPI. Но есть и хорошая новость: L3 кэш и шина QPI демонстрируют отличный потенциал по работе на повышенных частотах, так что в большинстве случаев фактором, ограничивающим разгон, будут выступать именно возможности процессорных ядер, а не их «обвязки».

Напряжения и температуры

Любой «гонщик» знает, что одним из неотъемлемых факторов, способствующих успешному разгону процессора, является увеличение напряжения питания различных узлов платформы. Так, например, при разгоне LGA775-систем нередко приходится прибегать к увеличению напряжений на процессоре, памяти, процессорной шине, памяти и чипсете. Установка этих величин выше их номинальных значений практически всегда расширяет разгонный потенциал системы. Впрочем, при этом не следует забывать и о том, что рост напряжений питания полупроводниковых приборов приводит к увеличению их тепловыделения и, вообще говоря, сокращению срока службы. Однако применение высококачественных систем охлаждения и умеренное отклонение от номинальных величин напряжений позволяет найти компромисс между «факторами риска» и ростом частотного потенциала.

Это же относится и к платформам нового поколения. Но системы, основанные на процессорах Core i7, имеют отличающееся строение и, вследствие этого, управление напряжениями в них при разгоне требует и иного подхода. Так, ввиду того, что чипсетный серверный мост и процессорная шина утратили своё определяющее значение, их напряжения в большинстве случаев не требуют корректировки даже при достаточно серьёзном увеличении частот. Зато переместившийся в процессор контроллер памяти и L3 кэш получили собственное независимое питание, управление которым при разгоне может принести определённые дивиденды.

Таким образом, определяющее значение в Core i7 системах имеют четыре основных напряжения, оперировать которыми и имеет смысл при разгоне. Это:

Напряжение питания процессора , которое используется непосредственно процессорными ядрами. Номинальное значение этого напряжения зависит от конкретного экземпляра процессора, но обычно равно 1,2 В. При этом максимально допустимым напряжением процессора спецификация называет 1,55 В, однако использование столь высокого вольтажа требует применения как минимум систем водяного охлаждения.
Напряжение питания Uncore : встроенного в процессор контроллера QPI и L3 кэша. Штатное напряжение для этих компонентов процессора установлено равным 1,2 В, однако спецификация предполагает, что без ущерба для процессора оно может быть увеличено до 1,35 В.
Напряжение питания памяти . Хотя на первый взгляд это напряжение не имеет прямого отношения к процессору, оно влияет не только на разгонные характеристики установленной в системе DDR3 SDRAM. Это же напряжение используется для питания переехавшего из чипсета в процессор контроллера памяти, что накладывает определённый отпечаток на его предельно допустимые величины. Intel крайне не рекомендует увеличивать напряжение питания памяти свыше 1,65 В, игнорирование же этого требования может привести к необратимому снижению частотного потенциала и повреждению процессора.
Напряжение CPU PLL (системы фазовой автоподстройки частоты). Данное напряжение играло немалую роль в разгоне четырёхъядерных LGA775 процессоров, эта роль сохранилась и для Core i7. Номинально напряжение устанавливается равным 1,8 В, но Intel допускает возможность его повышения до 1,88 В без какого-либо ущерба для процессора.



Известно, что увеличение напряжения процессора при разгоне приводит к квадратичному росту его тепловыделения. Именно поэтому при разгоне Core i7, как и любых других процессоров, необходимо пристально следить за температурным режимом. Предельно допустимая температура для ядер Core i7 – 100 градусов Цельсия. При переходе через этот порог процессор принудительно снижает напряжение питания и свой множитель вплоть до 12x. Благодаря данной мере кристалл защищается от опасного перегрева.

Для контроля температурного режима процессора существует несколько утилит, например CoreTemp или RealTemp . Их использование во время тестирования разогнанного процессора на стабильность позволит подобрать оптимальное напряжение питания, либо подаст знак о необходимости усовершенствования системы охлаждения.

Однако при этом необходимо иметь в виду, что процессоры Core i7 сообщают лишь о температурах своих вычислительных ядер, что позволяет с некоторой степенью вероятности быть уверенным в отсутствии перегрева в этих частях процессора. При этом температура встроенного в процессор северного моста не контролируется никаким образом. К тому же, Core i7 не имеет никаких встроенных механизмов по предупреждению перегрева L3 кэша и встроенного контроллера памяти, поэтому при увеличении напряжений Uncore и памяти нужно быть предельно осторожным.

Турбо-режим

Казалось бы, приведённой выше теоретической информации вполне достаточно для того, чтобы перейти к практическим экспериментам по разгону Core i7. И отчасти это так. Но всё же выстроенная стройная картина взаимосвязей множителей, напряжений и частот несколько нарушается дополнительными нововведениями, которыми располагают процессоры нового поколения. Речь идёт о технологии Turbo Boost – своего рода динамическом разгоне, внедрённом в процессоры самой Intel.

Напомним, что суть технологии Turbo Boost заключается в способности процессора увеличивать свой коэффициент умножения выше номинального значения в том случае, если это не приводит к превышению установленного равным 130 Вт порога энергопотребления. Текущая реализация этой технологии разрешает процессорам Core i7 превышать штатный множитель на 2, если в процессоре загружено работой только одно ядро, либо на 1, если под нагрузкой находится большее число ядер.

Казалось бы, такое несколько фривольное обращение процессора с собственным множителем может навредить разгону, однако на практике это оказывается не совсем так. Напротив, оверклокеры, выбравшие объектом приложения своих рук LGA1366-системы, получают в свои руки дополнительный инструмент.

Так, самый простой вариант заключается в элементарном отключении через BIOS Setup технологии Turbo Boost. Все материнские платы для процессоров Core i7 имеют соответствующую опцию. Более того, технология Turbo Boost напрямую связана с другой управляющей процессорным множителем технологией – Enhanced Intel SpeedStep. Это выражается в том, что турбо-режимы могут быть активированы только после включения EIST. Многие же оверклокеры привыкли отключать энергосберегающие технологи, а значит, они автоматически деактивируют и Turbo Boost.

Однако турбо-режим можно не игнорировать, а обратить и в свою пользу. Дело в том, что BIOS большинства LGA1366 материнских плат позволяет отключить контроль процессором собственных энергетических характеристик без деактивации турбо-режима. Такой трюк даёт возможность статически увеличить множитель CPU на 1 выше номинала при любой нагрузке, вне зависимости от текущего энергопотребления процессора. В результате, процессор Core i7-920 со штатным множителем 20x можно использовать при множителе 21x, а Core i7-940 – при множителе 23x, в то время как его штатный коэффициент умножения установлен равным 22x. Конечно, такое увеличение коэффициента умножения само по себе выглядит несерьёзно, но вместе с наращиванием базовой частоты BCLK оно вполне может помочь достижению лучших результатов в разгоне.

К сказанному остаётся добавить, что мы не рекомендуем использовать турборежим при разгоне в полной мере и по прямому назначению, хотя, в принципе, это возможно. Динамическое повышение множителя процессора при снижении нагрузки, не вызывающее никаких отрицательных последствий при эксплуатации в номинальном режиме, при разгоне может оборачиваться нестабильностью. Секрет кроется в том, что при разгоне процессора через изменение частоты BCLK шаг прироста частоты процессора при увеличении множителя становится больше, в результате чего процессор при переходе в турбо-режим может «переразгонять» себя дальше предела стабильности. В итоге легко может сложиться несколько парадоксальная ситуация: процессор будет успешно проходить ресурсоёмкие тесты на стабильность, но при умеренной реальной нагрузке, вследствие попыток перейти в турбо-режим, система будет давать сбои.

Комплектующие для оверклокерской системы

Материнская плата – ASUS P6T Deluxe

Вполне логично, что для разгона процессоров Core i7, также как и при разгоне любых других процессоров, выбор высококачественных комплектующих выступает одним из слагаемых успеха. Определяющее значение в оверклокерской платформе, несомненно, играет материнская плата, как один из самых важных компонентов системы, объединяющий воедино процессор, память, видеокарту и периферийные устройства. Для наших тестов мы избрали плату ASUS P6T Deluxe в первую очередь потому, что компания ASUS завоевала авторитет поставщика качественных и дружественных оверклокерам решений.


Впрочем, мы не можем сказать, что от беглого знакомства с ASUS P6T Deluxe у нас осталось какое-то особенное впечатление. Плата как плата, на первый взгляд. Невольно даже закрадывается некоторое разочарование, так как стоимость P6T Deluxe превышает 10 тысяч рублей, а материнская плата при этом не поражает воображение одним лишь внешним видом. Хотя, конечно, следует понимать, что платы для процессоров Core i7, основанные на единственном совместимом с ними наборе логики Intel X58 Express, в принципе не могут быть недорогими. Тон задаёт сама Intel, продающая производителям плат набор логики Intel X58 по цене, превышающей 50 долларов США.

Тем не менее, ASUS P6T Deluxe – это далеко не самая дешёвая плата на базе Intel X58. Дело в том, что разработчики ASUS решили не экономить на мелочах. Например, в плате используются электронные компоненты повышенной надёжности, восьмислойная, а не шестислойная PCB, а также ряд интересных дополнительных контроллеров. Но давайте познакомимся со всеми особенностями P6T Deluxe по порядку.

В первую очередь необходимо отметить наличие на этой плате трёх слотов PCI Express x16 (совместимых с версией протокола 2.0), предназначенных для установки графических карт. Эти слоты могут работать в двух режимах: x16/x16/x1 при использовании одной или двух видеокарт, либо x16/x8/x8, если в системе установлено сразу три видеокарты. Таким образом, ASUS P6T Deluxe позволяет собрать видеосистему из двух видеокарт без каких-либо ограничений. Что особенно приятно, P6T Deluxe прошла процедуру сертификации у NVIDIA, в результате чего она поддерживает не только технологию ATI Crossfire, но и NVIDIA SLI. Таким образом, рассматриваемая плата может служить основой высокопроизводительной игровой системы, оснащённой одной или несколькими видеокартами любого производителя.

Помимо трёх слотов PCI Express x16, плата предлагает один дополнительный слот PCI Express x4 и два слота PCI, один из которых, впрочем, скорее всего, будет заблокирован системой охлаждения видеокарты.

Инженеры ASUS решили придерживаться традиционного размещения слотов памяти, они находятся справа от процессорного гнезда. Кстати, именно такое, а не исповедуемое платой Intel Smackover расположение слотов над LGA1366, предусматривается референс-дизайном. Кроме того, в отличие от интеловской платы, ASUS P6T Deluxe обладает шестью слотами для DDR3 SDRAM – по два слота на каждый канал. Это означает, что в P6T Deluxe можно установить в общей сложности до 12 Гбайт памяти.

Отдельно хочется отметить тот факт, что инженеры ASUS чрезвычайно трепетно отнеслись к качественной прокладке сигнальных линий от процессора до памяти. Обратите внимание, ось, проходящая через центр слотов памяти, проходит и через центр процессора. Такое выравнивание может добавить дополнительную стабильность подсистеме памяти, например, при её разгоне. Кстати, для питания модулей DDR3 SDRAM предусмотрен трёхфазный, а не двухфазный, как на большинстве иных плат, преобразователь напряжения.



Что же касается конвертера питания самого процессора, то его схема включает шестнадцать каналов, плюс два отдельных канала для питания встроенного в процессор северного моста. Это – беспрецедентно сложная схема, в теории, гарантирующая высокую «чистоту» питания. При этом, благодаря использованию традиционного управляющего контроллера EPU, схема при небольшой нагрузке уменьшает количество используемых фаз до четырёх: таким путём достигается высокий КПД преобразователя питания. Неудивительно, что, реализовав столь сложную схему, ASUS не стала скупиться и на элементной базе. В составе конвертера питания, да и на всей плате целиком применяются конденсаторы с полимерным электролитом с увеличенным сроком службы, катушки с броневым сердечником и высокочастотные транзисторы с низким сопротивлением в открытом состоянии.



На транзисторах, окружающих процессорное гнездо, установлены традиционные для ASUS алюминиевые радиаторы медного цвета. За охлаждение южного моста отвечает невысокий радиатор, закрытый сверху декоративной пластиной с подсвечиваемым во время работы логотипом производителя. На северном мосту, напротив, обнаруживается массивный алюминиевый радиатор с небольшим числом рёбер причудливой формы. Согласно мнению инженеров ASUS, такая форма идеальна при отсутствии на чипсете собственного вентилятора, так как ребра пролегают вдоль воздушного потока, создаваемого процессорным кулером. Впрочем, вместе с этим разработчики позаботились и о возможности установки на этот затейливый радиатор стандартного 40 мм вентилятора. В комплекте поставки платы имеются специальные крепёжные стойки.



Как это принято на платах верхнего ценового диапазона, все перечисленные радиаторы соединены в единую систему охлаждения тепловыми трубками.


Необходимо отметить, что эта система охлаждения вряд ли помешает установке на ASUS P6T Deluxe массивных процессорных кулеров. Но дело тут даже не в том, что все радиаторы на плате имеют небольшую высоту, а в том, что референс-дизайн LGA1366 материнских плат предполагает некоторое смещение процессорного гнезда от верхнего края платы. И хотя это известие не порадует владельцев старых корпусов с воздуховодом, подходящим к процессорному кулеру, благодаря изменению компоновки на верхней части платы освобождается дополнительное место, дающее проектировщикам плат большую свободу в распределении компонентов.



Говоря об особенных возможностях ASUS P6T Deluxe, необходимо отметить, что эта плата снабжена дополнительным SAS-контроллером, встретить который в платформах для продвинутых пользователей ранее было невозможно. ASUS же установил на свою плату двухпортовый контроллер Marvell 88SE6320, позволяющий подключать как SATA, так и SAS-винчестеры и объединять их в RAID массивы уровня 0 или 1.



Кстати, так как в южном мосту ICH10R, использованном в основе P6T Deluxe, отсутствует поддержка PATA устройств, инженеры ASUS реализовали её установкой на плату ещё одного контроллера – Marvell 88SE6111. Благодаря ему на P6T Deluxe имеется не только PATA-133 интерфейс, но и дополнительный порт eSATA, вынесенный на заднюю панель платы.

Глядя на заднюю панель ASUS P6T Deluxe, можно обнаружить, что у этой платы имеются два гигабитных сетевых порта, обслуживаемых контроллерами Marvell 88E8056. Эти порты можно использовать как раздельно, так и вместе – в режиме Teaming. Также на задней панели присутствует разъём IEEE1394 FireWire и восемь портов USB 2.0. Ещё один порт Firewire и шесть USB 2.0 присутствуют на плате в виде дополнительных игольчатых разъёмов. Помимо перечисленного, на заднюю панель вынесен один PS/2 порт (он может работать как с клавиатурой, так и с мышью), а также аудио-разъёмы: шесть аналоговых и два S/PDIF – оптический и коаксиальный, работа которых обеспечивается восьмиканальным кодеком ADI AD2000B.



Следует заметить, что ASUS P6T Deluxe не лишена целого ряда прочих приятных мелочей, например, поддержки технологии ExpressGate, позволяющей загружать SplashTop Linux со встроенного флеш-носителя практически моментально после включения платы.



Или же нового приложения Turbo-V, позволяющего управлять всеми ключевыми параметрами платы (частотой BCLK и всеми напряжениями) непосредственно из операционной системы, а также работать с профилями настроек.


Ну или, наконец, установленных непосредственно на плату кнопок включения и перезагрузки, сильно упрощающих жизнь тестировщикам.

Хотя, конечно, гораздо больший интерес, в свете выбранной для этой статьи тематики, вызывают возможности BIOS Setup по конфигурированию процессора и платформы. Основная часть настроек, ориентированных на разгон, традиционно сведена на странице «Ai Tweaker».



Здесь присутствуют опции для установки всех основных частот и напряжений. Базовая частота BCLK выставляется в пределах от 100 до 500 МГц, частоты же для памяти, Uncore и QPI при этом выбираются из множества значений, определяемых соответствующими доступными коэффициентами. В этом ключе следует отметить удобство BIOS Setup рассматриваемой платы, который предлагает оперировать не множителями для соответствующих частот, а реальными значениями частот, получаемыми при использовании этих множителей.



Одновременно с возможностью изменения ключевых частот, P6T Deluxe предлагает и богатые средства для конфигурирования всех основных и второстепенных напряжений. Список возможных настроек и диапазонов их изменения приводится в таблице:


В этом изобилии настроек напряжений есть и четыре основные (те самые, о которых мы говорили выше), так что для разгона процессоров P6T Deluxe вполне подходит.



Кстати, помимо перечисленных установок, рассматриваемая плата сохранила и полезную функцию Load-Line Calibration, призванную бороться с вредным при разгоне падением напряжения на проводниках платы на участке от конвертера питания до процессора (эффект Vdroop).

Не обделён BIOS Setup и функциями для управления процессорными технологиями. В соответствующем разделе находятся опции для включения энергосберегающих технологий и технологии виртуализации, а также опции для включения турбо-режима. Так, установка «Intel Turbo Mode Tech» позволяет включить или отключить турбо-режим (после активации EIST), а параметр «Intel C-STATE Tech» отвечает за активацию контроля процессором собственного энергопотребления.



В остальном BIOS рассматриваемой платы мало отличается от BIOS других плат ASUS верхнего ценового диапазона. Поэтому добавить к сказанному хочется разве только одну любопытную деталь: встроенные в BIOS утилиты «ASUS O.C. Profile» (для работы с профилями настроек) и «ASUS EZ Flash» (для обновления прошивок) теперь способны работать не только с внешними носителями данных, но и с жёсткими дисками с файловой системой NTFS (в режиме чтения).

Память – Kingston KHX16000D3K3/3GX

При разгоне LGA1366 систем мы советуем использовать специализированную трёхканальную оверклокерскую память. И дело тут не только в том, что такая память продаётся комплектами по три модуля. Как мы знаем, в Core i7 системах можно использовать и двухканальную память, падение производительности в этом случае несущественно. Главная проблема заключается в том, что, во избежание повреждения встроенного в процессор контроллера памяти, Intel настоятельно рекомендует не увеличивать напряжение питания памяти свыше 1,65 В. Все же распространённые двухканальные комплекты DDR3 SDRAM, присутствующие на рынке, оптимизированы для использования в старых LGA775 системах и требуют установки более высоких напряжений.

Казалось бы, в этом случае при разгоне можно обойтись и обычной DDR3 памятью, работающей на штатном напряжении 1,5 В при частотах 1067 и 1333 МГц, однако это не совсем так. Дело в том, что увеличение частоты BCLK влечёт за собой и рост частот памяти. При этом минимальный множитель для частоты DDR3 SDRAM, равный 6x, в серийных процессорах Core i7 работоспособен лишь при незначительном отклонении BCLK от стандартного значения. В результате, при разгоне приходится пользоваться множителем 8x, а в этом случае частота памяти превышает 1333 МГц уже при разгоне BCLK до 167 МГц, то есть при повышении этой частотой своего номинального значения всего на 25 %. Поэтому оверклокерские Core i7 платформы, предполагающие более чем 25-процентный разгон повышением базовой частоты BCLK, должны комплектоваться DDR3 SDRAM, способной работать как минимум на частоте 1600 МГц при напряжении 1,65 В.

Конечно, можно выбрать такие модули и среди памяти «прошлого поколения», но гораздо проще приобрести специализированную DDR3 SDRAM, ориентированную на использование в Core i7 платформах. К настоящему моменту все ведущие производители оверклокерской памяти анонсировали свои комплекты соответствующего назначения. Для нашей же системы мы выбрали память Kingston HyperX KHX16000D3K3/3GX.



Данный комплект привлёк наше внимание тем, что на сегодняшний день это – самая скоростная представленная на рынке DDR3-память для LGA1366 систем. Этот трёхканальный комплект, включающий три гигабайтных модуля, способен работать на частотах до 2000 МГц при напряжении 1,65 В и таймингах 9-9-9-27.



Память Kingston HyperX KHX16000D3K3/3GX, вообще говоря, по своим характеристикам отлично подходит для эксплуатации в системах с экстремальным разгоном. Дело в том, что тактование памяти в Core i7 системах на частотах, близких к 2000 МГц, требует значительного повышения напряжения питания Uncore части процессора, примерно до 1,6–1,7 В. Поэтому мы бы не рекомендовали использовать память на столь высокой частоте без использования как минимум жидкостного охлаждения процессора. Тем более, что процессоры Core i7, к сожалению, не имеют никаких средств для диагностики перегрева встроенного L3 кэша и контроллера памяти.

Тем не менее, это совершенно не противоречит возможности применения Kingston HyperX KHX16000D3K3/3GX в «обычных» оверклокерских системах, в которых используются более распространённые воздушные кулеры. В таком случае эта память при напряжении питания 1,65 В может работать при частотах до 1780 МГц с таймингами 8-8-8-24, а при частотах до 1550 МГц – с задержками 7-7-7-21.

Впрочем, если вы не хотите тратиться на дорогую память Kingston HyperX KHX16000D3K3/3GX, работающую на частоте 2000 МГц, этот же производитель может предложить высококачественную трёхканальную память с напряжением 1,65 В с более низкими номинальными частотами: 1867, 1800 или 1600 МГц. Подобные же предложения есть и у других поставщиков памяти для энтузиастов.

Процессорный кулер – Noctua NH-U12P

Выбор высокоэффективного кулера для оверклокерской LGA1366 платформы – ответственное занятие. Дело в том, что тепловыделение процессоров Core i7 при разгоне ощутимо возрастает, поэтому для полного раскрытия частотного потенциала необходим соответствующий по эффективности отвод тепла. Максимальная температура процессорных ядер, при которой включается защита, составляет 100 °C и, например, штатного «коробочного» кулера от Core i7 не хватает для достаточного охлаждения этих процессоров уже при среднем разгоне.

Казалось бы, производители систем охлаждения предлагают массу высокоэффективных систем воздушного и водяного охлаждения, но в своей основной массе они пока неприменимы для LGA1366 платформ. Дело в том, что Intel изменил расположение крепёжных отверстий на материнской плате, по сравнению с LGA775 они отодвинуты от процессорного гнезда на большее расстояние. К счастью, некоторые производители оперативно сориентировались в изменившейся конъюнктуре и выпустили к своим флагманским продуктам дополнительные крепления, позволяющие устанавливать их в новых системах. Нам, например, удалось получить новое крепление для кулера Noctua NH-U12P, которое компания Noctua, кстати, готова выслать всем желающим бесплатно .

Сам по себе кулер NH-U12P уже сумел подтвердить свою хорошую эффективность, поэтому его использование в разогнанной Core i7 системе мы посчитали вполне уместным.


Новое LGA1366 крепление, получившее собственное название «Noctua LGA1366 SecuFirm2», позволяет надёжно закрепить хорошо знакомый кулер в новой платформе. Конструктивно оно подобно старому LGA775, но в нём применены пластина и скобы большего размера. К сожалению, это новое крепление сохранило и все недостатки своего предшественника: оно прекрасно подходит для однократной установки на плату, но замена процессора в тестовой системе вызывает серьёзные сложности. Так, для демонтажа кулера необходимо снимать с него вентилятор, а при необходимости замены процессора приходится отвинчивать и одну из крепёжных скоб, блокирующих защёлку процессорного гнезда.



Впрочем, мы простили Noctua NH-U12P эти недостатки. Ведь, во-первых, этот кулер – одна из самых эффективных на рынке систем воздушного охлаждения, а во-вторых, производитель всё-таки продлил жизнь своему удачному продукту, снабдив его дополнительной системой крепления.

Процессор – Intel Core i7-920

В качестве основного объекта для экспериментов мы решили выбрать наиболее популярный процессор в линейке Core i7. Этим процессором оказалась младшая модель в семействе, Core i7-920. Востребованность этого процессора объясняется его невысокой стоимостью, например, в официальном интеловском прайс-листе он оценён в 284 доллара, при том что следующая, более скоростная модель в этом семействе имеет цену 562 доллара. В рознице на данный момент Core i7-920 стоит около десяти тысяч рублей .



Характеристики этого процессора обсуждались уже не раз, поэтому позволим себе привести их перечень без дополнительных комментариев.



Заметим лишь, что поставляемые сегодня на рынок серийные процессоры Core i7 имеют степпинг C0, такой же степпинг мы наблюдали и у инженерных образцов, которые нам прислал Intel перед официальным анонсом. Однако как оказалось, серийные процессоры Core i7-920, которые появились на прилавках магазинов, имеют существенные отличия от ранее разосланных тестерам образцов. Серийные процессоры Core i7 получили разблокированные множители для формирования частот встроенного в процессор северного моста и памяти. В результате в системах, основанных на серийных процессорах Core i7, появилась возможность тактования DDR3-памяти на частотах, превышающих 1067 МГц, даже без увеличения частоты BCLK выше штатного значения. Иными словами, несмотря на то, что в официальном списке характеристик Core i7 значится лишь поддержка DDR3-800 и DDR3-1067 памяти, фактически эти процессоры поддерживают также и DDR3-1333. Формально, Core i7-920 позволяет установить и более высокие множители для частоты памяти, но на практике они, к сожалению, оказываются неработоспособными.

Например, приведённые ниже показания диагностической утилиты Everest сделаны нами как раз при работе памяти в режиме DDR3-1333.



Заметьте, утилита показывает, что напряжение питания нашего экземпляра процессора равно 1,2 В. На данный момент это – стандартное значение, все процессоры Core i7, с которыми нам довелось познакомиться, использовали именно это напряжение.

Поскольку мы взяли на тесты серийный процессор в коробочной поставке, пару слов следует сказать и о ней. Core i7 поставляется в синей картонной коробке, явно превышающей по размерам коробки четырёхъядерных процессоров семейства Core 2 Quad. Тем не менее, содержимое поставки осталось тем же. Помимо процессора, в коробке лежит буклет с инструкцией по установке и кулер.


Принципиальная конструкция штатного кулера, прилагаемого к Core i7, практически не изменилась по сравнению с системами охлаждения, поставляемыми с LGA775 процессорами. Он состоит из массивного алюминиевого радиатора цилиндрической формы с медным сердечником и вентилятора диаметром 90 мм. Также прогресс не коснулся и устройства крепления, которое выполнено в виде четырёх пластиковых защёлок, фиксируемых в специализированных отверстиях материнской платы.


Эффективности этого кулера вполне достаточно при эксплуатации процессора в штатном режиме, однако при разгоне он явно не справляется с возлагаемыми на него обязанностями и не даёт частотному потенциалу процессора раскрыться в полной мере.

Что касается самого процессора, то по виду он мало отличается от тестировавшихся нами ранее образцов. Единственное его отличие состоит в появлении серийной маркировки на крышке, где, помимо торговой марки Intel Core i7 и номера 920, имеется указание на штатную частоту, размер кэш-памяти третьего уровня и частоту QPI, а также метка PCG (Platform Compatibility Guide), отражающая электрические характеристики. Идентификационный номер (S-Spec) доставшегося нам процессора – SLBCH, на данный момент его имеют все серийные процессоры Core i7-920.

Описание тестовой системы

Подытоживая сказанное, приведём полный перечень участвующих в нашей тестовой системе комплектующих:

Процессор: Core i7-920 (2,66 ГГц, 8 Мбайт L3, ядро Bloomfield ревизии С0).
Процессорный кулер: Noctua NH-U12P с двумя вентиляторами Noctua NF-P12 (около 1300 об./мин).
Материнская плата: ASUS P6T Deluxe (BIOS 0904 от 18.11.2008).
Память: Kingston HyperX KHX16000D3K3/3GX (3 x 1 Гбайт, DDR3-2000, тайминги 9-9-9-27 при напряжении питания 1,65 В).
Видеокарта: ATI RADEON HD 4870 512 Mбайт.
Дисковая подсистема: Western Digital WD1500AHFD.
Блок питания: SilverStone SST-ST85ZF (850 Вт).
Операционная система: Microsoft Windows Vista Ultimate SP1 x86-64.


Разгон процессора

Приведённая в первой части данной статьи информация уже позволяет получить общее представление о том, как же следует разгонять процессоры Core i7. Основная идея этого процесса заключается в повышении базовой частоты BCLK, влекущей за собой рост тактовой частоты процессора. Но поскольку с BCLK связаны и другие частоты в системе, как то частота встроенного в процессор северного моста, частота памяти и частота шины QPI, при разгоне следует стараться по возможности использовать уменьшенные множители частот Uncore, DDR3 SDRAM и QPI. Это позволит более полно раскрыть потенциал процессора, и не даст разгону запнуться из-за чрезмерного повышения прочих частот в системе. Естественно, как и всегда, результаты разгона могут быть дополнительно улучшены увеличением основных напряжений выше их штатных значений, но увлекаться этим не стоит, по крайней мере, не позаботившись о качественном охлаждении процессора.

Используя имеющийся в лаборатории процессор Core i7-920, первым делом мы решили установить ту максимальную частоту, на которой он сможет работать без увеличения напряжений выше их номинального уровня. Для этого в BIOS Setup используемой нами материнской платы ASUS P6T Deluxe мы жёстко зафиксировали напряжение процессора и Uncore на стандартном уровне 1,2 В. Заметим, что установка значений напряжений в положение «Auto» не рекомендуется, так как в этом случае материнская плата начинает повышать их при разгоне самостоятельно и неподконтрольно пользователю.

Чтобы оградить себя от всяких сюрпризов, при разгоне мы отключили технологии EIST и Turbo Boost и жёстко зафиксировали коэффициент умножения в положении 20x – штатном для Core i7-920, номинальная частота которого равна 2,66 ГГц. Для частоты памяти мы выбрали множитель 8x. К сожалению, младший из доступных коэффициентов, 6x, продемонстрировал неработоспособность уже при частоте BCLK 150 МГц. Соответственно, для частоты Uncore, которая должна как минимум вдвое превышать частоту памяти, использовался множитель 16x. Для формирования же частоты шины QPI устанавливался минимальный доступный коэффициент 18x.

При таком наборе параметров нам удалось довести частоту BCLK до 175 МГц без какого-либо ущерба для стабильности функционирования. Кстати, тестирование стабильности мы выполняли, пользуясь 64-битной версией утилиты Prime95 25.7 в режимах Small FFTs и Blend. Именно эта программа показала наилучшую способность выявлять чрезмерный разгон и зачастую выдавала ошибки, когда другие популярные средства тестирования стабильности (в том числе OCCT, LinX и IntelBurnTest) показывали отсутствие каких-либо проблем.


Процессор в результате разогнался до 3,5 ГГц, что, учитывая его работу при штатном напряжении 1,2 В, можно назвать весьма неплохим результатом. Максимальная температура ядер во время прохождения тестов на стабильность не превышала при этом 74 градусов.

Очевидно, улучшить этот результат можно увеличением напряжения питания процессорного ядра. Однако мы не советуем злоупотреблять этой настройкой, так как увеличение напряжения влечёз за собой и рост тепловыделения, который в конечном итоге и встаёт на пути роста тактовой частоты при разгоне. В частности, при использовании воздушного охлаждения напряжение на процессоре в большинстве случаев не следует увеличивать свыше 1,35 – 1,4 В, так как в противном случае процессор будет перегреваться, не достигая своего предела по тактовой частоте.

Впрочем, в нашем случае установка напряжения процессорного ядра 1,35 В достичь ощутимо более высоких частот без дополнительных действий не позволила. И хотя при повышении частоты BCLK до 180 МГц система проходила тесты на стабильность процессора, при проверке стабильности подсистемы памяти возникали сбои. Очевидно, такое поведение тестовой платформы обуславливается достижением предела разгона встроенного в процессор северного моста, работающего на собственной частоте, также связанной с BCLK, и использующего собственное напряжение питания. К моменту увеличения базовой частоты до 175 МГц частота Uncore выросла до 2800 МГц, а это, очевидно, предел возможностей встроенного L3 кэша при штатном напряжении. Поэтому для дальнейших экспериментов мы повысили до 1,35 В и напряжение Uncore. Заодно, на всякий случай, мы увеличили до 1,88 В напряжение CPU PLL.

Предпринятые шаги позволили добиться стабильной работы процессора при частоте BCLK, равной 190 МГц. Процессор разогнался до 3,8 ГГц, а частота встроенного в него северного моста достигла 3040 МГц.


В таком состоянии тесты стабильности проходили без проблем, но дальнейшее увеличение частоты приводило к сбоям в Prime 95, даже предпринятое одновременно с дополнительным приростом процессорных напряжений. Похоже, что частота 3,8 ГГц и является пределом разгона нашего тестового Core i7-920, несмотря на то, что максимальная температура ядер при тестировании стабильности доходила лишь до 86 градусов, в то время как критический предел температуры установлен равным 100 °C.

Собственно, частоты порядка 3,8 ГГц – это и есть наиболее распространённый предел разгона процессоров Core i7-920 с применением воздушного охлаждения. Именно такой вывод можно сделать не только исходя из результатов наших тестов, но и анализируя отзывы первых покупателей этих процессоров. Кстати, имеющейся в нашей лаборатории, помимо серийного экземпляра, инженерный образец Core i7-920 продемонстрировал аналогичные разгонные возможности. Даже при повышении напряжения ядра до 1,4 В он смог разогнаться лишь до того же уровня 3,8 ГГц. Причём в данном случае речь идёт уже именно о пределе ядер, а не встроенного в процессор северного моста. Чтобы дополнительно убедиться в этом, мы снизили множитель процессора до 19x и получили его абсолютно стабильную работу при тех же настройках напряжений, но с использованием частоты BCLK, равной 200 МГц.


Подведём итог. Нам удалось добиться разгона процессора Core i7-920 со штатной частотой 2,66 до 3,8 ГГц. Таким образом, мы получили более чем 40-процентный прирост тактовой частоты с применением воздушного охлаждения и использованием потенциально безопасных для процессора напряжений. Рекомендуемые для такого разгона настройки, проверенные нами на двух разных экземплярах процессора, приводятся на скриншоте (на примере материнской платы ASUS P6T Deluxe).



Заметим, что успех этого разгона во многом определяется наличием в системе качественной памяти, способной работать на частоте порядка 1600 МГц с напряжением 1,65 В. Впрочем, память, используемая нами, могла бы работать и на более высокой частоте, вплоть до 2000 МГц. Но, к сожалению, попытки её дополнительного разгона провалились. Дело в том, что одновременно с увеличением частоты шины памяти требуется увеличивать и частоту встроенного в процессор северного моста. Но, к сожалению, на частоте порядка 4 ГГц он работать отказался даже со значительным повышением напряжения Uncore.

Выводы

Подведём финальную черту. Сегодняшнее тестирование подтвердило, что новые процессоры Core i7 разгоняются не хуже своих предшественников. Взяв наудачу первый попавшийся серийный процессор Core i7-920, мы смогли увеличить его частоту более чем на 40 %, достигнув 3,8-гигагерцового рубежа. При этом мы не прибегали ни к специальным методам охлаждения, используя серийно выпускаемый воздушный кулер, ни к повышению напряжений до потенциально опасных уровней.

Таким образом, можно говорить о том, что микроархитектура Nehalem не накладывает никаких серьёзных ограничений на рост тактовых частот. Используемый же для выпуска современных Core i7 технологический процесс с нормами производства 45 нм, в котором применяются диэлектрик на основе соединений гафния и металлические затворы, даёт возможность увеличения частот без резкого роста тепловыделения и энергопотребления процессора. А это значит, что со временем процессоры нового поколения станут не менее популярны среди оверклокеров и энтузиастов, чем процессоры семейства Core 2 Quad.

Ещё один важный вывод, который можно сделать по итогам проведённого исследования, касается сравнительной простоты разгона процессоров семейства Core i7. Несмотря на то, что они используют несколько независимых множителей для тактования различных узлов, а также раздельное питание для ядер и встроенного северного моста, процесс разгона более чем логичен, а потому не вызывает никаких недопониманий.

Главными же составляющими успеха в деле разгона процессоров Core i7 выступают, очевидно, качественные комплектующие, составляющие платформу. Рассмотренная в этой статье материнская плата ASUS P6T Deluxe оказалась в этом ключе прекрасной основой для оверклокерской системы, отличаясь самыми ценными для энтузиастов качествами: хорошей стабильностью и предсказуемостью. Немалое значение играет и оперативная память, которая для сохранения работоспособности процессора должна работать при сравнительно высоких частотах без экстремального увеличения напряжения. И с этой ролью прекрасно справился комплект Kingston HyperX KHX16000D3K3/3GX, который мы смело рекомендуем всем оверклокерам, планирующим связать свою судьбу с процессорами Core i7.

На этом рассказ о разгоне Core i7 мы не заканчиваем, в одной из ближайших статей мы познакомимся с тем, насколько производительными оказываются системы, построенные на разогнанных процессорах нового поколения, а также проанализируем, какие из четырёхъядерных процессоров, представленных на рынке, выгоднее приобретать с расчетом на разгон.

Другие материалы по данной теме


Новый хит Intel: процессоры Core i7
Первое знакомство с микроархитектурой Intel Nehalem

Текущая страница: 5 (всего у книги 11 страниц) [доступный отрывок для чтения: 8 страниц]

Параметры автоматического разгона

В некоторых системных платах есть специальные параметры для комплексного разгона системы, позволяющие увеличить ее производительность, особо не вдаваясь в тонкости настройки отдельных компонентов. Этот способ доступен для начинающих пользователей, но его эффективность может быть невысокой, а в некоторых случаях система даже может работать нестабильно.

Dynamic Overclocking (D.O.T.)

С помощью этого параметра можно задействовать технологию динамического разгона, которая применяется в ряде системных плат от MSI. Система отслеживает нагрузку на процессор, и когда она достигнет максимума, его производительность будет увеличена, а после спада нагрузки процессор автоматически возвратится в штатный режим.

Возможные значения:

□ Private, Sergeant, Captain, Colonel, General, Commander – выбор одного из указанных значений позволит задать уровень ускорения процессора от 1 % (для Private) до 15 % (для Commander).

Некоторые системные платы MSI позволяют выполнить расширенную настройку динамического разгона. Параметр Dynamic Overclocking Mode позволяет выбирать компоненты для разгона, а с помощью параметров CPU D.0.T3 step 1/2/3 setting и PCIE D.0.T3 step 1/2/3 setting можно подстраивать уровни разгона для процессора и шины PCI Express.

CPU Intelligent Accelerator 2 (C.I.A. 2)

C.I.A. 2 – технология динамического разгона, аналогичная D.O.T., но применяющаяся в системных платах Gigabyte.

Возможные значения:

□ Disabled – технология динамического разгона не используется;

□ Cruise, Sports, Racing, Turbo, Full Thrust – выбор одного из указанных значений задает уровень ускорения процессора от 5 % (Cruise) до 19% (Full Thrust).

Memory Performance Enhance (Performance Enhance)

Параметр позволяет повысить производительность оперативной памяти в системных платах Gigabyte и некоторых других производителей.

Возможные значения:

□ Standard (Normal) – разгон оперативной памяти не используется;

□ Fast, Turbo, Extreme – выбор одного из уровней разгона. В зависимости от модели системной платы эффект от этих значений может различаться.

AI Overclocking (Al Tuning)

С помощью этого параметра, который есть в некоторых системных платах ASUS, можно выбрать один из доступных вариантов разгона. Возможные значения:

□ Manual – все параметры разгона можно изменять вручную;

□ Auto – устанавливаются оптимальные параметры;

□ Standard – загружаются стандартные параметры;

□ AI Overclock (Overclock Profile) – система будет разогнана на величину, заданную с помощью параметра Overclock Options (возможные варианты – от 3 до 10 %);

□ AI N.O.S. (Non-Delay Overclocking System) – используется технология динамического разгона, аналогичная D.O.T. Более детально настраивается с помощью параметра N.O.S. Option; в зависимости от модели платы вы можете установить уровень разгона в процентах или чувствительность системы динамического разгона.

AI Overclock Tuner

Параметр служит для выбора режима разгона в ряде новых плат от ASUS.

Возможные значения:

□ Auto – автоматическая настройка параметров (режим по умолчанию);

□ Х.М.Р. – настройка работы памяти соответственно стандарту Intel Extreme Memory Profile (X.M.P.). Этот стандарт также должен поддерживаться модулями памяти, а для выбора текущего профиля памяти используется параметр extreme Memory Profile;

□ D.O.C.P. – при выборе этого значения вы можете задать желаемый режим работы оперативной памяти с помощью дополнительного параметра DRAM О.С. Profile, а базовая частота (BCLK) и коэффициенты умножения для памяти и процессора будут подобраны автоматически;

□ Manual – все параметры разгона настраиваются вручную.

Robust Graphics Booster (LinkBoost)

Параметр позволяет ускорить работу видеосистемы, увеличивая тактовые частоты видеоадаптера.

Возможные значения:

□ Auto – видеосистема работает в обычном режиме на тактовых частотах по умолчанию;

□ Fast, Turbo – видеосистема работает на повышенных частотах, благодаря чему производительность немного повышается (особенно в режиме Turbo).

Intel Turbo Boost

Параметр позволяет включить технологию динамического разгона процессоров семейства Intel Core i7/5. Технология Intel Turbo Boost дает возможность автоматически увеличивать частоту процессора при загруженности одного или нескольких ядер и отсутствии перегрева процессора. Возможные значения:

□ Enabled – технология Turbo Boost включена. При загруженности всех ядер множитель процессора может быть автоматически увеличен на 1-2 ступени, что соответствует поднятию тактовой частоты на 133 или 266 МГц. Если загружено только одно ядро, частота процессора может быть увеличена на две ступени и более, в зависимости от модели процессора;

□ Disabled – режим Turbo Boost отключен.

Параметры разгона процессора

Как известно, каждый процессор работает на некоторой частоте, которая указана в его технической характеристике и определяется как произведение базовой частоты на коэффициент умножения.

CPU Clock Ratio (CPU Ratio Selection, Multiplier Factor, Ratio CMOS Setting)

Параметр устанавливает коэффициент умножения для центрального процессора. Большинство современных процессоров позволяют только уменьшать его или вообще не реагируют на изменение коэффициента. Однако в ассортименте производителей имеются модели с разблокированным множителем (например, серия Black Edition у AMD), которые можно легко разогнать, просто повысив множитель. Возможные значения:

□ Auto – коэффициент умножения устанавливается автоматически в зависимости от процессора;

□ 7.0Х, 7.5Х, 8.0X, 8.5Х, 9.0X, 9.5Х и т. д. – выбрав одно из указанных значений, можно заставить процессор работать с особым коэффициентом умножения, в результате чего его тактовая частота будет отличаться от паспортной.

CPU Host Clock Control (CPU Operating Speed)

Параметр включает ручное управление частотой FSB (BCLK) и коэффициентом умножения, что может понадобиться при разгоне. Возможные значения:

□ Disabled или Auto Detect – тактовая частота процессора устанавливается автоматически; это значение следует выбирать для работы системы в обычном, неразогнанном режиме;

□ Enabled (On) или User Define – тактовая частота процессора может быть изменена вручную с помощью параметра CPU FSB Clock (это значение используется при разгоне).

CPU FSB Clock (CPU Host Frequency (MHz), FSB Frequency, External Clock)

Параметр устанавливает частоту системной шины FSB, или внешнюю частоту центрального процессора, с которой синхронизируются все остальные частоты. Изменение частоты FSB – основной способ разгона процессоров, а диапазон и шаг регулировки зависит от чипсета и модели системной платы.

Если вы не собираетесь разгонять компьютер, установите для этого параметра значение Auto либо отключите ручную настройку для режима работы процессора с помощью параметра CPU Operating Speed или аналогичного.

BCLK Frequency (Base Clock)

Параметр используется в системах на базе процессоров Core i3/5/7 и позволяет изменять базовую частоту, от которой зависят рабочие частоты процессора, шины QPI, оперативной памяти и ее контроллера. Штатное значение базовой частоты – 133 МГц, а шаг и диапазон регулировки зависят от модели платы. Для доступа к этому параметру может понадобиться включить ручную настройку частоты с помощью параметра Base Clock Control или аналогичного.

QPI Frequency (QPI Link Speed)

Параметр позволяет установить частоту шины QPI, которая используется для связи процессора Core i3/5/7 с чипсетом.

Возможные значения:

□ Auto – частота QPI устанавливается автоматически в соответствии с паспортными параметрами процессора;

□ хЗб, х44, х48 – множитель, определяющий частоту QPI относительно базовой (133 МГц);

□ 4800, 5866, 6400 – в некоторых платах вместо множителя может использоваться числовое значение частоты в мегагерцах.

CPU/NB Frequency (Adjust CPU-NB Ratio)

Параметр позволяет устанавливать частоту встроенного в процессор AMD контроллера памяти. В зависимости от модели платы в качестве значений может использоваться частота в мегагерцах или множитель относительно базовой частоты.

CPU Voltage Control (CPU VCore Voltage)

С помощью этого параметра можно вручную изменить напряжение питания центрального процессора, что иногда нужно при разгоне. Возможные значения:

□ Auto (Normal) – напряжение питания процессора устанавливается автоматически в соответствии с его паспортными параметрами;

□ числовое значение напряжения в диапазоне от 0,85 до 1,75 В (в зависимости от модели системной платы диапазон и шаг регулировки могут быть другими).

В некоторых платах для этих же целей используется параметр CPU Over Voltage, который позволяет увеличивать напряжение относительно паспортного на заданную величину.

ВНИМАНИЕ

Чрезмерно высокое питающее напряжение может вывести процессор из строя. Для большинства современных процессоров допустимым является увеличение напряжения на 0,2-0,3 В.

Дополнительные напряжения процессора

Современные процессоры, кроме вычислительных ядер, могут содержать кэш-память, контроллер оперативной памяти и другие компоненты. Для них в некоторых платах имеется возможность настраивать напряжение питания и уровни сигналов, но их влияние на стабильность разогнанной системы обычно невелико. Вот несколько подобных параметров:

□ CPU VTT Voltage – напряжение питания контроллера шины QPI и кэшпамяти L3 (Intel Core i3/5/7);

□ CPU PLL Voltage – напряжение питания схемы фазовой автоподстройки частоты. Этот параметр актуален для четырехъядерных процессоров Intel;

□ CPU/NB Voltage – напряжение питания контроллера памяти и кэшпамяти L3 в процессорах AMD;

□ CPU Differential Amplitude (CPU Amplitude Control, CPU Clock Drive) – регулировка амплитуды сигналов процессора;

□ Load-Line Calibration – включение этого параметра позволит улучшить стабильность напряжения питания при большой нагрузке на процессор.

Advanced Clock Calibration (NVidia Core Calibration)

Этот параметр предназначен для улучшения разгонного потенциала процессоров Phenom и Athlon. Технология Advanced Clock Calibration (АСС) поддерживается в новых чипсетах для процессоров AMD и позволяет выполнять автоматическую подстройку рабочей частоты и напряжения питания процессора.

Возможные значения:

□ Disable – технология АСС отключена, это значение рекомендуется для штатного (неразогнанного) режима работы;

□ Auto – технология АСС работает в автоматическом режиме, это значение рекомендуется при разгоне;

□ All Cores – при выборе данного значения вы сможете установить с помощью параметра Value уровень АСС в процентах для всех ядер одновременно;

□ Per Core – в отличие от предыдущего варианта, вы сможете настроить АСС для каждого ядра отдельно. Ручная настройка АСС может понадобиться, если при значении Auto система работает нестабильно.

Данный параметр вызвал огромный интерес у компьютерных энтузиастов, поскольку позволяет разблокировать неактивные ядра и превратить двух– или трехъядерный процессор Athlon/Phenom в четырехъядерный. Подробнее об этом читайте далее.

Параметры разгона оперативной памяти

Оперативная память работает по управляющим сигналам от контроллера памяти, который вырабатывает последовательность сигналов с некоторыми задержками между ними. Задержки необходимы для того, чтобы модуль памяти успел выполнить текущую команду и подготовиться к следующей. Эти задержки называют таймингами и обычно измеряют в тактах шины памяти. Среди всех таймингов наибольшее значение имеют следующие: CAS# Latency (tCL), RAS# to CAS# delay (tRCD), RAS# Precharge (tRP) и Active to Precharge Delay (tRAS).

При настройке BIOS по умолчанию все необходимые параметры памяти задаются автоматически. В каждом модуле памяти есть специальный чип под названием SPD (Serial Presence Detect), в котором записаны оптимальные значения для конкретного модуля. Для разгона следует отключить автоматическую настройку памяти и задавать все параметры вручную, причем при разгоне процессора вам придется не повышать частоту памяти, а, наоборот, понижать ее.

Количество доступных для настройки параметров оперативной памяти может сильно различаться для разных моделей системных плат, даже выполненных на одном и том же чипсете. В большинстве плат есть возможность изменять частоту памяти и основных таймингов, что вполне достаточно для разгона (рис. 6.2). Любители тщательной оптимизации и разгона могут выбрать более дорогую плату с множеством дополнительных настроек, а в самых дешевых платах средства ручной настройки памяти будут ограниченными или отсутствовать вообще. Параметры оперативной памяти могут находиться в разделе с настройками разгона, в разделе Advanced Chipset Features или в одном из подразделов раздела Advanced.


Рис. 6.2. Основные параметры оперативной памяти


DRAM Timing Selectable (Timing Mode)

Это основной параметр для настройки оперативной памяти, с помощью которого выбирается ручной или автоматический режим установки параметров.

Возможные значения:

□ By SPD (Auto) – параметры модулей памяти устанавливаются автоматически с помощью данных из чипа SPD; это значение по умолчанию, и без особой необходимости менять его не следует;

□ Manual – параметры модулей памяти устанавливаются вручную; при выборе этого значения можно изменять установки рабочих частот и таймингов.

Configure DRAM Timing by SPD (Memory Timing by SPD)

Смысл этих параметров полностью аналогичен рассмотренному выше DRAM Timing Selectable, а возможные значения будут такими:

□ Enabled (On) – параметры оперативной памяти устанавливаются автоматически в соответствии с данными SPD;

□ Disabled (Off) – оперативная память настраивается вручную.

Memory Frequency (DRAM Frequency, Memclock Index Value, Max Memclock)

Параметр отображает или устанавливает частоту работы оперативной памяти. Эта частота в большинстве случаев задается автоматически в соответствии с информацией из SPD. Настраивая частоту вручную, можно заставить память ускориться, однако далеко не каждый модуль при этом будет работать стабильно.

Возможные значения:

□ Auto – частота оперативной памяти устанавливается автоматически в соответствии с данными SPD (по умолчанию);

□ 100, 120, 133 (РС100, РС133) – возможные значения для памяти SDRAM;

□ 200, 266, 333, 400, 533 (DDR266, DDR333, DDR400, DDR533) – возможные значения для памяти DDR;

□ DDR2-400, DDR2-566, DDR2-667, DDR2-800, DDR2-889, DDR2-1067 – значения для памяти DDR2;

□ DDR3-800, DDR3-1066, DDR2-1333, DDR2-1600 – значения для памяти DDR3.

В некоторых платах этот параметр доступен только для чтения, а для изменения частоты памяти следует использовать параметр System Memory Multiplier.

System Memory Multiplier (FSB/Memory Ratio)

Определяет соотношение (множитель) между частотой FSB (BCLK) и частотой памяти.

Возможные значения:

□ Auto – соотношение между частотой FSB (BCLK) и частотой памяти настраивается автоматически в соответствии с данными SPD;

□ соотношение (например, 1:1, 1:2, 3:2, 5:4) или множитель (2, 2,5, 2,66, 3,00, 3,33, 4,00 и т. д.), определяющий связь между частотой FSB (BCLK) и частотой памяти. Конкретный набор значений зависит от типа чипсета и модели платы.

Ручная установка множителя применятся при разгоне, в этом случае множитель (соотношение) понижают, чтобы он не вышел за допустимые пределы при поднятии базовой частоты. Контролировать фактическое значение частоты памяти вы можете с помощью информационного параметра Memory Frequency или диагностических утилит, например CPU-Z (www.cpuid.com) или EVEREST.

CAS# Latency (tCL, DRAM CAS# Latency)

Параметр устанавливает задержки между подачей сигнала выборки столбца (CAS#) и началом передачи данных.

Возможные значения этого параметра зависят от типа используемых модулей и модели платы. Для памяти DDR диапазон регулировки может составлять от 1,5 до 3 тактов, для DDR2 – от 3 до 7 тактов, для DDR3 – от 4 до 15 тактов. При уменьшении значения CAS# Latency работа памяти будет ускоряться, однако далеко не все модули могут стабильно работать при низких задержках.

RAS# to CAS# delay (tRCD, DRAM RAS-to-CAS Delay)

Параметр изменяет время задержки между сигналом выборки строки (RAS#) и сигналом выборки столбца (CAS#).

Диапазон регулировки зависит от модели платы и может составлять от 1 до 15 тактов. Чем меньше значение, тем быстрее доступ к ячейке, однако, как и в случае с CAS# Latency, слишком низкие значения приведут к нестабильной работе памяти.

RAS# Precharge (tRP, DRAM RAS# Precharge, SDRAM RAS# Precharge, Row Precharge Time)

Параметр задает минимально допустимое время, чтобы подзарядить строку после ее закрытия.

Возможные значения – от 1 до 15. При меньших значениях память работает быстрее, но слишком низкие могут привести к ее нестабильности.

Active to Precharge Delay (tRAS, DRAM RAS# Activate to Precharge, Min RAS# Active Time)

Параметр устанавливает минимальное время между командой активизации строки и командой закрытия, то есть время, в течение которого строка может быть открыта.

Диапазон регулировки зависит от модели платы и может составлять от 1 до 63 тактов. Нет однозначной зависимости между значением этого параметра и производительностью памяти, поэтому для максимального эффекта следует подбирать tRAS экспериментально.

DRAM Command Rate (1Т/2Т Memory Timing)

Параметр устанавливает задержку при передаче команд от контроллера к памяти.

Возможные значения:

□ 2Т (2Т Command) – величина задержки равна двум тактам, что соответствует меньшей скорости, но большей надежности работы памяти;

□ IT (IT Command) – задержка в один такт увеличивает скорость оперативной памяти, однако не всякая система может при этом нормально работать.

В некоторых версиях BIOS встречается параметр 2Т Command, при включении которого устанавливается задержка в два такта, а при отключении – в один такт.

Extreme Memory Profile (Х.М.Р.)

Параметр позволяет включить поддержку расширенных профилей памяти. Данная технология разработана компанией Intel и предполагает запись в чип SPD дополнительных наборов параметров для работы на повышенной частоте или с минимальными задержками. Для использования этой технологии она должна поддерживаться вашим модулем памяти.

Возможные значения:

□ Disabled – память работает в штатном режиме;

□ Profile!, Profile2 – выбор одного из профилей памяти с повышенной производительностью. Чтобы узнать параметры этих профилей, следует обратиться к подробной спецификации вашего модуля.

Дополнительные параметры памяти

Как уже отмечалось, в некоторых системных платах имеются дополнительные параметры памяти. Они оказывают меньшее влияние на производительность, чем рассмотренные выше основные тайминги, поэтому их в большинстве случаев следует оставить по умолчанию. Если же у вас есть время и желание экспериментировать, с их помощью можно немного повысить скорость работы памяти. Чаще всего встречаются следующие параметры:

□ tRRD (RAS to RAS delay) – задержка между активизацией строк разных банков;

□ tRC (Row Cycle Time) – длительность цикла строки памяти;

□ tWR (Write Recovery Time) – задержка между завершением операции записи и началом предзаряда;

□ tWTR (Write to Read Delay) – задержка между завершением операции записи и началом операции чтения;

□ tRTP (Precharge Time) – интервал между командами чтения и предварительного заряда;

□ tRFC (ROW Refresh Cycle Time) – минимальное время между командой обновления строки и командой активизации или другой командой обновления;

□ Bank Interleave – определение режима чередования при обращении к банкам памяти;

□ DRAM Burst Length – определение размера пакета данных при чтении из оперативной памяти;

□ DDR Clock Skew (Clock Skew for Channel А/В) – регулировка смещения тактовых сигналов для модулей памяти.

ВНИМАНИЕ

Изменение таймингов памяти может привести к нестабильной работе компьютера, поэтому при первом же сбое следует установить тайминги по умолчанию.

DDR/DDR2/DDR3 Voltage (DDR/DDR2/DDR3 OverVoltage Control, Memory Voltage)

Параметр увеличивает напряжение питания чипов оперативной памяти для их более устойчивой работы на повышенных частотах. При выборе значения Auto (Default) для чипов памяти будет установлено стандартное напряжение питания, которое составляет 2,5 В для памяти DDR, 1,8 В – для DDR2 и 1,5 В – для DDR3.

Для более эффективного разгона оперативной памяти вы можете несколько увеличить напряжение питания, выбрав одно из предлагаемых значений. Диапазон и шаг регулировки зависят от модели платы, а в качестве значений могут применяться как абсолютные, так и относительные значения напряжений.

В некоторых платах могут присутствовать дополнительные параметры для настройки опорных напряжений отдельно для каждого канала памяти, например Ch-A/B Address/Data VRef. Практически всегда для них следует устанавливать значение Auto, а их подстройка может понадобиться только при экстремальном разгоне.

ВНИМАНИЕ

Во избежание необратимых повреждений модулей памяти не выставляйте чрезмерно высоких значений напряжений, а также позаботьтесь о более эффективном охлаждении модулей.