Процессор интел пентиум 4 3 ггц. Процессоры Intel Pentium4 LGA775

С одной стороны, время в IT-индустрии летит настолько быстро, что не успеваешь замечать новые продукты и технологии, а с другой… ну-ка, вспомним — сколько лет мы не видели нового ядра от Intel? Не старого с переделками: тут частоту FSB подняли, там виртуальную многопроцессорность с серверного процессора на десктопный перенесли (на самом деле — просто разрешили последнему честно рассказать, что она у него есть), но действительно полностью нового? Если не с нуля разработанного, то хотя бы не латаного, а заново по тем же лекалам сшитого, но с другими рюшечками и по последней моде? А ведь целых два года, оказывается! Даже с хвостиком небольшим. И все это время горячие головы рассуждали на излюбленную тему: а каким же оно будет, новое ядро? Чего только не предсказывали — вплоть до полной анафемы архитектуре NetBurst и воцарения сплошного Banias на декстопной платформе. Правда (как часто бывает), оказалась менее сказочной: новое ядро оказалось честным и последовательным продолжателем Northwood. Разумеется, с некоторыми архитектурными нововведениями, но стремления «до основанья, а затем…» в нем не прослеживается. Поэтому чисто эмоционально Prescott можно оценивать по-разному: кто-то похвалит инжереров Intel за последовательность и целеустремленность, кто-то, наоборот — посетует на отсутствие свежих идей. Однако эмоции — личное дело каждого, мы же обратимся к фактам. Теория

Основные изменения в ядре (Prescott vs. Northwood)

Для начала мы предлагаем вам небольшую табличку, в которой сведены воедино наиболее существенные различия между ядрами Prescott и Northwood во всем что касается «железа» (а точнее — кремния, и прочих «минеральных составляющих»).

Остается только добавить, что новое ядро содержит 125 миллионов транзисторов (куда там бедному Northwood с его 55 миллионами!), и его площадь равна 112 кв. мм (немного меньше площади Northwood — 146/131 кв. мм, в зависимости от ревизии). Произведя несложный арифметический подсчет, видим, что увеличив количество транзисторов в ~2,3 раза, за счет нового техпроцесса инженерам Intel удалось, тем не менее, уменьшить площадь ядра. Правда, не так значительно — «всего» в 1,3 (1,2) раза.

Что же касается технологии «напряженного» (некоторые предпочитают термин «растянутый») кремния — то она, если объяснять на пальцах, довольно проста: с целью увеличения расстояния между атомами кремния, он помещается на подложку, расстояние между атомами у которой больше. В результате, для того чтобы «хорошо усесться», атомам кремния приходится растягиваться по предложенному формату. Выглядит это примерно вот так:

Ну а понять, почему электронам проще проходить через напряженный кремний, вам поможет вот этот простенький рисунок:

Как видите, геометрическая ассоциация в данном случае вполне уместна: путь электрона просто становится короче.

Ну а теперь рассмотрим гораздо более интересные отличия: в логике ядра. Их тоже немало. Однако для начала будет нелишним напомнить об основных особенностях архитектуры NetBurst как таковой. Тем более что не так уж и часто мы это делали в последнее время.

Немного предыстории

Итак, одним из основных отличий ядер, разработанных в рамках архитектуры NetBurst, сама компания Intel считает уникальную особенность, выражающуюся в разделении собственно процесса декодирования x86-кода во внутренние инструкции, исполняемые ядром (uops), и процедуры их выполнения. Между прочим, такой подход породил в свое время немало споров относительно корректности подсчета стадий конвейера у Pentium 4: если подходить к данному процессору с классической точки зрения (эпохи до-NetBurst), то стадии декодера следует включать в общий список. Между тем, официальные данные Intel о длине конвейера процессоров Pentium 4 содержат информацию исключительно о количестве стадий конвейера исполняющего блока, вынося декодер за его рамки. С одной стороны — «крамола!», с другой — это объективно отражает особенность архитектуры, поэтому Intel в своем праве: она же ее и разработала. Спорить, можно, разумеется, до посинения, однако… какая, собственно, разница? Главное — понимать суть подхода. Не нравится вам, что декодер исключен? Ну так прибавьте его стадии к «официальным» — и получите искомую величину конвейера по классической схеме, вместе с декодером.

Таким образом, основная идея NetBurst — асинхронно работающее ядро, в котором декодер инструкций работает независимо от Execution Unit. С точки зрения Intel, существенно бо льшая, чем у конкурентов, частота работы ядра, может быть достигнута только при асинхронной модели т.к. если модель синхронная, то расходы на синхронизацию декодера с исполняющим блоком возрастают пропорционально частоте. Именно поэтому вместо обычного L1 Instructions Cache, где хранится нормальный x86-код, в архитектуре NetBurst применяется Execution Trace Cache, где инструкции хранятся уже в декодированном виде (uops). Trace — это и есть последовательность uops.

Также в историческом экскурсе хотелось бы окончательно развеять мифы, связанные с излишне упрощенной формулировкой, согласно которой ALU у Pentium 4 работает на «удвоенной частоте». Это и так… и не так. Однако для начала взглянем на условную блок-схему процессора Pentium 4 (уже Prescott):

Легко заметить, что ALU состоит из нескольких частей: в нем присутствуют блоки Load / Store, Complex Instructions, и Simple Instructions. Так вот: с удвоенной скоростью (0,5 такта на операцию) обрабатываются лишь те инструкции, что поддерживаются исполняющими блоками Simple Instructions. Блок ALU Complex Instructions, исполняющий команды, отнесенные к сложным — наоборот, может тратить до четырех тактов на исполнение одной инструкции.

Вот, собственно, и все, что хотелось бы напомнить относительно внутреннего устройства процессоров сконструированных на базе архитектуры NetBurst. Ну а теперь перейдем к нововведениям в самом свежем NetBurst-ядре — Prescott.

Увеличение длины конвейера

Вряд ли это изменение можно назвать усовершенствованием — ведь общеизвестно, что чем длиннее конвейер, тем бо льшие накладные расходы вызывает ошибка механизма предсказания ветвлений, и, соответственно, уменьшается средняя скорость выполнения программ. Однако, видимо, другого способа увеличить разгонный потенциал ядра, инженеры Intel найти не смогли. Пришлось прибегнуть к непопулярному, но проверенному. Итог? Конвейер Prescott увеличен на 11 стадий, соответственно, общее их количество равняется 31. Честно говоря, мы намеренно вынесли эту «приятную новость» в самое начало: фактически, описание всех последующих нововведений можно условно назвать «а вот теперь мы вам расскажем, как инженеры Intel боролись с последствиями одного-единственного изменения, чтобы оно окончательно не угробило производительность»:).

Усовершенствования в механизме предсказания ветвлений

В основном, тонкий тюнинг коснулся механизма предсказания переходов при работе с циклами. Так, если ранее по умолчанию обратные переходы считались циклом, то теперь анализируется длина перехода, и исходя из нее механизм пытается предсказать: цикл это, или нет. Также было обнаружено, что для ветвей с определенными типами условных переходов, независимо от их направления и расстояния, использование стандартного механизма предсказания ветвлений чаще всего неактуально — соответственно, теперь в этих случаях он не используется. Однако кроме теоретических изысканий, инженеры Intel не побрезговали и голой эмпирикой т.е. просто-напросто отслеживанием эффективности работы механизма предсказания ветвлений на примере конкретных алгоритмов. С этой целью было исследовано количество ошибок механизма предсказания ветвлений (mispredictions) на примерах из теста SPECint_base2000, после чего по факту были внесены изменения в алгоритм с целью их уменьшения. В документации приводятся следующие данные (количество ошибок на 100 инструкций):

Подтест SPECint_base2000 Northwood (130 nm) Prescott (90 nm)
164.gzip 1.03 1.01
175.vpr 1.32 1.21
176.gcc 0.85 0.70
181.mcf 1.35 1.22
186.crafty 0.72 0.69
197.parser 1.06 0.87
252.eon 0.44 0.39
253.perlbmk 0.62 0.28
254.gap 0.33 0.24
255.vortex 0.08 0.09
256.bzip2 1.19 1.12
300.twolf 1.32 1.23

Ускорение целочисленной арифметики и логики (ALU)

В ALU был добавлен специализированный блок для исполнения инструкций shift и rotate, что позволяет теперь исполнять данные операции на «быстром» (двухскоростном) ALU, в отличие от ядра Northwood, где они исполнялись в блоке ALU Complex Instructions, и требовали бо льшего количества тактов. Кроме того, ускорена операция целочисленного умножения (integer multiply), ранее исполнявшаяся в блоке FPU. В новом ядре для этого выделен отдельный блок.

Также есть информация о присутствии некоторого количества мелких усовершенствований, позволяющих увеличить скорость обработки инструкций FPU (и MMX). Впрочем, ее мы лучше проверим в практической части — при анализе результатов тестов.

Подсистема памяти

Разумеется, одним из основных плюсов нового ядра являются увеличенные размеры L1-кэша данных (в 2 раза т.е. до 16 килобайт) и кэша второго уровня (также в 2 раза т.е. до 1 мегабайта). Однако есть и еще одна интересная особенность: в ядро введена специальная дополнительная логика, обнаруживающая page faults в инструкциях software prefetch. Благодаря этому нововведению, инструкции software prefetch теперь имеют возможность осуществлять не только предвыборку данных, но и предвыборку page table entries т.е., другими словами, prefetch умеет не останавливаться на загруженной странице, но еще и обновлять страницы памяти в DTLB. Разбирающиеся в вопросе наверняка заметят на этом примере, что Intel внимательно следит за отзывами программистов, пусть даже и не кается прилюдно по поводу каждого обнаруженного ими негативного фактора, влияющего на производительность.

Новые инструкции (SSE3)

Кроме всего прочего, в Prescott добавлена поддержка 13 новых инструкций. Назван этот набор, по устоявшейся традиции, SSE3. В их числе присутствуют команды преобразования данных (x87 to integer), работы с комплексной арифметикой, кодирования видео (правда, всего одна), новые команды, предназначенные для обработки графической информации (массивов вершин), а также две инструкции, предназначенные для синхронизации потоков (явно последствия появления Hyper-Threading). Впрочем, о SSE3 мы в скором времени выпустим отдельную статью, поэтому рассматривать возможности данного набора в этом материале воздержимся, чтобы не портить излишней популяризацией серьезную и интересную тему.

Ну а теперь, пожалуй, довольно с нас теории и спецификаций. Попытаемся, как говорилось в одном известном анекдоте, «вместе со всем этим взлететь»:). Тестирование

Конфигурации стендов и ПО

Тестовый стенд

  • Процессоры:
    • AMD Athlon 64 3400+ (2200 МГц), Socket 754
    • Intel Pentium 4 3,2 ГГц «Prescott» (FSB 800/HT), Socket 478
    • Intel Pentium 4 2,8A ГГц «Prescott» (FSB 533/нет HT), Socket 478
    • Intel Pentium 4 3,4 ГГц «Northwood» (FSB 800/HT), Socket 478
    • Intel Pentium 4 3,2 ГГц «Northwood» (FSB 800/HT), Socket 478
  • Материнские платы:
    • ABIT KV8-MAX3 (версия BIOS 17) на чипсете VIA K8T800
    • ASUS P4C800 Deluxe (версия BIOS 1014) на чипсете Intel 875P
    • Albatron PX875P Pro (версия BIOS R1.00) на чипсете Intel 875P
  • Память:
    • 2x512 МБ PC3200 DDR SDRAM DIMM TwinMOS (тайминги 2-2-2-5)
  • Видеокарта: Manli ATI Radeon 9800Pro 256 МБ
  • Жесткий диск: Western Digital WD360 (SATA), 10000 об/мин



Pentium 4 2,8A ГГц «Prescott»
Единственный Prescott с частотой FSB 533 МГц
и без поддержки Hyper-Threading



Pentium 4 3,4 ГГц «Northwood»
Просто еще один Northwood…

Системное ПО и драйверы устройств

  • Windows XP Professional SP1
  • DirectX 9.0b
  • Intel Chipset Installation Utility 5.0.2.1003
  • VIA Hyperion 4.51
  • VIA SATA Driver 2.10a
  • Silicon Image Driver 1.1.0.52
  • ATI Catalyst 3.9
Плата ABIT KV8-MAX3 ASUS P4C800 Deluxe Albatron PX875P Pro
Чипсет VIA K8T800 (K8T800 + VT8237) Intel 875 (RG82004MC + FW82801ЕB) Intel 875 (RG82875 + FW82801ЕB)
Поддержка процессоров Socket 754, AMD Athlon 64 Socket 478, Intel Pentium 4, Intel Celeron
Разъемы памяти 3 DDR 4 DDR 4 DDR
Слоты расширения AGP/ 5 PCI AGP Pro/ 5 PCI AGP/ 5 PCI
Порты ввода/вывода 1 FDD, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2 1 FDD, 2 COM, 1 LPT, 2 PS/2
USB 4 USB 2.0 + 2 разъема по 2 USB 2.0 2 USB 2.0 + 3 разъема по 2 USB 2.0
FireWire 1 порт + 2 разъема на 2 порта (планка в комплекте), Texas Instruments TSB43AB23 1 порт + 1 разъем на 1 порт (нет планки в комплекте), VIA VT6307 —
Интегрированный в чипсет ATA-контроллер ATA133 + SATA RAID (0, 1) ATA100 + SATA ATA100 + SATA
Внешний ATA-контроллер Silicon Image Sil3114CT176 (SATA RAID 0, 1, 0+1, Spare) Promise PDC20378 (ATA133+SATA RAID 0, 1, 0+1) —
Звук AC"97-кодек Avance Logic ALC658 AC"97-кодек Analog Devices AD1985 AC"97-кодек Avance Logic ALC655
Сетевой контроллер 3Com Marvell 940-MV00 (Gigabit Ethernet) 3Com Marvell 920-MV00 (Fast Ethernet)
I/O-контроллер Winbond W83627HF-AW Winbond W83627THF-A Winbond W83627THF
BIOS 4 Мбит Award BIOS v6.00PG 4 Мбит AMI BIOS v2.51 3 Мбит Phoenix AwardBIOS v6.00
Форм-фактор, размеры ATX, 30,5x24,5 см ATX, 30,5x24,5 см ATX, 30,5x24,5 см
Средняя текущая цена (количество предложений) Н/Д(0) Н/Д(0) Н/Д(0)

В завершение описания, хотелось бы разъяснить алгоритм подбора участников тестирования. С одной стороны, полностью исключить из тестов процессоры AMD было бы неправильно, ведь эта платформа — основной конкурент Intel, как сейчас, так и в обозримом будущем. С другой стороны — совмещать в одной статье сравнение двух поколений Pentium 4 с процессорами другого производителя, означало бы не сравнить толком ни то, ни другое. Поэтому мы решили в первом материале, посвященном Prescott, пойти на определенный компрормисс: во-первых, полностью исключить всевозможные «экстремальные» варианты в виде Pentium 4 eXtreme Edition и Athlon 64 FX, во-вторых же, взять в качестве представителя альтернативной платформы только один, но быстрый из обычных десктопных процессоров AMD: Athlon 64 3400+.

Да и то, по большому счету, его результаты здесь приводятся лишь в качестве опции. В этом материале нас более всего интересует сравнение нового ядра Intel со старым. Если кто-то желает получить одновременно информацию о том, как производительность Prescott соотносится с ближайшим конкурентом — что ж, она представлена на диаграммах. Комментарии? Пожалуй, они просто излишни. Вы сами в этом убедитесь. Зная, какова производительность Prescott и Northwood, работающих на одинаковой частоте, и то, как соотносятся производительность Northwood и топовых процессоров AMD (а этот вопрос мы уже неоднократно освещали) — вы знаете вполне достаточно для того, чтобы самостоятельного сделать все остальные выводы.

Кроме того, хотелось бы разъяснить наличие на диаграммах двух столбиков для Prescott 3,2 ГГц. Дело просто в том, что мы решили… подстраховаться. Всем известно, что с выходом процессора на другом ядре, среди производителей системных плат сразу же начинается суматоха с обновлением BIOS, всяческих microcode update, и прочего «железно-ориентированного» ПО. Нам показалось логичным использовать такой ресурс нашей тестовой лаборатории как «официально Prescott-ready» системные платы максимально полно, чтобы уберечься от возможных последствий некорректной работы конкретной модели. Впрочем, как вы увидите далее, опасения оказались напрасными: в большинстве случаев новый процессор вел себя на обеих платах совершенно одинаково.

Все характеристики Prescott 2,8A ГГц программа
CPU-Z определяет вполне корректно:
как наличие SSE3, так и шину 533 МГц

Разумеется, не ошиблась она и в случае с
Prescott 3,2E ГГц

Низкоуровневые тесты в CPU RightMark

Для начала, мы решили проверить функционирование нового ядра в двух режимах — традиционно самом лучшем для процессоров Pentium 4 и самом худшем: SSE/SSE2 и MMX/FPU. Начнем с вычислительного блока (Math Solving).

Результаты неутешительные. Новое ядро медленнее старого, более того — в режиме MMX/FPU его отставание даже больше, чем при использовании SSE/SSE2. Делаем первый вывод: если что-то в FPU и «подкручивали», то явно в CPU RightMark используются другие команды. Ну а что у нас с рендерингом?

Во-первых, рассмотрим варианты работы модуля рендеринга в однопоточном и двухпоточном режимах с максимальной производительностью (SSE/SSE2). Картина достаточно интересная: если используется один поток — преимущество Prescott минимально, а больший по частоте Northwood его легко обгоняет. Однако стоит нам задействовать Hyper-Threading, как Prescott тут же резко вырывается вперед, причем настолько, что обгоняет всех других участников. Возникает впечатление, что некая работа над ядром в плане улучшения обработки параллельно выполняющихся потоков, была проведена, и заключалась она не только в расширении набора команд. Посмотрим теперь, как себя ведут те же процессоры в режиме MMX/FPU.

Абсолютно аналогичная картина. Причем если сопоставить ее с предыдущей — хорошо видно, что тщательность анализа себя оправдала: если бы, к примеру, мы ограничились рассмотрением лучшего (двухпотокового) результата, можно было бы ошибочно сделать вывод о том, что ядро Prescott быстрее в плане исполнения инструкций, причем даже в режиме MMX/FPU. Сейчас же хорошо видно, что быстродействие возросло исключительно благодаря оптимизации использования ресурсов виртуальных CPU.

Тесты в реальных приложениях

Перед тем как начать рассмотрение результатов тестов в реальных приложениях, сделаем небольшое вводное разъяснение. Дело в том, что процессор Pentium 4 на ядре Prescott с частотой 3,4 ГГц, к сожалению, до сих пор для нас недоступен, поэтому то, что вы видите на диаграммах под названием "Virtual" Prescott 3,4 ГГц — это не более чем аппроксимация результатов Prescott 3,2 ГГц, рассчитанная исходя из идеальных условий роста производительности пропорционально частоте. Кто-то может заметить, что это слишком топорный подход. Дескать, намного корректнее было бы, к примеру, разогнать имеющийся Prescott 3,2 ГГц с помощью выставления большей частоты FSB, или хотя бы выстроить кривую аппроксимации по трем точкам: Prescott 2,8 ГГц -> 3,0 ГГц -> 3,2 ГГц. Разумеется, так было бы корректнее. Однако «на всякого мудреца довольно простоты», и… просто обратите внимание на то, какие поправки вносит в общую картину наличие на диаграммах даже «идеального» Prescott 3,4 ГГц (а реальный будет либо таким же, либо медленнее — третьего не дано). Рискуя навлечь на себя немилось преждевременным разглашением тайны, скажем сразу: да практически никаких. Где ядро Prescott выигрывает — там это и так видно. А где проигрывает — не помогают ему даже идеализированные 3,4 ГГц…

Работа с графикой

Самые предсказуемые результаты у Northwood 3,4 ГГц (немного лучше, чем у Northwood 3,2 ГГц) и Prescott 2.8 ГГц (отсутствие поддержки Hyper-Threading сразу же выбросило его в аутсайдеры). Prescott 3,2 ГГц пытается быть хотя бы наравне с одночастотным Northwood, но у него не получается даже это. Ну а наш «виртуальный Prescott 3,4 ГГц», в свою очередь, не смог обогнать реальный Northwood 3,4 ГГц — что тоже естественно. C другой стороны, можно заметить, что все процессоры кроме Prescott 2,8 ГГц почти равны. Вряд ли это будет аргументом для апгрейда на Prescott, но хотя бы не станет существенным доводом против его покупки для тех, кто задумывается над приобретением новой системы.

В Lightwave ситуация аналогичная, только Prescott отстает еще больше. Здесь уместно будет вспомнить, что Lightwave (судя по сравнению результатов 6-й ветки с 7-й), затачивался под Pentium 4 очень тщательно и скрупулезно. Можно предположить, что именно поэтому он оказался так чувствителен к малейшим архитектурным изменениям в ядре. Также отметим, что впервые протестированный нами в этой программе Athlon 64 3400+ демонстрирует пусть и не лучший, но вполне приличный результат.

Для Photoshop в современных процессорных архитектурах, видимо, самым главным параметром является размер кэша. Мы уже неоднократно обращали внимание на то, что эта программа весьма «кэшелюбива», и результаты Prescott это подтверждают.

Кодирование медиаданных

Вообще, поскольку мы тестируем новую (или существенно модифицированную, если вам так больше нравится) архитектуру — то для нас любое приложение может стать маленьким открытием. По сути, сейчас количество даже важнее качества, потому что нам просто необходимо набрать как можно больше данных о том, как старые (еще не оптимизированные под Prescott) программы ведут себя с новым процессорным ядром. Вот, тот же LAME: оказывается, для него Prescott по всем статьям новый процессор — результаты совершенно не ложатся на то, что мы ранее знали про Northwood. Правда, они стали хуже. Что ж, бывает. Продолжаем коллекционировать…

Ogg Encoder демонстрирует практически идентичную картину: Prescott существенно проигрывает всем остальным процессорам без исключения, несмотря на удвоенный кэш данных первого уровня и L2. Остается предположить, что виновато увеличение длины конвейера при оставшемся неизменным объеме Trace Caсhe.

Даже тяготеющий к архитектуре NetBurst кодек DivX невзлюбил новое ядро. Не то что бы очень сильно, но все-таки оно ему не понравилось. Впрочем, тут есть определенная надежда на SSE3 — разработчики DivX просто обожают различные оптимизации (во всяком случае, судя по анонсам), поэтому весьма велик шанс, что единственная и неповторимая инструкция, предназначенная для ускорения кодирования видео, найдет свое место в будущем релизе данного кодека. Однако это все в будущем, а пока — увы…

А вот результаты XviD мы опять не приводим по причине совершенно невообразимого «фортеля», который в очередной раз выкинула эта нежно нами любимая программа. Дело в том, что прирост производительности Prescott по отношению к Northwood в ней составил… 232% ! Такие тесты, пардон, мы использовать просто отказываемся. Похоже, что их результаты могут зависеть вообще от чего угодно…

Ну, вот и первая победа. Впрочем, возвращаясь к теме о предпочтениях различного ПО, можно заметить, что Windows Media Video 9 весьма неплохо поддерживает Hyper-Threading, а данные низкоуровневых тестов показали, что эффективность задействования виртуальных CPU в случае с новым ядром возрастает. Похоже, что это первый положительный результат, достигнутый за счет качественного, а не количественного изменения в Prescott. Во всех предыдущих случаях он «выезжал» исключительно за счет большого объема кэша…

Очень, очень интересный результат. Mainconcept MPEG Encoder, которому мы пеняли за «корявую» работу с Hyper-Threading при кодировании в формат MPEG1 — вполне адекватно работает с виртуальными процессорами, если они эмулируются Prescott, а не Northwood! Впору даже задуматься: быть может, программисты не виноваты, просто «затык» был в процессорном ядре, которое некорректно распараллеливало потоки? Вполне возможно, по крайней мере, глядя на результаты Prescott, понимаешь, что и это предположение имеет право на жизнь. C другой стороны вполне неплохо себя показал Prescott 2,8A ГГц, про Hyper-Threading и слыхом не слыхавший. Забавная ситуация. Пожалуй, мы находимся на пороге интересного открытия: напрашивается предположение, что вся «оптимизация работы Hyper-Threading в Prescott» сводится всего лишь к тому… что этой технологии в Northwood не хватало объема кэша, чтобы развернуться в полную силу!

И снова можно порадоваться за новое ядро: в Mainconcept MPEG Encoder не только пропал «глюк» с кодированием MPEG1, но и преобразование в MPEG2 стало работать существенно быстрее. Имея в виду результаты предыдущих тестов, можно почти однозначно утверждать, что основным виновником торжества является улучшенная работа Hyper-Threading (и не забываем о том, за счет чего она могла стать лучше — если наши предположения верны). Что самое интересное — не понадобились даже специальные команды для управления потоками из набора SSE3, процессор сам отлично разобрался (поддержку SSE3 в данной версии кодировщика предполагать не приходится — она вышла довольно давно).

А вот Canopus ProCoder просто почти ничего не заметил. В принципе, небольшая разница в производительности присутствует, и она даже в пользу Prescott. Но, по сути, это копейки, мелочь. Учитывая «кэшелюбивость» ProCoder, можно даже сказать так: весь большой кэш, судя по всему, ушел на компенсацию других недостатков нового ядра. Он просто вытянул Prescott на ту же высоту, что и Northwood, но, увы — не более.

Архивирование

Традиционно, мы протестировали 7-Zip как со включенной поддержкой многопоточности, так и без нее. Ожидаемый эффект достигнут в этой программе не был: не заметно, чтобы многопоточность на Prescott давала намного больший эффект, чем на Northwood. Да и вообще — особой разницы между старым и новым ядром не видно. Похоже, что мы наблюдаем упомянутый выше эффект: все, что смогли сделать количественные показатели Prescott (объемы кэша L1 Data и L2) — это компенсировать его же удлиненный конвейер.

К слову: один из немногих тестов, где хоть как-то видна разница между платами. В остальном — все та же картина: Prescott и Northwood одинаковой частоты идут рядом, практически не отличаясь по скорости. Пессимисты скажут: «плохо», оптимисты: «могло быть и хуже»:). Мы — просто промолчим…

Игры

Картина во всех трех играх схожая, поэтому особенно расписываться нет нужды: Prescott все же медленнее. Правда, ненамного.

Обобщая результаты

Что ж, если делать какие-то выводы на основании тех тестов, что присутствуют в статье, то ситуация выглядит следующим образом: ядро Prescott в целом медленнее Northwood. Иногда это удается компенсировать бо льшим объемом кэша, вытянув производительность на уровень старого ядра. Ну а если программа особенно чувствительна к объему L2, Prescott даже способен выиграть. Кроме того, несколько улучшилась эффективность Hyper-Threading (но похоже, что причина снова кроется в увеличении объема L2-кэша). Соответственно, если программа умеет использовать обе сильные стороны нового ядра — большой кэш и виртуальную многопроцессорность — то выигрыш получается ощутимым. В целом же, производительность Prescott примерно такая же, как у Northwood, а применительно с старому, неоптимизированному ПО — даже более низкая. Ожидаемой революции, увы, не получилось. С другой стороны… а был ли мальчик? Но об этом — ниже.

Что же касается Prescott 2,8A ГГц с 533-мегагерцевой системной шиной и без поддержки Hyper-Threading, то как раз тут все предельно ясно. Во-первых, для Intel это просто очень хороший способ сделать хотя бы что-то из тех экземпляров, которые в «настоящем Prescott"овском» режиме банально не заработали. Этакий «Celeron среди Prescott"ов» (хотя будет, судя по всему, на базе этого ядра и официальный Celeron). Во-вторых — отсутствие Hyper-Threading скорее всего свидетельствует о принципиальном нежелании Intel видеть HT на устаревшей, низкоскоростной шине. Действительно: единственным представителем 533 МГц FSB + HT так и остался первый процессор с поддержкой этой технологии — Pentium 4 3,06 ГГц. Да и то по вполне понятной, извиняющей его причине: не было еще на тот момент CPU с 800-мегагерцевой шиной.

Таким образом, да простят нам инженеры Intel эту вольность, Pentium 4 2,8A ГГц — это «как бы не Prescott». А просто сравнительно недорогой (другим его выпускать нельзя — не купит ведь никто…), но высокочастотный Pentium 4. И совершенно неважно, на каком он сделан ядре, не в этом суть. Честно говоря, было искушение его в этот материал вообще не включать, но потом мы решили поступить наоборот: дать ему один раз «засветиться», и более к данному чу дному процессору не возвращаться. Из простого сравнения одночастотных ядер Prescott и Northwood понятно, что без Hyper-Threading Prescott 2.8 ГГц даже с Pentium 4 2.8C (800 МГц FSB + HT) по усредненным показателям производительности соперничать не сможет. Версии

Да, именно «версии», а не «выводы». Слишком неоднозначным получился этот материал. Проще было бы ограничиться анализом диаграмм и сделать напрашивающийся, лежащий на поверхности вывод: «если новое не быстрее (а то и медленнее) старого — значит, оно хуже». Списать, так сказать, в расход. Однако самый простой ответ — не всегда самый правильный. Поэтому мы решили коснуться аналитики, и рассмотреть выход Prescott в исторически-рыночной перспективе. Получилось, что ответов на вопрос «в чем для Intel состоит смысл выпуска Pentium 4 на ядре Prescott?» на самом деле несколько, и каждый из них можно логично аргументировать.

Версия первая или Большая ошибка

Почему бы и нет? Жила-была компания Intel, и появилась у нее идея: сделать процессорное ядро, ориентированное не на максимальный КПД (если рассматривать КПД как соотношение производительности к частоте), а на легкую масштабируемость. Дескать, если наши 2000 МГц проигрывают 1000 МГц от конкурента — не беда, догоним частоту до 4 ГГц и оставим всех позади. Между прочим, с чисто инженерной точки зрения, это вполне адекватное решение. Не все ли равно? Пользователя-то (грамотного) все равно интересуют не мегагерцы, а производительность, какая ему разница, за счет чего она достигается? Главное чтобы масштабируемость оказалась именно такой, какую предполагалось достичь. И вот, выясняется, что с масштабируемостью начались большие проблемы. Догнали до 3,4 ГГц, остановились… и пришлось придумывать новое ядро, у которого КПД еще ниже… и неизвестно, какими темпами будет расти у него частота… и так далее. Напомним, что это версия. Рассмотрим ее внимательнее в сопоставлении с реальными фактами.

Факт, свидетельствующий в пользу данной версии — рост частоты Pentium 4 за прошедший 2003 год. Все-таки 200 МГц, да еще и по отношению к такой «частотолюбивой» архитектуре как NetBurst — явно мало. Однако… как общеизвестно, рассматривать какой-то факт в отрыве от других — не очень хорошая практика. Был ли смысл в активном наращивании частоты Pentium 4 в прошлом году? Вроде бы нет… Основной конкурент решал другие вопросы — у него новая архитектура, новое ядро, ему нужно наладить массовое производство процессоров на базе этого ядра, обеспечить им соответствующую обвязку в виде чипсетов, системных плат, программного обеспечения, в конце концов! Поэтому один из вариантов ответа на вопрос «почему практически не росла частота (и производительность) Pentium 4 в 2003 году» звучит просто: не было особого смысла ее наращивать. Ни догонять, ни перегонять — вроде некого. Стало быть, можно особенно не торопиться.

Получить ответ на главный вопрос мы, увы, пока не можем: как будет «гнаться» новое ядро? Пока что, если судить по внешним признакам, фактов, подтверждающих хорошую масштабируемость Prescott — нет. Впрочем, равно как и опровергающих ее. Анонсированы 3,4-гигагерцевые версии как Prescott, так и Northwood. Northwood 3,4 ГГц, наверное, будет последним процессором на этом ядре (хотя, официальных подтверждений этого предположения нет). А то, что Prescott стартовал с 3,4 ГГц, а не с 3,8 или 4,0 тоже легко объяснимо: зачем прыгать через ступеньки? Подводя итог: версия «Большой ошибки», в принципе, имеет право на существование. Но если частота (а еще точнее, — производительность) Prescott будет быстро расти, это однозначно подтвердит ее несостоятельность.

Версия вторая или Переходное ядро

Ни для кого не секрет, что иногда производителю требуется выпустить некое устройство, достаточно ординарное само по себе (в другой ситуации совершенно не заслуживающее звания релизного продукта). Но в том-то и дело, что выпуск данного устройства необходим для продвижения на рынок других, анонсируемых одновременно с ним или чуть позже. Таким был Pentium 4 Willamette, вряд ли достойный звания «хорошего и быстрого процессора», однако явно обозначивший факт перехода одного из самых крупных игроков на процессорном рынке, на новое ядро, и под конец своего существования сменивший «промежуточный» Socket 423 на «долгоиграющий» Socket 478. Что, если аналогичная роль уготована Prescott?

Уже всем известно, что с выходом Grantsdale-P, нас ждет появление еще одного процессорного разъема для Pentium 4 (Socket T / Socket 775 / LGA775), и поначалу устанавливаться в него будут именно CPU на ядре Prescott. Лишь впоследствии Pentium 4 «Tejas» начнет постепенно их замещать. И тут вполне логично задаться вопросом: а насколько быстро будет происходить это замещение? Поскольку мы все равно лишь выдвигаем версии, ограничивать свою фантазию не будем, и предположим, что Intel желает этот процесс максимально ускорить. С помощью чего? Скорее всего — оставив Socket 478 мирно почивать в нижних строчках на диаграммах производительности, и сделав Socket 775 символом обновленной, мощной и скоростной платформы для Pentium 4. Тогда все становится ясно: Prescott нужен для того, чтобы на рынке присутствовал процессор, способный работать как в платах с разъемом Socket 478, так и с новым Socket 775. Tejas же, если наши предположения верны, будет устанавливаться только в Socket 775, и станет, таким образом, могильщиком как для Prescott, так и для устаревшей платформы Socket 478. Логично? Нам кажется, что да. В таком случае, правдоподобно смотрится и следующее предположение: жизнь Prescott’у уготована весьма недолгая…

Версия третья или «Кто с мечом к нам придет…»

Не секрет, что соперничество между двумя основными конкурентами — Intel и AMD, почти всегда строилось на противопоставлении двух основных аргументов. Intel: «наши процессоры — самые быстрые!», AMD: «зато у наших лучше соотношение цены и производительности!». Соперничество давнее, аргументы тоже. Причем, они не изменились даже с выходом процессоров AMD на ядрах K7/K8, — несмотря на то, что у последних с производительностью дела обстоят намного лучше, чем у K6. Ранее Intel не делала исключений из основного своего правила: продавать свои CPU с производительностью, аналогичной процессорам конкурента, немного дороже. Рынок местами очень прост, поэтому причина такого поведения понятна: если их и так покупают — то зачем снижать цену? Опять-таки: хоть участвовать в ценовых войнах Intel и приходилось, но развязывала их всегда AMD, это уже стало традицией. Третья версия базируется на очевидном предположении: а что если на этот раз Intel решила повести себя агрессивнее, чем обычно, и развязать ценовую войну первой?

В списке достоинств нового ядра Prescott числится не только новизна, объемы кэшей, и потенциально хорошая (правда, пока не подтвержденная) масштабируемость, но и… цена! Это сравнительно дешевое в производстве ядро: если при использовании 90-нанометровой технологии будет достигнут показатель выхода годных чипов хотя бы такой же, как у Northwood — то, ничуть не теряя в абсолютных показателях прибыли, Intel сможет продавать свои процессоры за гораздо меньшую цену. Напомним одну очевидную зависимость: такую характеристику CPU как «соотношение цена / производительность», можно улучшать, не только повышая производительность, но и снижая цену. Вообще-то, никто не мешает быстродействие даже понизить (!) — главное, чтобы цена упала еще больше:). Судя по появляющимся в Сети неофициальным анонсам цен на Pentium 4 Prescott, стоить они будут намного дешевле Pentium 4 Northwood. Таким образом, мы можем предположить, что Intel решила осуществить своего рода «обход с флангов»: пока основной конкурент, по старинке, все гонится и гонится за производительностью, ему будет нанесен удар в секторе middle-end систем, где пользователи тщательно анализируют именно такой показатель как price / performance.

Версия четвертая или Тайное оружие

Здесь следует сделать небольшое лирическо-историческое отступление для тех, кто «во времена оные» не очень активно отслеживал разные мелкие нюансы в процессорном секторе. Так, к примеру, можно вспомнить, что сразу после появления первых процессоров с поддержкой Hyper-Threading (а ими были вовсе не Pentium 4 «Northwood» + HT, а Xeon «Prestonia»), многие задались вопросом: «если ядра Prestonia и Northwood настолько похожи, что практически не отличаются по основным характеристикам, но у Prestonia поддержка Hyper-Threading присутствует, а у Northwood ее нет — то не логично ли предположить, что и у Northwood она тоже есть, просто искусственно заблокирована?». Впоследствии это предположение косвенно подтвердилось — анонсом Pentium 4 3,06 ГГц на все том же ядре Northwood, но уже с Hyper-Threading. Более того, самые смелые выдвигали и вовсе крамольную мысль: Hyper-Threading была даже в Willamette!

А теперь вспомним: что у нас в последнее время известно по части новых технологических инициатив Intel. Сразу всплывают два названия: «La Grande» и «Vanderpool». Первое — технология аппаратной защиты приложений от вмешательства извне, которую вкратце можно описать словами «сделать так, чтобы одно ПО не могло вмешиваться в функционирование другого». Впрочем, о La Grande вы можете почитать на нашем сайте . Об Vanderpool информации меньше, но исходя из обрывков доступной на сегодня, можно сделать вывод, что она представляет собой вариацию на тему полной виртуализации PC, включая все без исключения аппаратные ресурсы. Таким образом (самый простой, но и самый эффектный пример), на одном компьютере смогут работать параллельно две операционные системы, причем одна из них может быть даже перезагружена — но это совершенно не отразится на работе другой.

Так вот: есть очень большие подозрения, что и La Grande и Vanderpool в ядре Prescott уже реализованы, но (как было ранее с Hyper-Threading) пока не активированы. Если это предположение истинно, то многое относительно самого ядра становится понятным. В частности — то, почему оно такое большое, почему так долго разрабатывалось, но, несмотря на это, не выирывает в скорости у предыдущего. Если исходить из гипотезы «Тайного оружия», можно предположить, что основные ресурсы команды разработчиков были направлены вовсе не на достижение быстродействия, а на отладку новых функций. Частично данная версия перекликается со второй — так или иначе, но мы имеем дело с переходным ядром. Соответственно, быть совершенным оно вовсе не обязано, ибо не в том его основное предназначение. Между прочим, также удачно вторую и четвертую версии дополняет третья: низкая цена в данном случае является именно той конфеткой, что подсластит для конечного пользователя пилюлю «переходности».

Подводя итоги

Мы не зря назвали эту статью «полшага вперед». Prescott получился более сложным и неоднозначным, чем ожидаемый «Northwood с увеличенным объемом кэша и более высокой частотой» (как многие его воспринимали). Разумеется, можно обвинить производителя в том, что прирост скорости в среднем близок к нулю (а местами и отрицательный), в очередной чехарде с поддержкой процессоров на базе нового ядра системными платами… И, между прочим, вполне справедливо это сделать. Это, в конце концов, не наши проблемы — а между тем, именно мы с ними и столкнемся. Поэтому просто поставим в конце статьи «жирное троеточие». На стоп-кадре видно только начало шага: нога, зависшая в воздухе, или, если угодно, лайнер на взлете. Что нас ждет дальше? Благоприятным ли окажется «приземление» (Tejas?..) Пока можно только догадываться.

integrated heat spreader ) кристаллом, установленную на плату-переходник (англ. interposer ) с 423 штырьковыми контактами (размеры корпуса - 53,3×53,3 мм) . Между контактами на обратной стороне платы-переходника установлены SMD -элементы.

Поздние процессоры на ядре Willamette, процессоры Pentium 4 на ядре Northwood, часть процессоров Pentium 4 Extreme Edition на ядре Gallatin и ранние процессоры на ядре Prescott с по 2005 год выпускались в корпусе типа FC-mPGA2 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 478 штырьковыми контактами, а также SMD-элементами, с обратной (размеры корпуса - 35×35 мм).

Часть процессоров Pentium 4 Extreme Edition на ядре Gallatin, поздние процессоры на ядре Prescott, процессоры на ядрах Prescott-2M и Cedar Mill c весны по осень 2007 года выпускались в корпусе типа FC-LGA4 , представлявшем собой подложку из органического материала с закрытым теплораспределительной крышкой кристаллом с лицевой стороны и 775 контактными площадками с обратной (размеры корпуса - 37,5×37,5 мм). Как и в двух предыдущих типах корпусов, между контактами установлены SMD-элементы.

Часть мобильных процессоров на ядре Northwood выпускалась в корпусе типа FC-mPGA . Основным отличием этого типа корпуса от FC-mPGA2 является отсутствие теплораспределительной крышки.

Маркировка процессоров, имеющих теплораспределительную крышку, нанесена на её поверхность, а у остальных процессоров маркировка нанесена на две наклейки, расположенные на подложке с двух сторон от кристалла.

Особенности архитектуры

Конвейер процессора на ядре Northwood

Конвейер состоит из 20 стадий:

  • TC, NI (1, 2) - поиск микроопераций, на которые указывает последняя выполненная инструкция.
  • TR, F (3, 4) - выборка микроопераций.
  • D (5) - перемещение микроопераций.
  • AR (6-8) - резервирование ресурсов процессора, переименование регистров.
  • Q (9) - постановка микроопераций в очереди.
  • S (10-12) - изменение порядка исполнения.
  • D (13-14) - подготовка к исполнению, выборка операндов.
  • R (15-16) - чтение операндов из регистрового файла.
  • E (17) - исполнение.
  • F (18) - вычисление флагов.
  • BC, D (19, 20) - проверка корректности результата.

Архитектура NetBurst (рабочее наименование - P68 ), лежащая в основе процессоров Pentium 4, разрабатывалась компанией Intel, в первую очередь, с целью достижения высоких тактовых частот процессоров. NetBurst не является развитием архитектуры , использовавшейся в процессорах Pentium III , а представляет собой принципиально новую по сравнению с предшественниками архитектуру. Характерными особенностями архитектуры NetBurst являются гиперконвейеризация и применение кэша последовательностей микроопераций вместо традиционного кэша инструкций. АЛУ процессоров архитектуры NetBurst также имеет существенные отличия от АЛУ процессоров других архитектур.

Основными недостатками длинного конвейера являются уменьшение удельной производительности по сравнению с коротким конвейером (за один такт выполняется меньшее количество инструкций), а также серьёзные потери производительности при некорректном выполнении инструкций (например, при неверно предсказанном условном переходе или кэш-промахе).

Для минимизации влияния неверно предсказанных переходов, в процессорах архитектуры NetBurst используются увеличенный по сравнению с предшественниками буфер предсказания ветвлений (англ. branch target buffer ) и новый алгоритм предсказания ветвлений, что позволило достичь высокой точности предсказания (около 94 %) в процессорах на ядре Willamette. В последующих ядрах механизм предсказания ветвлений подвергался модернизациям, повышавшим точность предсказания.

Кэш последовательностей микроопераций (англ. Execution Trace Cache )

Процессоры архитектуры NetBurst, как и большинство современных x86 -совместимых процессоров, являются CISC -процессорами с RISC -ядром: перед исполнением сложные инструкции x86 преобразуются в более простой набор внутренних инструкций (микроопераций), что позволяет повысить скорость обработки команд. Однако, вследствие того, что инструкции x86 имеют переменную длину и не имеют фиксированного формата, их декодирование связано с существенными временными затратами.

В связи с этим, при разработке архитектуры NetBurst было принято решение отказаться от традиционной кэш-памяти инструкций первого уровня, хранящей команды x86, в пользу кэша последовательностей микроопераций, хранящего последовательности микроопераций в соответствии с предполагаемым порядком их исполнения. Такая организация кэш-памяти позволила также снизить временные затраты на выполнение условных переходов и на выборку инструкций.

АЛУ и механизм ускоренного выполнения целочисленных операций (англ. Rapid Execution Engine )

Так как основной целью разработки архитектуры NetBurst было повышение производительности за счёт достижения высоких тактовых частот, возникла необходимость увеличения темпа выполнения основных целочисленных операций. Для достижения этой цели АЛУ процессоров архитектуры NetBurst разделено на несколько блоков: «медленное АЛУ», способное выполнять большое количество целочисленных операций, и два «быстрых АЛУ», выполняющих только простейшие целочисленные операции (например, сложение). Выполнение операций на «быстрых АЛУ» происходит последовательно в три этапа: сначала вычисляются младшие разряды результата, затем старшие, после чего могут быть получены флаги.

«Быстрые АЛУ», обслуживающие их планировщики, а также регистровый файл синхронизируются по половине такта процессора, таким образом, эффективная частота их работы вдвое превышает частоту ядра. Эти блоки образуют механизм ускоренного выполнения целочисленных операций.

В процессорах на ядрах Willamette и Northwood «быстрые АЛУ» способны выполнять лишь те операции, которые обрабатывают операнды в направлении от младших разрядов к старшим. При этом результат вычисления младших разрядов может быть получен через половину такта. Таким образом, эффективная задержка составляет половину такта. В процессорах на ядрах Willamette и Northwood отсутствуют блоки целочисленного умножения и сдвига, а данные операции выполняются другими блоками (в частности, блоком инструкций MMX).

В процессорах на ядрах Prescott и Cedar Mill присутствует блок целочисленного умножения, а «быстрые АЛУ» способны выполнять операции сдвига. Эффективная задержка операций, исполняемых «быстрыми АЛУ», возросла по сравнению с процессорами на ядре Northwood и составляет один такт.

Система повторного исполнения микроопераций (англ. Replay System )

Основной задачей планировщиков микроопераций является определение готовности микроопераций к исполнению и передача их на конвейер. Вследствие большого числа стадий конвейера, планировщики вынуждены отправлять микрооперации на исполнительные блоки до того, как завершится выполнение предыдущих микроопераций. Это обеспечивает оптимальную загрузку исполнительных блоков процессора и позволяет избежать потери производительности в том случае, если данные, необходимые для выполнения микрооперации, находятся в кэш-памяти первого уровня, регистровом файле, или могут быть переданы минуя регистровый файл.

При определении готовности новых микроопераций к передаче на исполнительные блоки, планировщику необходимо определить время выполнения тех предыдущих микроопераций, результатом которых являются данные, необходимые для выполнения новых микроопераций. В том случае, если время выполнения заранее не определено, планировщик для его определения использует наименьшее время её выполнения.

Если оценка времени, необходимого для получения данных, оказалась верной, микрооперация выполняется успешно. В том случае, если данные не были получены вовремя, проверка корректности результата заканчивается неудачей. При этом микрооперация, результат выполнения которой оказался некорректен, ставится в специальную очередь (англ. replay queue ), а затем вновь направляется планировщиком на исполнение.

Несмотря на то, что повторное исполнение микроопераций приводит к значительным потерям производительности, применение данного механизма позволяет в случае ошибочного исполнения микроопераций избежать останова и сброса конвейера, который приводил бы к более серьёзным потерям.

Модели

Процессор с кодовым именем Willamette впервые появился в официальных планах компании Intel в октябре 1998 года , хотя его разработка и началась вскоре после завершения работ над процессором Pentium Pro , вышедшим в конце 1995 года , а название «Willamette» упоминалось в анонсах 1996 года . Необходимость в проектировании нового процессора архитектуры IA-32 появилась в связи со сложностями, возникшими при разработке 64-битного процессора Merced , которому в соответствии с планами компании Intel была отведена роль преемника процессоров архитектуры : разработка, осуществлявшаяся с 1994 года , сильно затянулась, а производительность Merced при выполнении инструкций x86 оказалась неудовлетворительной по сравнению с процессорами, для замены которых он предназначался .

Предполагалось, что Willamette выйдет во второй половине 1998 года , однако, в результате многочисленных задержек анонс был перенесён на конец 2000 года . В феврале 2000 года на форуме разработчиков Intel (IDF Spring 2000) был продемонстрирован компьютер, основой которого служил инженерный образец процессора Willamette, получившего наименование «Pentium 4», работающий на частоте 1,5 ГГц .

Первые серийные процессоры Pentium 4 на ядре , анонсированные 20 ноября 2000 года, производились по 180 нм технологии. Дальнейшим развитием семейства Pentium 4 стали процессоры на ядре , производившиеся по 130 нм технологии. 2 февраля 2004 года были представлены первые процессоры на ядре (90 нм), а последним ядром, использовавшимся в процессорах Pentium 4 стало ядро (65 нм). На базе ядер Northwood и Prescott выпускались также мобильные процессоры Pentium 4 и Pentium 4-M, представлявшие собой Pentium 4 с пониженным энергопотреблением. На базе всех ядер, перечисленных выше, выпускались также процессоры Celeron , предназначенные для бюджетных компьютеров, представлявшие собой Pentium 4 с уменьшенным объёмом кэш-памяти второго уровня и пониженной частотой системной шины .

Ниже представлены даты анонса различных моделей процессоров Pentium 4, а также их стоимость на момент анонса.

Мобильные процессоры Pentium 4
Процессор Pentium 4-M Mobile Pentium 4
Тактовая частота, ГГц 1,6 1,7 1,4 1,5 1,8 1,9 2 2,2 2,4 2,5 2,6 2,4 2,666 2,8 3,066 3,2 3,333
Анонсирован 4 марта 23 апреля 24 июня 16 сентября 14 января 16 апреля 11 июня 23 сентября 28 сентября
2002 года 2003 года 2004 года
Цена, $ 392 496 198 268 637 431 637 562 562 562 562 185 220 275 417 653 262

Pentium 4

Willamette

Pentium 4 1800 на ядре Willamette (FC-mPGA2)

Ещё до выхода первых Pentium 4 предполагалось, что и процессоры на ядре Willamette, и разъём Socket 423 будут присутствовать на рынке лишь до середины 2001 года, после чего будут заменены на процессоры на ядре Northwood и разъём Socket 478 . Однако, в связи с проблемами при внедрении 130 нм технологии, лучшим по сравнению с ожидавшимся процентом выхода годных кристаллов процессоров на ядре Willamette, а также необходимостью продажи уже выпущенных процессоров, анонс процессоров на ядре Northwood был отложен до 2002 года, а 27 августа 2001 года были представлены процессоры Pentium 4 в корпусе типа FC-mPGA2 (Socket 478), в основе которых по-прежнему лежало ядро Willamette .

Процессоры Pentium 4 на ядре Willamette работали на тактовой частоте 1,3-2 ГГц с частотой системной шины 400 МГц, напряжение ядра составляло 1,7-1,75 В в зависимости от модели, а максимальное тепловыделение - 100 Вт на частоте 2 ГГц .

Northwood

Intel Pentium 4 1800 на ядре Northwood

14 ноября 2002 года был представлен процессор Pentium 4 3066 МГц, поддерживающий технологию виртуальной многоядерности - Hyper-threading . Этот процессор оказался единственным процессором на ядре Northwood с частотой системной шины 533 МГц, обладавшим поддержкой технологии Hyper-threading. В дальнейшем эту технологию поддерживали все процессоры с частотой системной шины 800 МГц (2,4-3,4 ГГц) .

Характерной особенностью процессоров Pentium 4 на ядре Northwood была невозможность продолжительной работы при повышенном напряжении ядра (повышение напряжения ядра при разгоне является распространённым приёмом, позволяющим повысить стабильность работы на повышенных частотах ). Повышение напряжения ядра до 1,7 В приводило к быстрому выходу процессора из строя, несмотря на то, что температура кристалла при этом оставалась невысокой. Это явление, названное «синдромом внезапной смерти Northwood» (англ. sudden Northwood death syndrome ), серьёзно ограничивало разгон Pentium 4 на ядре Northwood .

Prescott

Pentium 4 2800E на ядре Prescott (Socket 478)

Pentium 4 3400 на ядре Prescott (LGA 775)

Процессоры Pentium 4 на ядре Prescott получили поддержку нового дополнительного набора команд - SSE3 , а также поддержку технологии EM64T (в ранних процессорах поддержка 64-битных расширений была отключена). Кроме того, была оптимизирована технология Hyper-threading (в частности, в набор SSE3 вошли инструкции, предназначенные для синхронизации потоков) .

В результате изменений, внесённых в архитектуру NetBurst, производительность процессоров на ядре Prescott изменилась по сравнению с процессорами на ядре Northwood, имеющими равную частоту, следующим образом: в однопоточных приложениях, использующих инструкции x87 , MMX , SSE и SSE2 , процессоры на ядре Prescott оказывались медленнее, чем предшественники, а в приложениях, использующих многопоточность или чувствительных к объёму кэш-памяти второго уровня, опережали их .

Cedar Mill

Pentium 4 641 на ядре Cedar Mill

Процессоры Pentium 4 на ядре Cedar Mill выпускались до 8 августа 2007 года , когда компания Intel объявила о снятии с производства всех процессоров архитектуры NetBurst.

Отменённые процессоры

Предполагалось, что в конце 2004 - начале 2005 годов на смену ядру Prescott в настольных процессорах Pentium 4 придёт новое ядро Tejas. Процессоры на ядре Tejas должны были выпускаться по 90 нм технологии, работать на частоте от 4,4 ГГц с частотой системной шины 1066 МГц, иметь увеличенный до 24 Кбайт кэш первого уровня и улучшенную поддержку технологии Hyper-threading . В конце 2005 года процессоры на ядре Tejas должны были быть переведены на 65 нм технологию производства и достичь частоты 9,2 ГГц . В перспективе тактовая частота процессоров архитектуры NetBurst должна была превысить отметку в 10 ГГц, однако сроки анонса Tejas постоянно переносились, процессоры на ядре Prescott не смогли достичь частоты 4 ГГц из-за проблем с тепловыделением, в связи с чем в начале 2004 года появилась информация об отмене выпуска процессоров на ядре Tejas , а 7 мая 2004 года компания Intel официально объявила о прекращении работы как над ядром Tejas, так и над перспективными разработками, основанными на архитектуре NetBurst .

Pentium 4 Extreme Edition

Первые процессоры Pentium 4 Extreme Edition (Pentium 4 «EE» или «XE»), предназначенные для энтузиастов , были представлены компанией Intel 3 ноября 2003 года. В их основе лежало ядро Gallatin, использовавшееся в серверных процессорах Xeon и представлявшее собой ядро Northwood ревизии M0 с кэш-памятью третьего уровня объёмом 2 Мбайт . Площадь кристалла таких процессоров составляла 237 мм².

Процессоры Pentium 4 EE на ядре Gallatin работали на частоте 3,2-3,466 ГГц, имели частоту системной шины 1066 МГц для модели, работающей на 3,466 ГГц, и 800 МГц для остальных моделей (3,2 и 3,4 ГГц). Напряжение ядра составляло 1,4-1,55 В, а максимальное тепловыделение - 125,59 Вт на частоте 3,466 ГГц. Изначально процессоры Pentium 4 EE ядре Gallatin выпускались в корпусе типа FC-mPGA2 (Socket 478), а затем - в корпусе типа FC-LGA4 (LGA775).

21 февраля 2005 года компанией Intel был представлен процессор Pentium 4 EE на ядре Prescott 2M. Он выпускался в корпусе типа FC-LGA4, предназначался для установки в системные платы с разъёмом LGA775 и работал на частоте 3,733 ГГц. Частота системной шины составляла 1066 МГц, напряжение питания - 1,4 В, максимальное тепловыделение - 148,16 Вт.

Дальнейшим развитием семейства Extreme Edition стали двухъядерные процессоры Pentium XE .

Pentium 4-M и Mobile Pentium 4

Мобильные процессоры Pentium 4-M представляли собой Pentium 4 на ядре Northwood, имеющие пониженное напряжение питания и тепловыделение, а также поддерживающие энергосберегающую технологию Intel SpeedStep . Максимально допустимая температура корпуса была повышена по сравнению с процессорами для настольных компьютеров и составляла 100 °C (у настольных процессоров на ядре Northwood - от 68 до 75 °C), что было связано с условиями работы в ноутбуке (небольшое воздушное пространство и размеры радиатора, менее сильный воздушный поток).

Все процессоры Pentium 4-M работали с частотой системной шины 400 МГц. Напряжение ядра процессоров Pentium 4-M составляло 1,3 В, максимальное тепловыделение - 48,78 Вт на частоте 2,666 ГГц, типичное - 35 Вт, в режиме пониженного энергопотребления - 13,69 Вт. Процессоры Pentium 4-M работали на частотах от 1,4 до 2,666 ГГц.

Процессоры Mobile Pentium 4 представляли собой Pentium 4 на ядрах Northwood или Prescott и работали на более высоких по сравнению с Pentium 4-M тактовых частотах - от 2,4 до 3,466 ГГц. Некоторые процессоры Mobile Pentium 4 поддерживали технологию Hyper-threading.

Все процессоры Mobile Pentium 4 работали с частотой системной шины 533 МГц. Напряжение ядра составляло 1,325-1,55 В, максимальное тепловыделение - 112 Вт на частоте 3,466 ГГц, типичное - от 59,8 до 88 Вт, в режиме пониженного энергопотребления - от 34,06 до 53,68 Вт.

Положение на рынке

Процессоры Pentium 4 Extreme Edition являлись «имиджевыми » процессорами, а оптовая цена на эти процессоры в момент анонса всегда составляла 999 $ .

Несмотря на то, что в течение года после анонса Pentium 4 основу продаж компании Intel по-прежнему составляли процессоры Pentium III (это было связано с крайне высокой стоимостью систем на базе Pentium 4 в сочетании с памятью типа RDRAM , альтернативы которой не было до выхода набора микросхем Intel 845 осенью 2001 года ), впоследствии благодаря агрессивной рекламной и маркетинговой политике компании Intel (в том числе, предоставление скидок производителям компьютеров и торговым сетям за использование и продажу исключительно продукции Intel, а также выплаты за отказ от использования продукции конкурентов ) в сочетании с неудачной маркетинговой политикой основного конкурента - компании AMD, процессоры Pentium 4 стали популярны среди пользователей . Этому также способствовала более высокая тактовая частота процессоров Pentium 4 (в частности, из-за высокой тактовой частоты процессоров конкурента, а также популярности «мифа о мегагерцах » , компания AMD была вынуждена ввести рейтинг производительности процессоров Athlon XP, нередко вводивший неопытных пользователей в заблуждение ). Тем не менее, компании AMD удалось серьёзно потеснить Intel на рынке микропроцессоров благодаря удачным продуктам - ранним Athlon XP и Athlon 64, превосходившим процессоры Pentium 4 в производительности и имеющим меньшую стоимость. Так, с 2000 по 2001 год компании AMD удалось увеличить свою долю на рынке процессоров архитектуры x86 с 18 % до 22 % (доля Intel при этом сократилась с 82,2 % до 78,7 %), а после решения проблем, возникших у AMD в 2002 году, когда её доля на рынке сократилась до 14 %, с 2003 по 2006 - до 26 % (доля Intel - около 73 %) .

Сравнение с конкурентами

Параллельно с процессорами семейства Pentium 4 существовали следующие x86-процессоры:

  • Intel Pentium III-S (Tualatin). Предназначались для рабочих станций и серверов. Несмотря на меньшую тактовую частоту, по производительности превосходили процессоры Pentium 4 на ядре Willamette в большинстве задач. Кроме того, в отличие от Pentium 4, процессоры Pentium III-S могли работать в двухпроцессорной конфигурации. Также компанией Intel выпускались процессоры Pentium III на ядре Tualatin, отличавшиеся от Pentium III-S меньшим объёмом кэш-памяти второго уровня. Оба этих процессора не получили широкого распространения: они были представлены позже, чем Pentium 4, являвшиеся в то время флагманскими процессорами компании Intel, и стоили значительно дороже, чем Pentium 4, имеющие сравнимую производительность .
  • Intel Celeron (Tualatin). Представляли собой Pentium III с уменьшенной частотой системной шины, предназначались для недорогих систем и в целом уступали процессорам Pentium 4 за счёт меньшей тактовой частоты (старшая модель Celeron работала на частоте 1,4 ГГц, в то время, как младшая модель Pentium 4 - на 1,3 ГГц) и небольшой пропускной способности памяти (в системах на процессорах Celeron обычно использовалась память PC133 SDRAM , а процессоры Pentium 4 чаще всего работали с памятью типа RDRAM или DDR SDRAM) и системной шины (100 МГц против 400 МГц) . Производительность разогнанных Celeron была сравнима с производительностью равночастотных Pentium 4 при более низкой цене .
  • Intel Celeron (Willamette-128 и Northwood-128), Celeron D (Prescott-256 и Cedar Mill-512). Представляли собой Pentium 4 с уменьшенными частотой системной шины и размером кэш-памяти второго уровня, предназначались для недорогих систем и всегда уступали процессорам Pentium 4. В некоторых задачах Celeron на ядре Willamette-128 уступали также и предшественникам (Celeron на ядре Tualatin) со значительно более низкими частотами .
  • Intel Pentium M и Celeron M . Являлись дальнейшим развитием процессоров Pentium III. Предназначались для мобильных компьютеров, обладали низким энергопотреблением и тепловыделением. Pentium M опережал как большинство мобильных Pentium 4 M, так и некоторые настольные процессоры Pentium 4, обладая при этом значительно меньшими тактовой частотой и тепловыделением . Процессор Celeron M имел близкую к Pentium M производительность, незначительно отставая от него.
  • Intel Pentium D (Presler, Smithfield). Двухъядерные процессоры, представлявшие собой два ядра Prescott (процессоры на ядре Smithfield) или Cedar Mill (Presler), находящиеся либо на одном кристалле (Smithfield), либо в одном корпусе (Presler). Опережали равночастотные Pentium 4 в большинстве задач. Однако процессоры Pentium 4 имели большую тактовую частоту, чем Pentium D (старшая модель Pentium D на ядре Smithfield работала на частоте 3,2 ГГц, а старшая модель Pentium 4 - на 3,8 ГГц), что позволяло им опережать двухъядерные процессоры в задачах, не оптимизированных под многопоточность .
  • AMD Athlon (Thunderbird). Конкурировали с процессорами Pentium 4 на ядре Willamette. В задачах, использующих дополнительные наборы инструкций SSE и SSE2 , требующих высокой пропускной способности памяти, а также в приложениях, оптимизированных под архитектуру NetBurst (приложения, работающие с потоковыми данными), процессоры Athlon уступали процессорам Pentium 4, однако в офисных и бизнес-приложениях, задачах трёхмерного моделирования, а также в математических расчётах, процессоры Athlon показывали более высокую производительность .
  • AMD Athlon XP . Конкурировали в основном с процессорами Pentium 4 на ядре Northwood. В названиях моделей этих процессоров фигурировала не тактовая частота, а рейтинг, показывающий производительность процессоров Athlon XP относительно Pentium 4. «Равнорейтинговые» Athlon XP уступали процессорам Pentium 4 в приложениях, оптимизированных под архитектуру NetBurst, требовавших наличие поддержки инструкций SSE2 или высокой пропускной способности памяти, однако значительно опережали их в вычислениях с плавающей запятой и неоптимизированных приложениях. Старшие Pentium 4 опережали конкурента в большинстве приложений .
  • AMD Athlon 64 . Конкурировали в основном с процессорами Pentium 4 на ядре Prescott. Опережали их в ряде задач (например, офисные приложения, научные расчёты или игры) за счёт меньших задержек при работе с памятью (за счёт встроенного контроллера памяти) и более эффективного математического сопроцессора, уступали процессорам Pentium 4 в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности (например, кодирование видео) .
  • AMD Athlon 64 FX . Конкурировали с процессорами Pentium 4 Extreme Edition. Как и в случае с Athlon 64 и Pentium 4, Athlon 64 FX опережали конкурентов за счёт архитектурных особенностей, интегрированного контроллера памяти или более эффективного математического сопроцессора, уступая им в задачах, оптимизированных под архитектуру NetBurst или имеющих поддержку многопоточности .
  • AMD Duron (Morgan и Applebred). Были нацелены на рынок недорогих процессоров и конкурировали с процессорами Celeron, в целом уступая процессорам Pentium 4, однако в некоторых приложениях, которые не были оптимизированы под архитектуру NetBurst и не использовали набор инструкций SSE2, могли опережать Pentium 4, имеющие значительно более высокие тактовые частоты .
  • VIA C3 (Nehemiah) и VIA Eden. Предназначались для компьютеров с низким энергопотреблением и ноутбуков (C3 и Eden-N) и для интегрирования в системные платы (Eden), имели низкую производительность и уступали конкурирующим процессорам.
  • VIA C7 . Также, как и процессоры VIA C3, предназначались для компьютеров с низким энергопотреблением и ноутбуков. Серьёзно уступали конкурентам и могли опережать их только в задачах шифрования (за счёт его аппаратной поддержки) .
  • Transmeta Efficeon . Предназначались для ноутбуков, имели низкое энергопотребление и тепловыделение. Уступали в большинстве задач мобильным процессорам AMD и Intel, опережая мобильные процессоры VIA .

Работавшие на высокой частоте процессоры Pentium 4 отличались большим энергопотреблением и, как следствие, тепловыделением. Максимальная тактовая частота серийных процессоров Pentium 4 составила 3,8 ГГц, при этом типичное тепловыделение превысило 100 Вт , а максимальное - 150 Вт . Однако при этом процессоры Pentium 4 были лучше защищены от перегрева, чем конкурирующие процессоры. Работа Thermal Monitor - технологии термозащиты процессоров Pentium 4 (а также последующих процессоров Intel) - основана на механизме модуляции тактового сигнала (англ. clock modulation ), позволяющем регулировать эффективную частоту работы ядра с помощью введения холостых циклов - периодического отключения подачи тактового сигнала на функциональные блоки процессора («пропуск тактов», «троттлинг »). При достижении порогового значения температуры кристалла, зависящего от модели процессора, автоматически включается механизм модуляции тактового сигнала, эффективная частота снижается (при этом определить её снижение можно либо по замедлению работы системы, либо с помощью специального программного обеспечения, так как фактическая частота остаётся неизменной), а рост температуры замедляется. В том случае, если температура всё же достигает максимально допустимой, происходит отключение системы . Кроме того, поздние процессоры Pentium 4 (начиная с ядра Prescott ревизии E0 ), предназначенные для установки в разъём Socket 775, обладали поддержкой технологии Thermal Monitor 2, позволяющей снижать температуру путём снижения фактической тактовой частоты (с помощью понижения множителя) и напряжения ядра .

Наглядным примером эффективности термозащиты процессоров Pentium 4 стал эксперимент, проведённый в 2001 году Томасом Пабстом. Целью этого эксперимента являлось сравнение эффективности термозащиты процессоров Athlon 1,4 ГГц, Athlon MP 1,2 ГГц, Pentium III 1 ГГц и Pentium 4 2 ГГц на ядре Willamette. После снятия кулеров с работающих процессоров, процессоры Athlon MP и Athlon получили необратимые термические повреждения, а система на Pentium III зависла, в то время как система с процессором Pentium 4 лишь замедлила скорость работы . Несмотря на то, что ситуация с полным отказом системы охлаждения (например, в случае разрушения крепления радиатора), смоделированная в экспериментах, маловероятна, а в случае возникновения приводит к более серьёзным последствиям (например, к разрушению плат расширения или системной платы в результате падения на них радиатора) вне зависимости от модели процессора , результаты эксперимента Томаса Пабста отрицательно повлияли на популярность конкурирующих процессоров AMD, а мнение о их ненадёжности было широко распространено даже после выхода процессоров Athlon 64 , имеющих более эффективную по сравнению с предшественником систему защиты от перегрева. К тому же температуры процессоров Intel в данном эксперименте, равные 29 и 37 по Цельсию, вызывают сомнение - ведь это рабочие температуры процессоров Intel при нулевой загрузке ЦПУ, и при наличии штатной системы охлаждения. Разумеется, при снятом радиаторе они ведут себя по другому: нагреваются до критической температуры, срабатывает тепловая защита и компьютер выключается. А если учесть, что тепловыделение Pentium 4 не меньше, чем у Athlon, то вопросов с дымящимся через считанные секунды AMD и работающим несколько секунд после снятия системы охлаждения Intel не убавляется. Просто в эксперименте Томаса Пабста были показаны в гипертрофированном виде имеющие место: достоинства процессоров Intel и недостатки процессоров AMD, относительно тепловой защиты. Возможно, это была рекламная акция в пользу новых процессоров Intel, особенно учитывая отношение потребителей к первым процессорам Pentium 4 из-за их высокой цены и низкой производительности.

Из-за особенностей архитектуры NetBurst, позволявших процессорам работать на высокой частоте, процессоры Pentium 4 пользовались популярностью среди оверклокеров . Так, например, процессоры на ядре Cedar Mill были способны работать на частотах, превышавших 7 ГГц , с использованием экстремального охлаждения (обычно использовался стакан с жидким азотом) , а младшие процессоры на ядре Northwood со штатной частотой системной шины 100 МГц надёжно работали при частоте системной шины 133 МГц и выше .

Технические характеристики

Willamette Northwood Gallatin Prescott Prescott 2M Cedar Mill
Настольный Настольный Мобильный Настольный Мобильный Настольный
Тактовая частота
Частота ядра, ГГц 1,3-2 1,6-3,4 1,4-3,2 3,2-3,466 2,4-3,8 2,8-3,333 2,8-3,8 3-3,6
Частота FSB , МГц 400 400, 533, 800 400, 533 800, 1066 533, 800, 1066 () 800
Характеристики ядра
Набор инструкций IA-32 , MMX , SSE , SSE2 IA-32 , EM64T (некоторые модели), MMX , SSE , SSE2 , SSE3
Разрядность регистров 32/64 бит (целочисленные), 80 бит (вещественночисленные), 64 бит (MMX), 128 бит (SSE)
Глубина конвейера 20 стадий (без учёта декодера инструкций) 31 стадия (без учёта декодера инструкций)
Разрядность ША 36 бит 40 бит
Разрядность ШД 64 бит
Аппаратная предвыборка данных есть
Количество

Через несколько дней после официального представления AMD своего последнего процессора Athlon64 FX-53, Intel решила объявить о выпуске на рынок 3,4-ГГц версии Prescott, которая позиционируется на конкуренцию с Athlon64, а не с Athlon64 FX-53, несмотря на одинаковый размер кэша.

Хотя стратегия Intel по гонке тактовых частот пока оказывалась вполне успешной, сегодня становится всё труднее находить аргументы в пользу процессора Prescott, который плохо наращивает свою производительность по сравнению с чипами AMD, использующими встроенный контроллер памяти.

Да, Intel нужна быстрая платформа со всеми выпестованными особенностями типа Socket 775, PCI Express и памятью DDR2, но на тактовую частоту процессора уповать уже не приходится. Это урок, который Intel уже пришлось выучить на серверном рынке, поскольку AMD получает всё более широкую поддержку своего семейства Opteron. И Pentium 4 Prescott не слишком хорошо соответствует репутации Intel, ведь его тепловой пакет TDP составляет более сотни ватт - при этом процессор не даёт сколько-нибудь ощутимых преимуществ по сравнению с предшественником Northwood.

Intel, конечно же, не почивает на лаврах - сегодня компания находится в процессе внедрения нового степпинга D0 ядра Prescott, который позволит процессору достичь тактовой частоты вплоть до 4 ГГц - как и упоминается в планах компании. Поскольку не все 3,4-ГГц версии Prescott имеют степпинг D0, мы решили привести таблицу, которая поможет отличить старые и новые процессоры Prescott.

По информации Intel, последний степпинг позволит увеличивать тактовую частоту из-за внесённых оптимизаций потребления энергии. Однако тепловой пакет нового процессора не изменился и остался на уровне 103 Вт максимум. Хотя процессор и кажется улучшенным по сравнению с 3,2-ГГц версией, его тепловыделение всё ещё несколько непропорционально по отношению к тактовой частоте. В любом случае, при покупке следует быть готовым к высокому тепловыделению процессора.

CPU-Z правильно определяет новый процессор Pentium 4: Model 3, Stepping 3 (CPUID 0F34h). Перед нами старый степпинг C0.

Новый процессор нагревается чуть сильнее.

Pentium 4: обзор моделей

Как вы, наверняка, знаете, Pentium 4 Prescott является ядром Pentium 4 третьего поколения. Первое, под кодовым названием Willamette, приобрела немалую популярность из-за увеличения производительности по сравнению с Pentium III Tualatin, в то же время потребляя намного больше энергии.

Второе поколение ядра под названием Northwood изготавливалось по 130-нм техпроцессу - на сегодня его по-прежнему можно называть лучшим ядром Pentium 4, поскольку процессор обеспечивает приличную производительность и неплохие возможности по "разгону". Мы уже смогли заставить несколько процессоров Northwood работать на частоте больше 4 ГГц - причём с обычными кулерами.

Сегодня на рынке присутствует большое число процессоров Pentium 4, базирующихся на ядрах Northwood или Prescott. Тактовые частоты сегодня начинаются на отметке 2,4 ГГц и заканчиваются на 3,4 ГГц, причём на этом отрезке потребитель может выбирать 20 разных моделей. Чтобы вы смогли лучше представлять себе ситуацию с процессорами Pentium 4, мы свели все модели вместе в краткую таблицу:

Процессор FSB Частота ядра Ядро HT
Pentium 4 400 МГц 2,0, 2,2, 2,4, 2,6 ГГц Northwood Нет
Pentium 4 B 533 МГц 2,4 ГГц Northwood Нет
Pentium 4 533 МГц 2,26, 2,53, 2,66, 2,8 ГГц Northwood Нет
Pentium 4 533 МГц 3,06 ГГц Northwood Да
Pentium 4 C 800 МГц 2,4, 2,6, 2,8 ГГц Northwood Да
Pentium 4 800 МГц 3,0, 3,2, 3,4 ГГц Northwood Да
Pentium 4 A 533 МГц 2,8 ГГц Prescott Нет
Pentium 4 E 800 МГц 2,8, 3,0, 3,2, 3,4 ГГц Prescott Да

Чем дальше располагается буква по алфавиту, тем лучше процессор вы получите. Однако это относится только к сравнению двух различных моделей с одинаковой тактовой частотой - типа Pentium 4 на 2,4 ГГц и FSB400 в сравнении с Pentium 4 B на 2,4 ГГц и FSB533. Pentium 4 C работает на FSB800 и поддерживает Hyper-Threading. Единственным исключением является Pentium 4 3,06 ГГц, который работает на FSB533 - и является первым процессором, поддерживающим Hyper-Threading. Буква E обозначает модели Prescott с 1-Мбайт кэшем L2, в то же время версии этого ядра с FSB533 обозначаются буквой A.

Intel вводит номера моделей

Существует много причин, по которым лучше использовать модельные номера, а не тактовые частоты. Во-первых, в номере можно учесть множество технологических деталей, типа FSB, размера кэша, частоты или дополнительных функций - Hyper-Threading и т.д. Во-вторых, исчезнет путаница между разными версиями процессоров с одинаковой тактовой частотой - в результате чего обычный покупатель легко выберет самый быстрый процессор. В-третьих, в индустрии существует множество примеров успешного использования модельных номеров - скажем та же AMD с семейством Opteron 14x, 24x и 84x. Первая цифра номера указывает поддержку числа процессоров: 1 - для одного процессора, 2 - для двухпроцессорных систем и т.д. Цифра x может быть 2, 4, 6 и 8 - что указывает на частоты 1,6, 1,8, 2,0 и 2,2 ГГц.

Наконец, мы должны подумать о процессорах Intel Pentium M, тем более что вскоре появится новая версия с техпроцессом 90-нм (Dothan). Поскольку этот чип будет существенно быстрее Banias из-за увеличенных тактовых частот, Intel будет очень трудно аргументировать покупку 3-ГГц настольного процессора Prescott, который в некоторых приложениях работает медленнее 2,0-ГГц Dothan.

По нашим источникам, тактовые частоты должны полностью исчезнуть из названий процессоров Intel. Поскольку число доступных моделей процессоров вряд ли уменьшится, такой шаг нам кажется вполне логичным. Будущая система именования процессоров будет выглядеть примерно так: процессор Pentium 4 будет дополняться номером 5xx, а линейка Celeron - номером Celeron 3xx.

Мобильные процессоры Настольные процессоры
Производительный сегмент рынка Pentium M 755 (2,0 ГГц)
Pentium M 745 (1,8 ГГц)
Pentium M 735 (1,7 ГГц)
Pentium M 725 (1,6 ГГц)
Pentium M 715 (1,5 ГГц)
Pentium 4 Extreme Edition
Массовый сегмент рынка Pentium 4 Mobile Pentium 4 560 (3,6 ГГц)
Pentium 4 550 (3,4 ГГц)
Pentium 4 540 (3,2 ГГц)
Pentium 4 530 (3,0 ГГц)
Pentium 4 520 (2,8 ГГц)
"Бюджетный" сегмент рынка Celeron M 340 (1,5 ГГц)
Celeron M 330 (1,4 ГГц)
Celeron M 320 (1,3 ГГц)
Celeron D 340 (2,93 ГГц)
Celeron D 330 (2,8 ГГц)
Celeron D 320 (2,66 ГГц)
Celeron D 310 (2,53 ГГц)

На момент начала продаж процессорные решения серии Intel Pentium 4 позволяли создавать наиболее производительные настольные вычислительные системы. Спустя 8 лет это семейство чипов устарело и было снято с производства. Именно об этом легендарном модельном ряде ЦПУ и пойдет в этом материале речь.

Позиционирование процессора

На самом старте продаж данные процессоры принадлежали к наиболее быстродействующим решениям. На подобную их принадлежность указывали передовая на тот момент архитектура полупроводникового кристалла NetBurst, существенно возросшие тактовые частоты и прочие значительно улучшенные технические характеристики. Как результат, владельцы персональных компьютеров на их базе могли решать любые по уровню сложности задачи. Единственная сфера, в которой эти чипы не применялись - это серверы. В таких высокопроизводительных вычислительных машинах использовались процессорные решения серии XEON. Также не совсем оправданно применение в составе офисных ПК Intel Pentium 4. Ядра такого чипа в этом случае не до конца нагружались и с экономической точки зрения такой подход был целиком и полностью не оправдан. Для ниши “Интел” выпускала менее производительные и более доступные ЦПУ серии Celeron.

Комплектация

В двух типичных вариантах поставки можно было встретить процессор Intel Pentium 4. Один из них был нацелен на небольшие компании, которые специализировались на сборке системных блоков. Также такой вариант поставки подходил для домашних сборщиков персональных компьютеров. В прайс-листах он обозначался ВОХ, а в него производитель включал следующее:

    Чип в защитной упаковке из прозрачного пластика.

    Фирменную систему теплоотвода, которая состояла из специальной термопасты и кулера.

    Талон с гарантийными обязательствами.

    Краткое руководство по назначению и использованию процессорного решения.

    Наклейка с логотипом модели чипа для передней панели системного блока.

Второй вариант поставки в каталогах компьютерных комплектующих обозначался TRAIL. В этом случае из списка поставки исключалась система охлаждения и ее необходимо было дополнительно приобретать. Подобный вид комплектации наиболее оптимально подходил для крупных сборщиков персональных компьютеров. За счет большого объема продаваемой продукции они могли позволить покупать системы охлаждения по более низким оптовым ценам и такой подход был оправдан с экономической точки зрения. Также такой вариант поставки пользовался повышенным спросом среди компьютерных энтузиастов, которые приобретали улучшенные модификации кулеров и это позволяло еще лучше разогнать такой процессор.

Процессорные разъемы

Процессор Intel Pentium 4 мог устанавливаться в один из 3-х видов процессорных разъемов:

Первый разъем появился в 2000 году и был актуальным до конца 2001 года. Затем ему на смену пришел PGA478, который вплоть до 2004 года занимал ведущие позиции в перечне продукции компании “Интел”. Последний сокет LGA775 появился на прилавках магазинов в 2004 году. В 2008 году его сменил LGA1156, который был нацелен на применение чипов с более передовой архитектурой.

Сокет 423. Семейства поддерживаемых чипов

Производители процессоров в лице компаний “Интел” и АМД в конце 1999 года - начале 2000 года постоянно расширяли перечень предлагаемых чипов. Только у второй компании была вычислительная платформа с запасом, которая базировалась на сокете PGA462. А вот “Интел” все возможное на тот момент из процессорного разъема PGA370 “выжала” и ее нужно было предлагать рынку компьютерных технологий что-то новое. Этим новым и стал рассматриваемый чип с обновленным процессорным разъемом в 2000 году. Intel Pentium 4 дебютировал одновременно с анонсом платформы PGA423. Стартовая частота процессоров в этом случае была установлена на отметке 1,3 ГГц, а наибольшее ее значение достигало 2,0 ГГц. Все ЦПУ в этом случае принадлежали к семейству Willamette, изготавливались по технологии 190 нм. Частота системной шины была равна реальным 100 МГц, а ее эффективное значение составляло 400 МГц.

Процессорный разъем PGA478. Модели ЦПУ

Через год в 2001 году вышли обновленные процессоры Intel Pentium 4. Socket 478 - это разъем для их установки. Как было уже отмечено ранее, этот сокет был актуальным вплоть до 2004 года. Первым семейством процессоров, которые в него могли быть установлены, стал Willamette. Наивысшее значение частоты для них было установлено на 2,0 ГГц, а начальное - 1,3 ГГц. Техпроцесс у них соответствовал 190 нм. Затем появилось в продаже семейство ЦПУ Northwood. Эффективное значение частоты в некоторых моделях в этом случае было увеличено с 400 МГц до 533 МГц. Частота чипов могла находиться в пределах от 2,6 ГГц до 3,4 ГГц. Ключевое же нововведение чипов этого модельного ряда - это появление поддержки технологии виртуальной многозадачности HyperTraiding. Именно с ее помощью на одном физическом ядре обрабатывалось сразу два потока программного кода. По результатам тестов получался 15-процентный прирост быстродействия. Следующее поколение чипов “Пентиум 4” получило кодовое название Prescott. Ключевые от предшественников в этом случае заключались в улучшенном технологическом процессе, увеличении кеш-памяти второго уровня и повышение тактовой частоты до 800 МГц. При этом сохранилась поддержка HyperTraiding и не увеличилось максимальное значение тактовой частоты - 3,4 ГГц. Напоследок необходимо отметить то, что платформа PGA478 была последней вычислительной платформой, которая не поддерживала 64-битные решения и могла выполнять лишь только 32-разрядный программный код. Причем это касается и системных плат, и процессорных решений Intel Pentium 4. Характеристики компьютеров на базе таких комплектующих являются целиком и полностью устаревшими.

Завершающий этап платформы Pentium 4. Сокет для установки чипов LGA775

В 2006 году производители процессоров начали активно переходить на 64-разрядные вычисления. Именно по этой причине Intel Pentium 4 перешел на новую платформу на основе разъема LGA775. Первым поколением процессорных устройств для нее называлось точно также, как и для PGA478 - Prescott. Технические спецификации у них были идентичны предыдущим моделям чипов. Ключевое отличие - это повышение максимальной тактовой частоты, которая в этом случае могла уже достигать 3,8 ГГц. Завершающим же поколением ЦПУ стало Cedar Mill. В этом случае максимальная частота понизилась до 3,6 ГГц, но при этом техпроцесс улучшился и энергоэффективность улучшилась. В отличие от предшествующих платформ, в рамках LGA775 “Пентиум 4” плавно перешел из сегмента решений среднего и премиального уровня в нишу процессорных устройств бюджетного класса. На его место пришли чипы серии Pentium 2, которые уже могли похвастаться двумя физическими ядрами.

Тесты. Сравнение с конкурентами

В некоторых случаях достаточно неплохие результаты может показать Intel Pentium 4. Processor этот отлично подходит для выполнения программного кода, который оптимизирован под один поток. В этом случае результаты будут сопоставимы даже с нынешними ЦПУ среднего уровня. Конечно, сейчас таких программ не так уж и много, но они все еще встречаются. Также этот процессор способен составить конкуренцию нынешним флагманам в офисных приложениях. В остальных случаях этот чип не может показать приемлемый уровень производительности. Результаты тестов будут приведены для одного из последних представителей данного семейства “Пентиум 4 631”. Конкурентами для него будут процессоры Pentium D 805, Celeron Е1400, Е3200 и G460 от “Интел”. Продукция же АМД будет представлена Е-350. Количество ОЗУ стандарта DDR3 равно 8 Гб. Также данная вычислительная система доукомплектована адаптером GeForce GTX 570 с 1 Гб видеопамяти. В трехмерных пакетах Maya, Creo Elements и Solid Works в актуальных версиях 2011 года рассматриваемая модель “Пентиум 4” показывает достаточно неплохие результаты. По результатам тестов в этих 3-х программных пакетах была выведена средняя оценка по сто балльной шкале и силы распределились следующим образом:

“Пентиум 4 631” проигрывает процессорам с более продвинутой архитектурой и более высокими тактовыми частотами G460 и Е3200, у которых 2 физических ядра. Но при этом обходит полноценную двухъядерную модель D 805 на аналогичной архитектуре. Результаты же Е-350 и Е1400 были предсказуемые. Первый чип ориентирован на сборку ПК, в которых на первый план выходит энергопотребление, а удел второго - это офисные системы. Совершенно по-другому распределяются силы при кодировании медиафайлов в программах Lame, Apple Lossless, Nero AAC и Ogg Vorbis. В этом случае на первый план уже выходит количество ядер. Чем их больше, тем лучше выполняется задача. Опять-таки, по усредненной сто балльной шкале силы распределились следующим образом:

Даже Е-350 с приоритетом на энергоэффективность обходит “Пентиум 4” модели 631. Продвинутая архитектура полупроводникового кристалла и наличие 2-х ядер все-таки дают о себе знать. Изменяется картина при тестировании процессоров в архиваторах WinRAR и 7-Zip. Результаты чипов по той же самой шкале распределились так:

В этом тесте множество факторов оказывает влияние на конечный результат. Это и архитектура, это и размер кеша, это и тактовая частота, это и количеств ядер. Как результат, типичным середнячком получился тестируемый “Пентиум 4” в исполнении 631. Эталонная же система, производительность которой соответствовала 100 баллам, базировалась на ЦПУ Athlon II Х4 модели 620 от АМД.

Разгон

Внушительным увеличением уровня производительности мог похвастаться Intel Pentium 4. Разгон этих процессорных устройств позволял достичь значений тактовой частоты в 3,9-4,0 ГГц при улучшенной воздушной системе охлаждения. Если же заменить воздушное охлаждение на жидкостное на базе азота, то вполне можно рассчитывать на покорение значения в 4,1-4,2 ГГц. Перед разгоном компьютерная система должна быть укомплектована следующим образом:

    Мощность блока питания должна быть минимум 600 Вт.

    В компьютере должна быть установлена продвинутая модель системной платы, на которой можно осуществлять плавное регулирование различных параметров.

    Кроме основного кулера, на процессоре в системном блоке должны находиться дополнительные 2-3 вентилятора для осуществления улучшенного теплоотвода.

Мультипликатор частоты в этих чипах был заблокирован. Поэтому простым поднятием его значения разогнать ПК невозможно. Поэтому единственный способ увеличения производительности - это увеличение реального значения тактовой частоты системной шины. Порядок же разгона в этом случае следующий:

    Уменьшаются значения частот всех компонентов ПК. В этот список лишь только не попадает лишь только системной шины.

    На следующем этапе увеличиваем рабочее значение частоты последней.

    После каждого такого шага необходимо проверить стабильность работы компьютера с помощью прикладного специализированного софта.

    Когда простого повышения частоты уже недостаточно начинаем повышать напряжение на ЦПУ. Его максимальное значение равно 1,35-1,38 В.

    После достижения наибольшего значения напряжения частоту чипа повышать нельзя. Это и есть режим максимального быстродействия компьютерной системы.

В качестве примера можно привести модель 630 процессора “Пентиум 4”. Ее стартовая частота равна 3 ГГц. Номинальная же тактовая частота системной шины составляет в этом случае 200 МГц. Значение последней можно на воздушном охлаждении повысить вплоть до 280-290 МГц. В результате ЦПУ будет работать уже на 4,0 ГГц. То есть прирост производительности составляет 25 процентов.

Актуальность на сегодняшний день

На сегодняшний день целиком и полностью устарели все процессоры Intel Pentium 4. Температура их функционирования, энергопотребление, технологический процесс, тактовые частоты, размер кеш-памяти и ее организация, количество адресуемой ОЗУ - это далеко не полный перечень тех характеристик, которые указывают на то, что это полупроводниковое решение устарело. Возможностей такого чипа лишь достаточно для решения наиболее простых задач. Поэтому владельцам таких компьютерных систем необходимо их обновлять в срочном порядке.

Стоимость

Несмотря на то что в 2008 году выпуск рассматриваемых ЦПУ был прекращен, их все еще можно купить в новом состоянии со складских запасов. При этом необходимо отметить то, что в исполнении LGA775 и с поддержкой технологии НТ можно приобрести чипы Intel Pentium 4. Цена на них находится в пределах 1300-1500 рублей. Для офисных систем это вполне адекватный уровень стоимости. Процессорные решения, которые находились в использовании, можно найти на различных торговых площадках в интернете. Цена в этом случае начинается с отметки в 150-200 рублей. Полностью же собранный персональный компьютер бывший в употреблении можно купить по цене от 1500 рублей.

Процессоры такого типа покупаются в первую очередь заядлыми игроками и энтузиастами, так как цены на них достаточно высоки.

Как это часто случается с конкурирующими компаниями, стоит одной из них попытаться объявить очередную сногсшибательную новинку, другая обязательно попытается прекратить триумфальный момент объявлением какого-нибудь собственного продукта. Ярким примером здесь будут компании ATI и NVIDIA. Создается впечатление, что они только этим и занимаются. То появляется новая немного модернизированная видеокарта, то новый пакет драйверов и т.д.

Интел собирается точно также подпортить праздник AMD, но, представляя не Prescott, а все тот же Pentium 4 Northwood, но более быстрый, хоть он и обладает точно такой же тактовой частотой, что и обычный 3.2 ГГц Northwood. Давайте попробуем разобраться, чем же отличается новый процессор Интел и какие у него преимущества над остальными.

Осмотр в любых исследованиях является самым простым методом выявления отличий (найдите десять отличий:-). Так что предлагаем посмотреть на то, что Интел называет "Экстремальной Редакцией" - Extreme Edition.

Как видно, из этого много информации не получишь. Слева - опытный образец процессора Pentium 4 3.2 ГГц, а справа - Extreme Edition.

Несколько отличий можно заметить, взглянув на обратную сторону. Находящийся справа Extreme Edition обладает большим количеством конденсаторов, чем обычный Northwood. Очевидно, количество ножек осталось точно таким же, так как он без проблем входит в Socket-478. Пока что существенных отличий нет, давайте поищем их глубже.

Оба процессора - опытные образцы, но EE, данные о котором сейчас приведены слева, в отличие от стандартного Northwood, обладает 2 MБ кэша третьего уровня. Дальнейшее исследование не показало никаких других различий между этими двумя процессорами.

Зачем увеличивать кэш?

Первичная причина увеличения объема встроенного кэша может заключаться в том, что кэш-память в современных процессорах работает на той же скорости, что и сам процессор. Как вы могли заметить, частота процессора в этом случае никак не меньше 3200 MГц. Больший объем кэша позволяет процессору держать большие части кода готовыми к выполнению. Такая архитектура процессоров сфокусирована на уменьшении задержек, связанных с простоем процессора в ожидании данных. Игры используют большие части кода, который необходимо извлекать из системной памяти по первому требованию процессора. Уменьшение промежутков времени, уходящих на передачу данных от памяти к процессору, - это надежный метод увеличения производительности приложений, требующих интенсивного взаимодействия с памятью. Кэш Level 3 имеет немного более высокое время ожидания, чем Level 1 и 2, это вполне естественно. Хоть он и медленнее, но все-таки он значительно более быстрый, чем обычная память. Не все приложения выигрывают от увеличения объема или скорости кэш-памяти. Это сильно зависит от природы приложения. Так как Интел нацеливает этот процессор в первую очередь на игровой рынок, следует ожидать, что здесь он покажет значительное преимущество перед обычным 3.2 ГГц.

Если большой объем встроенного кэша - это хорошо, тогда что же удерживало Интел от этой стратегии ранее? Простым ответом является высокая себестоимость такого решения. Резервирование пространства для кэша очень дорого. Стандартный 3.2GHz Northwood содержит 55 миллион транзисторов. Добавляя 2048 КБ кэша L3, Интел идет на увеличение количества транзисторов до 167 миллионов. Простой математический расчет покажет нам, что EE - один из самых дорогих процессоров. Но начало положено, и, скорее всего, за этим процессором последует целая линейка экстремальных моделей.

Пришло время тестирования

Вот основные параметры системы, на которой проводилось тестирование, и процессоры, принимавшие в нем участие.

  • Intel Pentium 4 3.2GHz Extreme Edition ES 800FSB CPU (12x - 28x)
  • Intel Pentium 4 3.2GHz ES 800FSB CPU (12x - 16x)
  • AMD Athlon 64 FX-51 CPU (2.2GHz) RAM (DDR400, dual channel)
  • AMD Athlon 64 3200+ (2.0GHz) RAM (DDR400, single channel)
  • AMD Barton XP3200+ S462 CPU (2200MHz / 200FSB)
  • EPoX 4PDA2+ i865PE Springdale с PAT-подобным BIOS (15/08/03) для обоих процессоров Интел
  • ASUS SK8N nForce3 Pro150 для Athlon 64 FX-51
  • EPoX 8HDA3+ VIA K8T800 для AMD Athlon 64 3200+
  • EPoX 8RDA3G nForce2 Ultra 400 для XP3200+ Barton
Другие компоненты
  • ATi Radeon 9800 Pro (380/340)
  • 2 x 256MB Corsair XMS3500C2, 2-6-2-2 @ DDR400 для обоих P4, VIA K8T800 (SC) и материнские платы nForce2.
  • 2 x 512MB Legacy Electronics DDR400 ECC/Registered 2.5-3-3-10
  • Liteon 16x DVD
  • Samcheer 420w PSU
  • Монитор Samsung 181T TFT
  • AMD reference S940/754 cooler
  • Akasa Silver Mountain cooler
  • Thermaltake AX478 cooler с вентилятором 25CFM
Программное обеспечение
  • Windows XP Professional SP1
  • DirectX9.0a
  • NVIDIA nForce 3 3.43 драйверы для чипсета
  • Intel 5.00.1012 драйверы для чипсета
  • NVIDIA nForce 2.45 драйверы
  • VIA Hyperion 4.49v2 драйверы
  • ATI CATALYST 3.7 драйверы и панель управления (6378s)
  • ScienceMark 2.0
  • Pifast v41
  • LAME v3.92 MP3
  • HEXUS SETI benchmark 0.417AR WU
  • Realstorm Raytracing benchmark v1.10 320x180x32
  • WinRAR 3.20
  • Kribi Benchmark v1.19
  • 3DMark 2001SE v330
  • UT2003 (Build 2225)
  • X2: The Threat - Rolling Demo
  • Comanche 4 benchmark
  • Serious Sam 2: Sierra De Chiapas Demo.
  • Quake 3 v1.30 HQ

Примечания

В качестве оппонентов процессору EE выступят три лучших процессора AMD и Интеловский 3.2 ГГц Northwood. Процессор будет работать в своем стандартном режиме 3.2 ГГц / 200 FSB (800 МГц QDR) и при разгоне до 3.6 ГГц / 200 FSB (множитель 18x). При тактовой частоте 3.6 ГГц процессор работал на стандартном напряжении и с довольно тихим воздушным охлаждением. Тесты запускались по три раза (SETI один) и при расхождении в результатах отбрасывались самый высокий и самый низкий показатели. Если отдельно не указаны разрешение экрана, глубина цвета и частота обновления, то подразумеваются такие параметры: 1024x768x32 85 Гц.

Основные характеристики всех процессоров приведены в таблице:

Процессор Pentium 4 3.2 ГГц EE Pentium 4 3.2 ГГц AMD Athlon FX-51 AMD Athlon 64 3200+ AMD Barton XP3200+
Тактовая Частота 3200 MГц 3200 MГц 2200 MГц 2000 MГц 2200 MГц
кеш L1 20 КБ 20 КБ 128 КБ 128 КБ 128 КБ
кеш L2 512 КБ 512 КБ 1024 КБ 1024 КБ 512 КБ
кеш L3 2048kb - - - -
Полоса пропускання памяти 6.4 ГБ/с 6.4 ГБ/с 6.4 ГБ/с 3.2 ГБ/с 6.4 ГБ/с
FSB 800 МГц 800 МГц Частота ядра Частота ядра 400 МГц
Площадь подложки 231 мм 2 131 мм 2 193 мм 2 193 мм 2 101 мм 2
Количество транзисторов 167 млн. 55 млн. 105.9 млн. 105.9 млн.? 54 млн.
Производственный процесс 0.13 микрон 0.13 микрон 0.13 микрон SOI 0.13 микрон SOI 0.13 микрон
Разрядность ОС 32 бит 32 бит 32/64 бит 32/64 бит 32 бит
Напряжение 1.525/1.55 В 1.525/1.55 В 1.525-1.55 В 1.525-1.55 В 1.65 В
Количество контактов 478 478 940 754 462

Мы опустили любую форму поддержки Hyper-Threading по той причине, что эффективность этой технологии сильно зависит от выполняемых задач.

Перейдем к тестированию

ScienceMark 2.0 обеспечивает исчерпывающий анализ полосы пропускания и времени ожидания. Это как раз те два показателя, которые помогут EE продемонстрировать свое отличие от других процессоров. Мы тестировали ЕЕ в двух режимах: 3.2 ГГц и 3.6 ГГц.


МБ, больше - лучше
A64 FX-51, 5479
3,6 ГГц EE, 4258
3,2 ГГц ЕЕ, 4195
3,2 ГГц, 4102
A64 3200+, 2922
XP3200+, 2817

Измерение полосы пропускания памяти требует демонстрации возможностей кэша. ЕЕ показал себя хорошо - немного быстрее стандартного 3.2 ГГц и на ступень ниже впечатляющих показателей Athlon 64 FX-51.

ScienceMark 2.0 скорость доступа к памяти 4 МБ/512 Б
нс, меньше - лучше
A64 3200+, 53
A64 FX-51, 57
3,6 ГГц EE, 65
3,2 ГГц ЕЕ, 73
3,2 ГГц, 84
XP3200+, 94

Время ожидания, возможно, является более важным показателем производительности. Кроме того, выбранный объем блока данных 4 МБ позволил ослабить влияние увеличенного кеша EE на результаты. Он снова оказывается более быстрым, чем стандартный P4 и еще более быстрым при более высокой тактовой частоте. Но первенство Athlon 64, тем не менее, ничем не нарушается.

Pifast - скромный тест на более низкое время ожидания или более широкую полосу пропускания.

Pifast
3,6 ГГц EE, 53,69
A64 FX-51, 55,72
3,2 ГГц ЕЕ, 59,57
3,2 ГГц, 61,48
XP3200+, 63,31
A64 3200+, 64,17

EE почти на 2 секунды опережает стандартный Pentium 4 3.2 ГГц, а при разгоне до 3.6 ГГц EE становится лидером. Но нужно отметить, что ему необходима для этого более высокая тактовая частота, при том, что Athlon FX-51 работает на частоте 2.2 ГГц.

Перекодировка WAV в MP3
время в секундах, меньше - лучше
3,6 ГГц EE, 147
3,2 ГГц ЕЕ, 165
3,2 ГГц, 165
A64 FX-51, 181
XP3200+, 183
A64 3200+, 200

Более высокая тактовая частота обеспечивает превосходство EE. Дополнительный кеш здесь вообще не играет основной роли. Это то, о чем мы говорили выше. При увеличении объема кэш-памяти производительность в стандартных приложениях существенно не увеличится. Основные преимущества будут заметны в вычислительных задачах.

SETI
время в формате ч:м:с, меньше - лучше
3,6 ГГц EE, 1:39:32
A64 FX-51, 1:46:35
3,2 ГГц ЕЕ, 1:51:34
A64 3200+, 1:58:29
3,2 ГГц, 2:07:20
XP3200+, 2:10:55

Результаты SETI сильно отличаются. Загрузите большой кэш большим объемом данных и вы пронаблюдаете, как ЕЕ опережает стандартный Pentium 4 больше, чем на 15 минут, причем, работая на стандартной частоте с абсолютно одинаковым стандартным блоком данных 0.417AR. Значительное превосходство ЕЕ в этом тесте обеспечивается низким временем ожидания при работе со встроенным кэшем. Время работы в режиме 3.6 ГГц самое быстрое из тех, что мы видели в этом тесте. (1:39:32)

Kribi Bench v1.19, Jetshadow, Realistic
FPS, больше - лучше
3,6 ГГц EE, 10,33
3,2 ГГц ЕЕ, 9,4
3,2 ГГц, 8,559
A64 FX-51, 6,72
A64 3200+, 6,01
XP3200+, 5,1

Следующий тест Kribi является тестовой системой с программным рендерингом от Adept Development. Тестирующую программу можно переписать по этой ссылке. Тест создает модели, содержащие до 16.7 миллиардов полигонов. Для нашего тестирования была выбрана встроенная модель JetShadow в реалистичном режиме. Реализация SSE и поддержка Hyper-Threading показывает, что этот тест в большей степени предрасположен к процессорам от Интел, чем от AMD (об этом красноречиво говорят и результаты). Дополнительный кэш в этом случае значительно повлиял на результат.


FPS, больше - лучше
A64 FX-51, 59,73
A64 3200+, 53,47
XP3200+, 50,69
3,6 ГГц EE, 46,74
3,2 ГГц ЕЕ, 41,91
3,2 ГГц, 41,02
WinRAR 3.2, 168 МБ/38 файлов/Best/4096 КБ
время в секундах, меньше - лучше
A64 FX-51, 126
3,6 ГГц EE, 130
3,2 ГГц ЕЕ, 145
3,2 ГГц, 146
A64 3200+, 180
XP3200+, 210

В качестве следующего теста был выбран популярный архиватор WinRAR 3.20. Нужно было создать архив из 38 файлов разных размеров от 1 КБ до 50 МБ. Разогнанный EE показал неплохой результат, но все же ему не хватило мощности, чтобы опередить Athlon 64 FX-51. Такая картина подтверждает наши ожидания и результаты большинства неигровых тестов. ЕЕ в определенных условиях оказывается заметно более быстрым, чем его стандартный собрат. Возможно, игровые тесты внесут изменения в получающуюся картину.

Начнем с 3DMark 2001SE. Большие наборы данных и ширина полосы пропускания памяти должны обеспечить первенство для EE.

Realstorm Raytracing 320x180x32, отражения и тени
FPS, больше - лучше
A64 FX-51, 59,73
A64 3200+, 53,47
XP3200+, 50,69
3,6 ГГц EE, 46,74
3,2 ГГц ЕЕ, 41,91
3,2 ГГц, 41,02

Из результатов теста Realstorm Raytracing видно, что он предпочитает процессоры AMD. Даже результаты 3.6 ГГц EE здесь оставляют желать лучшего.

3DMark 2001SE v330
больше - лучше
3,6 ГГц EE, 20924
3,2 ГГц ЕЕ, 20097
A64 FX-51, 20079
A64 3200+, 19527
3,2 ГГц, 19106
XP3200+, 18136

Так оно и произошло, процессор EE опережает стандартный почти на тысячу условных "попугаев". Разогнанная версия показала самый лучший результат, почти достав до отметки в 21000. Это, конечно, впечатляет, даже несмотря на незначительный отрыв показателей 3,2 ГГц ЕЕ от A64FX-51.

Comanche 4
FPS, больше - лучше
3,6 ГГц EE, 84,31
3,2 ГГц ЕЕ, 75,43
A64 FX-51, 73,84
3,2 ГГц, 68,23
A64 3200+, 66,71
XP3200+, 56,73

Comanche 4 является еще одним требовательным к объему кэш-памяти тестом. По его результатам отчетливо видно обеспеченное кэшем 10% увеличение производительности 3,2 ГГц ЕЕ по сравнению с обычным Pentium 4 3,2 ГГц.

Давайте посмотрим фактам в лицо. Интел узнает, что новые процессоры AMD гораздо быстрее работают с 32-разрядными приложениями, чем собственные аналоги компании. Процессор Opteron, который был прародителем как FX-51, так и меньших 3200+ Clawhammer, мусировался на сайтах новостей и обзоров в течении нескольких месяцев. Практически каждый рецензент замечал, насколько высок уровень производительности этих процессоров при их тактовых частотах. Мы видели процессоры Opteron с частотами 1.6 ГГц и 1.8 ГГц, которые обладают значительно более высокой производительностью, чем лучшие Hyper-Threading процессоры Интел, особенно в игровых тестах. Эти факты и заставили Интел предпринять какой-то шаг. Этим шагом оказался Pentium 4 Extreme Edition.

Наши тесты в целом показали, что таланты EE лучше всего проявляются в игровых тестах, где требуется обработка большого объема данных. Если же во внимание принимать результаты всех тестов, то вы должны были заметить, что AMD Athlon FX-51 вместе с Pentium 4 Extreme Edition занимают то первое, то второе место. Производительность и цена этих процессоров значительно не отличаются.

У энтузиастов с толстыми кошельками появилась возможность выбора между двумя игровыми монстрами, а Интел удастся отвлечь часть этих потенциальных покупателей от Athlon FX-51. Ориентировочная цена обоих процессоров практически одинакова: Athlon FX-51 - 900 $; Pentium 4 Extreme Edition - 925 $.