Советские корни процессора Intel Pentium

Мало кто знает, но у истоков создания самого известного в мире процессора Intel Pentium были и советские специалисты и инженеры. В свое время СССР добился достаточно серьезных достижений в создании компьютерной техники. Примером этому может служить серия советских суперкомпьютеров «Эльбрус», которые были созданы в Институте точной механики и вычислительной техники (ИТМиВТ) в 1970-1990-х годах прошлого века, это же название носит серия микропроцессоров и систем, созданных на их основе и выпускаемых сегодня ЗАО МЦСТ (Московский центр SPARC-технологий).

История компании «-Эльбрус МСЦТ»- началась в 1992 году, когда Бабаян со своими коллегами и при участии Дэвида Дицеля, в то время работавшего в компании Sun Microsystems, организовали «-Московский центр SPARC-технологий»-. Позднее при участии Бабаяна были созданы еще несколько компаний: «-Эльбрус 2000″-, «-Эльбрус Интернейшнл»-, которые и образуют «-Эльбрус МЦСТ»-.

Компания работала как по заказам зарубежных компаний: Sun, Transmeta (именно в эту компанию перебрался со временем Дэвид Дицель), а также выполняла работы по заказам правительства России. Прежде всего, это используемые в российской армии вычислительные комплексы «-Эльбрус 90-микро»- на базе собственных процессоров серии МЦСТ R. За их создание Бабаян и его коллеги в своё время получили государственные награды.

Однако история самого »-Эльбруса»- куда длиннее. Первый компьютер с таким названием был создан еще в 1978 году в ИТМиВТ им. С.А. Лебедева АН СССР под руководством Б.С. Бурцева и при участии Бориса Бабаяна, который был одним из заместителей главного конструктора. Основными заказчиками компьютеров «-Эльбрус»-были, конечно, военные.


Первый компьютер «Эльбрус» обладал модульной архитектурой и мог включать в себя от 1 до 10 процессоров на базе схем средней интеграции. Быстродействие данной машины достигало 15 миллионов операций в секунду. Объем оперативной памяти, которая была общей для всех 10 процессоров, составлял до 2 в 20 степени машинных слов или, если применять принятые сейчас обозначения, 64 Мб. Однако самым интересным в «Эльбрусе-1» была именно его архитектура. Созданный в СССР суперкомпьютер стал первой в мире коммерческой ЭВМ, которая применяла суперскалярную архитектуру. Ее массовое применение за рубежом началось только в 90-х годах прошлого века с появлением на рынке доступных процессоров Intel Pentium.

Как выяснилось позднее, подобные разработки существовали и до «-Эльбруса»- в корпорации IBM, однако работы эти были закрытыми и так и не привели к созданию коммерческого продукта. Правда, в ряде публикаций появлялись сведения, что при проектировании «-Эльбруса»- в основу были положены разработки зарубежных фирм. Однако участники создания советского суперкомпьютера с такой позицией не согласны. В одном из интервью В.С. Бурцев, главный конструктор «-Эльбруса»-, отметил, что при создании компьютера конструкторы старались использовать передовой опыт как отечественных, так и зарубежных разработчиков. И на архитектуру «-Эльбрусов»- оказали влияние не только компьютеры фирмы Burroughs, но и разработки таких фирм, как Hewlett-Packard, а также опыт создателей БЭСМ-6.

При этом немалая часть разработок была оригинальной, к ним относится и суперскалярная архитектура. Кроме этого для организации передачи потоков данных между периферийными устройствами и оперативной памятью в компьютере могли применяться специальные процессоры ввода-вывода. Таких процессоров в составе системы могло быть до 4-х штук, они работали параллельно с центральным процессором и обладали своей собственной памятью.

Следующим этапом работ явилось создание компьютера «Эльбрус-2». Эти ЭВМ отправились в серийное производство в 1985 году. По своей внутренней архитектуре они не сильно отличались от «Эльбрус-1», но применяли новую элементную базу, что позволило увеличить максимальную производительность до 125 млн. операций в секунду. Объем оперативной памяти компьютера увеличился до 16 млн. 72-разрядных слов или 144 Мб. Максимальная пропускная способность каналов ввода-вывода «Эльбруса-2» составляла 120 Мбайт/с.

Данные компьютеры активно применялись в СССР в областях, которые требовали большого количества вычислений, в первую очередь в оборонной отрасли. ЭВМ «Эльбрус-2» эксплуатировались в ядерных исследовательских центрах в Челябинске-70 и в Арзамасе-16 в ЦУПе, наконец, именно этот комплекс, начиная с 1991 года, применялся в системе ПРО А-135, а также на других военных объектах страны.
Помимо двух перечисленных выше компьютеров, также выпускался ЭВМ общего назначения «Эльбрус 1-КБ», создание данного компьютера было окончено в 1988 году. До 1992 года было произведено 60 таких ЭВМ. Они были основаны на технологиях «Эльбруса-2» и применялись для замены устаревших машин БЭСМ-6. При этом между «Эльбрус 1-КБ» и БЭСМ-6 существовала полная обратная программная совместимость, которая была дополнена новыми режимами работы с увеличенной разрядностью чисел и адресов.

Создание компьютеров «Эльбрус» было по достоинству оценено руководством Советского Союза. За разработку «Эльбруса-1» многие инженеры были награждены орденами и медалями. Борис Бабаян был награжден Орденом Октябрьской революции, его коллега В.В. Бардиж – орденом Ленина. За разработку «Эльбруса-2» Бабаян с рядом своих коллег был удостоен Ленинской премии, а генеральный конструктор В.С. Бурцев и ряд других специалистов – Государственной премии.


После завершения работ над ЭВМ «Эльбрус-2» в ИТМиВТ взялись за разработку ЭВМ на базе принципиально новой процессорной архитектуры. Проект, который был назван достаточно просто – «Эльбрус-3», также значительно опередил аналогичные разработки на Западе. В «Эльбрусе-3» впервые был реализован подход, который Борис Бабаян называет «постсуперскалярным». Именно такой архитектурой в будущем обладали процессоры Intel Itanium, а также чипы компании Transmeta. Стоит отметить, что в СССР работы над данной технологией были начаты в 1986 году, а Intel, Transmeta и HP приступили к реализации работ в этом направлении лишь в середине 1990-х годов.

К сожалению, «Эльбрус-3» так никогда и не был запущен в серийное производство. Его единственный работающий экземпляр был построен в 1994 году, но в это время он был никому не нужен. Логическим продолжением работ над данным компьютером стало появление процессора «Эльбрус-2000», известного также как E2K.

По словам Бориса Арташесовича Бабаяна, главного архитектора суперкомпьютеров линии Эльбрус, суперскалярная архитектура была изобретена в России: «-В 1978-ом году мы сделали первую суперскалярную машину, Эльбрус-1. Сейчас на Западе делают суперскаляры только такой архитектуры. Первый суперскаляр на Западе появился в 92-ом году, наш в 78-ом. Причем тот вариант суперскаляра, который сделали мы, аналогичен Pentium Pro, который Intel сделал в 95-ом году «-.

Подтверждают историческое первенство Эльбрус и в Америке. В той же статье из Microprocessor Report Кит Дифендорфф, разработчик Motorola 88110, одного из первых западных суперскалярных процессоров, пишет: «-В 1978 году, почти на 15 лет раньше, чем появились первые западные суперскалярные процессоры, в Эльбрус-1 использовался процессор, с выдачей двух команд за один такт, изменением порядка исполнения команд, переименованием регистров и исполнением по предположению «-.

В 1991г в Эльбрус (тогда еще ИТМиВТ) побывал г-н Розенбладт (Peter Rosenbladt) из фирмы Hewlett-Packard, и получил исчерпывающую документацию на Эльбрус-3. Позже выяснилось, что именно тогда HP начала проект, приведший к совместной с Intel разработке EPIC-процессора Merced. Его архитектура очень схожа с Эльбрус-3, а отличия в основном связаны с упрощениями сделанными в микропроцессоре от Intel.

По словам Б.А. Бабаяна, Петер Розенбладт предлагал сотрудничество с HP. Но Бабаян выбрал Sun (первая встреча с руководством Sun состоялась еще в 1989г). И в 1991г с Sun был заключен контракт. От официальных представителей Sun известно, что Эльбрус принимал участие в разработке микропроцессора UltraSPARC, оптимизирующих компиляторов, операционных систем (в том числе Solaris), инструментария Java, библиотек мультимедиа.

Первоначально проект E2k финансировался фирмой Sun. Сейчас проект полностью независим, вся интеллектуальная собственность на него принадлежит Эльбрус и защищена примерно 70-ю патентами США. Б.А. Бабаян поясняет «-Если бы мы и дальше работали с Sun в этой области, то все принадлежало бы Sun. Хотя 90% работы было выполнено еще до появления Sun «-.

В Sun с 1992 по 1995 Эльбрус работал вместе с известным микропроцессорным архитектором Дэйвом Дитцелом. Как рассказывает Б.А. Бабаян, «-Потом Дэйв образовал собственную фирму - Transmeta и начал работать над машиной, очень похожей на нашу. Мы по-прежнему поддерживаем с Дитцелом тесные контакты. Да и он очень хочет с нами сотрудничать «-. Про будущий продукт Transmeta пока известно мало. Известно, что это VLIW/EPIC микропроцессор с низким энергопотреблением, двоичная совместимость с x86 обеспечивается динамической трансляцией объектного кода.

Е2К против Itanium

64-битный процессор Intel Itanium не оправдал надежд и на бумаге сильно уступал «Эльбрус-2000».

С 1994 по 1998 годы о работе команды Бориса Бабаяна ничего не было слышно - русские готовили сенсацию. В 1998 году без особой шумихи Бабаян и Ко (порядка 400 сотрудников) переименовались в компанию «Эльбрус».

Тем временем зарубежные конкуренты не спали. В 1989 году Intel и Hewlett-Packard объединили свои силы для создания процессора нового поколения - Itanium (кодовое имя - Merced). Itanium должен был вобрать в себя все самые современные наработки и стать венцом процессоростроения. Многие ожидали, что новый процессор будет доминировать на рынке серверов, рабочих станций и, возможно, настольных компьютеров, вытеснив все остальные. Проектная частота Merced равнялась 800 МГц, уровень тепловыделения - 60 Вт, а объем кэш-памяти третьего уровня - от 2 до 4 Мбайт. При этом процессор должен был стать 64-битным.

Совершенно реальный процессор R500 от МЦСТ был блеклым отголоском многообещающего «Эльбрус-2000».

День Х настал 25 февраля 1999 года, когда на конференции Microprocessor Forum к трибуне поднялся лично Борис Бабаян и громко заявил, что его компания разработала микропроцессор «Эльбрус-2000» (Е2К), сильно опережающий хваленый Merced по всем характеристикам. Вся компьютерная общественность застыла в ожидании. Вместо запланированных двух часов Бабаян выступал четыре часа. Прозвучали ответы на вопросы относительно конкуренции со стороны западных компаний и перспектив выхода на рынок микропроцессора и компьютеров на его основе. В какой-то момент Борис Бабаян шокировал публику, заявив, что сумма для выпуска пробной партии процессоров «Эльбрус-2000» нужно $60 млн. Такая цифра отпугнула всех потенциальных инвесторов. Еще бы, ведь все обещания Бабаяна были чистой теорией - никаких инженерных сэмплов и прототипов показано не было.

Легенда компьютерного мира Гордон Бэлл (Gordon Bell), который, работая в DEC, создавал компьютеры линий PDP и VAX, а сейчас возглавляет исследовательское подразделение Microsoft (Telepresence Research Group), популяризирует проект Эльбрус E2k на международных конференциях.

Его лекция с названием «-Следующее десятилетие супервычислений»- (The Next Ten Years in Supercomputing) 26 мая 1999 г открывала Международный Симпозиум по Высокопроизводительным Вычислениям (International Symposium on High Performance Computing) в Японии, а 10 июня - четырнадцатую Манхеймовскую Конференцию по Суперкомпьютерам (Mannheim Supercomputer Conference) в Германии. Оба раза доктор Бэлл часть лекции посвятил рассказу о E2k. В слайде под названием «-Russian Elbrus E2K»- он приводит таблицу, где оценивает E2k и Merced. Причем сравнение свидетельствует явно не в пользу детища Intel.

Ниже приведена таблица из доклада Гордона Бэлла.

Микропроцессор E2K Merced
Тактовая частота, ГГц 1.2 0.8
Производительность, SPECint95 / SPECfp95 135 / 350 45 / 70
Размер кристалла, мм2 126 300
Энергопотребление, Ватт 35 60
Пропускная способность шины, Гбайт/сек 15 н/д
Кэши (Кбайт) 64 / 256 н/д
Пиковая производительность, GFLOPS 10.2 н/д
Планируемое время начала поставок 4-ый квартал 2001г н/д

Семейство процессоров Intel Pentium Производство: с 1993 по 1999 Производитель: Intel Частота ЦП : 60-300 МГц Частота FSB : 50-66 МГц Технология производства:
800-250 нм Наборы инструкций : IA-32 , MMX Разъёмы : Ядра :
  • P54CS
  • Tillamook

Pentium (произносится Пе́нтиум ) - торговая марка нескольких поколений микропроцессоров семейства x86 , выпускаемых корпорацией Intel с 22 марта 1993 года . Pentium является процессором Intel пятого поколения и пришёл на смену Intel 80486 (который часто называют просто 486).

История

Модели

Первоначально (22 марта 1993 года) было представлено только две модели, основанные на ядре P5 с частотами 60 и 66 МГц. Позже были выпущены и более производительные процессоры Pentium, основанные на усовершенствованных ядрах. Кроме того, были представлены мобильные версии процессоров и процессоры Pentium OverDrive.

Процессоры Pentium для настольных компьютеров (desktop)
Кодовое имя ядра P5 P54C P54CS P55C
Техпроцесс, нм 800 600 350
Тактовая частота ядра, МГц 60 66 75 90 100 120 133 150 166 200 166 200 233
Анонсирован 23 марта 1993 10 октября 1993 7 марта 1994 27 марта 1995 12 июня 1995 4 января 1996 10 июня 1996 8 января 1997 2 июня 1997

P5

Единственные две модели процессоров Pentium первого поколения, с тактовой частотой ядра 60 и 66 МГц, были анонсированы 23 марта 1993 года.

Процессор выпускался в 273-контактном корпусе CPGA , на материнскую плату устанавливался в процессорный разъём Socket 4 и требовал питание напряжением 5 В. Частота системной шины (FSB) была равна частоте ядра, то есть множитель ядра был равен 1,0.

Все процессоры Pentium относятся к классу SL Enhanced - это значит, что в них предусмотрена система SMM , обеспечивающая снижение энергопотребления. Кэш второго уровня размещался на материнской плате и мог иметь размер до 1 Мб. Ранние варианты процессоров, с частотами 60-100 МГц (ядра P5 и P54C), имели ошибку в модуле математического сопроцессора , которая в редких случаях приводила к уменьшению точности операции деления. Этот дефект был обнаружен в 1994 году и стал известен как «Pentium FDIV баг ».

Процессоры на ядре P5 изготавливались с использованием 800-нанометрового техпроцесса , по биполярной BiCMOS -технологии. Процессор содержит 3,1 млн транзисторов, а размер кристалла ядра составляет 294 мм². Pentium 66 потребляет ток в 3,2 А и имеет мощность 16 Вт, что потребовало установки дополнительного вентилятора. Производство таких процессоров оказалось очень сложным и процент выхода годных кристаллов оказался слишком мал. Многие специалисты, указывая на многочисленные недостатки (см.: F0 0f c7 c8) процессоров Pentium первого поколения, не советовали покупать данные модели. Производство на время пришлось остановить. Однако вскоре началось производство усовершенствованных процессоров, основанных на ядре P54C.

P54C

В процессорах Pentium второго поколения используется умножение тактовой частоты, он работает быстрее системной шины. Для указания, во сколько раз тактовая частота ядра процессора больше частоты системной шины, используется множитель. Во всех процессорах, основанных на ядре P54C, множитель равен 1,5.

P54CS

Первые процессоры, основанные на данном ядре, были выпущены 27 марта 1995 года . По сути, это ядро представляет собой ядро P54C, изготовленное с использованием 350-нанометровой биполярной BiCMOS-технологии, что позволило уменьшить размер кристалла ядра до 91 мм² (процессоры Pentium 120 и 133), однако вскоре, в результате оптимизации ядра, его размер удалось уменьшить до 83 мм² при том же количестве транзисторов. При этом Pentium 200 потреблял ток в 4,6 А, а его максимальная рассеиваемая энергия (тепловыделение) составляло 15,5 Вт.

P55C

8 января 1997 года были выпущены процессоры Pentium, основанные на ядре P5 третьего поколения (P55C). Центром разработок и исследований Intel в Хайфе (Израиль) в ядро P55C был добавлен новый набор инструкций, названный MMX (MultiMedia eXtension), существенно увеличивающий (от 10 до 60 %, в зависимости от оптимизации) производительность компьютера в мультимедиа-приложениях. В результате, эти процессоры именуются Pentium w/MMX technology (обычно сокращается до Pentium MMX). Новый процессор включает в себя устройство MMX с конвейерной обработкой команд, кэш L1 увеличен до 32 Кб (16 Кб для данных и 16 Кб для инструкций). Состоит новый процессор из 4,5 млн транзисторов и производится по усовершенствованной 280-нанометровой CMOS -технологии с использованием кремниевых полупроводников, работает на напряжении 2,8 В. Максимальный потребляемый ток равен 6,5 А, тепловыделение равно 17 Вт (для Pentium 233 MMX). Площадь кристалла у процессоров Pentium MMX равна 141 мм². Процессоры выпускались в 296-контактном корпусе типа CPGA или PPGA для Socket 7.

Pentium OverDrive

Было выпущено несколько поколений Pentium OverDrive.

  • В 1995 году вышел первый Pentium OverDrive (на ядре P24T). Он был предназначен для установки в гнёзда типа Socket 2 или Socket 3 и работал с напряжением питания 5 В, то есть служил для модернизации систем, использующих процессор 486 без замены материнской платы. При этом данный процессор обладал всеми функциями процессора Pentium первого поколения (на ядре P5). Было выпущено две модели, работающие на частотах 63 и 83 МГц, старшая потребляла ток в 2,8 А и обладала рассеиваемой мощностью 14 Вт. Из-за высокой стоимости данный процессор ушёл, не успев появиться. И хотя через некоторое время (4 марта 1996 года) на смену этим процессорам пришли Pentium ODP5V с частотами 120 и 133 МГц, основанные на ядре P5T (по сути, представляет собой ядро P54CS), они также не стали популярны.
  • 4 марта 1996 года выходит следующая версия Pentium OverDrive - Pentium ODP3V - на ядре P54CT. Данное ядро основано на ядре P54CS. Процессор выпускался в 320-контактном корпусе CPGA для Socket 5 или Socket 7.
  • 3 марта 1997 года выходят две модели Pentium ODPMT (с частотами 150 и 166 МГц), построенные на ядре P54CTB (аналог P55C). Позже, 4 августа 1997 года, выходят ещё две модели на том же ядре (с частотами 180 и 200 МГц). Они выпускались в 320-контактных корпусах CPGA и были предназначены для Socket 5 или Socket 7 (Pentium ODPMT-200 MMX - только для Socket 7).

Tillamook

Процессоры, основанные на данном ядре, предназначались для портативных компьютеров, использовались в т. н. «мобильном модуле» MMC-1 Mobile Module Connector с 280 пинами работали вместе с чипсетом Intel 430 TX и имея при этом 512 КБ кэш-памяти на системной плате. Ядро Tillamook (названо в честь города в штате Орегон , США), представляет собой ядро P55C с пониженным напряжением питания - модель с частотой 300 МГц работала с напряжением 2,0 В, потребляя при этом ток в 4,5 А и обладала тепловыделением в 8,4 Вт. Старшие модели (с частотой 233, 266 и 300 МГц) выпускались с использованием 250-нм техпроцесса и имели кристалл площадью 90 мм², также существовали версии со 166 МГц частотой ядра Модели 200 и 233 выпускались с августа 1997 г., модель 266 с января 1998, а старшая в линейке модель была представлена в январе 1999 г.

Pentium (произносится Пентиум) - торговая марка нескольких поколений микропроцессоров семейства x86, выпускаемых корпорацией Intel с 22 марта 1993 года. Pentium является процессором Intel пятого поколения и пришёл на смену Intel 80486 (который часто называют просто 486).

Отличия от i3(4)86:

  • адресная память в стравнении с предыдущей моделью не изменилась;
  • шана данных 64 бита (если Pentium 32 бита);
  • впервые 2 конвейера самостоятельно считывает и обрабатывает потоки;
  • впервые появилось спекулятивное исполнение команд;
  • впервые используется такая технология, как автоматическое переупорядочивание команд:
ADD AX,BX ADD CX,AX - пропуск, чтение следующей DX, 5h

Измененный порядок ни на что не влияет. НО проблема - условный переход.

ADD AX,BX ADD CX,AX YZ M1 MOV DX, 5h

Решение: предпологается, что переход выполнился, следовательно, произошло считывание команды в конвейер; если выясняется, что все правильно - продолжается выполнение, иначе - происходит сброс конвейера и перезагрузка с места перехода.

Основания для предположения:

  • статистика переходов (если много, кратный цикл);
  • блок предстказаний использует статистику: если переход условный, указывает назад, то с большой вероятностью выполнится. (Пример: repeat until). А если вперед, то большая вероятность, что не будет выполняться.

Впервые аппаратная поддержка мультипроцессорности (соединение с помощью специальной шины/спец интерфейса)

{Шина данных 32 ----> 64, так как 2 конвеера}

Тактовая частота Pentium: 60-150 МГц Тактовая частота MMX: 200 МГц

Существуют дополнительные регистры, отвечающие за прошедшее с начала кода число тактов.

Существует команда CPUID - идентификатор CPU.

Всевозможные регистры.

Архитектурная особенность

(до этого CISC) Существует внутренний перекодировщик преобразования CISC команд во внутренний код RISC в оболочке CISC.

Прерывание: ранее --> PIC (программный контроллер прерывания).

Ранее источник прерывающий сигнал на ножке процессора, и адрес перехода.

APIC: источник - сообщение, приходящее по специальной шине.

Процессор Intel Pentium P6200

Intel Pentium P6200 - процессор начального уровня, предназначенный для ноутбуков. Он работает на частоте 2.13 ГГц, но, к сожалению, не поддерживает технологию TurboBoost для автоматического разгона. Кроме того, отсутствует функция шифрования AES и поддержка многопоточности. CPU поддерживает технологию Enhanced Speedstep, которая позволяет снизить энергопотребление во время низкой нагрузки на процессор, но другие энергосберегающие технологии в данном процессоре отключены (также как и в серии Penryn Pentium).

P6200 основан на микроархитектуре Arrandale, следовательно, имеет встроенный контроллер памяти и графическую карту Intel HD Graphics (оба произведены по 45 нм технологическому процессу, а CPU по 32 нм). Встроенная видеокарта GMA HD работает на частоте 500 МГц и способна разгоняться до 667 МГц благодаря технологии Turbo Boost.

Производительность данного процессора немного ограничена из-за низкой тактовой частоты и отсутствия Turbo Boost и Hyperthreading. Если судить по показателю частоты в ГГц, то процессор Pentium P6200 должен быть чуть лучше, чем Core 2 Duo с аналогичной тактовой частотой, из-за встроенного контроллера памяти и небольших улучшений в ядре.

*Указанные тактовые частоты могут быть изменены производителем

История появления Pentium процессора

Одним обычным тихим воскресным утром 10 мая 1992 года,четыре инженера фирмы INTEL прибыли в аэропорт San Jose International. Установив видеоаппаратуру, Анджела Чанг, Эрик Деваннайн, Автар Саини и Сухель Заатри нервозно прохаживались по залу, ожидая с минуты на минуту самолета из Орегона.

Когда Марк Хопман, спустя несколько минут после приземления самолета, вышел из коридора, держа в руках маленький голубой чемодан, вся встречающая группа направилась к нему. Все внимание было приковано к чемодану, в котором находился продукт разработчиков 5 Орегонской фабрики. Трудно было поверить, что в этом чемодане находился результат трехлетнего труда многих людей, воплощенный в маленький чип. Так началась жизнь Pentium процессора, который формально был представлен 22 марта 1993 года.

В то время, когда Винод Дэм делал первые наброски, начав в июне 1989 года разработку Pentium процессора, он и не подозревал, что именно этот продукт будет одним из главных достижений фирмы INTEL. С появлением Pentium процессора рынок компьютеров сразу изменился и начался новый этап конкуренции. San Microsistems, MIPS и другие продавцы RISC процессоров, разрабатывающие супербыстрые чипы, безоговорочно признали, что новый процессор фирмы INTEL станет стандартом для новых настольных PC.

Процесс рождения Pentium процессора был нелегким

По теории, создавая процессор, команда разработчиков создает концепцию проекта, в котором определяются его основные свойства и нововведения. Далее инженеры проектируют логику,которая затем воплощается в конкретные схемы. Как только заканчивается схемотехническое проектирование, проектировщики топологии прорисовывают каждый транзистор. В результате их труда создается конечный шаблон.Реально же все было иначе. Традиционный процесс проектирования был кардинально переработан, поскольку требовались ускоренные темпы реализации проекта.

Как только команда разработчиков выполняла локальную задачу, мененджеры перераспределяли ресурсы. Каждый инженер решал персональную задачу. Командный дух постоянно подвергался таким испытаниям, как задержки и трудности, однако временной план выполнения проекта от этого не зависел. Для выполнения всех задач использовались самые последние достижения автоматизированного проектирования. Очень пригодился опыт, накопленный при проектировании и решении аналогичных проблем в 286, Intel386 и Intel486 процессорах.

Как только выполнялся очередной этап проекта, сразу начинался процесс всеобъемлющего тестирования. Было желание не повторить проблемы, возникшие в свое время с Intel486, задержавшие его запуск в производство. Каждая ошибка трассировалась в обратном порядке и устранялись ее причины. Остальные инженеры выполняли сотни тестирований для проверки логики, архитектуры и общей конструкции. Они выполнили более, чем 5000 уточняющих тестирований, прежде, чем Pentium процессор обрел свою архитектуру. Для тестирования была разработана специальная технология, позволившая имитировать функционирование Pentium процессора с использованием программируемых устройств, объединенных на 14 платах с помощью кабелей. Только когда были обнаружены все ошибки, процессор смог работать в реальной системе. В дополнение ко всему, в процессе разработки и тестирования Pentium процессора принимали активное участие все основные разработчики персональных компьютеров и программного обеспечения, что немало способствовало общему успеху проекта.

В конце 1991 года, когда была завершен макет процессора, инженеры смогли запустить на нем программное обеспечение. Проекировщики начали изучать под микроскопом разводку и прохождение сигналов по подложке с целью оптимизации топологии и повышения эффективности работы. Проектирование в основном было завершено в феврале 1992 года. Началось всеобъемлющее тестирование опытной партии процессоров, в течение которого испытаниям подвергались все блоки и узлы. В апреле 1992 года было принято решение, что пора начинать промышленное освоение Pentium процессора. В качестве основной промышленной базы была выбрана 5 Орегонская фабрика.

Более 3 миллионов транзисторов были окончательно перенесены на шаблоны. Началось промышленное освоение производства и доводка технических характеристик, завершившиеся через 10 месяцев, 22 марта 1993 года широкой презентацией Pentium процессора.

Современная микропроцессорная технология фирмы INTEL

Достижения фирмы INTEL в искусстве проектирования и производства полупроводников делают возможным производить мощные микропроцессоры в все более малых корпусах. Разработчики микропроцессоров в настоящее время работают с комплементарным технологическим процесом металоксид полупроводник (CMOS) с разрешением менее, чем микрон.

Использование субмикронной технологии позволяет разработчикам фирмы INTEL располагать больше транзисторов на каждой подложке. Это сделало возможным увеличение количества транзисторов для семейства X86 от 29,000 в 8086 процессоре до 1,2 миллионов в процессоре Intel486 DX2, с наивысшим достижением в Pentium процессоре. Выполненный по 0.8 микронной BiCMOS технологии, он содержит 3.1 миллиона транзисторов. Технология BiCMOS объединяет преимущества двух технологий: биполярной (скорость) и CMOS (малое энергопотребление). С помощью более, чем в два раза большего количества транзисторов Pentium процессора по сравнению с Intel486, разработчики поместили на подложке компоненты, ранее располагавшимися снаружи процессора. Наличие компонентов внутри уменьшает время доступа, что существенно увеличивает производительность. 0.8 микронная технология фирмы INTEL использует трехслойный метал и имеет уровень, более высокий по сравнению с оригинальной 1.0 микронной технологией двухслойного металла, используемой в процессоре Intel486.

Фирма INTEL использовала самые последние достижения технологии проектирования микропроцессоров для достижения преимуществ, сравнимых с альтернативными архитектурами, используемыми в научных и инженерных рабочих станциях, обеспечив при этом совместимость с програмным обеспечение стоимостью $50 миллиардов, наработанного для семейства микропроцессоров серии X86.

Да и само программное обеспечение для Pentium процессора разрабатывалось по новой технологии. Еше на этапе проектирования аппаратных средств процессора к проекту стали привлекаться эксперты из всех основных компаний, разрабатывающих операционные системы и компиляторы - Microsoft, IBM, NeXT, Borland, Watcom, MetaWare и др. Это позволило на аппаратном уровне поддержать новые технологии программирования с учетом фирменного стиля поставщиков стандартного программного обеспечения. С другой стороны, еще до рождения нового процессора использовались методы классической и специльной оптимизации, раскрывающие специфические достоинства архитектуры X86, например, использование команд загрузки-записи, мощных режимов адрессации, удаление инвариантных участков кода из циклов и т.д. Теперь, только за счет перекомпиляции традиционных приложений удается повысить их производительность на новом процессоре еще вдвое. Такого в настоящее время не может предложить не один из конкурентов фирмы INTEL.

Новое поколение процессоров фирмы INTEL

Объединяя более, чем 3.1 миллион транзисторов на одной кремниевой подложке, 32-разрядный Pentium процессор характеризуется высокой производительностью с тактовой частотой 60 и 66 МГц. Его суперскалярная архитектура использует усовершенствованные способы проектирования, которые позволяют выполнять более, чем одну команду за один период тактовой частоты, в результате чего Pentium в состоянии выполнять огромное количество PC-совместимого программного обеспечения быстрее, чем любой другой микропроцессор. Кроме существуюших наработок программного обеспечения, высокопроизводительный арифметический блок с плавающей запятой Pentium проессора обеспечивает увеличение вычислительной мощности до необходимой для использования недоступных ранее технических и научных приложений, первоначально предназначенных для платформ рабочих станций. Также, как локальные и глобальные сети продолжают вытеснять устаревшие иерархические сети, управляемые большими ЭВМ, преимущества мультипроцессорности и гибкость операционной системы Pentium процессора - идеал для Хост-компьютера для современных приложений клиент-серверов, применяемых в промышленности.

Поскольку Pentium процессор способен достигать уровня производительности равного или более высокого, чем современные рабочие станции высокого уровня, он обладает преимуществми, которых лишены обычные рабочие станции: полная совместимость с более, чем 50 000 программных приложений со стоимостью миллиарды долларов, которые были написаны под ахитектуру фирмы INTEL. В дополнение, Pentium процессор позволяет использовать все основные операционные системы, которые доступны современным настольным персональным компьютерам, рабочим станциям и серверам, включая UNIX, Windows-NT, OS/2, Solaris и NEXTstep.

Pentium процессор. Технические нововведения

Многочисленные нововведения - характерная особенность Pentium процессора в виде уникального сочетания высокой производительности, совместимости, интеграции данных и наращиваемости. Это включает:

  • Суперскалярную архитектуру;
  • Раздельное кэширование программного кода и данных;
  • Блок предсказания правильного адреса перехода;
  • Высокопроизводительный блок вычислений с плавающей запятой;
  • Расширенную 64-битовую шину данных;
  • Поддержку многопроцессорного режима работы;
  • Средства задания размера страницы памяти;
  • Средства обнаружения ошибок и функциональной избыточности;
  • Управление производительностью;
  • Наращиваемость с помощью Intel OverDrive процессора.

Архитектура Pentium процессора

1 - 64-битовый шинный интерфейс;
2 - Средства кэширования программного кода;
3 - Буферы выборки с упреждением;
4 - 32-битовый целочисленный блок АЛУ;
5 - 32-битовый целочисленный блок АЛУ;
6 - Набор регистров;
7 - Средства кэширования данных;
8 - Блок предсказания правильного адреса перехода;
9 - Блок конвеерных вычислений с плавающей запятой.

Суперскалярная архитектура

Суперскалярная архитектура Pentium процессора представляет собой совместимую только с INTEL двухконвеерную индустриальную архитектуру, позволяющую процессору достигать новых уровней производительности посредством выполнения более, чем одной команды за один период тактовой частоты. Термин "суперскалярная" обозначает микропроцессорную архитектуру, которая содержит более одного вычислительного блока. Эти вычислительные блоки, или конвееры, являются узлами, где происходят все основные процессы обработки данных и команд.

Появление суперскалярной архитектуры Pentium процессора представляет собой естественное развитие предыдущего семейства процессоров с 32-битовой архитектурой фирмы INTEL. Например, процессор Intel486 способен выполнять несколько своих команд за один период тактовой частоты, однако предыдущие семейства процессоров фирмы INTEL требовали множество циклов тактовой частоты для выполнения одной команды.

Возможность выполнять множество команд за один период тактовой частоты существует благодаря тому, что Pentium процессор имеет два конвеера, которые могут выполнять две инструкции одновременно. Так же, как и Intel486 с одним конвеером, двойной конвеер Pentium процессора выполняет простую команду за пять этапов: предварительная подготовка, первое декодирование (декодирование команды), второе декодирование (генерация адреса), выполнение и обратная выгрузка. Это позволяет нескольким командам находиться в различных стадиях выполнения, увеличивая тем самым вычислительную производительность.

Каждый конвеер имеет свое арифметическо-логическое устройство (ALU), совокупность устройств генерации адреса и интерфейс кэширования данных. Так же как и процессор Intel486, Pentium процессор использует аппаратное выполнение команд, заменяющее множество микрокоманд, используемых в предыдуших семействах микропроцессоров. Эти инструкции включают загрузки, запоминания и простые операции АЛУ, которые могут выполняться аппаратными средствами процессора, без использования микрокода. Это повышает производительность без затрагивания совместимости. В случае выполнения более сложных команд, для дополнительного ускорения производительности выполнения расширенного микрокода Pentium процессора для выполнения команд используются оба конвеера суперскалярной архитектуры.

В результате этих архитектурных нововведений, по сравнению с предыдущими микропроцессорами, значительно большее количество команд может быть выполнено за одно и то же время.

Раздельное кэширование программного кода и данных

Другое важнейшее революционное усовершенствование, реализованное в Pentium процессоре, это введение раздельного кэширования. Кэширование увеличивает производительность посредством активизации места временного хранения для часто используемого программного кода и данных, получаемых из быстрой памяти, заменяя по возможности обращение ко внешней системной памяти для некоторых команд. Процессор Intel486, например, содержит один 8-KB блок встроенной кэш-памяти, используемой одновременно для кэширования программного кода и данных.

Проектировщики фирмы INTEL обошли это ограничение использованием дополнительного контура, выполненного на 3.1 миллионах транзисторов Pentium процессора (для сравнения, Intel486 содержит 1.2 миллиона транзисторов) создающих раздельное внутреннее кэширование программного кода и данных. Это улучшает производительность посредством исключения конфликтов на шине и делает двойное кэширование доступным чаще, чем это было возможно ранее. Например, во время фазы предварительной подготовки, используется код команды, полученный из кэша команд. В случае наличия одного блока кэш-памяти, возможен конфликт между процессом предварительной подготовки команды и доступом к данным. Выполнение раздельного кэширования для команд и данных исключает такие конфликты, давая возможность обеим командам выполняться одновременно. Кэш-память программного кода и данных Pentium процессора содержит по 8 KB информации каждая, и каждая организована как набор двухканального ассоциативного кэша - предназначенная для записи только предварительно просмотренного специфицированного 32-байтного сегмента, причем быстрее, чем внешний кэш. Все эти особенности расширения производительности потребовали использования 64-битовой внутренней шины данных, которая обеспечивает возможность двойного кэширования и суперскалярной конвеерной обработки одновременно с загрузкой следующих данных. Кэш данных имеет два интерфейса, по одному для каждого из конвееров, что позволяет ему обеспечивать данными две отдельные инструкции в течение одного машинного цикла. После того, как данные достаются из кэша, они записываются в главную память в режиме обратной записи. Такая техника кэширования дает лучшую производительность, чем простое кэширование с непосредственной записью, при котором процессор записывает данные одновременно в кэш и основную память. Тем не менне, Pentium процессор способен динамически конфигурироваться для поддержки кэширования с непосредственной записью.

Таким образом, кэширование данных использует два различных великолепных решения: кэш с обратной записью и алгоритм, названный MESI (модификация, исключение, распределение, освобождение) протокол. Кэш с обратной записью позволяет записывать в кэш без обращения к основной памяти в отличие от используемого до этого непосредственного простого кэширования.

Эти решения увеличивают производитльность посредством использования преобразованной шины и предупредительного исключения самого узкого места в системе. В свою очередь MESI-протокол позволяет данным в кэш-памяти и внешней памяти совпадать - великолепное решение в усовершенствованных мультипроцессорных системах, где различные процессоры могут использовать для работы одни и те же данные.

Высокопроизводительный блок вычислений с плавающей запятой

Нарастающая волна 32-разрядных программных приложений включает много интенсивно вычисляющих, графически ориентиро-программ, которые занимают много процессорных ресурсов на выполнение операций с плавающей запятой, обеспечивающих математические вычисления. Поскольку требования к персональным компьютерам со стороны программного обеспечения по вычислениям с плавающей запятой постоянно возрастают, удовлетворить эти потребности могут усовершенствования в микропроцессорной технологии. Процессор Intel486 DX, например, был первым микропроцессором, интегрированным на одной подложке с математическим сопроцессором. Предыдущие семейства процессоров фирмы INTEL, при необходимости использования вычислений с плавающей запятой, использовали внешний математический сопроцессор.

Pentium процессор позволяет выполнять математические вычисления на более высоком уровне благодаря использованию усовершенствованного встроенного блока вычислений с плавающей запятой, который включает восьмитактовый конвеер и аппаратно реализованные основные математические функции. Четырехтактовые конвеерные команды вычислений с плавающей запятой дополняют четырехтактовую целочисленную конвееризацмю. Большая часть команд вычислений с плавающей запятой могут выполняться в одном целочисленном конвеере, после чего подаются в конвеер вычислений с плавающей запятой. Обычные функции вычислений с плавающей запятой, такие как сложение, умножение и деление, реализованы аппаратно с целью ускорения вычислений.

В результате этих инноваций, Pentium процессор выполняет команды вычислений с плавающей запятой в пять раз быстрее, чем 33-МГц Intel486 DX, оптимизируя их для высокоскоростных численных вычислений, являющихся неотъемлемой частью таких усовершенствованных видеоприложений, как CAD и 3D-графика.

Pentium процессор на тактовой частоте 66 МГц работает как "числодробилка" с рейтингом 64.5 по тесту SPECint92, практически не уступая RISC-процессору Alpha компании Digital, но с тактовой частотой вдвое более высокой.

Общая производительность Pentium процессора превосходит в 6 раз 25 МГц Intel486 SX и в 2.6 раз - 66 МГц Intel486 DX2. Индекс по рейтингу iCOMP для 66 МГц Pentium процессора, который выполняет 112 миллионов операций в секунду, составляет 567. Индекс по iCOMP (Intel COmparative Microprocessor Peformance) выполняет относительное сравнение производительности 32-битовых процессоров фирмы INTEL.

Расширенная 64-битовая шина данных

Pentium процессор снаружи представляет собой 32-битовое устройство. Внешняя шина данных к памяти является 64-битовой, удваивая количество данных, передаваемых в течение одного шинного цикла. Pentium процессор поддерживает несколько типов шинных циклов, включая пакетный режим, в течение которого происходит порция данных из 256 бит в кэш данных и в течение одного шинного цикла.

Шина данных является главной магистралью, которая передает информацию между процессором и подсистемой памяти. Благодаря этой 64-битовой шине данных, Pentium процессор существенно повышает скорость передачи по сравнению с процессором Intel486 DX - 528 MB/сек для 66 МГц, по сравнению со 160 MB/сек для 50 МГц процессора Intel486 DX. Эта расширенная шина данных способствует высокоскоростным вычислениям благодаря поддержке одновременной подпитки командами и данными процессорного блока суперскалярных вычислений, благодаря чему достигается еще большая общая производительность Pentium процессора по сравнению с процессором Intel486 DX.

В общем, имея более широкую шину данных, Pentium процессор обеспечивает конвееризацию шинных циклов, что способствует увеличению пропускной способности шины. Конвееризация шинных циклов позволяет второму циклу стартовать ранше завершения выполнения первого цикла. Это дает подсистеме памяти больше времени для декодирования адреса, что позволяет использовать более медленные и менее дорогостоящие компоненты памяти, уменьшая в результате общую стоимость системы. Ускорение процессов чтения и записи, параллелилизм адреса и данных, а также декодирование в течение одного цикла - все вместе позволяет улучшить пропускную способность и повышает возможности системы.

Мультипроцессорность

Pentium процессор - это идеал для наростающей волны мультипроцессорных систем, а также высочайший уровень производительности и вычислительной мощности в области современных вычислительных средств. Мультипроцессорные приложения, которые соединяют два или более Pentium процессоров - хорошо обслуживаются посредством усовершенствованной архитектуры кристаллов, раздельным встроенным кэшированием программного кода и данных, а также наборами микросхем для управления внешней кэш-памятью и утонченными средствами контроля целостности данных.

Как обсуждалось ранее, Pentium процессор поддерживает упорядоченный кэш с его MESI протоколом. Когда один процессор получает доступ к данным, которые кэшируются в другом процессоре, он имеет возможность приема правильных данных. И если данные модифицировались, все процессоры получают возможность доступа к приему данных в модифицированном виде. Новейший Pentium процессор фирмы INTEL также определяет, какие команды распознаются системой в соответствии с ипользуемым способом программирования. Это строго определенно подсказывает, каким образом программному обеспечению, разработанному для однопроцессорной системы, корректно работать в многопроцессорном окружении.

Средства разделения памяти на страницы

Pentium процессор предлагает опции поддержки любой из традиционных размеров страниц памяти - 4 KB или более широкие, 4 MB страницы. Эта опция позволяет производить вычисление частоты свопинга страниц в комплексных графических приложениях, буферах фреймов, а также ядер операционных систем, где увеличенный размер страницы сейчас позволяет пользователям перепланировать шире первоначально громоздкие объекты. Увеличение страниц дает результат в виде повышения производительности, причем все это отражается на прикладном программном обеспечении.

Определение ошибок и функциональная избыточность

Хорошая защита данных и обеспечение их целостности посредством внутренних средств становится крайне важным в приложениях, критичным к потерям данных благодаря распространению современного окружения клиент-серверов. Pentium процессор содержит два усовершенствования, традиционно присущих проектированию класса больших ЭВМ - внутреннее определение ошибок и контроль за счет функциональной избыточности (FCR) - это помогает обеспечить целостность данных развивающихся сегодня систем, базирующихся на настольных компьютерах.

Внутреннее определение ошибок дополняет битом четности внутренний код и кэширование данных, сдвиговую ассоциативную таблицу страниц, микрокод, а также целевой буфер перехода, помогая определять ошибки таким образом, что это остается незаметным и для пользователя, и для системы. В то же время контроль с помощью функциональной избыточности оптимизирован для приложений, критических к потерям данных, где Pentium процессор может работать в конфигурации основной/контролирующий. Если между двумя процессорами обнаруживаются разногласия, система извещается об ошибке. В результате происходит обнаружение более, чем 99% ошибок.

Кроме того, на подложке процессора расположено устройство встроенного тестирования. Самотестирование охватывает более 70% узлов Pentium процессора, не требует выполнения сброса кристалла и представляет собой процедуру, обычно используемую при диагностике систем. Другими встроенными решениями является реализация стандарта IEEE 1149.1, позволяющая тестировать внешние соединения проессора и отладочный режим, дающий возможность программному обеспечению просматривать регистры и состояние процессора.

Управление производительностью

Управление производительностью - особенность Pentium процессора, что позволяет разработчикам систем и прикладных расширений оптимизировать свои аппаратные и программные средства посредством определения потенциально узкого места для программного кода. а работчики могут наблюдать и считать такты для внутренних событий процессора, таких, как производительность чтения и записи данных, кэширование совпадений и выпадений, прерываний и использования шины. Это позволяет им измерять эффективность, которую имеет код в двойной архитектуре Pentium процессора и в своих продуктах и выполнять тонкую настройку своих приложений или систем для достижения оптимальной производительности. Выгода для конечных пользователей - это более высокие достоинства и высшая производительность, и все это благодаря хорошему взаимодействию с Pentium процессором, пользовательской системой и прикладным программным обеспечением.

Давая возможность разработчикам проектировать системы с управлением энергопотреблением, защитой и другими свойствами, Pentium процессор поддерживаем режим управления системой (SMM), подобный режиму архитектуры Intel SL.

Наращиваемость

Вместе со всем, что сделано нового для 32-битовой микропроцессорной архитектуры фирмы INTEL, Pentium процессор сконструирован для легкой наращиваемости с использованием архитектуры наращивания фирмы INTEL. Эти нововведения защищают инвестиции пользователей посредством наращивания производительности, которая помагает поддерживать уровень продуктивности систем, основанных на архитектуре процессоров фирмы INTEL, больше, чем продолжительность жизни отдельных компонентов. Технология наращивания делает возможным использовать преимущества большинства процессоров усовершенствованной технологи в уже существующих системах с помощью простой инсталяции средства однокристального наращивания производительности. Например, первое средство наращивания - это OverDrive процессор, разработанный для процессоров Intel486 SX и Intel486 DX, использующий технологию простого удвоения тактовой частоты, использованную при разработке микропроцессоров Intel486 DX2.

Посредством наращивания одного из этих дополнительных процессоров в сокет, расположенный возле центрального микропроцессора на большинстве материнских платах Intel486, пользователи могут увеличить общую производительность системы более, чем на 70% практически для всех программных приложений.

Технология наращивания с помощью OverDrive процессоров возможна и для систем, основанных на семействе Pentium процессора, посредством простой установки в будущем процессора, выполненного по усовершенствованной технологии. В свою очередь, технология Pentium процессора является основой дополнительного процессора, разрабатываемого для систем, базируемых на Intel486 DX2.

Процессоры Pentium фирмы Intel представляют пятое поколение процессоров семейства х86. По базовой регистровой архитектуре и системе команд они совместимы с вышеописанными 32-битными процессорами, но имеют 64-битную шину данных, благодаря чему их иногда ошибочно называют 64-разрядными. По сравнению с предыдущими поколениями процессоры Pentium имеют следующие качественные отличия:

  • Суперскалярная архитектура: процессор имеет два параллельно работающих конвейера обработки (U-конвейер с полным набором инструкций и V-конвейер с несколько ограниченным набором), благодаря чему он способен одновременно выполнять две инструкции. Однако преимущества этой архитектуры полностью реализуются только при специальном режиме компиляции ПО.
  • Применение технологии динамического предсказания ветвлений совместно с выделенным внутренним кэшем команд объемом 8 Кбайт, обеспечивает максимальную загрузку конвейеров.
  • Внутренний (Level 1) кэш данных объемом к Кбайт в отличие от 486-го работает с отложенной (до освобождения внешней шины) записью и настраивается на режим сквозной или обратной записи, поддерживая протокол
  • Внешняя шина данных ради повышения производительности имеет разрядность 64 бит, что требует соответствующей организации памяти.
  • Встроенный сопроцессор за счет архитектурных улучшений (конвейеризации) в 2-10 раз превосходит FPU-486 по производительности.
  • Введено несколько новых инструкций, в том числе распознавание семейства и модели CPU.
  • Применено выявление ошибок внутренних устройств (внутренний контроль паритета) и внешнего интерфейса шины, контролируется паритет шины адреса.
  • Введена возможность построения функционально-избыточной двухпроцессорной системы.
  • Реализован интерфейс построения двухпроцессорных систем с симметричной архитектурой (начиная со второго поколения Pentium).
  • Введены средства управления энергопотреблением.
  • Применена конвейерная адресация шинных циклов.
  • Сокращено время (число тактов) выполнения инструкций.
  • Введена трассировка инструкций и мониторинг производительности.
  • Расширены возможности виртуального режима - введена виртуализация флага прерываний.
  • Введена возможность оперирования страницами размером 4 Мб в режиме страничной переадресации (Paging).

Все Pentium-процессоры имеют средства SMM, возможности которых расширялись по мере появления новых моделей. Средства тестирования включают возможность выполнения встроенного теста BIST (Built-In Self Test), обеспечивающего выявление ошибок микрокодов, программируемых логических матриц, тестирование командной кэш-памяти, кэш-памяти хранения данных, буфера быстрой переадресации и ROM. Все процессоры имеют стандартный тестовый порт IEEE 1149.1, позволяющий тестировать процессор с помощью интерфейса JTAG.

В процессорах реализованы новые дополнительные средства отладки:

  • зондовый режим (Probe Mode), обеспечивающий доступ к внутренним регистрам и пространствам ввода-вывода системной памяти процессора Pentium. Этот режим позволяет проверять и изменять состояние CPU, обеспечивая средства для отладки программ с возможностями, подобными внутрисхемным эмуляторам;
  • расширения отладки DE (Debug Extensions), позволяющие ставить контрольные точки по адресам ввода-вывода;
  • внутренние счетчики, используемые для текущего контроля производительности и учета числа событий;
  • пошаговое исполнение с помощью команды CPUID.

Процессоры Pentium первого поколения (Р5) с тактовой частотой 60 и 66 МГц имели напряжение питания 5 В, что приводило к большому тепловыделению (на частоте 66 МГц - 16 Вт). Они выпускались в корпусах PGA-273 (матрица 21x21), для установки этих процессоров предназначен сокет 4.

Первые модели процессоров имели ошибку в FPU (floating point flaw), выражавшуюся в потере точности при выполнении деления с некоторыми сочетаниями операндов. Ошибка могла появляться от 4-го до 19-го разряда после десятичной точки. С начала 1995 года процессоры выпускались уже без ошибок. Статистические исследования показывают, что ошибка может проявляться раз в несколько лет. Тем не менее фирма Intel до сих пор обеспечивает бесплатную замену уже проданных процессоров с ошибкой на исправленные версии, но без «апгрейда» на более современные модели. Процессоры с ошибкой могут быть выявлены с помощью утилиты CPUIDF.EXE, которую можно получить на Web-сервере компании.

Pentium Overdrive 120 и 133 МГц (Overdrive for Pentium) - вариант процессора Pentium второго поколения (с пониженным энергопотреблением и удвоением частоты), предназначенный для замены процессоров Pentium 1-го поколения. Он имеет корпус PGA-273, устанавливаемый в сокет 4. Эти процессоры дороже обычных Pentium 120 или 133, их применение имеет смысл только тогда, когда по каким-либо причинам нет возможности заменить старую системную плату, а производительности Pentium 60 или 66 Мгц недостаточно. Но более мощный процессор в такую плату все равно уже не поставить.

Процессоры Pentium второго поколения (Р54) имеют напряжение питания 3,3 В и менее, что существенно снижает рассеиваемую мощность. При этом их входные и выходные сигналы остаются совместимыми с ТТЛ, однако для входов допустимый уровень сигнала ограничен на уровне 3,3 В (кроме тактовых входов CLC и PICCLC, допускающих уровень до 5 В). Более совершенные модели второго поколения используют технологию снижения напряжения питания VRT (Voltage Reduction Technology). При этом напряжение питания VCC для интерфейсных схем остается равным 3,3 В, а для питания ядра, потребляющего около 90% мощности, VCC снижено до 2,9 В, что уменьшает рассеиваемую мощность.

Процессоры изготавливаются в корпусах SPGA-296 с шахматным расположением выводов, для их установки предназначены сокеты 5 и 7. Сокет 7 имеет две шины питания: VCC2 для питания ядра процессора и VCC3 для питания интерфейсных схем - и допускает установку процессоров с VRT-технологией.

В процессорах второго поколения применяется внутреннее умножение частоты, при этом интерфейсные схемы внешней системной шины работают на частотах 50, 60 или 66,66 МГц, а ядро процессора работает на более высокой частоте (75, 90, 100, 120, 133, 150, 166, 180 и 200 МГц). Разделение частот позволяет реализовать достижения технологии изготовления процессоров, существенно опережающие возможности повышения производительности памяти и других традиционных компонентов компьютера. Коэффициент умножения (1,5, 2, 2,5 или 3) задается комбинацией уровней сигналов на входах BF0, BF1 в пределах, разрешенных спецификацией тактовой частоты процессора. Независимость установки внешней частоты и коэффициента умножения позволяет одну и ту же внутреннюю частоту задавать разными способами. Например, 100 МГц можно получить и как 50x2, и как 66,66x1,5. Последний вариант в общем случае предпочтительнее, поскольку при этом шина PCI будет работать на частоте 33 МГц, а не 25 МГц. Однако бывают и исключения: если установленная память при частоте 66 МГц потребует больше тактов ожидания, чем при 50 МГц, то предпочтительнее скорее всего будет частота 50 МГц.

Процессоры с различающимися значениями тактовых частот, указанных в маркировке на корпусе, выполняются по одним и тем же шаблонам (схемам) в пределах одной группы степпинга (см. ниже). Маркировка частоты наносится после жестких отбраковочных испытаний в зависимости от частоты, на которой он полностью прошел выходной контроль. Это открывает возможности для «разгона» процессоров, включая и пиратскую перемаркировку, когда на процессор наносится новое обозначение завышенной тактовой частоты. Против перемаркировки в некоторых моделях процессоров устанавливали специальные схемы, не допускающие разгона.

Pentium OverDrive 125, 150 и 166 МГц - вариант процессоров 2-го поколения для замены Pentium 75, 90 и 100 МГц. От обычных в основном отличаются фиксированным (установленным внутри корпуса) коэффициентом умножения частоты. Предназначены для установки в сокет 5 или 7.

Процессоры Pentium MMX (Р55С) - новое поколение процессоров, основанное на MMX-технологии, ориентированной на мультимедийное, 2D- и 3D- графическое и коммуникационное применение. В архитектуру Pentium введены восемь 64-битных регистров (точнее, появилась возможность иного использования регистров FPU), 4 новых типа данных и 57 дополнительных мнемоник инструкций для одновременной обработки нескольких единиц данных (SIMD - Single Instruction Multiple Data). Одновременно обрабатываемое 64-битное слово может содержать как одну единицу обработки, так и восемь однобайтных, четыре двухбайтных, или два четырехбайтных операнда. В остальных командах обеспечивается совместимость с Pentium.

Кроме MMX-расширения, в архитектуре Pentium MMX имеется ряд усовершенствований, повышающих его производительность и на обычных операциях. Более эффективный способ предсказания ветвлений позаимствован у Pentium Pro, удвоено число буферов записи (их стало четыре) и удвоен объем обеих частей кэша L1 (теперь 16+16 Кб), увеличено число ступеней конвейеров, улучшена возможность параллельных вычислений (процессор способен выполнять две SIMD-инструкции с 16-битными данными за 1 такт).

В двухпроцессорных системах Pentium MMX поддерживает только симметричную архитектуру, возможность функционально-избыточного контроля (FRC) изъята.

Применено раздельное питание ядра (напряжение 2,7-2,9 В, номинал 2,8 В) и интерфейсных схем (3,135 - 3,6 В, номинал 3,3 В). Процессор совместим по выводам с Pentium второго поколения с технологией VRT и устанавливается в сокет 7 (установка в сокет 5 механически возможна, но электрически недопустима).

Процессоры Pentium для мобильных применений имеют пониженное энергопотребление, обеспеченное снижением напряжения питания ядра процессора. Кроме того, из этих процессоров изъяты средства поддержки двухпроцессорных систем, APIC и соответствующие им внешние выводы. Процессоры этого класса исполняются в корпусах SPGA, а также в корпусах TCP, имеющих выводы, расположенные по периметру корпуса.

Интерфейс шины процессоров Pentium

По интерфейсу шина процессора Pentium напоминает шину i486, но имеет заметные отличия. Новые особенности направлены на поддержку политики обратной записи кэша, повышение производительности и обеспечение дополнительных функциональных возможностей. Если шина i486 была ориентирована на максимальную гибкость и простоту подключения устройств с различной разрядностью, то шина Pentium ориентирована на достижение максимальной производительности. Шина данных стала 64-битной для повышения производительности обмена с памятью. Возможность динамического управления разрядностью шины (сигналы BS16# и BS8#) изъята, согласование по разрядности с интерфейсными шинами возложено на микросхемы чипсета.

При разрешенном контроле паритета данных (сигналом PEN) ошибка вызывает не только срабатывание сигнала РСНК#, но и фиксацию сбойного адреса и данных в регистре машинного контроля. А если установлен бит MCE регистра CR4, по этой ошибке генерируется исключение 18.

В дополнение к контролю паритета шины данных введен контроль паритета шины адреса. Обнаруженная ошибка паритета бит А шины адреса только вызывает сигнал ошибки АРСНК#, который может быть обработан системной логикой. Пакетные циклы выполняются только при обращениях к памяти, причем как при чтении (как это было у 486-го), так и при записи. Пакетные циклы связаны только с кэшируемой памятью, при этом кэшируемость памяти подразумевает и ее поддержку пакетного режима. Во время пакетного цикла сигналы разрешения байт и младшие биты адреса А не меняются (пакеты всегда выровнены по границам строк кэша). Порядок чередования адресов (табл. 1), как и у процессора 486, оптимизирован для двухбанковой организации памяти. Снова появилась конвейерная адресация на шине (как у 286-го и 386-го), что позволяет одновременно на шине присутствовать двум обслуживаемым запросам. На рис.1 и 2 приведены временные диаграммы одиночных и конвейеризованных пакетных циклов. Признаком пакетного цикла (и его окончания) является сигнал CACHE#. Внешняя система не может прервать пакетный цикл, начатый процессором (в 486-м она могла заставить процессор любой пакетный цикл преобразовать в обычные сигналом RDY#). Конвейеризация запрашивается сигналом NA#, в ответ на который процессор через такт выдаст адрес следующего цикла. Без конвейеризации следующий адрес (и тип цикла) был бы выставлен только после завершения передачи данных текущего цикла.

Как и у предыдущих процессоров, тип шинного цикла задается управляющими сигналами М/Ю#, D/C# и W/R#, действующими одновременно со стробом ADS#. Кроме циклов обращения к памяти, вводу-выводу и подтверждения прерывания, процессор имеет специальные шинные циклы, идентифицируемые по комбинации сигналов ВЕ# (табл.2). Эти циклы, так же как и остальные, требуют подтверждения сигналом BRDY#.

Рис.1. Одиночные циклы чтения и записи на шине Pentium


Рис.2. Конвейеризованные пакетные циклы чтения на шине Pentium

Процессор имеет вход EWBE#, с помощью которого он отслеживает состояние внешних буферов отложенной записи для обеспечения корректной последовательности шинных циклов записи. Для поддержания согласованности данных кэша и основной памяти процессор отрабатывает циклы слежения (Snoop Cycle или Inquire Cycle), инициированные внешней (для него) системой. Эти циклы, как и в 486-м, используют сигналы AHOLD#, EADS# и ответные сигналы процессора HIT# и HITM#. Сигнал FLUSH# вызывает выгрузку всех модифицированных строк первичного кэша (обратную запись). Циклы слежения инициируется системой для определения присутствия затребованной области памяти в строке какой-либо кэш памяти и определения ее состояния. Процессоры, начиная с Pentium, поддерживают протокол MESI, названный по определяемым им состояниям М (Modified), Е (Exclusive), S (Shared) и I (Invalid). Состояния определяются следующим образом:

M-state - строка присутствует только в одном кэше и модифицирована, то есть отличается от содержимого основной памяти. Доступ к этой строке возможен без генерации внешнего (по отношению к локальной шине) цикла обращения;
E-state - строка присутствует только в одном кэше, но не модифицирована. Доступ к этой строке возможен без генерации внешнего цикла обращения, при записи в нее она перейдет в состояние «М»;
S-state - строка потенциально может присутствовать в нескольких кэшах. Ее чтение возможно без генерации внешнего цикла, а запись в нее должна сопровождаться сквозной записью в основную память, что повлечет аннулирование соответствующих строк в других кэшах;
I-state - строка отсутствует в кэше, ее чтение может привести к генерации цикла заполнения строки. Запись в нее будет сквозной и выйдет на внешнюю шину.

Инициализация процессора выполняется по сигналу RESET, как и для предыдущих процессоров. В дополнение ко входу сброса RESET введен сигнал INIT, по которому процессор переходит в то же состояние, что и по сигналу RESET, но сохраняя содержимое кэша и регистров FPU. Этот сигнал может быть использован для переключения из защищенного режима в реальный.

Во время действия сигнала RESET должны установиться значение на входах управления коэффициентом умножения BF и частота на входе CLC. Колебания входной частоты не могут быстро отрабатываться схемой умножителя, построенной на основе петли фазовой автоподстройки частоты PLL (Phase Lock Loop). При нестабильности генератора входной частоты работоспособность процессора не гарантируется.

Для процессоров первого поколения умножение частоты не применялось (KF=1). Для процессоров с частотой 75-133 МГц коэффициент умножения (1,5 или 2) официально определялся сигналом BF, но фактически многие процессоры воспринимали два сигнала: BF0 (называемый просто BF) и BF1. Значение коэффициентов умножения для различных моделей Pentium приведены в табл.3. Пока что они отличаются только трактовкой коэффициента по умолчанию (когда оба вывода BF0 и BF1 свободны), но для грядущего процессора 266 МГц, вероятно, комбинация 10 будет означать коэффициент 4 (а не 2, как указано в справочном листке на процессоры ММХ).

Таблица 3. Коэффициент умножения частоты процессоров

Pentium 75-133 МГц Pentium ММХ 166-233 МГц
BF KF FCORE* KF FCORE*
00 2.5 150, 166 2.5х 166
01 3.0 180, 200 3.0x 200
10 2.0 100, 120, 133 2.0x Нет
11 1.5 75, 90, 100 3.5x 233**
* Частота ядра указана для внешней частоты 66,66 МГц.
** Допустимый диапазон внешней частоты 33,33-66,66 МГц.

В момент окончания действия сигнала RESET процессор кроме нормального рабочего режима может быть переведен в один из следующих режимов:

  • BIST (Built-In Self Test) - встроенный тест, выполняемый приблизительно за 219 тактов ядра и охватывающий около 70% внутренних блоков процессора. Во время выполнения теста процессор не генерирует внешних циклов. После выполнения теста процессор переходит в рабочий режим, о результате завершения можно судить по содержимому регистра ЕАХ. Нулевое значение указывает на исправность, любое другое - на отказ какого-либо блока. Если во время выполнения BIST процессор обнаружит внутреннюю ошибку паритета, он выставит сигнал IERR# и попытается выполнить ShutDown. BIST запускается при высоком уровне сигнала INIT во время спада сигнала RESET;
  • Tristate Test Mode - режим, при котором все (кроме TDO) выходные и двунаправленные сигналы переходят в третье состояние, включается по низкому уровню сигнала FLUSH# во время спада сигнала RESET;
  • FRC - режим, при котором процессор работает в качестве проверяющего в функционально-избыточной двухпроцессорной системе. Включается при низком уровне на входе FRCMC# во время спада сигнала RESET.

Для процессоров Pentium источниками аппаратно вызываемых прерываний являются следующие входные сигналы, расположенные в порядке убывания приоритета:

  • BUSCHK# - контроль шины, вызывающий исключение MCE;
  • R/S# - переключение в зондовый режим;
  • FLUSH# - очистка кэш-памяти (может вызвать поток операций записи);
  • SMI# - прерывание входа в режим SMM;
  • INIT - «мягкий» сброс процессора;
  • NMI - немаскируемое прерывание;
  • INTR - запрос маскируемых прерываний;
  • STOPCLK# - останов синхронизации.

Здесь понятие прерывания трактуется несколько шире и относится ко всем событиям, заставляющим процессор генерировать внешние циклы вне очереди, определяемой прерываемой последовательностью инструкций (таким образом можно определить действие сигнала FLUSH#). Если в процессоре разрешена работа контроллера APIC, то прерывания, поступающие по его шине, заменяют в данном списке сигналы NMI и INTR.

Процессоры второго поколения имеют возможность изменять порядок приоритета прерываний с помощью бита ITR (бит 9 регистра TR12). В табл.4 приведены два возможных варианта приоритетов прерываний.

Зондовый режим отладки (Probe Mode) использует тестовый порт ТАР (Test Acess Port) подключения интерфейса JTAG. Этот интерфейс может использоваться не только для тестирования (Boundary Scan), но и для отладочных целей. Для этого в состав порта ТАР введен сигнал R/S#, по его отрицательному перепаду процессор завершает выполнение текущей инструкции и останавливается, сообщив об этом сигналом PRDY. В этом состоянии по интерфейсу JTAG внешнее отладочное устройство может «пообщаться» со всеми внутренними регистрами процессора, после чего, возвратив сигнал в неактивное состояние (высокий уровень), «отпустить» процессор для продолжения выполнения прерванного потока инструкций. По предоставляемым возможностям отладки зондовый режим эквивалентен внутрисхемному эмулятору - мечте любого разработчика самого аппаратно-зависимого программного обеспечения. Для подключения порта ТАР фирма Intel предлагает на системной плате устанавливать специальный 20- или 30-штырьковый разъем, к которому подключается шлейф внешнего отладчика. На этот разъем выводятся сигналы процессора R/S#, PRDY, TDI, TDO, TMS, ТСК и TRST# - все, что нужно для внутрисхемной отладки. Но даже если этого разъема нет на системной плате, подключиться к выводам ТАР можно через специальную переходную колодку, к которой подключен шлейф ТАР. Колодка вставляется в сокет, а в нее - процессор. Есть и сдвоенные колодки для отладки двухпроцессорных систем.

Таблица 4. Приоритеты прерываний процессоров Pentium
Прерывание ITR = 0 (по умолчанию) ITR = 1
1 Точка останова (INT 3) Точка останова (INT 3)
2 BUSCHK# BUSCHK#
3 Ловушки отладки (INT 1) FLUSH#
4 R/S# SMI#
5 FLUSH# Ловушки отладки (INT 1)
6 SMI# R/S#
7 INIT INIT
8 NMI NMI
9 INTR INTR
10 Ошибка FPU Ошибка FPU
11 STPCLK# STPCLK#
12 Отказ на следующей инструкции

Режим SMM реализован аналогично предыдущим процессорам 386SL и 486SL, но начиная со второго поколения имеется возможность рестарта инструкций (см. табл. 3.9) и входа в SMM по сообщению, принятому с шины APIC.

Процессоры Pentium 2-го поколения имеют возможность снижения энергопотребления в нерабочем режиме (табл. 5). По сигналу STOPCLK# процессор выгружает буфера записи и входит в режим Stop Grant, в котором прекращается тактирование большинства узлов процессора, что вызывает снижение энергопотребления примерно в 10 раз. В этом состоянии он прекращает исполнение инструкций и не обслуживает прерывания, однако продолжает слежение за шиной данных, отслеживая кэш-попадания. Из этого состояния процессор выходит по снятию сигнала STOPCLK#. Управление сигналом STOPCLK# совместно с использованием режима SMM реализует механизм расширенного управления питания АРМ (Advanced Power Management). При отсутствии активности внешняя схема (чипсет) по команде, исполненной в режиме SMM, устанавливает данный сигнал. По пробуждающему событию внешняя схема (без участия процессора, который «спит») снимает сигнал, и процессор продолжает работу. Кроме того, с помощью сигнала STOPCLK# возможно и замедление процессора (с пропорциональным снижением потребляемой мощности), если на этот вход подавать периодический импульсный сигнал. Скважность импульсов будет определять коэффициент простоя процессора и, следовательно, его производительность (как бы снижая условную тактовую частоту).

В состояние пониженного потребления Auto HALT PowerDown процессор переходит при исполнении инструкции HALT. В этом состоянии процессор реагирует на все прерывания и также продолжает слежение за шиной. В режиме остановки внешней синхронизации процессор потребляет минимальную мощность, но в этом режиме он не выполняет никаких функций, а последующая подача синхронизации должна сопровождаться сигналом аппаратного сброса RESET.

*В режиме остановки синхронизации процессор потребляет менее 0,3 Вт.

В Pentium первого поколения имеются выходные сигналы трассировки, отражающие работу конвейеров (IU, IV), факты ветвлений (IBT) и трассу ветвлений ВТЗ-ВТО. Однако в процессорах второго поколения этих выводов нет - видимо, их наблюдать стало уже не интересно. Назначение сигналов приведено в табл.6.

Таблица 6. Назначение сигналов процессора Pentium
Сигнал I/O Назначение
А I/O Address - сигналы шины адреса. Линии А являются входными в циклах слежения
А20М I А20 Mask - маскирование бита А20 физического адреса для эмуляции адресного пространства 8086. При конфигурировании на двухпроцессорное применение сигнал игнорируется
ADS# O Address Status - сигнал идентификации адресного цикла, во время которого действительны сигналы W/R#, D/C#, M/IO#, ВЕ и А
ADSC#* O Address Status Copy - функционально идентичен ADS#, используется для разгрузки линии ADS#
AHOLD I Address Hold - запрос доступа к внутренней шине адреса процессора от другого контроллера шины для организации циклов слежения
АР I/O Address Parity - контрольный бит паритета шины адреса
APCHK# O Address Parity Check - сигнал ошибки паритета шины адреса
APICEN/ PICD1 * I Advanced Programmable Interrupt Controller Enable - сигнал разрешения работы APIC высоким уровнем во время спада сигнала RESET. Если APIC разрешен, в рабочем режиме вывод используется для линии данных APIC (Programmable Interrupt Controller Data 1)
BE#
BE#
O
I/O
Byte Enable - сигналы, указывающие на используемые байты шины данных в данном цикле шины. Сигналы ВЕ# используются для задания идентификатора APIC во время действия сигнала RESET. BE4# используется как вход во время цикла FLUSH в двухпроцессорных системах
BF I Bus Frequency - управление коэффициентом умножения частоты (см. табл.3). У Pentium 60 и 66 МГц отсутствуют
BOFF# I Backoff - сигнал, принудительно переводящий все выходы в высокоимпедансное состояние. Если он вводится во время шинного цикла, после снятия сигнала шинный цикл возобновится
BP# O Breakpoint - сигналы, указывающие на попадание в точку останова по отладочным регистрам DR3 и DR2
PM/BP# O Perfomance Monitor/Breakpoint - сигналы, указывающие на попадание в точку останова по отладочным регистрам DR1 и DR0 или срабатывание счетчиков, используемых для мониторинга производительности процессора
BRDY# I Burst Ready - вход готовности, по которому завершается текущий цикл передачи данных. В отличие от i486 сигнал используется для завершения всех циклов (сигнал RDY# исключен, пакетные циклы процессор применяет только к кэшируемой памяти, подразумевая их безусловную поддержку системой)
BRDYC#*
Burst Ready Copy - логический эквивалент сигнала BRDY#
BREQ O Bus Requred - сигнал внутреннего запроса процессором доступа к шине. Действует и в то время, когда процессор не управляет шиной
BUSCHK# I Bus Check - сигнал, которым система может сообщить о неудачном завершении шинного цикла. При этом адрес и управляющие сигналы фиксируются в регистрах MCR, и при установленном бите MCE в регистре CR4 вырабатывается исключение «machine check exception». Не действует при активном сигнале STPCLK#
CACHE# O Для циклов, инициированных процессором, указывает на внутреннюю кэшированность цикла (при чтении) и на пакетный цикл в случае записи. Если сигнал во время чтения неактивен, процессор не будет кэшировать принятые данные, независимо от сигнала KEN#. Сигнал используется и для определения длины цикла (числа передач)
CLK I Clock - внешний сигнал синхронизации процессора
CPUTYP* I CPU Туре - определение типа процессора. У первичного (в двухпроцессорной системе) или единственного процессора вывод должен быть заземлен, у вторичного - соединен с шинои VCC. Для процессоров OverDrive применяется для определения необходимости использования протокола квитирования (в системах с двумя сокетами)
D/P#* O Dual/Primary - индикатор процессора. Первичный процессор, управляя шиной, устанавливает низкий уровень сигнала
D/C# O Data / Code# - сигнал, определяющий тип шинного цикла (высокий уровень при передаче данных памяти или ввода-вывода, низкий - при выборке кода, в цикле подтверждения прерывания или при останове)
D I/O Data - сигналы шины данных
DP I/O Data Parity - биты паритета байт шины данных
PICDO * I/O Dual Processing Enable - разрешение двухпроцессорного режима. Для вторичного процессора - выход, позволяющий первичному процессору (у которого этот сигнал является входным) определить присутствие вторичного по низкому уровню во время действия сигнала RESET#. Используется для индикации наличия процессора в сокете. В рабочем режиме используется как линия данных APIC
EADS# I External Address - индикатор присутствия действительного адреса на выводах шины адреса процессора. Используется для выполнения цикла слежения внутреннего кэша
EWBE# I External Write Buffer Empty - индикатор пустоты внешних буферов записи. Если во время генерации цикла записи процессор обнаруживает неактивное состояние этого сигнала, операция будет задержана для предоставления возможности внешним буферам выгрузить свои операции на шину
FERR# O Floating Point Error - сигнал ошибки мат. сопроцессора. Используется как запрос прерывания по ошибке
FLUSH# I Cache Flush - сигнал для полной очистки внутреннего кэша. По этому сигналу производятся все обратные записи, после чего специальным циклом подтверждения сообщит о завершении очистки. Если этот сигнал устанавливается перед окончанием действия сигнала RESET, процессор переходит в тестовый режим с высокоимпедансным состоянием выходных и двунаправленных линий
FRCMC#* I Functional Redundancy Checking Master/Checker - вход, определяющий роль процессора в функционально-избыточной паре: основной или проверочный. Воспринимается только во время сигнала RESET#
HIT#, HITM# O Сигналы результатов операции слежения за транзакцией. HIT# (Snoop Hit) указывает на кэш-попадание. HITM# (Hit Modified) указывает на попадание в модифицированную строку, запрещая другим контроллерам шины обращаться к этим данным до выполнения обратной записи (WB). Сигналы появляются через два такта после сигнала EADS# соответствующего цикла слежения
HLDA O Hold Acknowledge - подтверждение предоставления управления локальной шиной другому контроллеру
HOLD I Hold Request - запрос управления локальной шиной от другого контроллера
IERR# O Internal Error - сигнал обнаружения внутренней ошибки паритета или несравнения в режиме FRC
IGNNE# I Ignore Numeric Error - игнорирование ошибки сопроцессора - запрет вырабатывания исключения. Используется для совместимости с АТ, где вместо исключения вырабатывается аппаратное прерывание
INIT I Initialization - 4мягкая» инициализация процессора. Сигнал приводит к сбросу общих регистров и переходу по вектору, заданному при конфигурировании по включению. Содержимое кэш-памяти, буферов записи и регистров FPU не затрагивается. Если сигнал активен во время окончания действия сигнала RESET#, процессор выполняет BIST
LINT (NMI, INTR) I Local APIC Interrupt - входы прерываний локальных контроллеров APIC. Если работа API С запрещена, LINT0 становится сигналом INTR, LINT1 - сигналом NMI. По сигналу RESET# работа API С разрешается и входы работают в режиме APIC, который может быть отменен программно. Во время действия сигнала RESET# используются для конфигурирования умножителя частоты
INV I Invalidation - вход аннулирования строки в случае попадания в цикле опроса (во время действия сигнала EADS#)
KEN# I Cache Enable - разрешение кэширования памяти, к которой происходит обращение в текущем цикле
LOCK# O Bus Lock - сигнал монополизации управления шиной, вырабатывается на время выполнения инструкции по префиксу LOCK и автоматически при выполнении инструкций XCHG с памятью, подтверждения прерывания и доступа к таблицам дескрипторов
M/IO# O Memory/ IO# Select - высокий уровень указывает на обращение к памяти (или останов), низкий - на обращение к портам ввода-вывода или подтверждение прерывания
NA# I Next Address - вход, сигнализирующий о готовности внешнего ОЗУ принять следующий адрес обращения до завершения текущей передачи данных. Следующий адрес (вместе со стробом EADS#) появится через два такта после NA#. Процессор может держать на внешней шине до двух незавершенных циклов
PBGNT#* I/O Private bus grant - линия, используемая в двухпроцессорных системах для передачи управления локальной шиной
PBREQ#* I/O Private bus request - линия запроса локальной шины в двухпроцессорных системах
PCD O Page Cache Disable - запрет кэширования страницы (вывод состояния бита PCD регистра CR3, каталога или таблицы страниц). PCD может принудительно устанавливаться битом общего запрета кэширования CD регистра CR0
PWT O Page Write Through - кэширование страницы с алгоритмом WT (вывод состояния бита PWT регистра CR3, каталога или таблицы страниц)
PCHK# O Patrity Check - сигнал ошибки паритета любого из разрешенных байт
PEN# I Parity Enable - вход, определяющий вместе с битом MCE регистра CR4 генерацию исключения в случае возникновения ошибки паритета в текущем цикле чтения
PHIT#* I/O Private hit - сигнал кэш-попадания, используемый для обеспечения когерентности первичной кэш-памяти в двухпроцессорных системах
PHITM#* I/O Private modified hit - сигнал кэш-попадания в модифицированную строку, используемый для обеспечения когерентности первичной кэш-памяти в двух-процессорных системах
PICCLK* I APIC Clock - синхронизация шины APIC
PRDY O Probe Ready - сигнал готовности зонда, используемый аппаратными средст-вами отладки. Указывает на остановку нормального исполнения в ответ на сигнал R/S# (вход в зондовый режим)
R/S# I Run/Stop# - вход, останавливающий нормальное исполнение инструкций и переводящий в зондовый режим по отрицательному перепаду
RESET I Сброс процессора - конфигурирование процессора, инициализация регистров, очистка кэша (без выполнения обратной записи) и переход к вектору сброса (по умолчанию OFFFFFFFOh). Если по окончании действия сигнала активен сигнал INIT#, процессор выполняет BIST
SCYC O Split Cycle - индикатор сблокированного невыровненного цикла (требующего дополнительных передач)
SMI# I System Management Interrupt - сигнал прерывания для входа в режим SMM
SMIACT# O Сигнал индикации режима SMM
STPCLK# I Stop Clock - асинхронный сигнал, переводящий процессор в состояние Stop Grant с малым потреблением
WB/WT# I Write Back/Write Through - вход, позволяющий с точностью до каждой строки определить политику записи при кэшировании
TRST# I Test Reset - сигнал сброса логики ТАР
TCK I Test Clock - синхронизация при тестировании по интерфейсу JTAG
TDI I Test Data Input - входные данные при тестировании по интерфейсу JTAG
TDO O Test Data Output - выходные данные при тестировании по интерфейсу JTAG
TMS I Test Mode State - выбор режима тестирования JTAG
VCC2 I Питание ядра (2,9 В)
NC I No Connected - выводы, которые должны оставаться неподключенными
VCC2DET# O Сигнал управления регулятором напряжения VCC2 (используется для авто-матического включения второго источника в процессорах с VRT)
VCC3 I Питание интерфейса (3,3 В)
VSS I Общий провод питания (GND)
W/R# O Write/Read - сигнал, определяющий тип шинного цикла (запись/чтение)
*Выводы ADSC#, BRDYC#, CPUTYP, D/P#, FRCMC#, PBGNT#, PBREQ#, PHIT#, PHITM#, PICCLK, PICDO и PICD1 у процессоров для мобильных применений отсутствуют.

Расширения архитектуры

Относительно базовой архитектуры 32-разрядных процессоров и ее развития в процессорах четвертого поколения процессоры Pentium (и старше) имеют ряд расширений, появляющихся по мере совершенствования моделей. Для возможности получения сведений о них в систему команд включена инструкция CPUID, позволяющая программно в любой момент времени (а не только сразу после сигнала RESET) получить сведения о классе, модели и архитектурных особенностях конкретного процессора. Подробно применение этой инструкции описано в п. 7.2.

В дополнение к базовой архитектуре 32-разрядных процессоров Pentium имеет набор регистров, специфических для модели - MSR (Model Specific Registers). В их число входит группа тестовых регистров (TR1-TR12), средства мониторинга производительности, регистры-фиксаторы адреса и данных цикла, вызвавшего срабатывание контроля машинной ошибки. Название этой группы регистров указывает на их возможную несовместимость для разных классов (Pentium и Pentium Pro) и даже моделей процессоров. Программа, их использующая, должна опираться на сведения о процессоре, полученные по инструкции CPUID.

Средства для мониторинга производительности включают таймер реального времени и счетчики событий. Таймер TSC (Time Stamp Counter) представляет собой 64-битный счетчик, инкрементируемый с каждым тактом ядра процессора. ДЛЯ чтения его содержимого предназначена инструкция RDTSC.

Счетчики событий CTRO, CTR1 разрядностью по 40 бит программируются на подсчет событий различных классов, связанных с шинными операциями, исполнением инструкций, событиями во внутренних узлах, связанных с работой конвейеров, кэша, контролем точек останова и т. п. Шестибитные поля типов событий позволяют каждому из счетчиков независимо назначить подсчет событий из обширного списка. Состояние счетчиков может быть предустановлено и считано программно. Кроме того, имеются внешние сигналы РМ, которые программируются на указание фактов срабатывания или переполнения соответствующих счетчиков. Поскольку эти сигналы могут менять свое значение с частотой, не превышающей частоту системной шины, из-за внутреннего умножения частоты каждое появление этих сигналов может отражать и несколько (до значения коэффициента умножения) фактов срабатывания счетчиков.

Тестовые регистры позволяют управлять большинством функциональных узлов процессора, обеспечивая возможность весьма подробного тестирования их работоспособности. С помощью бит регистра TR12 можно запретить новые архитектурные свойства (предсказание и трассировку ветвлений, параллельное выполнение инструкций) а также работу первичного кэша:

  • бит 0 - NBP (No Branch Prediction) - запрещает заполнение буфера ВРВ. При этом прежние вхождения продолжают действовать, для полного отключения предсказания необходимо загрузить регистр CR3 (это вызовет сброс таблицы ветвлений);
  • бит 1 - TR - разрешает формирование специального цикла сообщения о ветвлении;
  • бит 2 - SE (Single Pipe Execution) - запрещает работу второго конвейера (отменяет парное исполнение инструкций);
  • бит 3 - Cl (Cache Inhibit) - запрещает заполнение строк первичного кэша. В отличие от бита CD регистра CR0, этот бит не влияет на сигнал PCD, тем самым обеспечивается возможность работы внешнего вторичного кэша при запрещенном первичном (в тестовых целях);
  • бит 9 - ITR (Ю Trap Restart) - разрешает поддержку рестарта инструкций ввода-вывода при прерываниях SMI.

В технической информации на процессоры Pentium есть упоминание о свойстве «Programmable Buffer Size». Первое, что приходит в голову при переводе, будет звучать «как программируемый размер буферов» и наводит на мысль о буферах записи. На самом деле к свойствам программной или логической архитектуры это не имеет никакого отношения, а является способностью управлять чисто электрическими свойствами буферных схем интерфейса.

Двухпроцессорные системы

Процессоры Pentium начиная со второго поколения имеют специальные интерфейсные средства для построения двухпроцессорных систем. Интерфейс позволяет на одной локальной системной шине устанавливать два процессора, при этом почти все их одноименные выводы просто непосредственно объединяются. Целью объединения является либо использование симметричной мультипроцессорной обработки SMP (Symmetric Multi-Processing), либо построение функционально-избыточных систем FRC (Functional Redundancy Checking).

В системе с SMP каждый процессор выполняет свою задачу, порученную ему операционной системой. Поддержку SMP имеют такие ОС, как Novell NetWare, Windows NT, Unix. Оба процессора разделяют общие ресурсы компьютера, включая память и внешние устройства. В каждый момент времени шиной может управлять только один процессор из двух, по определенным правилам они меняются ролями.

Поскольку каждый из процессоров имеет свой внутренний первичный кэш, в круг задач интерфейса входит поддержание согласованности данных во всех иерархических ступенях оперативной памяти (два первичных, один вторичный кэш и основная память). Эта задача решается с помощью локальных циклов слежения, воспринимаемых процессором, не управляющим шиной в данный момент по сигналу ADS#, генерируемому другим процессором. Ответами на локальные циклы слежения являются сигналы PHIT# и PHITM#, а роль сигналов HIT# и HITM# остается прежней - они используются во внешних (по отношению к обоим процессорам) циклах слежения, инициируемых сигналами EADS#.

Для обработки аппаратных прерываний в многопроцессорных системах традиционные аппаратные средства становятся непригодными, поскольку прежняя схема подачи запроса INTR и передачи вектора в цикле INTA# явно ориентирована на единственность процессора. Для решения этой задачи в структуру процессоров Pentium начиная со второго поколения введен расширенный программируемый контроллер прерывания APIC (Advanced Programmable Interruption Controller). Этот контроллер имеет внешние сигналы локальных прерываний LINT и трехпроводную интерфейсную шину (PICD и PICCLK), по которым оба процессора связываются с контроллером APIC системной платы. Запросы локальных прерываний обслуживаются только тем процессором, на выводы которого (LINTO, LINT1) поступают их сигналы. Общие (разделяемые) прерывания (в том числе и SMI) приходят к процессорам в виде сообщений по интерфейсу APIC. При этом контроллеры предварительно программируются, определяя функции каждого из процессоров в случае возникновения того или иного аппаратного прерывания. Контроллеры APIC каждого из процессоров и контроллер системной платы, связанные интерфейсом APIC, выполняют маршрутизацию прерываний (Interrupt Routing), причем как статическую, так и динамическую. Внешне программный интерфейс обработки прерываний остается совместимым с управлением контроллера 8259А, что обеспечивает прозрачность присутствия APIC для прикладного программного обеспечения. Режим обработки прерываний посредством APIC разрешается сигналом APICEN по аппаратному сбросу, впоследствии он может быть запрещен программно.

Арбитраж процессоров выполняется с помощью «приватных» сигналов запроса (PBREQ#) и подтверждения передачи (PBGNT#) управления локальной шиной. Процессор - текущий владелец шины - отдаст управление шиной другому процессору по его запросу только по завершении операции. Сблокированные циклы не могут прерываться другим процессором, кроме случая, когда обращение к памяти попадает в область, модифицированный образ которой находится в кэше другого процессора. В этом случае, индицируемом сигналом PHITM#, ему отдадут управление для выполнения обратной записи из кэша. Сигналы обычного системного арбитража (HOLD, HLDA, BOFF#) в двухпро-цессорной системе действуют обычным образом, но воспринимаются и управляются поочередно текущим владельцем локальной шины.

В конфигурации FRC два процессора выступают как один логический: функционально-избыточная пара master/checker. Основной процессор (Master) работает в обычном однопроцессорном режиме. Проверочный процессор выполняет все те же операции «про себя», не управляя шиной, и сравнивает выходные сигналы основного (проверяемого) процессора с теми сигналами, которые он генерирует сам, выполняя те же операции без выхода на шину. В случае обнаружения расхождения вырабатывается сигнал ошибки IERR, который может обрабатываться как прерывание.

Двухпроцессорные системы в принципе могут использовать процессоры различного степпинга, но частоты ядра у них должны совпадать (шина, естественно, синхронизируется общим сигналом).

Маркировка и идентификация процессоров Pentium

Процессоры Pentium имеют довольно сложную систему маркировки. На верхней плоскости корпуса указывается семейство, к которому принадлежит процессор, код продукта и тактовая частота Например, обозначение А80502-90 относится ко второй модели Pentium с частотой 90 МГц. Надписи © ’92 ’93 или © ’92 ’95 в нижней строке к году выпуска отношения не имеют.

Трехзначное число, следующее за символами SX, SK, SU, SY или SZ называется S-спецификацией, определяющей номер версии (степпинг) продукта и его параметры. Степпинг производителя (Mfg. Stepping) кодируется последовательностью букв и цифр. По мере исправления ошибок и незначительных изменений увеличивается цифра (то есть после А1 последует А2). Значительные изменения сопровождаются изменением буквы и сбросом цифры (например, после АЗ последует ВО). В пределах одного степпинга производителя имеется группа изделий с различными S-спецификациями.

Существуют следующие модификации некоторых параметров процессоров:
STD (стандартное) - питание VCC = 3,135-3,6 В для процессоров типа С2 и последующих
VR (Volt Reduced) - пониженное питание VCC = 3,300-3,465 В;
VRE - для С2 и последующих VCC = 3,40-3,60 В; для B-step 3,45-3,60 В;
MD означает пониженные требования к временным характеристикам.

Напряжение питания указывается в маркировке явно (например, 2.9 В) после трехзначной S-спецификации или кодируется в символах, следующих за слэшем. В обозначении вида SK113 / ABC поля А, В и С несут следующую информацию:
поле А задает диапазон напряжения питания: S = STD, V=VRE;
поле В задает спецификации временных параметров: S - стандартная, М - пониженные требования (MD);
поле С задает возможность работы в двухпроцессорной системе: S - стандартная, U - процессор может работать только в однопроцессорной системе, в двухпроцессорном режиме не тестировался.

Информацию о процессоре содержит регистр EDX после аппаратного сброса, ее же можно получить и из регистра ЕАХ после выполнения инструкции CPUID (запустив, например, утилиту CPUID.EXE). Заметим, что информация о допустимой тактовой частоте в процессоре не хранится, а появляется только в маркировке после отбраковочных испытаний. В табл.7 приведены параметры выпускаемых процессоров (по состоянию на май 1997 года). В первых четырех графах указаны биты регистров EDX или ЕАХ, в которых хранятся данные коды. Тип 0 сообщает первичный процессор (или единственный в однопроцессорной системе), тип 2 - вторичный процессор двухпроцессорной системы. Семейство 5 указывает на принадлежность процессора к классу Pentium. Модель указывает на поколение (Pentium 60/66 представляли модель 1). Степпинг производителя (Mfg. Stepping) символьно отражает модель, числовой степпинг и тип корпуса. Данной таблицей можно воспользоваться для разрешения сомнений о корректности применения конкретного процессора в определенных условиях. Для однопроцессорных систем наибольший интерес представляет уровень напряжения питания.

Таблица 7. Модификации процессоров Pentium 75-200 МГц

Процессоры для мобильных применений отличаются пониженным энергопотреблением и более высокой допустимой температурой, что позволяет их использовать в довольно тесных корпусах с плохими условиями вентиляции.

Типы сокетов для процессоров Pentium

Для установки процессоров Pentium разработаны три типа сокетов - 4, 5 и 7 (табл. 8 и 9).

Сокет 4 (рис.3) предназначен для процессоров первого поколения (60 и 66 МГц). Он имеет матрицу выводов 21x21 и напряжение питания 5 В.

Сокет 5 предназначен для процессоров Pentium второго поколения с частотой до 100 МГц, у которых коэффициент умножения фиксирован и составляет 1,5 и применяется одно напряжение питания около 3,3 В. Выводы его матрицы размером 37x37 расположены в шахматном порядке (рис.4).

Таблица 11. Питание в сокете 7

Процессоры, совместимые с Pentium

К процессорам пятого поколения, кроме классического Pentium фирмы Intel, относятся и ряд процессоров других фирм. Часть из них имеет некоторые черты процессоров шестого поколения, но в данной главе рассмотрим процессоры, имеющие интерфейс, совместимый с процессором Pentium.

Фирма AMD выпускает два семейства процессоров, совместимых по выводам с Pentium - К5 и К6. Процессоры этих типов могут устанавливаться в сокеты 7, некоторые версии К5 могут работать и в сокетах 5. Процессоры программно совместимы с семейством х86 и имеют логотип, указывающий на совместимость с Windows. Однако их можно смело устанавливать только в системные платы, в описании которых есть явное указание на возможность их применения. В противном случае возможны неприятности с работой кэш-памяти, которые не выявляются многими тестовыми программами. Системные платы, поддерживающие процессоры AMD, учитывают некоторую специфику режимов работы буферных интерфейсных схем.

Процессоры AMD, как всегда, отличаются наличием развитых средств SMM и управления энергопотреблением. Цена этих процессоров ниже аналогичных изделий Intel.

AMD К5 PR75/90/100/120/133/166 и выше - Pentium-совместимые процессоры, предназначенные для установки в сокет 7. По сравнению с процессорами Intel эти процессоры имеют некоторые черты шестого поколения: более сложный конвейер, исполнение по предположению, изменение порядка выполнения инструкций, переименование регистров и некоторые другие. В обозначении производительности применяется P-Rating (см. п. 7.3), причем тактовая частота ядра может быть ниже обозначения PR. Например, процессор с обозначением вида AMD-K5 PR133ABQ 100MHz имеет Р-рейтинг 133 и частоту ядра 100 МГц. Буквы, идущие за значением PR, отражают следующие параметры:

А - тип корпуса (SPGA),

В - напряжение питания.

Возможные варианты для процессоров с одним питанием:

В=3,5 В (3,45-3.60)

С=3,3 В (3,30-3.465)

F=3.3 В (3.135-3.465)

Для будущих процессоров с раздельным питанием ядра и интерфейса:

G=x/y - автоматическое определение

Q - допустимая температура корпуса. Возможны варианты:

Иногда те же процессоры обозначаются и как AMD5K86 75 MHz (90, 100...).

Процессоры имеют внешние частоты 50, 60 и 66,66 МГц, но используют иной ряд коэффициентов умножения: 1,5, 1,75, 2, как показано в табл.12.

Вывод BF (совпадающий с BF0) в первых моделях позволял задавать коэффициент 1,5 (BF=1) или 2 (BF=0). Выводы BF позволяют задавать коэффициенты 1,5 (BF=10 или И), 1,75 (BF=00). Сочетание 11 зарезервировано.

Таблица 12. Частоты и коэффициенты умножения процессоров AMD К5
P-Rating Код модели - DX Частота ядра Частота шины BF BF Коэффициент умножения
AMD-K5-PR75 0 75 50 1 - 1,5
AMD-K5-PR90 0 90 60 1 - 1,5
AMD-K5-PR100 0 100 66.66 1 - 1,5
AMD-K5-PR120 1 90 60 - 10 1,5
AMD-K5-PR133 1 100 66.66 - 10 1,5
AMD-K5-PR166 2 116.7 66.66 - 00 1,75

Процессоры поддерживают возможность функционально-избыточной двух-процессорной архитектуры (FRC), однако интерфейса симметричных мультип-роцессорных систем не имеют.

Как и в Pentium 2-го поколения, интерфейс JTAG дополнен сигналами R/S# и PRDY, реализующими зондовый режим отладки.

AMD-Кб ММХ - процессор, по архитектуре ядра и свойствам напоминающий Pentium II (или Pentium Pro с поддержкой ММХ, что примерно одно и то же). Однако в отличие от этих процессоров, AMD-Кб ММХ не имеет внутреннего вторичного кэша и устанавливается в стандартный сокет 7, что является весьма привлекательным свойством. Вопрос применимости этого процессора в широко распространенных системных платах упирается в основном в поддержку конкретной версией BIOS, замена которой при использовании флэш-памяти не представляет собой большой технической проблемы. Процессор имеет раздельный первичный кэш данных и инструкций, по 32 Кб каждый. Кэш данных двухпортовый, поддерживает обратную запись. Кэш инструкций имеет дополнительную область для предварительно декодированных инструкций. Предсказание ветвлений выполняется по двухступенчатой схеме, обеспечивая достоверность предсказаний на уровне 95%. Не вдаваясь в подробности архитектурных решений, можно сказать, что в этом процессоре отражены практически все достижения, имеющиеся в процессоре Pentium И, включая режимы управления потреблением и тактированием. В отличие от процессоров Intel Р54 и Р55, процессор AMD-Кб ММХ не имеет встроенных средств поддержки многопроцессорных систем, включая APIC. У него отсутствует сигнал проверки шинных операций (BUSCHK), нет зондового режима и не выводятся сигналы точек останова (ВР) и монитора производительности (РМ).

Питание ядра (VCC2=2,9 В для 166 и 200 МГц и VCC2=3,2 В для 233 МГц) и интерфейсных цепей (VCC3=3,3 В) разделено, что снижает рассеиваемую мощность, которая не превышает 17,2, 20,0 и 28,3 Вт для процессоров с частотами 166, 200 и 233 МГц соответственно. В режиме Stop Grant потребление снижается до сотен милливатт.

Входная частота 66,66 МГц, коэффициент умножения задается тремя сигналами BF в соответствии с данными табл.13. Процессор Кб имеет дополнительный вход управления умножителем частоты BF2, отсутствующий у Pentium.

По назначению выводов BF при BF2=1 процессор совпадает с Intel Pentium MMX, для получения коэффициентов 4,5-5,5 системная плата должна иметь третий джампер.

Процессоры фирмы Cyrix по архитектуре выбиваются из пятого поколения, причем в обе стороны. В них применяется «принстонская» архитектура первичного кэша (общий кэш для инструкций и данных) с некоторыми дополнительными архитектурными особенностями. Специальный механизм (Data Dependency removal) снижает число остановок конвейеров процессора («больное место» Pentium Pro на 16-битных приложениях).

Cyrix 6x86 (Ml) - процессоры, по выводам совместимые с Pentium, но имеющие архитектурные черты шестого поколения процессоров. К ним относится переименование регистров, исполнение по предположению, изменение порядка выполнения инструкций и т. п. Унифицированный первичный кэш размером 16 Кб используется как для инструкций, так и для данных; дополнительно имеется 256-байтный кэш инструкций. Процессор устанавливается в сокет 7. Несмотря на уход архитектуры вперед, Windows 95 и некоторые диагностические программы могут ошибочно идентифицировать процессор 6x86 как 486-й. Однако если BIOS поддерживает процессор Cyrix, в заставке POST тип процессора определяется верно. Если бы ОС Windows 95 определяла его как Pentium, программы, использующие специфические инструкции Pentium, могли бы работать некорректно, поскольку не все эти инструкции реализованы в процессоре 6x86. Как и в процессорах Cyrix 5x86, имеется та же «болезнь роста» - с этим процессором могут «зависать» некоторые программы, в частности написанные с помощью системы Clipper. Дело опять-таки в задержках, реализованных на программных циклах. Для их удлинения фирма предлагает специальные программы-замедлители, доступные по адресу ftp://ftp.cjnix.com/tech/pipeloop.exe . Для использования пакета 3D-Studio с данным процессором предлагаются Patch- файлы, доступные по адресу ftp://ftp.ktx.com/download/patches/3dsr4/fast_cpu/ fstcpufx.exe.

В обозначении вида Cyrix 6х86-Р120+ элемент 120+ означает производительность, превышающую производительность процессора Pentium 120 МГц (Р-рейтинг). Выпускаются процессоры с производительностью Р120+, Р133+, Р150+, Р166+ и Р200+. Их отличительной особенностью является фиксированный коэффициент умножения, равный двум, и тактовые частоты ядра, меньшие, чем у соответствующих процессоров Pentium. Внешние частоты процессоров составляют 50, 55, 60, 66,66 и 75 МГц, что создает некоторые проблемы: частота 55 МГц (для Р133+) имеется не на всех системных платах ввиду ее использования только одним типом процессора, а частота 75 МГц (для Р200+) редко поддерживается, поскольку для многих компонентов системной платы пока еще является слишком высокой.

Процессоры 6x86 используют питание 3.3 (имеют в обозначении элемент С016) или 3,52 В (С028, С052), напряжение питания может указываться в маркировке и явно. Потребляемая мощность достигает 25 Вт (на уровне потребления Pentium Pro), что предъявляет более жесткие требования к охлаждению процессора и к рассеиваемой мощности внешнего регулятора напряжения. Максимально допустимая температура корпуса +70°С. Процессоры с раздельным питанием 6x86L используют 2,8 В для питания ядра и 3,3 В для питания интерфейсных схем. По потреблению и охлаждению с ними особых проблем не возникает.

Cyrix 6х86МХ - усовершенствованный вариант процессора Ml, включающий поддержку ММХ, реализацию специфических инструкций Pentium (мониторинг производительности, счетчик реального времени), расширенный до 64 Кб унифицированный первичный кэш. Изменяемые коэффициенты умножения 2, 2,5, 3 и 3,5 облегчают выбор внешней частоты (табл.14).

Процессоры устанавливаются в сокет 7. Питание ядра 2,8 В, интерфейсных схем 3,3 В.

Процессоры разработки Cyrix, выпускаемые на заводах IBM, продаются под торговой маркой IBM.

Таблица 14.Частоты и коэффициенты умножения процессоров Cyrix
Процессор Частота шины Частота ядра Коэффициент
6x86-Р120+ 50 100 2
6x86-Р133+ 55 110 2
6x86-Р150+ 60 120 2
6х86-Р166+ 66 133 2
6х86-Р200+ 75 150 2
6x86MX-PR166GP 60 150 2,5
6x86MX-PR200GP 66 166 2,5
6x86MX-PR233GP 75 188 2,5

Процессор Cyrix MediaGX™ является новым словом в архитектуре процессоров для PC и предназначен для недорогих портативных и настольных систем. Кроме обычного ядра, реализующего систему команд Pentium, процессор имеет встроенный графический контроллер VGA с 2D-акселераторами, использующий унифицированную архитектуру памяти UMA, а также аудиоканал. Сам процессор имеет интерфейс динамической памяти и шины PCI. К нему в комплекте должен использоваться еще один кристалл Сх5510 с контроллерами шин ISA, IDE, всеми традиционными системными средствами PC и портом MIDI.

Процессор вместе со своим кристаллом-компаньоном предназначен для установки на специализированные системные платы. По состоянию на начало июня 1997 года доступны процессоры с частотой ядра 120, 133 и 150 МГц.

Чипы серии Pentium D стали первыми процессорами для настольных систем, которые включали 2 вычислительных модуля на одном кремниевом кристалле. Именно такое исполнение позволяло им увеличить быстродействие в задачах, которые требовали наличия нескольких физических ядер. Именно о серии этих новаторских центральных процессоров и пойдет речь в данном материале.

Предыстория появления

В начале 2005 года в мире процессорных решений сложилась весьма проблематичная ситуация: дальнейшее повышение тактовой частоты было уже невозможным, а увеличивать производительность все же было необходимо. Поэтому в существующую организацию персональных компьютеров необходимо было вносить определенные изменения, суть которых сводилась к тому, что на одном кристалле начали изготавливать уже 2 вычислительных модуля. При выполнении однопоточных приложений быстродействие оставалось на том же уровне. А вот в случае запуска программного кода, оптимизированного уже под 2 ядра, такая компоновка позволяла получить существенное увеличение быстродействия, которое в некоторых случаях могло достигать 30-40 процентов. Первым таким чипом и стал процессор Pentium D. По существу, какой-либо большой новизны в полупроводниковых кристаллах данного продукта не было по той причине, что это были хорошо известные модули обработки кода “Пентиум 4”. Только в последних ядро было лишь только одно, то вот в “Пентиум Д” их было уже два.

Ниша процессоров данного семейства

Первые Pentium D позиционировались компанией “Интел” как доступные флагманские решения с высоким уровнем быстродействия. К тому же, как было уже отмечено ранее, данные процессорные устройства имели 2 ядра на одной кремниевой подложке. На ступеньку ниже в сегменте продукции “Интел” на то время располагались “Пентиум 4” с поддержкой НТ. У них был один физический блок и два логических. То есть программный код такие решения могли обрабатывать в 2 потока. В результате в рамках платформы LGA775 они обеспечивали средний уровень быстродействия. На нишу же офисных систем были нацелены процессоры серии Celeron. Скромные технические характеристики не позволяли их использовать в каких-либо других сферах.

Что входило в список поставки?

В двух списках комплектации можно было встретить ЦПУ серии Pentium D от “Интел”. Один из них расширенный и называется ВОХ. В него компания-производитель включила следующее:

    Фирменную коробку из картона.

    Прозрачный пластиковый чехол для безопасной транспортировки процессорного устройства.

    Систему охлаждения, разработанную компанией “Интел”. В нее входил воздушный кулер и специальная модификация термопасты, которая способствовала улучшенному отводу тепла с ЦПУ.

    Краткое руководство по применению в бумажном виде.

    Наклейка с логотипом семейства процессоров.

    Гарантийный талон.

Наиболее оптимально такой вариант поставки подходил для использования ЦПУ в номинальном режиме. Если же планировалось “разгонять” процессор, то предпочтительней уже выглядела комплектация TRAIL. Она была практически полностью идентична перечню поставки ВОХ. Разница лишь только заключалась в отсутствии системы охлаждения. В этом случае ее необходимо было приобретать отдельно. Как правило, вариант комплектации TRAIL приобретался компьютерными энтузиастами, которые затем оснащали свои ПК продвинутой системой охлаждения. Это позволяло разогнать компьютер и увеличить его быстродействие.

Процессорный разъем. Архитектурные особенности

В сокет LGA775 должен был устанавливаться любой чип линейки Pentium D. Характеристики же их указывали на то, что не все материнские платы данной платформы поддерживали такие ЦПУ. Поэтому при сборке новой вычислительной системы необходимо в обязательном порядке проверить список поддерживаемых моделей процессоров и найти в нем “Пентиум Д”. Эту же самую процедуру нужно делать и в случае модернизации персонального компьютера. Как было отмечено ранее, 2 ядра обычных кристалла “Пентиум 4” входили в состав Pentium D. Температура из-за такой компоновки подложки в процессе работы существенно возрастала. Чтобы исключить перегрев полупроводниковой основы ЦПУ, компания “Интел” вынуждена была существенно снизить номинальные значения тактовых частот. В результате не существенно уменьшилась производительность в однопоточных задачах, а вот в программном коде, оптимизированном на 2 потока, быстродействие увеличилось.

Первое поколение “Пентиум Д”

Впервые Intel Pentium D был представлен в мае 2005 года. Кодовое название данного семейства - Smithfield. Изготавливались эти ЦПУ по технологии 90 нм, тепловой пакет у них был заявлен на уровне 130 Вт. Младшая модель с индексом 805 имела тактовую частоту 2,66 ГГц, а шина данных на материнской плате при этом функционировала на 533 МГц. Все остальные чипы имели частоту системной шины 800 МГц. Причем как первого, так и второго поколения. Наиболее же производительная модель ЦПУ маркировалась индексом 840. Ее рабочая частота была равна 3,2 ГГц. Кэш первого уровня был равен 64 Кб, а второго - 2 кластера по 1 Мб. Количество транзисторов в этом случае было равно 230 миллионам, а площадь кристалла составляла 206 мм 2 .

Вторая ревизия чипов данного поколения

Через год было выпущено обновленное поколение данного семейства чипов. Первым нововведением стал техпроцесс. Теперь полупроводниковые кристаллы изготавливались по технологии 65 нм. Это позволило уменьшить площадь кристалла до 140 мм 2 . Но при этом тепловой пакет ЦПУ не изменился и остался равен 130 Вт. Второе важное обновление - это увеличение тактовой частоты. Ее минимальное значение было установлено производителем на отметке 2,8 ГГц для чипов индексом 915. Флагманов в этом случае было 3. Pentium D 945 и 950 функционировали на частоте 3,4 ГГц, а 960 - 3,6 ГГц. Еще одно важное нововведение - это увеличение кэша второго уровня в 2 раза - до 2 кластеров по 2 Мб. Именно за счет сочетания этих нескольких факторов и удалось компании “Интел” добиться увеличения производительности, которое в процентном соотношении могло достигать 20 процентов.

Стоимость

На момент начала продаж стоимость таких чипов находилась в диапазоне от 70 до 110 долларов. С учетом позиционирования и возможностей такой ценник был вполне оправдан. Сейчас же с начала продаж прошло уже достаточно много времени, но встретить такие процессоры в продаже все еще можно. Только цены на них существенно снизились и находятся в диапазоне от 30 до 50 долларов. Например, Pentium D 945 сейчас стоит 3800 рублей. С учетом того, что основная ниша таких ЦПУ - это офисные системы, то подобный подход к ценообразованию целиком и полностью оправдан. При этом остальные комплектующие в таком персональном компьютере обойдутся значительно дешевле. Поэтому “Пентиум Д” - достойный вариант для сборки недорогих ПК с низким быстродействием.

За немногим более чем 10 лет своего существования процессоры Pentium фирмы Intel прошли огромный путь. Только тактовая частота возросла более чем в 53 раза, с 60 МГц до 3200 МГц. Также Intel является автором многих разработок, которые уже потом, использовали такие компании как AMD и VIA.

Всего за эти 10 лет были выпущены следующие семейства процессоров:

  • 1993 год - Intel Pentium
  • 1995 год - Intel Pentium PRO
  • 1997 год - Intel Pentium MMX
  • 1997 год - Intel Pentium II
  • 1999 год - Intel Pentium !!!
  • 2000 год - Intel Pentium 4

А теперь рассмотрим каждое из них подробнее.

Все началось 22-го марта 1993 года. Именно тогда Intel представляет первые процессоры под торговой маркой Pentium , которая на долгие годы стала синонимом слова процессор.

Это был первый процессор с двухконвейерной структурой. Носил кодовое имя P5 . Имел тактовые частоты 60 и 66 МГц. Частота шины совпадала с тактовой частотой процессора. Процессоры содержали более 3.1 млн. транзисторов и выпускались по технологии 0.80 мкм, а позже – 0.60 мкм. Размер кэша первого уровня L1 составлял 16 Кб - 8 Кб на данные и 8 Кб на инструкции, в то время как кэш второго уровня размещался на материнской плате и мог иметь объем до 1 Мб. Процессор выпускался для разъема Socket 4.

Через год, в марте 1994 года Intel выпускает второе поколение Pentium (ядро P54 ).

Процессор имел частоты от 75 до 200 МГц. Частота шины 50-66 МГц. Размер кэша L1 остался прежним – 16 Кб (8 Кб на данные и 8 Кб на инструкции). Кэш второго уровня остался на материнской плате, и мог иметь объем до 1 Мб. При производстве этого процессора Intel применяет более совершенный техпроцесс 0.50 мкм. Процессор содержал более 3.3 млн. транзисторов. Выпускался для разъема Socket 5, позднее Socket 7.

Pentium PRO

1 ноября 1995 года, выпуском процессора Pentium PRO (кодовое имя P6 ), начался отсчет шестого поколения процессоров. От предыдущего поколения их отличало применение технологии динамического исполнения - изменения порядка исполнения инструкций и архитектура двойной независимой шины. Добавилась еще одна шина, которая соединяет процессор с кэшем второго уровня, который встроен в ядро. В результате этого впервые был применен кэш L2, работающий на частоте процессора. Первоначальный размер кэша L2 – 256 Кб; к 18 августа 1997 году достиг 1024 Кб. Максимальный размер – 2048 Кб. Кэш первого уровня остался прежним: 8 Кб + 8 Кб. Имел тактовые частоты 150, 166, 180, 200 МГц.

Процессоры Pentium PRO выпускались в корпусах SPGA (Staggered Pin Grid Array) с матрицей штырьковых выводов. В одном корпусе было установлено два кристалла – ядро процессора и кэш второго уровня собственного изготовления. Устанавливался в Socket 8 с возможностью объединить до 4-х процессоров для симметричной мультипроцессорной обработки. Шина 60-66 МГц. При 32-битных вычислениях и многозадачности значительно превосходил по производительности Pentium, но в 16-битных приложениях проигрывал ему. Процессор 150 МГц производился с использованием техпроцесса 0.60 мкм, более старшие модели – 0.35 мкм. Pentium PRO состоял из более чем 5.5 млн. транзисторов, плюс от 15.5 до 31 млн. включал кэш. Pentium MMX

8 января 1997 года произошел выпуск процессора Pentium w/MMX technology (кодовое имя P55 ), являющийся продолжением линейки Pentium, в котором впервые был реализован новый набор из 57 команд MMX (Multi Media eXtention), существенно увеличивающий производительность компьютера в мультимедиа-приложениях (от 10 до 60 %, в зависимости от оптимизации).

Выпускался с тактовыми частотами 166, 200 и 233 МГц. Работал на 66 МГц шине. По сравнению с Pentium, был вдвое увеличен размер кэша первого уровня, который составил 32 Кб. Как и в предыдущих версиях был применен раздельный кэш: 16 Кб на данные и 16 Кб на инструкции. Стоит сказать, что такое разделение (и размер) кэша L1 стало своеобразным стандартом на долгие годы. Кэш второго уровня, как и у предшественника, остался на материнской плате, и мог иметь объем до 1 Мб. Процессоры выпускались по 0.35 мкм технологии, и состояли из 4.5 млн. транзисторов. Рассчитан на Socket 7.

Pentium II

Первые процессоры с названием Pentium II появились 7 мая 1997 года. Эти процессоры объединяют архитектуру Pentium PRO и технологию MMX. По сравнению с Pentium Pro удвоен размер первичного кэша (16 Кб + 16 Кб). В процессоре используется новая технология корпусов - картридж с печатным краевым разъемом, на который выведена системная шина: S.E.C.C (Single Edge Contact Cartridge). Выпускался в конструктиве Slot 1, что естественно потребовало апгрейда старых системных плат. На картридже размером 14 x 6.2 x 1.6 см установлена микросхема ядра процессора (CPU Core), несколько микросхем, реализующих вторичный кэш, и вспомогательные дискретные элементы (резисторы и конденсаторы).

Такой подход можно считать шагом назад – у Intel уже была отработана технология встраивания в ядро кэша второго уровня. Но таким образом можно было использовать микросхемы памяти сторонних производителей. В свое время, Intel считала такой подход перспективным на ближайшие 10 лет, хотя через непродолжительное время отказывается от него.

В то же время сохраняется независимость шины вторичной кэш-памяти, которая тесно связана с ядром процессора собственной локальной шиной. Частота этой шины была вдвое меньше частоты ядра. Так что Pentium II имел большой кэш, работающий на половинной частоте процессора.

Первые процессоры Pentium II (кодовое название Klamath ), появившиеся 7 мая 1997 года, насчитывали около 7.5 млн. транзисторов только в процессорном ядре и выполнялись по технологии 0.35 мкм. Они имели тактовые частоты ядра 233, 266 и 300 МГц при частоте системной шины 66 МГц. При этом вторичный кэш работал на половинной частоте ядра и имел объем 512 Кб. Для этих процессоров был разработан Slot 1, по составу сигналов сильно напоминающий Socket 8 для Pentium Pro. Однако Slot 1 позволяет объединять лишь пару процессоров для реализации симметричной мультипроцессорной системы, либо системы с избыточным контролем функциональности (FRC). Так что этот процессор представляет собой более быстрый Pentium Pro с поддержкой MMX, но с урезанной поддержкой мультипроцессорности.

26 января 1998 году вышел процессор из линейки Pentium II с названием ядра – Deschutes . От Klamath отличался более тонким технологическим процессом – 0.25 мкм и частотой шины 100 МГц. Имел тактовые частоты 350, 400, 450 МГц. Выпускался в конструктиве S.E.C.C, который в старших моделях был сменен на S.E.C.C.2 - кэш с одной стороны от ядра, а не с двух, как в стандартном Deschutes и измененное крепление кулера. Последнее ядро, официально применявшееся в процессорах Pentium II, хотя последние модели Pentium II 350-450 шли с ядром, уже больше напоминавшим Katmai - только, естественно, с обрезанным SSE. Осталась поддержка MMX. Кэш первого уровня – все те же 32 Кб (16 + 16). Кэш второго уровня также не изменился – 512 Кб работающие на половинной частоте. Процессор состоял из 7.5 млн. транзисторов и выпускался для разъема Slot 1.

Pentium II OverDrive – так назывался процессор вышедший 11 августа 1998 года для апгрейда Pentium PRO на старых материнских платах, и работающий в разъеме Socket 8).

Носил кодовое имя P6T . Имел частоту 333 МГц. Кэш первого уровня – 16 Кб на данные + 16 Кб на инструкции, кэш второго уровня имел размер 512 Кб и был интегрирован в ядро. Работал на частоте процессора. Шина 66 МГц. Содержал 7.5 млн. транзисторов и производился по техпроцессу 0.25 мкм. Поддерживал набор инструкций MMX.

Новой веткой в направлении технологии микропроцессоров для Intel был выпуск параллельных основным, "облегченных" и удешевленных вариантов. Таковой является серия Celeron . 15 апреля 1998 года был представлен первый процессор, носящий название Celeron и работающий на тактовой частоте 266 МГц.

Кодовое имя Covington . Этот процессор является “обрезанным” Pentium II. Celeron построен на базе ядра Deschutes без кэша второго уровня. Что, конечно же, сказалось на его производительности. Зато разгонялся он просто великолепно (от полутора до двух раз). Если разгон Pentium II ограничивала максимальная частота кэша, то здесь его просто не было!

Celeron работал на шине 66 МГц и повторял все основные характеристики своего предка – Pentium II Deschutes: кэш первого уровня – 16 Кб + 16 Кб, MMX, техпроцесс 0.25 мкм. 7.5 млн. транзисторов. Процессор выпускался без защитного картриджа - конструктив – S.E.P.P (Single Edge Pin Package). Разъем - Slot 1.

Начиная с частоты 300 МГц, появились процессоры Celeron с интегрированным в ядро кэшем второго уровня, работающим на частоте процессора, размером 128 Кб. Кодовое имя – Mendocino . Вышел 8 августа 1998. Благодаря полноскоростному кэшу имеет высокую производительность, сравнимую с Pentium II (при условии одинаковой частоты системной шины). Выпускались с тактовыми частотами от 300 до 533 МГц. 30 ноября 1998 года, вышел вариант процессора с конструктивом P.P.G.A (Plastic Pin Grid Array), который работал в разъеме Socket 370.

До 433 МГц выпускался в двух конструктивах: S.E.P.P и P.P.G.A. Некоторое время параллельно существовали Slot-1 (266 - 433 МГц) и Socket-370 (300A - 533 МГц) варианты, в конце концов, первый был плавно вытеснен последним.

Новый Celeron был шагом к Pentium !!!, но так как работал на шине 66 МГц, не мог показать все преимущества интегрированного высокоскоростного кэша. Так как кэш был интегрирован в ядро, значительно увеличилось количество транзисторов, из которых состоит процессор - 19 млн. Техпроцесс остался прежним – 0.25 мкм.

Для мощных компьютеров предназначено семейство Xeon . Pentium II Xeon - серверный вариант процессора Pentium II, пришедший на смену Pentium PRO. Производился на ядре Deschutes и отличался от Pentium II более быстрой (полноскоростной) и более емкой (есть варианты с 1 или 2 Мб) кэш-памятью второго уровня и конструктивом. Выпускался в конструктиве S.E.C.C для Slot 2. Это тоже краевой разъем, но с 330 контактами, регулятором напряжения VRM, запоминающим устройством EEPROM. Способен работать в мультипроцессорных конфигурациях. Был выпущен 29 июня 1998 года.

Кэш второго уровня, как и в Pentium PRO, полноскоростной. Только здесь он находится на одной плате с процессором, а не интегрирован в ядро. Кэш первого уровня – 16 Кб + 16 Кб. Частота шины – 100 МГц. Поддерживал набор инструкций MMX. Процессор работал на частотах 400 и 450 МГц. Выпускался с применением техпроцесса 0.25 мкм. и содержал 7.5 млн. транзисторов.

На этом развитие линейки Pentium II заканчивается. Начиная с Pentium II, Intel выделяет три основных направления в производстве процессоров: Pentium – высокопроизводительный процессор для рабочих станций и домашнего применения, Celeron бюджетный вариант пентиума для офиса или дома, Xeon – серверный вариант, обладающий повышенной производительностью.

Pentium !!!

Первые процессоры с названием Pentium !!! мало чем отличались от Pentium II. Они работали на такой же шине с частотой 100 МГц (позже, с 27 сентября 1999 года, появились модели, работающие на шине 133 МГц), выпускались в конструктиве S.E.C.C. 2 и были рассчитаны на установку в Slot 1.

Кэш память осталась прежней: L1 – 16 Кб + 16 Кб. L2 – 512 Кб, размещенные на процессорной плате, и работающие на половинной частоте процессора. Главным отличием является расширение набора SIMD-инструкций - SSE (Streaming SIMD Extensions). Также расширен набор команд MMX и усовершенствован механизм потокового доступа к памяти. Кодовое имя ядра Katmai . Вышел 26 февраля 1999 года. Процессор работал на частотах 450-600 МГц, содержал 9.5 млн. транзисторов. Также как предшественник - Pentium II Deschutes, выпускался с применением техпроцесса 0.25 мкм.

Coppermine – так называлось следующее ядро процессора Pentium !!!, пришедшее на смену Katmai 25 октября 1999 года. По сути, именно Coppermine является новым процессором, а не доработкой Deschutes. Новый процессор имел полноскоростной интегрированный в ядро кэш второго уровня размером 256 Кб (Advanced Transfer Cache).

Выпускался с использованием техпроцесса 0.18 мкм. Утоньшение технологии с 0.25 до 0.18 мкм позволило разместить на ядре большее число транзисторов и теперь их стало 28 млн., против 9.5 млн. в старом Katmai. Правда, основная масса нововведенных транзисторов относится к интегрированному L2-кэшу. L1 кэш остался без изменений. Поддерживал наборы команд MMX и SSE. Сначала выпускался в конструктиве S.E.C.C. 2, но так как кэш теперь встроен в ядро процессора, процессорная плата оказалась ненужной, и только повышала стоимость процессора. Поэтому вскоре процессоры стали выходить в конструктиве FC-PGA (Flip-Chip PGA). Как и Celeron Mendocino, они работали в разъеме Socket 370.

Правда со старыми материнскими платами была ограниченная совместимость. Так как теперь процессор работал на более высоких тактовых частотах, ядро было расположено сверху, и имело непосредственный контакт с радиатором. Coppermine был последним процессором для Slot 1. Работал на шине 100 и 133 МГц (в названии процессора 133-я шина обозначалась буквой B , например – Pentium !!! 750B). Процессоры с ядром Coppermine работали на тактовых частотах с 533 до 1200 МГц. Первые попытки выпустить процессор на этом ядре с частотой 1113 МГц закончились неудачей, так как он в предельных режимах работал очень нестабильно, и все процессоры с этой частотой были отозваны - этот инцидент сильно подмочил репутацию Intel.

Ядро Tualatin пришло на смену Coppermine 21 июня 2001 года. В это время на рынке уже присутствовали первые процессоры Pentium 4, и новый процессор был предназначен для испытания новой 0.13 мкм. технологии, а также для того чтобы заполнить нишу высокопроизводительных процессоров, так как производительность первых Pentium 4 была довольно низкой. Tualatin - это изначальное название глобального проекта Intel по переводу производства процессоров на 0.13-микронную технологию. Сами процессоры с новым ядром стали первыми продуктами, появившимися в рамках этого проекта.

Изменений в самом ядре немного - добавилась только технология "Data Prefetch Logic". Она повышает производительность, предварительно загружая данные, необходимые приложению в кэш. Кроме этого отличие этих ядер заключается в используемой технологии производства - Coppermine изготавливается по технологии 0.18 мкм, а Tualatin по 0.13 мкм. Разъем для нового процессора остался прежним - Socket 370, а вот конструктив сменился на FC-PGA 2, который использовался в процессорах Pentium 4. От старого FC-PGA он в первую очередь отличается тем, что ядро покрыто теплорассеивающей пластиной, которая также защищает его от повреждения при установке радиатора.

С выпуском Tualatin, линейка Pentium !!! "распалась" на два класса - настольных и серверных процессоров. У первых объем L2-кэша так и остался равным 256 Кб, у вторых - удвоился до 512 Кб; также у настольной версии нового P-III (так называемого Desktop Tualatin) отсутствовала поддержка SMP. Кэш первого уровня – 16 Кб + 16 Кб. Следует сказать, что Desktop Tualatin просуществовал недолго: он поставлялся только крупным сборщикам ПК, и был изъят с рынка, для того чтобы не составлять конкуренцию Pentium 4. А вот Pentium !!!-S, серверная версия процессора, должен был занять нишу мощных серверных процессоров, так как производительности процессоров Xeon уже не хватало, а Pentium 4 не имел поддержки SMP, да и вообще показывал довольно низкую производительность.

Как уже было сказано выше, процессоры Tualatin выпускались с применением более совершенного 0.13 мкм. техпроцесса, работали на шине с частотой 133 МГц и состояли из 44 млн. транзисторов. Поддерживали наборы инструкций MMX и SSE. Процессор работал на частотах от 1 ГГц до 1.33 ГГц (Desktop Tualatin), и от 1.13 ГГц до 1.4 ГГц (серверный вариант).

Совсем недавно я узнал довольно интересную информацию – оказывается Intel разрабатывала процессор, который должен был быть продолжением линейки Pentium !!!. Этот процессор был основан на модернизированном ядре Tualatin с применением 0.13 мкм. техпроцесса. Основными его отличиями от обычного Tualatin, был увеличенный до 1024 Кб. кэш второго уровня и системная шина с частотой 166 МГц! Частоты должны были достигать как минимум 2.0 ГГц. Но Intel, делая ставку на процессор Pentium 4, отказывается от нового Tualatin. Ведь если даже Celeron Tualatin, будучи разогнан до частот порядка 1.7 ГГц, с легкостью конкурирует не только с Celeron Willamette, но и с Pentium 4, то новый Tualatin, оснащенный огромным кэшем и быстрой шиной не оставлял бы им никакого шанса.

После выхода процессоров Pentium !!!, Intel, чтобы не терять позиций на рынке бюджетных процессоров, продолжила выпуск линейки Celeron. Теперь это были абсолютно другие процессоры – Intel повторяет опыт создания первых процессоров с названием Celeron: использует ядро процессора Pentium !!! с обрезанным до 128 кб кэшем второго уровня и медленной шиной 66 МГц.

29 марта 2000 года появляются первые процессоры Celeron на ядре Coppermine 128 или Coppermine Lite .

Как видно из названия, процессор выполнен на ядре Coppermine с вдвое уменьшенным кэшем второго уровня. Как и старший брат - Pentium !!! Coppermine, новый Celeron, имеет набор дополнительных команд SSE, быструю встроенную кэш-память и производится по той же технологической норме (0.18 мкм.), отличаясь только объемом кэша второго уровня - 128 Кб против 256 Кб у Pentium !!! (обиднее всего то, что кэш-то в процессоре физически присутствует, он просто отключен). Работает в том же разъеме Socket 370.

Первые процессоры появились с частотой 566 МГц и работали на шине 66 МГц. Позже, 3 января 2001 года, с выходом 800 МГц версии, Celeron переходит на более быструю 100 МГц шину. Максимальная частота этих процессоров составляла 1100 МГц. Кэш первого уровня: 32 Кб (16 Кб на данные и 16 Кб на инструкции). Процессор состоял из 28.1 млн. транзисторов.

Еще никогда Celeron не был так близок к процессору Pentium. От Pentium !!! Desktop Tualatin он отличался лишь более медленной 100 МГц шиной. В общем, оставив неизменным объем кэша второго уровня и снизив частоту FSB до 100 МГц у ядра Tualatin для desktop применения, Intel выпустила "новый Celeron". Процессоры выпускались с тактовыми частотами от 900 МГц до 1400 МГц, состояли из 44 млн. транзисторов, поддерживали MMX, SSE. Техпроцесс 0.13 мкм. Выпускались в конструктиве FC-PGA 2, для разъема Socket 370.

С выходом Pentium !!! Intel продолжает выпускать серверные процессоры на базе уже нового поколения Pentium. 17 марта 1999 вышел первый процессор из линейки Pentium !!! Xeon.

Кодовое название ядра Tanner . Был построен на базе Pentium !!! Katmai. Содержал 512, 1024 или 2048 Кб полноскоростной кэш памяти второго уровня. Кэш первого уровня - 16 Кб + 16 Кб. Выпускался с частотами 500 и 550 МГц с применением 0.25 мкм. техпроцесса, и состоял из 9.5 млн. транзисторов. Работал на 100 МГц системной шине. Выпускался в конструктиве S.E.C.C для Slot 2. Был предназначен для использования в двух-, четырех-, восьмипроцессорных (и более) серверах и рабочих станциях.

С переходом Pentium !!! на новое ядро 25 октября 1999 года появилась и модификация процессора Xeon с новым ядром Cascades . По сути, это было модернизированное ядро Coppermine. Процессор имел от 256 КБ до 2048 Кб кэш памяти второго уровня, работал на частотах системной шины 100 и 133 МГц (в зависимости от версии). Выпускались процессоры с частотами от 600 до 900 МГц. Процессоры с частотой 900 МГц из первых партий перегревались и их поставки были временно приостановлены. Как и предшественник, Xeon Cascades был рассчитан на установку в разъем Slot 2. Выпускался с применением 0.18 мкм. техпроцесса и состоял из 28.1 млн. транзисторов. Мог работать в двух-, четырех- и восьмипроцессорных серверах и рабочих станциях.

На базе ядра Tualatin процессоры Xeon не выпускались. Их место занял Pentium !!!-S, о котором я рассказывал выше. Процессоры Xeon поддерживали наборы команд MMX и SSE.

Pentium 4

Столкнувшись с множеством проблем при попытке увеличить частоту процессора Pentium !!! на ядре Coppermine выше 1 ГГц, инженеры Intel поняли, что старая архитектура процессоров, не менявшаяся со времен Pentium Pro, требует радикальных изменений. И хотя переход производства на 0.13 мкм поможет Pentium !!! еще около года вполне достойно выполнять свою работу, потенциал этой архитектуры уже практически исчерпан и компания для своих новых 32-х разрядных процессоров разработала новую архитектуру, которую назвала Intel NetBurst Micro-Architecture. Для того чтобы процессоры могли работать на частотах порядка нескольких гигагерц, Intel увеличивает длину конвейера Pentium 4 до 20 ступеней (Hyper Pipelined Technology) за счет чего удалось даже при технологических нормах 0,18 мкм добиться работы процессора на частоте в 2 ГГц. Однако из-за такого увеличения длины конвейера время выполнения одной команды в процессорных тактах также сильно увеличивается. Поэтому компания сильно поработала над алгоритмами предсказания переходов (Advanced Dynamic Execution).

Кэш 1-го уровня в процессоре претерпел значительные изменения. В отличие от Pentium !!!, кэш которого мог хранить команды и данные, Pentium 4 имеет всего 8 Кб кэш данных. Команды, сохраняются в так называемом Trace Cache. Там они хранятся уже в декодированном виде, т.е. в виде последовательности микроопераций, поступающих для выполнения в исполнительные устройства процессора. Емкость этого кэша составляет 12000 микроопераций.

Также в новом процессоре был расширен набор команд - SSE2 . К 70 инструкциям SSE, добавились еще 144 новые инструкции. Одной из множества инноваций была совершенно новая 100 МГц шина, передающая по 4 пакета данных за такт - QPB (Q uad P umped B us), что дает результирующую частоту 400 МГц.

Первым из линейки Pentium 4 был процессор с ядром Willamette 423 .

Появившись 20 ноября 2000 года с частотами 1.4 и 1.5 ГГц, эти процессоры, изготовленные с применением техпроцесса 0.18 мкм, достигли частоты 2 ГГц. Процессор устанавливался в новый разъем Socket 423 и выпускался в конструктиве FC-PGA 2. Состоял из 42 млн. транзисторов.

Кэш 2-го уровня остался прежнего объема - 256 Кб. Ширина шины кэша L2 составляет 256 бит, но латентность кэша уменьшилась в два раза, что позволило добиться пропускной способности кэша в 48 Гб при частоте 1.5 ГГц.

Так как архитектура нового процессора была ориентирована в первую очередь на рост частоты, то неудивительно, что первые процессоры Pentium 4 показывают крайне низкую производительность. В большинстве задач 1.4 ГГц процессор уступал Pentium !!! Coppermine, работающему на частоте 1000 МГц.

Позже, 27 августа 2001 года, появились процессоры с ядром Willamette предназначенные для установки в новый разъем - Socket 478. Процессор повторял все характеристики своего предка, за исключением конструктива - mPGA и разъема Socket 478.

Предыдущий форм-фактор Socket 423 был "переходным" и Intel в дальнейшем не собирается его поддерживать. Размеры процессора уменьшились благодаря тому, что теперь выводы сделаны непосредственно под ядром процессора. Этот процессор, как и предшественник, работал на частотах от 1.4 до 2.0 ГГц.

Northwood – так называется следующее ядро, на котором и по сей день, выпускаются процессоры Pentium 4.

Переход на 0.13 мкм. техпроцесс позволил еще больше наращивать тактовую частоту, и увеличить кэш второго уровня до 512 Кб. Увеличилось и количество транзисторов, которые составляют процессор – теперь их стало 55 млн. Естественно, что осталась поддержка наборов инструкций MMX, SSE и SSE2.

Первые процессоры на ядре Northwood появились 7 августа 2001 года с частотой 2.0 ГГц и частотой системной шины 400 МГц (4 * 100 МГц). На сегодняшний день, процессоры Northwood, работают на частотах от 1.6 до 3.2 ГГц. Чтобы не возникало путаницы с процессорами, работающими на одинаковых частотах, но с разным ядром Intel опять применяет буквенную маркировку. Например, Pentium 1.8A , где буква A указывает на новое ядро и увеличенный кэш второго уровня.

6-го мая 2002 года, Intel выпускает процессор на базе ядра Northwood с частотой системной шины 533 МГц (4 * 133 МГц) и тактовой частотой 2.26 ГГц. Так как модели с частотой шины 400 МГц выпускались с частотами до 2.6 ГГц, то и тут была применена буквенная маркировка. Как и в процессорах Pentium !!! наличие 133 МГц шины обозначалось буквой B . Например, Pentium 4 2.4B .

Но Intel не останавливается на достигнутом, и 14 апреля 2003 года выпускает процессор на все том же ядре Northwood, но уже с частотой системной шины 800 МГц (4 * 200 МГц) и тактовой частотой 3.0 ГГц. Позже, процессоры с 800 МГц системной шиной стали выпускаться с меньшими частотами – от 2.4 ГГц. Для обозначения новой шины в маркировке процессора появляется буква C . Например, Pentium 4 2.4C . (Таким образом, есть три модификации процессора 2.4 ГГц с разными частотами шины, различающимися в 2 раза!)

Все процессоры с частотой системной шины 800 МГц поддерживают новую технологию HT , что расшифровывается как Hyper-Threading .

Pentium 4 HT

14 ноября 2002 года был выпущен процессор Pentium 4 с частотой 3.06 ГГц и частотой системной шины 533 МГц с поддержкой новой технологии Hyper-Threading .

Один физический процессор с Hyper-Threading видится системой как два, что позволяет оптимизировать загрузку его ресурсов и повысить производительность. Принцип действия Hyper-Threading основывается на том, что в каждый момент времени только часть ресурсов процессора используется при выполнении программного кода. Неиспользуемые ресурсы также можно загрузить работой - например, задействовать для параллельного выполнения еще одного приложения (либо другого потока этого же приложения).

HT – это не настоящая многопроцессорность, ведь количество блоков непосредственно исполняющих команды не изменилось. Повысился лишь КПД их использования. Поэтому, чем лучше оптимизирована конкретная программа под HT, тем выше будет выигрыш в производительности. По данным Intel, преимущество от HT может достигать 30%, в то время как блоки, ее реализующие, занимают менее 5% общей площади кристалла Pentium 4. Впрочем, даже идеально оптимизированные приложения могут, к примеру, обращаться к данным, которых нет в кэш-памяти процессора, заставляя его простаивать. Если сама архитектура NetBurst была рассчитана на повышение количества мегагерц, то Hyper-Threading наоборот, рассчитан на повышение выполняемой работы за один такт.

Одной из причин достаточно позднего представления Hyper-Threading в Pentium 4 (поддержка существует не только в ядре Northwood, но даже в Willamette, однако была заблокирована) являлась относительно небольшая распространенность Windows XP – единственной ОС семейства Windows, полноценно поддерживающей новую технологию. Также технологию должен поддерживать чипсет и BIOS системной платы.

На сегодняшний день технологию Hyper-Threading поддерживает процессор Pentium 4 3.06 ГГц с частотой системной шины 533 МГц, а также все процессоры с частотой шины 800 МГц.

После выпуска Pentium 4 Willamette для разъема Socket 478, с целью вытеснения с рынка процессоров для Socket 370, а также, желая занять нишу бюджетных процессоров (где до этого был Celeron Tualatin), Intel выпускает Celeron на базе ядра Willamette 128 .

Ядро Willamette 128 архитектурно ничем не отличается от ядра Pentium 4 Willamette. Организация кэша и алгоритмы его работы не изменились, единственное отличие заключается в размере - 128 Кб кэша второго уровня вместо 256 Кб в оригинальном Pentium 4 Willamette.

Естественно, сохранен и форм-фактор Socket 478, который Intel собирается использовать еще долго. Таким образом, Intel переводит свои процессоры на одну платформу, так что при последующем апгрейде не понадобится менять вместе с процессором и материнскую плату.

15 мая 2002 года появляется первый процессор с названием Celeron, построенный на базе Pentium 4, с частотой 1.7 ГГц. Позже, 12 июня 2002 года появляется версия на 1.8 ГГц.

Новый Celeron, как и раньше, использует 100 МГц системную шину, правда теперь уже с передачей 4-х сигналов за такт. Учетверенная 100 МГц системная шина наконец-то решает старую проблему Celeron - недостаток пропускной способности FSB.

Как и Pentium 4 Willamette, новый Celeron выполнен с применением 0.18 мкм. техпроцесса. Состоит из 42 млн. транзисторов. Выпускается с частотами 1.7 и 1.8 ГГц.

Следующее и последнее на сегодняшний день ядро процессора Celeron, это Northwood (естественно с урезанным до 128 Кб кэшем второго уровня). Первым процессором на этом ядре был Celeron 2.0 ГГц, который вышел 18 сентября 2002 года. Он, как и Celeron Willamette 128, полностью повторяет характеристики старшего брата Pentium 4 Northwood, за исключением шины рассчитанной исключительно на 400 МГц (4 * 100 МГц) и кэша второго уровня размером 128 Кб.

Применение 0.13 мкм. техпроцесса дает преимущество в виде хорошей разгоняемости. У ядра Northwood хороший частотный потенциал (на сегодняшний день до 3.2 ГГц), поэтому запас для разгона есть.

С момента первого выпуска Intel Pentium II Xeon прошло чуть меньше трех лет. И Intel, 21 мая 2001 года, продолжая свой курс по сегментированию своих процессоров, анонсирует процессор Xeon следующего поколения, который базируется на ядре Pentium 4 Willamette. Процессор называется по-старому, Intel Xeon, и выпускается в трех вариантах: 1.4 ГГц, 1.5 ГГц и 1.7 ГГц. Ядро процессора почти полностью идентично обычной (desktop) версии Pentium 4 за исключением незначительных деталей. Это означает, что новый Xeon имеет все то, что есть в Pentium 4 – как достоинства новой архитектуры, так и ее недостатки.

Первые модели Xeon выпускались с применением 0.18 мкм. техпроцесса, с ядром, практически полностью повторявшим Pentium 4 Willamette и носившем кодовое имя Foster . Процессор выпускался с тактовыми частотами до 2,0 ГГц. Состоял из 42 млн. транзисторов.

Кэш память первого уровня, как и у всех процессоров линейки Pentium 4, с архитектурой NetBurst, 8 Кб кэш данных. Кэш второго уровня – 256 Кб с улучшенной передачей данных (256 Кб Advanced Transfer Cache). Также как в Pentium 4 Willamette, в новом Xeon применена 400 МГц системная шина (4 * 100 МГц) которая синхронно работает с двумя каналами памяти на частоте 400 МГц.

Исторически, линейки процессоров Intel Xeon (то есть Pentium II Xeon, Pentium III Xeon) всегда использовали отличный от обычных версий процессора конструктив. В то время как процессоры Pentium II и Pentium III выпускались в 242-контактном Slot1 варианте, то их Xeon версии использовали 330-контактный разъем Slot-2. Большинство добавочных ножек использовалось для снабжения чипа дополнительной энергией. С двумя мегабайтами L2 кэша Pentium III Xeon потреблял больше энергии, чем его 256-килобайтный собрат. Аналогичная ситуация произошла и с новым Xeon. Если первые процессоры Pentium 4 Willamette, используют 423-контактный разъем, то в Xeon применяется 603-контактный интерфейс, предназначенный для использования в разъеме Socket 603. Процессор может работать только в одно- или двухпроцессорных конфигурациях.

9 января 2002 года появляются процессоры Xeon, сделанные на базе ядра Northwood с применением 0.13 мкм. техпроцесса, и оснащенные 512 Кб кэш памяти второго уровня. Кодовое название ядра – Prestonia . От своего предшественника - Xeon Foster, отличается только увеличенным кэшем и более совершенным техпроцессом. Процессоры работают на частотах от 1.8 ГГц, до 3.0 ГГц. Состоят из 55 млн. транзисторов. В процессорах с ядром Prestonia впервые появилась поддержка Hyper-Threading.

12 марта 2002 года, выходит процессор Xeon MP. Изготовлен с применением 0.18 мкм. и оснащен 256 Кб кэш памяти второго уровня. Основное отличие от процессоров Xeon Foster - возможность работать в многопроцессорных системах. Работают на частотах от 1.4 до 1.6 ГГц. Также в этих процессорах осуществлена поддержка технологии Hyper-Threading.

4 ноября 2002 года появляются процессоры Xeon MP, изготовленные с применением 0.13 мкм. техпроцесса. Эти процессоры, работающие на частотах 1.5 ГГц, 1.9 ГГц и 2.0 ГГц отличаются от своего собрата Xeon Prestonia, не только возможностью работы в многопроцессорных конфигурациях, но и наличием интегрированного кэша третьего уровня размером 1 или 2 Мб. Благодаря этому увеличилось количество транзисторов, составляющих процессор до 108 млн.!

18 ноября 2002 года появились процессоры Xeon работающие на 533 МГц (4 * 133 МГц) системной шине. Эти процессоры сделаны на ядре Prestonia, с применением 0.13 мкм. техпроцесса и состоят из 108 млн. транзисторов. Кэш память второго уровня – 512 Кб. Кэш третьего уровня 1 Мб. Процессоры Xeon на 533 МГц шине выпускаются с тактовыми частотами от 2.0 ГГц до 3.06 ГГц (вышел 10 марта 2003). Также недавно был анонсирован 3.2 ГГц процессор.

В конце 2003 года, Intel представит новое ядро для своих процессоров – Prescott . Эти процессоры будут изготавливаться с применением 0.09 мкм. (90 нм) технологии. Ядро Prescott будет состоять из 125 млн. транзисторов, и содержать 1 Мб кэш второго уровня. Также, возможно будет наконец-то увеличен кэш первого уровня до 32 Кб. Естественно, что новое ядро будет обладать поддержкой технологии Hyper-Threading. Только это уже будет Hyper-Threading 2 , дальнейшее развитие «многопроцессорности» в одном чипе. В чем будет заключаться их отличие пока не известно, но есть предположения (никем не подтвержденные) что новинка позволяет в одном физическом процессоре видеть не два, а несколько виртуальных процессоров.

Также будет добавлен новый набор инструкций (или расширен уже присутствующий), включающий 15 новых инструкций по переводу чисел с плавающей запятой в целые, арифметику комплексных чисел, специальные команды для декодирования видео, SIMD-инструкции для формата с плавающей запятой и процесс синхронизации потоков.

Первые процессоры с этим ядром будет работать на частотах 3.2 и 3.4 ГГц. Их корпуса будут совместимы с используемыми сейчас в процессорах Pentium 4 Northwood. В дальнейшем процессоры Prescott будут переведены в новую упаковку LGA 775, содержащую 775 выводов, для которой потребуются и новые материнские платы с разъемом Socket T.

На базе нового ядра будет также продолжен выпуск процессоров линейки Celeron. Только теперь это уже совсем не тот Celeron, что был раньше. Чипы Celeron на ядре Prescott будут быстрее предшественников на Northwood не только за счет возросшей тактовой частоты ядра. Они будут поддерживать системную шину с частотой 533 МГц, а объем их кэша увеличится со 128 до 256 кб. Первые Celeron на ядре Prescott будут иметь частоты 2.8 и 3.06 ГГц. Не успев выпустить процессоры по 90-нм технологии, Intel уже во всю развивает следующее поколение технологии производства чипов – с нормами 65 нм. Также ведутся разработки, и есть работающие чипы изготовленные с применением не только 0.065 мкм. техпроцесса, но и 45 нм, 32 нм и даже 22 нм.

За Prescott последует ядро Tejas с шиной 1066 МГц. На его основе будут представлены восемь различных процессоров с тактовыми частотами от 6 до 9.2 ГГц. Появление в продаже первого из них запланировано на конец 2004 года. После этого компания представит ядро Nehalem , использующее системную шину 1200 МГц и позволяющее получить рабочую частоту свыше 10 ГГц. Nehalem будет основан на совершенно новой архитектуре. Это будет не модернизированный Pentium 4, как Prescott и Tejas. В нем будет применена система аппаратной защиты LaGrande, и по некоторым данным, использована более совершенная технология многопоточной обработки. Число транзисторов в чипе составит порядка 150-250 миллионов. Появиться Pentium Nehalem должны в 2005 году.

Также недавно был объявлен новый процессор из линейки Pentium 4 - Intel Pentium 4 Extreme Edition .

Он оснащен технологией Hyper-Threading, работает на системной шине 800 МГц, имеет тактовую частоту ядра 3.2 ГГц. Но главным его отличием от предшествующих Pentium 4 стало наличие интегрированной в кристалл кэш-памяти третьего уровня L3 объемом 2 Мб! Эта кэш-память дополняет стандартный кэш L2 512 кбайт и работает также на частоте ядра процессора (правда, с гораздо большей латентностью, поскольку она асинхронная и призвана ускорять работу с данными из наиболее часто используемых областей системной памяти). Таким образом, всего новый Pentium 4 Extreme Edition имеет кэш-память объемом 2.5 Мб! А также является единственным desktop процессором с кэшем третьего уровня, интегрированным в ядро.

Процессор Pentium 4 Extreme Edition позиционируется Intel главным образом для игрового рынка, хотя не исключено и его применение в производительных рабочих станциях. Новый процессор использует ядро от мультипроцессорных Xeon MP с интегрированной кэш-памятью L3. Его немного изменили с целью поддержки системной шины 800 МГц, уменьшения энергопотребления и др. и упаковали в стандартный корпус от Pentium 4.

При написании данного материала была использована информация с Интернет сайтов

  • www.ixbt.com
  • www.3DNews.ru
  • www.Intel.ru
  • www.сайт

    Алексей Гавриленко aka [-Alex-]