ТЕХНИЧЕСКИЙ ОБЗОР
На конференции Microprocessor Forum были представлены RISC-технологии для архитектуры Х86 и инфомедийных приложений
RISC-технология превзошла саму себя на ежегодной конференции Microprocessor Forum, где были представлены RISC-составляющие, отвечающие за работу самых быстрых из новых Х86-совместимых микросхем и осваивающие новые рубежи в инфомедийно-ориентированных процессорах. Неожиданным оказалось то, что во всех этих случаях было забыто первоначальное значение аббревиатуры RISC: Reduced Instruction Set Computing - вычисления с сокращенным набором команд.
Набор команд микросхем следующего поколения может быть назван Rehosted ("с новым хостом"), поскольку в процессорах от компаний Advanced Micro Devices, Cyrix, Intel и NexGen потоки внешних инструкций Х86 внутри заменяются на более тщательно разработанные операции. Эти наборы можно назвать Refocused ("с новым фокусом") из-за мультимедийных расширений, которые разрабатываются в корпорациях Cyrix, Digital Equipment и Intel и фирме Sun Microsystems, чтобы задействовать в связанных с изображениями операциях принцип встроенного параллелизма. Все внутренние составляющие этих новых процессоров, несомненно, Regularized ("организованные") по сравнению с силиконовым спагетти оригинального CISC Х86.
Единственное, что остается сокращенным, - это физические размеры и без того микроскопических компонентов, поскольку число транзисторов на одном кристалле к концу десятилетия по подсчетам достигнет 50 миллионов, а к 2010 году - миллиарда транзисторов на кристалл. Об этом на конференции рассказал в своей программной речи начальник административной службы корпорации Intel Крейг Барретт, который предсказал, что к тому времени тактовая частота достигнет 4000 МГц, а производительность - 100 млрд. инструкций в секунду.
Pentium Pro повышает уровень Risc-технологии, сохраняя связь Х86
В любом случае предсказания Барретта можно назвать весьма сдержанными, поскольку они прежде всего базируются на представлении о постоянном улучшении существующих технологий, без учета возможности резких скачков.
Поскольку требования к питанию схемы возрастают пропорционально увеличению частоты, но при этом снижаются пропорционально квадрату нижнего напряжения питания схемы, Барретт предполагает, что скоро будет совершен переход на схемы с напряжением 1 В. Это подтвердилось на следующий день после речи Барретта, когда инженер-консультант DEC Пит Бэннон представил 2-вольтовый процессор Alpha 21164А, имеющий 9,66 млн. транзисторов, размещенных на 209 кв.мм, и работающий с тактовой частотой свыше 400 МГц.
Alpha корпорации DEC продолжает удерживать лидерство в своем направлении, a Motorola тем временем предложила серьезные новшества в других, не менее важных, областях. В то время как самый быстрый новый процессор Alpha рассеивает мощность 20 Вт при традиционной обработке целых чисел и чисел с плавающей запятой, Motorola представила новое семейство интегрированных коммуникационных контроллеров, рассеивающих малые доли ватта и при этом позволяющих работать высокоинтегрированным комбинациям соединений Ethernet, LocalTalk, T-1, ISDN, Peripheral Component Interconnect на PCMCIA-картах.
Как сообщили официальные представители, семейство продуктов Motorola PowerQUICC с ядром на PowerPC предоставит пять разных комбинаций Ethernet, последовательного порта и даже 32-канального протокола HDLC (высокоуровневое управление цифровой связью) на компактных микросхемах ценой около и ниже $100 при оптовых покупках.
Обычным серверам, настольным и портативным машинам на основе Х86 на конференции Microprocessor Forum было уделено неоправданно много времени. Старший редактор журнала Micro Design Resources Джим Тарли процитировал консультанта Ника Триденника, который сказал, что Х86-совместимые процессоры составляют около 2% в общем производстве микропроцессоров.
"Из систем на основе 32-разрядных процессоров в мире лучше всего продаются игровые приставки", - сказал Тарли, добавив, что в обычном доме используется 25 микропроцессоров, из которых, как правило, только один принадлежит к типу Х86.
Однако битва за долю рынка Х86 еще никогда не была такой ожесточенной, поскольку конкуренты Intel уже предлагают вполне сопоставимые разработки, в то время как сама Intel еще не перешла к выпуску процессоров нового поколения. Вместо того чтобы конкурировать на рынках с большими объемами продаж и низкими ценами, например современном рынке процессоров класса 486 ("которые по-прежнему продаются на порядок лучше, чем любой RISC [процессор]", как сказал директор конференции Майкл Слэйтер), компании типа AMD, Cyrix и NexGen предлагают процессоры, конкурирующие с Pentium корпорации Intel, как раз в то время, как объемы продаж Pentium самой Intel, вероятно, приближаются к своему пику.
Мощность процессоров Cyrix и Intel значительно улучшается благодаря увеличенным кэшам
Слэйтер решился говорить так, поскольку сумел понять новую позицию конкурентов Intel: "У них есть процессор, конкурирующий с Pentium 100, в то время как Intel поставляет 133 МГц процессоры. Но Cyrix 6Х86 ближе к лидерству [на рынке Х86], чем любой конкурент, который когда-либо был у Intel" (см. результаты эталонных тестов).
Представители Intel выступили в первый день конференции, приняв участие в дискуссии "Мифы и (конвейеризованная) реальность", посвященной новому процессору Pentium Pro, известному до сделанного в сентябре официального заявления как Р6. С 5,5 млн. транзисторов в процессорной части Pentium Pro представляет собой "потрясающую глубоко конвейеризованную разработку", как сказал Боб Коллуэл, менеджер по архитектуре Р6, который представил технический обзор.
Главное отличие подхода Intel от принципов ее конкурентов - это то, как активно Intel использует конвейеризацию. Сравнительно большие внутренние буферы и большое количество отдельных исполнительных устройств позволяет Pentium Pro поддерживать неупорядоченное вероятностное выполнение тщательно разработанных "микроопераций" внутри процессора, при этом сохраняя упорядоченный захват и отдачу потока инструкций Х86, входящего и выходящего из "черного ящика".
Сохранение последовательности внешних инструкций - основа сохранения совместимости с огромной инсталлированной базой исполнимого Х86-кода и инструментария разработки для Х86. Немногие инструменты разработки и еще меньшее количество программ уже оптимизированы для работы даже с нынешним процессором Pentium, так что Intel по вполне понятным причинам не рискует потребовать от создателей ПО, чтобы они приложили специальные усилия, добиваясь полной отдачи от машин Pentium Pro.
В представительном эталонном тесте на обработку целых чисел результаты тестов Intel показывают типичную микрооперацию со сроком выполнения 14 циклов. "Запасная станция" с 20 разъемами и "буфер переорганизации" с 40 разъемами предоставляет Pentium Pro ощутимую свободу в изменении последовательности этих микроопераций (чтобы свести до минимума общее время выполнения), на чью долю, если верить Intel, приходится около 30% общей пропускной способности процессора Pentium Pro.
Выполняя компиляцию с Си, процессор Intel показал постоянную среднюю пропускную способность всего на 3% меньше, чем 1 инструкция на цикл, что всегда было целью разработчиков RISC-процессоров.
Однако глубокая конвейеризация процессора Intel на других тестах показала себя не так хорошо: одна маленькая секция из 10 тысяч инструкций в Excel потребовала 6,7 такта на инструкцию, но Коллуэл отметил, что на результат повлияли операции ввода-вывода, потребовавшие 75% циклов. Они должны исполняться строго последовательно. Коллуэл подсчитал, что для Excel-кода более типичным можно назвать 2 - 3 такта на инструкцию.
Для сравнения: в конкурирующих разработках AMD, Cyrix и NexGen ударение делается скорее на широту, чем на глубину, т.е. их разработчики стараются добиться примерно такой же производительности, но при меньшей зависимости от сложной конвейерной оптимизации, используя меньше этапов конвейеризации и больший параллелизм за счет увеличения числа и/или мощности параллельных блоков.
Инженеры корпорации Cyrix, в частности, обсуждали сделанные ими сметанные анализы наборов Х86-команд разных типов, используемых в коде Windows 95, и тех, что используются под Windows З.х, и описали соответствующие способы оптимизации. Официальные представители AMD признали, что задерживают выпуск процессора К5, который, как предусмотрено планом, будет выполнять до четырех инструкций одновременно (20 октября AMD и NexGen объявили о заключении соглашения о слиянии).
Директор фирмы NexGen по разработке Nex686 Грег Фэйвор объявил, что из-за сложности типов Х86-команд предпочтительно использовать два сложных декодера, а не три блока меньшей мощности, как в Pentium Pro.
"Мы хотим предложить на обычных рынках крупных продаж производительность на уровне шестого поколения", - сказал Фэйвор. К этой же цели стремятся по меньшей мере три конкурента, которые, без всякого сомнения, и в дальнейшем будут стараться превратить этот рынок в потребительский.
Питер Коффи