Следующая статья: Процессоры Cyrix - как устроены и основные принципы
Содержание
- Процессор AMD К6
- Процессор AMD К6-2
- Процессор AMD K6-III
- Таблица основных характеристик процессоров AMD
- Процессор AMD Athlon
- Основные элементы ядра Athlon
- Процессор Thunderbird
- Процессор Duron
- Процессор Palomino (Athlon ХР - EXtra Performance)
- Процессор Morgan
- Процессор Thoroughbred
- Процессор Sempron
- Архитектура процессора К8
- Таблица режимов процессоров К8
- Некоторые прочие особенности К8
- Процессор Athlon 64х2
Процессор AMD К6
Длительное время Advanced Micro Devices, подобно Cyrix, производила центральные процессоры 286, 386 и 486, которые были основаны на разработках Intel. К5 был первым независимо созданным х86 процессором, на который AMD возлагала большие надежды.
Однако, покупка компанией AMD основанного в Калифорнии конкурента весной 1996 года, кажется, создала возможность лучше подготовиться к своей следующей атаке на Intel. К6 начал жизнь как Nx686, будучи переименованным после приобретения NextGen. Серия ММХ-совместимых процессоров К6 была запущена в середине 1997 года, за несколько недель до Cyrix 6х86МХ, и сразу была одобрена пользователями.
Изготовленный по 5-слойной 0.35-мкм технологии, К6 был почти на 20 % меньше, чем Pentium Pro и при этом содержал на 3.3 млн транзисторов больше (8.8 против 5.5 млн). Большинство этих дополнительных транзисторов находилось в кэше первого уровня на 64 Кбайт (на кэш команд 32 Кбайт и на кэш данных 32 Кбайт). Это равносильно четырем Pentium Pro или двум Pentium ММХ и Pentium II.
Центральный процессор К6 поддерживал технологию ММХ Intel, включая 57 новых х86 команд, разработанных для развития мультимедийного программного обеспечения. Как и Pentium Pro, Кб был многим обязан классическим технологиям RISC. Используя суперскалярную микроархитектуру AMD RISC86, чип декодировал каждую х86-инструкцию в ряд более простых действий, которые могли быть обработаны, используя типичные принципы RISC - такие, как выполнение вне естественного порядка, переименование регистров, предсказание переходов, спекулятивное исполнение, опережающая выборка данных.
Центральный процессор К6 начинал с версий 166.200 и 233 МГц. Уровень его производительности был очень схож с Pentium Pro соответствующих частот с его максимальным 512 Кбайт кэшем второго уровня. Общее с чипом Cyrix MX (но в несколько меньшей степени) - работа с плавающей запятой - была областью относительной слабости по сравнению с Pentium Pro или Pentium II. Однако проникновению процессора на рынок в конце 1997 - начале 1998 года препятствовали проблемы, которые возникли у AMD при перемещении ее нового производственного 0.25-мкм процесса из лабораторий на заводы-изготовители. Это привело к падению производства центральных процессоров на 200 и 233 МГц, задержке введения чипа 266 МГц и отмене чипа 300 МГц.
Процессор AMD К6-2
Процессоры AMD К6-2 с 9.3 млн транзисторов производились по 0.25-микронной технологии AMD. Процессор был упакован в 100 МГц Sирег7-совместимую, 321-контактную керамическую плату (ceramic pin grid array (CPGA) package).
K6-2 включает инновационную эффективную микроархитектуру RISC86, большой (64 Кбайт) кэш первого уровня (двухпортовый кэш данных на 32 Кбайт, кэш команд на 32 Кбайт с дополнительным предрасшифровывающим кэшем на 20 Кбайт), а также улучшенный модуль работы с плавающей запятой. Эффективная производительность при его запуске в середине 1998 года была оценена в 300 МГц, к началу 1999 года самым быстрым из доступных процессоров была версия 450 МГц.
Трехмерные возможности К6-2 представляли другое важное достижение. Они были воплощены в AMD технологии 3DNow!, как новый набор из 21 команды, который дополнял стандартные команды ММХ, уже включенные в архитектуру К6, что ускоряло обработку трехмерных приложений.
Процессор AMD K6-III
В феврале 1999 года AMD объявила о начале выпуска партии 400 МГц AMD К6-lll процессора под кодовым названием «Sharptooth» и опробовала 450 МГц версию. Ключевой особенностью этого нового процессора была инновационная разработка - «Трехуровневый кэш».
Традиционно процессоры персональных компьютеров использовали два уровня кэша:
- кэш первого уровня (L1), который обычно расположен на кристалле;
- кэш второго уровня (L2), который мог располагаться либо вне центрального процессора, на материнской плате или слоте, либо непосредственно на чипе центрального процессора.
Общее эмпирическое правило при проектировании подсистемы кэша - чем больше и быстрее кэш, тем выше производительность (ядро центрального процессора может быстрее получить доступ к инструкциям и данным).
Признавая выгоды большого и быстрого кэша в удовлетворении потребностей приложений, все более требовательных к производительности персональные компьютеры, «Трехуровневый кэш» компании AMD вводил архитектурные новшества кэша, разработанные для увеличения производительности персонального компьютера на основе платформы Super7:
- внутренний L2-кэш (256 Кбайт), работающий на полной скорости процессора AMD-K6-I1I и дополняющий кэш L1 (64 Кбайт), который был стандартен для всего семейства процессоров AMD-K6;
- многопортовый внутренний кэш, позволяющий одновременное 64-битовое чтение и запись как кэшу L1, так и L2;
- первичную процессорную шину (100 МГц), обеспечивающую соединение с резидентной кэш-памятью на системной плате, расширяемой от 512 до 2048 Кбайт.
Таблица основных характеристик процессоров AMD
| Тип процессора | Архитектура | Год выпуска | Кодовое наименование | Количество транзисторов, млн | Ядро, мм | L1 -кэш, Кбайт | L2-кэш, Кбайт |
|---|---|---|---|---|---|---|---|
| AMD K5 | K5 | 1996 | SSA/5 | 4.3 | 271-161 | 8+16 | Внешн. |
| 1996 | Godot | 4.3 | 181 | 8+16 | Внешн. | ||
| AMD К6 | К6 | 1997 | Nx686 (Model 6) | 8.8 | 162 | 32+32 | Внешн. |
| 1998 | Little Foot | 8.8 | 88 | 32+32 | Внешн. | ||
| K6-II | 1998-2001 | Chompers | 9.3 | 81 | 64 | Внешн. | |
| К6 III | 1999 | Sharptooth | 21.3 | 118 | 64 | 256 | |
| Athlon | К7 | 1999 | Argon | 22.0 | 184 | 128 | 512 |
| 2000 | Pluto | 22.0 | 102 | 128 | 512 | ||
| 2000-2001 | Thunderbird | 37.0 | 120 | 64+64 | 256 | ||
| Duron | 2000-2001 | Spitfire | 25.0 | 100 | 64(|) + 64(D) | 64-128 | |
| 2001-2002 | Morgan | 25.18 | 106 | 128 | 64 | ||
| 2003 | Applebred | 37.2 | 85 | 128 | 64 | ||
| Athlon ХР/МР | 2001-2002 | Palomino | 37.5 | 130 | 128 | 256 | |
| 2002 | Thoroughbred | 37.2 | 85 | 128 | 256 | ||
| 2003-2004 | Barton | 54.3 | 101 | 64+64 | 512 | ||
| Sempron | К7 | 2004 | Thorton | 54.3 | 101 | 128 | 256 |
| 2004 | Thoroubred | 37.2 | 85 | 128 | 256 | ||
| 2005 | Winchester | 68.5 | 84 | 128 | 128 | ||
| Sempron | К7 | 2005 | Palermo | 68-75 | 84 | 64+64 | 128-256 |
| 2006 | Manila | 103 | 81 | 128 | 128-256 | ||
| Athlon 64 | К8 | 2003-2004 | Clawhammer | 105.9 | 193 | 128 | 512-1024 |
| 2004 | Newcastle | 68.5 | 144 | 128 | 512 | ||
| 2004 | Winchester | 68.5 | 84 | 128 | 512 | ||
| 2005 | Venice | 76 | 84 | 128 | 512 | ||
| 2005 | San Diego | 114 | 115 | 128 | 512-1024 | ||
| 2006 | Orleans | 129 | 125 | 128 | 512 | ||
| 2006 | Manchester | 154 | 147 | 128 | 512 | ||
| Opteron | 2003 | Sledgehammer | 64+64 | 1024 | |||
| 2005 | Venus, Troy, Athens | 64+64 | 1024 | ||||
| Athlon 64 x 2 | 2-ядерные | 2005 | Manchester | 154 | 147 | 128 x 2 | 512 x 2 |
| 2005 | Toledo | 233 | 199 | 128 x 2 | 512 x 2 | ||
| 2006 | Windsor | 243 | 220 | 128 x 2 | 512 x 2 | ||
| 2006 | Brisbane | 153.6 | 183 | 128 x 2 | 1024 x 2 |
| Тип процессора | Архитектура | Размер минимальной структуры, мкм | Тактовая частота шины, МГц | Тактовая частота процессора, МГц | Потребляемая мощность, Вт | Интерфейс |
|---|---|---|---|---|---|---|
| AMD K5 | K5 | 0.5-0.35 | 50-66 | 75-100 | 11-15 | Socket 5/7 |
| 0.35 | 60-66 | 90-115 | 12-16 | Socket 5/7 | ||
| AMD К6 | К6 | 0.35 CMOS | 66 | 166-300 | 13-28 | Socket 7 |
| 0.25 | 66 | 200-300 | 13-28 | Socket 7 | ||
| K6-II | 0.25 | 66-100 | 266-550 | 15-30 | Super7(321 p) | |
| К6 III | 0.25 | 100 | 400-450 | 18-30 | Super7 | |
| Athlon | К7 | 0.25 | 200 | 500-700 | 36-54 | Slot A(575 p) |
| 0.18 | 200 | 550-950 | 31-62 | Slot A | ||
| 0.18 | 200 | 700-1.4 ГГц | 38-72 | Socket A/Slot A | ||
| Duron | 0.18 | 200 | 600-950 | 27-41 | Socket A (Socket 462) | |
| 0.18 | 200 | 900-1.3 ГГц | 44-60 | S 462 | ||
| 0.13 | 266 | 1.4-1.8 | 57 | S 462 | ||
| Athlon ХР/МР | 0.18 | 266 | 1.4-1.7 | 62-72 | Socket 462 | |
| 0.13 | 266 | 1.4-2.25 | 49-74 | S 462 | ||
| 0.13 | 266-400 | 1.86-2.33 | 66-77 | Socket A | ||
| Sempron | К7 | 0.13 | 333 | 1.5-2.0 | 62 | S 754/S 939 |
| 0.13 | 333 | 1.5-2.0 | 62 | S462 | ||
| 0.09 | 400 | 1.6 | 62 | S 754 | ||
| Sempron | К7 | 0.09 | 400 | 1.6-1.8 | 59-64.0 | Socket А/ Socket 754 |
| 0.09 | 400 | 1.6-2.0 | 35-62 | AM2 | ||
| Athlon 64 | К8 | 0.13 | 400 | 1.8-2.4 | 89 | S 754 |
| 0.09 | 400 | 1.6-2.4 | 89 | S754 | ||
| 0.09 | 400 | 1.8-2.2 | 67 | S 939 | ||
| 0.09 | 400 | 2.0-2.4 | 16-89 | S 754 | ||
| 0.09 | 400 | 2.2 | 89 | S 939 | ||
| 0.09 | 400 | 1.8-2.4 | 35-62 | AM2 | ||
| 0.09 | 400 | 2.0-2.2 | 67 | S 939 | ||
| Opteron | 0.13 | 800/НТ | 1.4-2.4 | 55-95 | S 940 | |
| 0.09 | 1000/НТ | 1.6-3.0 | 55-95 | S 940 | ||
| Athlon 64 x 2 | 2-ядерные | 0.09 | 667-800 | 2.0-2.4 | 69-110 | S939 |
| 0.09 | 2.0-2.4 | 89-110 | S 939 | |||
| 0.09 | 2.0-2.6 | 65-89 | AM2 | |||
| 0.09 | 2.0-2.8 | 65-89 | AM2 |
Проект многопортового внутреннего кэша процессора AMD-K6-III позволил как кэшу L1 (64 Кбайт), так и кэшу L2 (256 Кбайт) выполнять одновременное 64-битовое чтение и запись операций за один такт процессора. В дополнение к этому многопортовому проекту кэша ядро процессора AMD-K6-I11 было в состоянии получить доступ к кэшам L1 и L2 одновременно, что увеличивало общую пропускную способность центрального процессора.
Процессор AMD Athlon
Выпуск процессора Athlon летом 1999 года был наиболее удачным ходом AMD. Это позволило им гордиться тем, что они произвели первый процессор седьмого поколения (у него было достаточно много радикальных архитектурных отличий от Pentium ll/lll и К6-III, чтобы заслужить название процессора следующего поколения), и это означало также, что они вырвали технологическое лидерство у Intel.
Древнегреческое слово Athlon означает «трофей», или «игры». Athlon - процессор, с помощью которого AMD надеялась увеличить реальное конкурентоспособное присутствие в корпоративном секторе, помимо его традиционного преимущества на потребительском рынке и рынке трехмерных игр. Ядро размещается на кристалле в 102 квадратных миллиметров и содержит приблизительно 22 млн транзисторов.
Основные элементы ядра Athlon
Многократные декодеры
Три полных декодера переводят х86-команды в макрооперации (MacroOPs) с фиксированной длиной для более высокой пропускной способности команд и увеличения мощности обработки. Вместо того чтобы выполнять х86 команды с длиной 1-15 байтов, процессор Athlon выполняет макрооперации фиксированной длины.
Блок контроля команд
Как только макрооперация расшифрована, за цикл посылаются до трех макроопераций блоку управления инструкциями (ICU). Это буфер перенаправления макроопераций с 72 входами (ROB), который управляет выполнением каждой макрооперации в целом, осуществляет переименование регистра для операндов, управляет любыми условиями исключения и действиями команды. ICU посылает макрооперацию планировщику исполнения.
Конвейеры исполнения
Athlon содержит 18-разрядный планировщик макроопераций и 36-разрядный планировщик операций мультимедиа и ПТ. Эти планировщики распределяют MacroOPs по девяти независимым конвейерам - три для вычислений с ФТ, три для вычисления адресов и три для выполнения команд ММХ, 3DNow! и операций ПТ для х87.
Структура процессора AMD Athlon
Суперскалярный блок плавающей точки FPT
Предыдущие центральные процессоры AMD были недостаточно производительными при работе с ПТ по сравнению с Intel. К этому недостатку более чем ответственно отнеслись в Athlon, который характеризуется суперскалярной архитектурой, включающей три конвейера выполнения команд с ПТ вне естественного порядка - FMUL (перемножение с ПТ), FADD (сложение с ПТ) и FSTORE (запись с ПТ). «Суперскалярность» означает способность центрального процессора выполнять более одной команды за такт процессора. Athlon же может выполнять одну операцию над 32-битовым числом с ПТ за такт процессора, что дает производительность в 2.4 Гфлопс при частоте в 600 МГц.
Прогнозирование переходов
Процессор Athlon предлагает сложную динамическую логику прогнозирования ветвления, чтобы минимизировать или устранить задержки из-за команд перехода, широко распространенные в программном обеспечении х86.
Системная шина
Системная шина Athlon - первая системная шина на 200 МГц для х86-платформ. Основанная на протоколе Digital Alpha EV6, первичная шина (FSB) - потенциально расширяемая до 400 МГц и более и, в отличие от разделяемой шины SMP (Symmetric Multi-Processing) проекта Pentium III, использует архитектуру «точка-точка», чтобы обеспечить широкую полосу пропускания для одно- и многопроцессорных х86 платформ.
Архитектура кэша
Архитектура кэша Athlon существенно превосходит обычные центральные процессоры шестого поколения - полноценный кэш первого уровня 128 Кбайт, в 4 раза больший, чем у Pentium III, и быстродействующий 64-битовый контроллер вторичного кэша 2-го уровня, поддерживающий от 512 Кбайт до 8 Мбайт.
Расширенный 3D Now
В ответ на Streaming SIMD Extensions (Intel Pentium III) реализация 3DNow! в Athlon была модернизирована добавлением 24 новых команд к исходной 21 инструкции 3DNow!
Athlon был первоначально доступен в диапазонах скорости 500.550 и 600 МГц и 650 МГц немного позднее (все изготовлены по 0.25-мкм технологии). К концу 1999 года AMD еще более повысила частоту: его ядро К75 (750 МГц) является первым процессором, построенным с использованием алюминиевой 6-слойной технологии 0.18-мкм компании AMD.
Утверждение о том, что это был самый быстрый х86 совместимый центральный процессора тысячелетия, спорно, поскольку Intel быстро ответила объявлением 800 МГц Pentium III. Однако AMD вскоре вернула лидерство в 2000 году выпуском версий на 800 и 850 МГц и преуспела в опережении Intel в преодолении барьера 1 ГГц буквально через несколько недель.
Процессор Thunderbird
В середине 2000 года была выпущена улучшенная версия Athlon с кодовым названием «Thunderbird».
Технология 0.18-мкм, кэш-память 2-го уровня (L2) размером в 256 Кбайт расположена на плате процессора и работает на полной частоте процессора (первые процессоры Athlon имели кэш L2, работавшую на меньших частотах, например при частоте в 1 ГГЦ, память L2 работала на 330 МГц).
Интерфейсы - 462-контактный Socket А и Slot А. Частоты от 0.75 до 1 ГГц. Размещение 256 Кбайт памяти на кристалле привело к увеличению его размера до 120 квадратных миллиметров (102 квадратных миллиметров для ядра). Однако он меньше исходного (0.25-micron) К7 Athlon, который занимает 184 квадратных миллиметров. Добавление 256 Кбайт к L2-кэшу на кристалле весьма увеличивает число транзисторов. Центральный процессор Thunderbird включает 37 млн транзисторов, то есть 15 млн добавились для размещения кэша L2.
Осенью 2000 года был выпущен чипсет AMD760 (см. далее), обеспечивающий поддержку для памяти DDR SDRAM РС1600 (200 МГц FSB) и РС2100 (266 МГц FSB). Другие особенности - AGP 4-х, 4 порта USB, адресация памяти 8 Гбайт на 4 DIMM и поддержка АТА-100. С этого момента процессоры Athlon выпускались только для разъемов Socket А. Последние из процессоров Athlon/Thunderbird были выпущены летом 2001 года, достигнув частоты 1.4 ГГц.
Процессор Duron
В середине 2000 года был выпущен процессор Duron, предназначенный для дома и офиса. Название происходит от латинского «durare» - «вечный», «длительный». Кэш-память L1 (128 Кбайт) и L2 (64 Кбайт) размещается на плате. Первичная системная шина работает на частоте 200 МГц. Поддерживается улучшенная технология 3DNow! Технология 0.18-мкм, частоты 600.650 и 700 МГц. Интерфейс - 462-контактный разъем Socket А.
Процессор Palomino (Athlon ХР - EXtra Performance)
Процессор выполнен по 0.18-мкм технологии с использованием медных проводников на плате (вместо алюминия), содержит 37.5 млн транзисторов на кристалле в 128 квадратных миллиметров. Достигнуто понижение на 20 % энергопотребления сравнительно с Thunderbird. Введен ряд новшеств, в совокупности именуемых AMD как «QuantiSpeed Architecture»:
- введение дополнительного буфера - буфера быстрого преобразования адреса (БПА, TLB - Processor's Transition Lookaside Buffer). Это дополнительная кэш-память, расположенная между L1 и L2. В частности, TLB содержит данные, которые используются для перевода виртуальных адресов в физические и наоборот;
- поддержка SSE-технологии Intel. В Palomino добавлены еще 52 новые команды SIMD по отношению к ранее имевшимся. Удвоено количество исходных 21 SIMD-команд, реализующих «3DNow!», и получена технология «Enhanced 3DNow!» («3DNow! Professional»);
- использование технологии упаковки OPGA (organic PGA) для замещения CPGA (ceramic PGA), которая использовалась ранее. Использование пластмасс вместо керамики технологичнее, платы оказываются легче и обладают лучшими тепловыми свойствами. Кроме того, можно плотнее размещать навесные элементы, что уменьшает наводки и помехи. OPGA размещаются на уже известном разъеме Socket А.
Процессор Morgan
Morgan первоначально представлял собой ядро Palomino c удаленными 3/4 кэша L2 (64 Кбайт вместо 256 Кбайт). Размер кристалла - 106 квадратных миллиметров, число транзисторов - 25.18 млн. Напряжение питания было изменено с 1.6 до 1.75 В.
Процессор Thoroughbred
Летом 2002 года AMD начала поставлять первый процессор с 0.13-мкм технологией и медными соединениями. Площадь кристалла - 80 квадратных миллиметров (у его предшественников - 128 квадратных миллиметров). Питание - 1.65 В, размеры кэша на кристалле - 128 Кбайт для L1 и 256 Кбайт для L2, разъем - Socket А. Эквивалентная производительность Athlon ХР - 2400+ или 2600+.
Однако ядро Thoroughbred рассматривать как простую переделку Palomino с учетом новых норм технологического процесса все же не совсем верно. Thoroughbred по своей внутренней структуре значительно отличается от Palomino, в чем можно убедиться по микроснимкам процессорных ядер.
Ядра процессоров AMD
- а - Palomino;
- б - Thoroughbred
Процессор Sempron
Летом 2004 года AMD объявила о выходе центрального процессора семейства Sempron. Первоначально задуманный как преемник успешного центрального процессора Duron и прямой конкурент процессору Celeron D (Intel, 90 нм), диапазон применения Sempron фактически перекрыл диапазон Athlon AMD ХР и поставил фирмы, выпускающие настольные и мобильные персональные компьютеры, перед выбором - либо Sempron, либо Athlon 64.
Все первые центральные процессоры базировались на 130-нм технологии AMD. Наиболее мощные образцы (3100+) выпускаются в формате интерфейса Socket 754 (Athlon 64 - в формате Socket 939). Другие участники семейства - от 2 ГГц (2800+) до 1.5 ГГц (2200+) - используют Socket А.
В дальнейшем Sempron предполагается перевести на 90-нм технологию и интерфейс Socket 939.
Архитектура процессора К8
Эта архитектура используется во всех современных серверных, настольных и мобильных процессорах AMD (Opteron, Athlon 64 и Athlon 64 Х2). Первым из процессоров К8 являлся Hammer (середина 2000 года ).
Одним из главных новшеств К8 является 64-разрядная архитектура х86-64 ISA. Примером 64-разрядных процессоров (IA-64) является Intel Itanium. Однако между 64-разрядными архитектурами процессоров Itanium и К8 мало общего. Itanium - процессор, несовместимый с системой команд х86, тогда как К8, напротив, таковым является.
Стратегия AMD на 64 бита (х86-64) заключается в следующем - за основу взято производительное х86-ядро и расширен набор инструкций для возможности адресации 64-битового пространства памяти. Особенности архитектуры х86-64 (AMD64):
- обратная совместимость с инструкциями х86;
- 8 новых 64-битовых РОН плюс 64-битовые версии прежних 8 РОН х86 (доступны лишь в 64-битовом «длинном» режиме);
- поддержка SSE и SSE2 помимо восьми новых регистров SSE2;
- увеличен объем адресуемой памяти для приложений, работающих с большими объемами данных (доступно лишь в «длинном» режиме);
- высокая производительность 32-битовых приложений плюс поддержка появляющихся 64-битовых приложений, хороший вариант переходного процессора.
Таблица режимов процессоров К8
| Режим | Подрежим | Назначение | Адресуемая память, Гбайт | Операционная система | Примечания |
|---|---|---|---|---|---|
| «Преемственности» (Legacy Mode) | Нет | Работа со всеми 16- или 32-бито-выми х86-прило-жениями | 4 | 32-раз-рядная | Используются только 32 разряда в 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется |
| «Длинный» (Long Mode) | Полный (64 разряда) | Работа с 64-разрядными приложениями (инструкции х86-64) | Более 4 | 64-разрядная | Используются 64-разрядные основные и дополнительные регистры. Требуется перекомпиляция старых программ |
| Совместимости (Compatibility Mode) | Запуск 32-разрядных программ в 64-раз-рядной ОС | 2 в 32-битовой ОС. 4 в 64-битовой ОС | Используются только 32 разряда е 64-разрядных регистрах. Дополнительные 64-разрядные регистры не задействованы. Перекомпиляция ПО не требуется |
Основные недостатки:
- процессор продолжает поддерживать архитектуру х86, которая достаточно устарела;
- новые РОН можно использовать лишь в 64-битовом режиме, что не позволяет повысить производительность 32-битовых приложений посредством улучшения архитектуры системы команд.
Для реализации возможности работы как с 32-битовыми, так и с 64-битовыми приложениями процессоры К8 поддерживают два режима работы - Long Mode и Legacy Mode. В режиме Long Mode также предусмотрено два подрежима - 64-битовый и Compability mode (режим совместимости).
Некоторые прочие особенности К8
- контроллер памяти интегрирован в сам процессор. Традиционно он располагается в «северном мосте» чипсета на системной плате. Собственно, контроллер памяти - это основной функциональный блок «северного моста» (в чипсетах Intel его так и называют - МСН, Memory Controller Hub); встроенный порт («линк») шины HyperTransport - универсальной шины межчипового соединения. В процессорах К8 Opteron может быть до 3-4 линков НТ, что позволяет комбинировать их в кластерные структуры
Архитектура AMD К8
- архитектура К8 разработана с перспективой создания многоядерных процессоров и многопроцессорных систем: если центральные процессоры Intel Хеоn может продемонстрировать лишь 11 процентов увеличения производительности при переходе к двум процессорам, то в случае с Opteron оно составляет 24 процента;
- усовершенствован блок предсказания переходов - для увеличения точности он содержит историю 16 000 переходов, а также 2000 адресов назначения.
Исполнение инструкций на конвейере К8 начинается с блока выборки инструкций. За один такт блок выбирает из кэша 16 байт данных и выделяет из них от одной до трех инструкций х86 - сколько в выбранных данных поместилось. Поскольку средняя длина команды х86 составляет 5-6 байт, то, как правило, блоку удается выбрать три команды за такт.
На втором такте конвейера выбранные команды распределяются по трем блокам декодирования инструкций. Самые сложные команды отправляются в декодер сложных команд (VectorPath), другие - в декодеры простых команд (DirectPath).
Исходные х86-инструкции на завершающих этапах работы декодера К7/К8 переводятся в макрооперации, или МакОПы (mOPs). Большинству х86-инструкций соответствует одна МакОП, некоторые преобразуются в 2 или 3, а наиболее сложные, например деление или тригонометрические, - в последовательность из нескольких десятков МакОП. Макрооперации имеют фиксированную длину и регулярную структуру.
Условно можно считать что в определенный момент МакОп может «расщепляться» на две микрооперации (МкОП). Как правило, в К7 и в К8 МакОП содержит две МкОП - одну для АЛУ (ALU) (или блока ПЗ - FPU), другую - для УВА (устройства вычисления адреса, AGU - Address Generation Unit).
За счет конвейеризации возможны ситуации, когда одновременно в разных блоках процессора будут выполняться до двух десятков команд - и в К7, и в К8 имеется десять исполнительных устройств - три ALU, три FPU, три AGU и отдельный блок умножения.
Подобно тому, как объединение двух отдельных МкОП в одну МакОП дает явные преимущества, точно так же дела обстоят и с самими МакОП - практически везде они выступают не в виде самостоятельных единиц, а в виде группы. Группу образуют три МакОП, которые одновременно запускаются на параллельные каналы.
Вся дальнейшая работа идет не с одиночными, а с «тройками» МакОП («линиями», line). Такая «линия», с точки зрения центрального управляющего блока процессора - ICU (Instruction Control Unit) воспринимается как единое целое: все основные действия выполняются именно над «линиями», в первую очередь выделение внутренних ресурсов.
Сгенерированные «линии» от декодеров по одной за такт поступают в блок управления командами - Instructions Control Unit (ICU), где подготовленные к исполнению линии накапливаются в специальной очереди (24 линии).
Из очереди в 24 линии по три МакОП в каждой ICU выбирает в наиболее удобной для исполнения последовательности (одна-три МакОП) и пересылает их либо на АЛУ, либо на блок ПЗ в зависимости от типа микрооперации. В случае АЛУ микрооперации сразу же попадают в очередь планировщика (шесть элементов по три МакОП), который подготавливает необходимые для исполнения микрооперации ресурсы, дожидается их готовности и только потом отправляет. Причем при исполнении одной МакОП на самом деле может происходить исполнение сразу двух действий (МкОП).
Процессор Athlon 64х2
AMD снова оказалась впереди Intel, продемонстрировав действующий экспериментальный образец двухъядерного процессора летом 2004 года и поэтому Intel вызвала всеобщее удивление, все же выйдя первой на рынок с двухъядерным процессором весной 2005 года Однако, мало того, что AMD 64 Х2 был только короткое время позади Pentium Extreme Edition и Pentium D по датам выхода на рынок, он значительно опережал их по показателям эффективности.
Athlon 64 Х2 включает все возможности, заложенные в единственном ядре Athlon 64 (такие, как HyperTransport и Enhanced Virus Protection - EVP). Когда центральный процессор работает под ОС Windows ХР (SP2), EVP интерпретирует области системной памяти как «только данные», так что любой находящийся здесь фрагмент кода может быть либо прочитан, либо записан, но не может быть выполнен как код программы. Тем самым EVP действует как профилактическая мера против обычных злонамеренных вирусов, локализуя и обезвреживая их.
Основная архитектура ядра Х2 по существу та же, как и у Athlon 64. Различие в том, что новые чипы, размещаемые на единственном кристалле в 199 квадратных миллиметров, причем каждый содержит более чем 233 млн транзисторов, изготовлены по 90-нм технологии AMD.
Таким образом, спецификации первоначально объявленного диапазона Athlon 64 Х2 были эквивалентны таковым из существующих центральных процессоров на 3500+, 3700+, 3800+ и 4000+ с изменением кэша L2 и тактовой частоты. Модели с 512 Кбайт кэша на ядре базируются на двойном ядре «Winchecter», в то время как версии версии кэша L2 на 1 Мбайт используют дизайн «Toledo». К лету 2005 года диапазон был расширен с появлением нового чипа (3800 +).
Если вам необходим ремонт фотоаппаратов canon, то мы с радостью вам поможем. На нашем сайте вы ознакомитесь с полным перечнем услуг, которые окажут вам наши квалифицированные специалисты.
Видео: «Зашибенная рыбалка»
Офигенская рыбалка






