У нас: 141825 рефератів
Щойно додані Реферати Тор 100
Скористайтеся пошуком, наприклад Реферат        Грубий пошук Точний пошук
Вхід в абонемент



Стаття - Athlon xp 3200+
26



даними, процесор AMD Athlon XP містить три дешифратори команд x86. Кожний дешифратор здібний до декодування трьох інструкцій за такт. Пропускна спроможність декодування надає можливість процесору вигідно використовувати здібності архітектури QuantiSpeed, таким чином поліпшуючи IPC.

FPU

Трьох потокова архітектура процесора AMD Athlon XP та суперскалярна здатність плаваючої крапки заснована на трьох конвеєрних блоках виконання операцій з плаваючою крапкою. Використовуючи форматування даних і одно інструкційні мультидані (SIMD) операції, засновані на моделі інструкцій MMX, процесор AMD Athlon XP може виконати чотири 32-бітні операції з плаваючою крапкою за такт.

Три окремих блоки виконання інструкцій з плаваючою крапкою процесора підтримують інструкції плаваючої крапки x87, інструкції MMX і 3DNow! Нижче перелічені ці блоки:

1. Fstore – Це конвеєр завантаження/зберігання операцій з плаваючою крапкою, який управляє завантаженням FP, зберіганням і змішаними операціями.

2. Fadd – Це конвеєр, який містить технологію 3DNow!, додавання, MMX ALU/shifter, і блок виконання FP додавання.

3. Fmul – Це мультиконвеєр, який містить MMX ALU, множник MMX, множник інструкцій FP/3DNow! і підтримку інструкції FDIV.

FPU процесора AMD Athlon XP - суперконвеєрний. Ця техніка підтримує вищі частоти і дозволяє FPU, швидше обробити комплексні інструкції плаваючої крапки. Сьоме покоління FPU процесора AMD Athlon XP має ще деякі особливості, як наприклад 36-входовий планувальник інструкцій і регістровий файл на 88-входів для незалежного, суперскалярного спекулятивного виконання інструкцій плаваючої крапки.

Технологія 3DNow!™

Процесор AMD Athlon XP з технологією 3DNow! додав 51 нову інструкцію в порівнянні з процесором AMD Athlon. Ці 51 нові інструкції разом з доповненнями для цілочисельних операцій SIMD, що вже входять в розширений стандарт 3DNow! сумісні з технологією Intel SSE.

Технологія 3DNow! і SSE - це в значній мірі додаткові архітектурні розширення. За допомогою виконання їх комбінацій, розробники програмного забезпечення здатні визначити, як вони можуть використовувати просунуті архітектурні здібності, дозволені системою команд SIMD. Приклади додатків, здатних отримати вигоду від використання цих розширень системи команд, включають швидкісне розпізнавання, кодування/декодування відео і розробку 3D графіки.

Багато існуючого програмного забезпечення, якє є SIMD-оптимізованим, для того щоб отримати вигоду від 3DNow! технології або SSE, залежить від архітектури процесора на якій це програмне забезпечення виконується. Архітектура процесора AMD Athlon XP з розширеною 3DNow! технологією, дає наступні три сценарія для розробки програмного коду:

1. Програмне забезпечення, оптимізоване виключно для архітектури процесора AMD. З використанням технології 3DNow! та оптимізованого для них коду заснованого на підтримці спеціальної технології 3DNow для процесорів AMD.

2. Програмне забезпечення, оптимізоване для обох архітектур процесорів - AMD з технологією 3DNow! та x86 з технологією SSE. З використанням технології 3DNow! та оптимізованого для них коду заснованого на підтримці спеціальної технології 3DNow для процесорів AMD.

3. Програмне забезпечення, оптимізоване виключно для іншої архітектури процесора x86, що підтримує SSE. З використанням неоптимізованого коду на архітектурі процесора AMD.

Процесор AMD Athlon XP з розширеною технологією 3DNow! дозволяє SIMD-оптимізованому програмному забезпеченню з третього сценарію представленого вище, підтримувати SSE і завантажувати оптимізовані програми для збільшення продуктивності. Розпізнавання підтримки SSE в 3DNow! формується наперед автоматично додатками програмного забезпечення, за допомогою спеціальних прапорів промислового стандарту. Ними забезпечені інструкції CPUID, розроблені, щоб автоматично визнати підтримку SSE і направити програму по оптимізованій ланці коду. Таким чином процесор AMD Athlon XP має перевагу в продуктивності при виконанні спеціально розробленого для нього коду.

Апаратна попередня вибірка даних (Hardware Data Prefetch)

Для того щоб збільшити IPC і таким чином підвищити продуктивність процесора, процесор AMD Athlon XP також використовує апаратну технологію попередньої вибірки даних. Ця апаратна технологія попередньої вибірки даних спостерігає за доступами до пам'яті, замічає регулярні зразки такого доступу і спекулятивно заносить ці дані до кешу L2 попереду даних поточного доступу. Таким чином зменшується середній час доступу до даних, що знаходяться в пам'яті. В минулому, попередня вибірка даних підтримувався через інструкції, введені в 3DNow! і технології SSE. Проте, для процесора, щоб мати перевагу цієї здатності, додаткам програмного забезпечення довелося оптимізуватися під 3DNow! і інструкції SSE. Процесор AMD Athlon XP розроблений, щоб автоматично оптимізувати продуктивність на існуючому програмному забезпеченні, яке наперед не оптимізоване, використовуючи апаратні інструкції попередньої вибірки даних, підтримуємі 3DNow!

Переваги від апаратної попередньої вибірки даних процесора AMD Athlon XP спостерігаються у високорівневих програмних додатках з інтенсивним обміном даними та обміном масивів даних. Продуктивність також отримується за допомогою не зайняття пропускної спроможності каналу виконання команд процесора, яке вимагається інструкціями попередньої вибірки даних програмного забезпечення. Оптимізація найбільш ефективна, при використанні швидкої пам'яті, наприклад DDR.

Ексклюзивні та спекулятивні буфери швидкої трансляції адрес (TLB)

Особливістю процесора AMD Athlon XP є двохрівнева структура буферів швидкої трансляції адрес для інструкцій та трансляції адрес даних. TLB Інструкцій 1 рівня (L1) (I-TLB) мають 24 входи, TLB даних L1 (D-TLB) 40 входів, L2 I-TLB і D-TLB мають по 256 входів кожний.

Щоб зменшити конфлікти між входами TLB, структури L1 і L2 TLB мають ексклюзивну архітектуру. За допомогою ексклюзивної архітектури TLB, L1 TLB може містити входи, які не дублюються в L2 TLB, дозволяючи комбінувати L1 TLB і L2 TLB для збільшення загального доступного вхідного потоку як інструкцій так і даних. За допомогою зменшення числа конфліктів, збільшується продуктивність високорівневих додатків, що використовують інтенсивний обмін даними,


Сторінки: 1 2 3 4 5