Частота gpu – Частота графического процессора (GPU)

Содержание

на что влияет это параметр?

Опубликовано 3.10.2018 автор — 0 комментариев

Привет, друзья! Как вы, вероятно, уже знаете, все видеокарты оборудованы GPU, то есть графическими процессорами. Одним из ключевых параметров при работе устройства, является частота графического процессора, на что влияет эта характеристика, я расскажу в сегодняшней публикации.

Зачем нужен графический процессор

Этот чип в видеокарте занят самым важным делом: он рендерит графику, просчитывая 2D и 3D объекты и их взаимодействие между собой и тем самым формируя изображение, передаваемое затем на дисплей монитора. Благодаря особенностям архитектуры, этот чип гораздо эффективнее обрабатывает графику по сравнению с центральным процессором, несмотря на меньшую мощность.

Такой чип может быть как составной частью видеокарты, так и быть интегрированным в северный мост материнской платы или как логический блок на ЦП. Как правило, последние два типа менее мощные и подходят для выполнения повседневных задач, но слабо справляются с рендерингом сложных объектов.

На что влияет его частота

Тактовая частота ядра – количество операций, которые графический процессор выполняет в секунду. На сегодняшний день у мощных видеокарт этот показатель уже перевалил за гигагерц.

Чем выше тактовая частота, тем больше данных может обработать графический ускоритель. Это влияет не только на количество FPS в играх, но и на количество примитивов в отрендеренных объектах, то есть на качество графики.

Таких показателей удалось добиться, благодаря уменьшению техпроцесса графического чипа, увеличив количество логических блоков на той же площади кристалла. Подробнее о техпроцессе видеокарты вы можете почитать здесь.

Два главных конкурента, которые выпускают графические чипы, Nvidia и AMD, постоянно соревнуются за повышение частотных характеристик. Выпустить новую топовую модель, которая по техническим параметрам хотя бы на пару месяцев заткнет за пояс конкурентов – уже скорее дело престижа, а не насущная потребность рынка.

Даже в развитых странах не каждый геймер может позволить себе такое устройство.

Можно ли увеличить частоту и зачем это делать

Существует целый ряд программ, которые позволяют выполнить boost графического чипа, повысив его частотные характеристики (конечно, если компонент поддерживает такую опцию). Сюда можно отнести:

  • ASUS GPU Tweak – лучше всего работает с видеокартами именно этого бренда, открывая пользователю доступ к дополнительным опциям;
  • MSI Afterburner – всеядная утилита, которой все равно, что разгонять;
  • RivaTuner – «прародитель» всех современных программ для оверклокинга, на основании наработок которого, созданы все последующие продукты.

Кроме повышения частоты графического процессора, эти утилиты умеют увеличивать частоту памяти, регулировать скорость вращения кулеров и многое другое. «Что это дает в практическом плане?» – может спросить внимательный читатель.

Увеличение тактовой частоты, как можно догадаться, позволяет увеличить качество графики и количество ФПС в играх программными средствами, то есть не покупая новую видеокарту.

Такой «костыль» можно использовать как временное решение, когда юзер еще морально не созрел для покупки нового девайса, однако уже хочется поиграть в новинку, которую комп не вытягивает по системным требованиям.

При этом следует учитывать, что разгон видеокарты требует аккуратного и вдумчивого подхода – если переборщить с увеличением частоты и «дать копоти» больше, чем видеокарта реально сможет вытянуть физически, происходит перезапуск графического драйвера, что обычно ведет к крашу запущенной игры или видеоредактора.

Сломать девайс таким способом очень сложно, из‐за предусмотренной программистами «защиты от дурака».Однако хочу также отметить, что особо настойчивые фанаты оверклокинга умудряются таки сжечь видеокарту, дав ей повышенную нагрузку и убрав количество оборотов кулера до минимума.

В качестве рекомендации, советую обратить внимание на видеокарту Asus PCI‐Ex GeForce GTX 1060 Dual 3GB (DUAL‐GTX1060‐O3G), которая потянет все современные игры на приемлемых настройках графики.

К сожалению, для майнинга такой продукт подходит хуже, чем аналогичная по цене видяха от AMD. Ну тут уже такое – или в игры гонять, или крипту майнить, не так ли?

Полезными могут оказаться публикации «Как подобрать игры по системным требованиям компьютера» и «Видеокарты?». А на сегодня у меня все.

До новых встреч на страницах моего блога, дорогие друзья! Не забудьте расшарить эту статью в социальных сетях и подписаться на новостную рассылку.

С уважением, автор блога Андрей Андреев.

infotechnica.ru

Технические характеристики графических акселераторов — ITC.ua

Технические характеристики графических акселераторов

Модель и кодовое имя GPU

По названию модели нетрудно определить основные функциональные возможности акселератора. Когда ATI или NVIDIA выпускают новое поколение графических чипов, оно обычно сразу бывает представлено несколькими ревизиями (обозначаемыми кодовыми именами) со схожими характеристиками, но некоторыми различиями в производительности, а иногда и функциональности, за счет разных поддерживаемых частот, ширины шины памяти, количества рабочих конвейеров, техпроцесса. У NVIDIA кодовое имя имеет префикс NV (или G начиная с GeForce 7xxx). У ATI – префикс R или RV (например, R520 – GPU Radeon X1800 XT). Нет прямого соответствия между кодовым именем и моделью видеокарты. На одной ревизии чипа может выпускаться несколько моделей карт, например, на NV43 основаны все разновидности GeForce 6500 и 6600 (в том числе GT и LE-редакции), или наоборот: одна и та же модель – на разных чипах (AGP-версии разных GeForce 6800 GT базируются на ре-визии NV40, PCI-E-версия – на NV45). Впрочем, для потребителя, не интересующегося тонкостями разгона, окажется более понятным официальное название ядра, например GeForce 6800 GT, а не лежащая в его основе ревизия чипа, так как этим названием и будут определяться основные параметры видеокарты.

Производственный процесс, нм

Параметр, говорящий о минимальном размере элемента на кристалле GPU. Конечным пользователям может быть интересен прежде всего тем, что от него в немалой степени зависят тепловыделение и разгонный потенциал GPU. Чем меньше числовое значение техпроцесса, тем меньше площадь кристалла и тем меньшего тепловыделения можно ожидать, а значит, большего разгона достичь. При прочих равных характеристиках обычно стоит предпочесть акселератор на ревизии GPU с более тонким техпроцессом.

Интерфейс

Этим параметром определяется, на какой платформе и материнской плате способна работать та или иная модель акселератора. Сейчас, если отбросить совсем уж древние интерфейсы, остаются два варианта: AGP 8X либо PCI Express x16. На материнской плате имеется только один способ подключения видеокарт (кроме экзотических моделей), причем шина AGP является устаревшей и встречается лишь на платформах прошлого поколения. Новые модели акселераторов рассчитаны на PCI Express.

Частота GPU (core clock), MHz

Частота графического процессора, частота шины памяти и разрядность шины являются главными параметрами, определяющими быстродействие конкретной модели видеокарты по сравнению с другими акселераторами на этом же чипе. Производитель GPU устанавливает некую рекомендуемую («референсную») частоту для каждой модели чипа, на которой он должен стабильно работать и которой рекомендуется придерживаться изготовителям готовой продукции. В то же время многие топ-модели видеокарт уже протестированы на стабильную работу с повышенными частотами самими производителями. Рост частоты увеличивает нагрев GPU, а также риск появления артефактов в изображении, зависаний или даже выхода GPU из строя, но существует немало утилит для повышения штатной частоты, в том числе и таких, которые идут прямо с «оверклокерскими» моделями акселераторов и поддерживаются их производителями.

Частота шины памяти (memory clock), MHz

Частота памяти вместе с шириной шины памяти и типом памяти определяет пиковую пропускную способность видеопамяти в гигабайтах в секунду (GBps). Наряду с частотой GPU эта характеристика чаще и проще всего поддается изменению, причем разгон акселератора по памяти способен дать лучшие результаты, чем разгон самого GPU. Максимальный разгонный потенциал памяти (до появления проблем) во многом определяется временем доступа установленных на видеокарте микросхем памяти (задается в наносекундах). Его можно оценить, поделив единицу на это время.

Ширина шины памяти (memory bus width), bit

Шириной шины определяется, сколько информации может быть передано между GPU и видеопамятью за один цикл доступа. В зависимости от поколения и модели GPU выбор обычно стоит между 64 и 128 бит или (для новых поколений) 128 и 256 бит. Урезанные по ширине шины памяти модели видеокарт характеризуются серьезной потерей производительности, которая значительно более заметна, чем даже при снижении частоты памяти либо GPU. По возможности, таких моделей желательно избегать.

Объем видеопамяти, МB

Объемом видеопамяти будет определяться, сколько графических ресурсов сможет уместиться в локальную скоростную память видеоакселератора. Больше всего памяти занимают текстуры самого различного назначения, немного меньше – геометрия 3D-моделей. Десятка два и более мегабайт обычно уходит на организацию обязательных буферов кадров и хранение специальных промежуточных текстур – render targets, используемых при многопроходном рендеринге и для сложных эффектов. При нехватке локальной видеопамяти приложения вынуждены будут обращаться к технологии GART (Graphics Address Remapping Table), также иногда называемой AGP-текстурированием (однако применяется она и на PCI-E-ускорителях), для хранения части текстур в системной памяти, что может значительно ударить по производительности. Но и брать низкопроизводительную модель видеокарты с чрезмерно большим объемом видеопамяти тоже не стоит, на средних настройках качества она будет бесполезна. Кроме того, в такие модели зачастую ставят более медленные микросхемы памяти.

FFP (Fixed Function Pipeline)

До появления шейдеров и программируемой архитектуры GPU технология FFP была единственным доступным методом обработки 3D-графики на 3D-акселераторе. Как видно из названия, это жестко фиксированный набор простейших операций и алгоритмов, из которых можно выбирать необходимые в данный момент и иногда комбинировать их друг с другом, однако весьма ограниченным и нерасширяемым способом. В современных 3D-акселераторах отдельный аппаратный блок, отвечающий за поддержку FFP для старых приложений, отсутствует и полностью эмулируется драйвером с помощью шейдеров.

Шейдеры

Шейдеры – это небольшие программы, написанные непосредственно для графического процессора (GPU). Они загружаются в память видеокарты и используются на некоторых этапах 3D-конвейера, требующих особой гибкости. Применение шейдеров обеспечивает программируемую архитектуру GPU и предоставляет разработчику приложений большую свободу для реализации идей по сравнению с использованием FFP.

Типы шейдеров

По функциональному назначению и набору инструкций шейдеры делятся на две категории – вершинные (vertex shader) и пиксельные (pixel shader). Вершинные шейдеры обрабатывают геометрию 3D-моделей и отвечают, например, за такие задачи, как простейшая трансформация (поворот, масштабирование) модели, ее анимация и деформация, повертексное освещение. Пиксельные шейдеры подключаются к делу на более позднем этапе конвейера при растеризации изображения, т. е. отрисовке 2D-картинки. Они оперируют такими данными, как отдельные пиксели текстур, и итогом их работы будет результирующий цвет пикселя, вычисленный на основе этих данных. Вершинные и пиксельные шейдеры действуют в связке, и пиксельный использует данные, подготовленные для него вершинным (например, текстурные координаты, освещенность, цвет).

Версии шейдеров (или Shader Model)

Существует несколько поколений шейдеров, которые отличаются набором инструкций и их возможностями, количеством адресуемых регистров, определенными лимитами. Последняя актуальная версия – SM 3.0, соответствующая требованиям DirectX 9.0c. Поддержка поколений шейдеров является обратно совместимой, т. е. акселератор с поддержкой SM 3.0 также поддерживает и SM 2.0, и 1.x.

Поддерживаемый 3D API

Каждая следующая версия API Direct3D добавляет новые возможности и расширяет существующие. Кроме того, она предъявляет еще и набор технических требований, которые акселератор должен поддерживать аппаратно, чтобы быть полностью совместимым с данной версией (впрочем, иногда производители делают программную эмуляцию каких-то возможностей нового API в драйвере, но это более медленно и не всегда достижимо). Подобные требования относятся не только к версии шейдеров, но и, например, к поддерживаемым акселераторами форматам текстур (скажем, поддержка текстур floating point-формата нужна для HDR). Уже пару лет наиболее актуальным остается DirectX 9.0c, хотя выход десятой версии с немалым числом изменений ожидается в 2007 г.

В отличие от Direct3D версии OpenGL обновляются куда реже, так как основные нововведения принято реализовывать с помощью различных расширений, и только проверенные и наиболее полезные находят отражение в базовом API. Все акселераторы, поддерживающие DirectX 9.0c, также поддерживают и OpenGL 2.0, последнюю версию этого API.

Количество пиксельных и вершинных конвейеров (исполнительных блоков) GPU

От количества исполнительных блоков зависит вычислительный потенциал акселератора, его способность распараллеливать вычисления на различных этапах. Данное число определяется моделью установленного GPU (но не кодовым именем, так как бывает, что разные модели на одной ревизии GPU выпускаются за счет отбраковки и отключения части конвейеров). И в большинстве случаев, кроме моделей с отключенными конвейерами, изменить его нельзя. К тому же процедура эта нетривиальна и легко может привести к выходу акселератора из строя либо проблемам со стабильностью его работы.

Тип видеопамяти

DDR, GDDR2, GDDR3 – тип памяти, который определяет в основном возможность достижения более высоких частот. На сегодняшний день самыми скоростными являются чипы GDDR4, способные работать на частотах порядка 2 GHz.

itc.ua

1.8. Тактовая частота видеочипа

Рабочая частота GPU измеряется в мегагерцах, в миллионах тактов в секунду. Эта характеристика прямо влияет на производительность видеочипа, чем она выше, тем больший объем работы чип может выполнить в единицу времени, обработать большее количество вершин и пикселей. Пример: частота видеочипа, установленного на плате RADEON X1900 XTX равна 650 МГц, а точно такой же чип на RADEON X1900 XT работает на частоте в 625 МГц. Соответственно будут отличаться и все основные характеристики производительности. Но далеко не только рабочая частота чипа однозначно определяет производительность, на его скорость сильно влияет и архитектура: количество различных исполнительных блоков, их характеристики и т.п.

В последнее время участились случаи, когда тактовая частота для отдельных блоков GPU отличается от частоты работы всего остального чипа. То есть, разные части GPU работают на разных частотах, и сделано это для увеличения эффективности, ведь некоторые блоки способны работать на повышенных частотах, а другие — нет.

1.9. Скорость заполнения (филлрейт)

Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта: пиксельный (pixel fill rate) и текстурный (texel rate). Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга), а текстурная — это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.

Количество блоков пиксельных шейдеров (или пиксельных процессоров)

Пиксельные процессоры — это одни из главных блоков видеочипа, которые выполняют специальные программы, известные также как пиксельные шейдеры. По числу блоков пиксельных шейдеров и их частоте можно сравнивать шейдерную производительность разных видеокарт. Так как большая часть игр сейчас ограничена производительностью исполнения пиксельных шейдеров (см. технологические обзоры игр), то количество этих блоков очень важно! Если одна модель видеокарты основана на GPU с 8 блоками пиксельных шейдеров, а другая из той же линейки — 16 блоками, то при прочих равных вторая будет вдвое быстрее обрабатывать пиксельные программы, и в целом будет производительнее. Но на основании одного лишь количества блоков делать однозначные выводы нельзя, обязательно нужно учесть и тактовую частоту и разную архитектуру блоков разных поколений и производителей чипов. Только по этим цифрам сразу можно сравнивать чипы только в пределах одной линейки одного производителя: AMD(ATI) или NVIDIA. В других же случаях нужно обращать внимание на тесты производительности.

Количество блоков вершинных шейдеров (или вершинных процессоров)

Аналогично предыдущему пункту, эти блоки выполняют программы шейдеров, но уже вершинных. Данная характеристика важна для некоторых игр, но не так явно, как предыдущая, так как даже современными играми блоки вершинных шейдеров почти никогда не бывают загружены даже наполовину. И, так как производители балансируют количество разных блоков, не позволяя возникнуть большому перекосу в распределении сил, количеством вершинных процессоров при выборе видеокарты вполне можно пренебречь, учитывая их только при прочих равных характеристиках.

studfiles.net

Основные характеристики видеокарт | Все о видеокартах | Железо


Современные графические процессоры содержат множество функциональных блоков, от количества и характеристик которых зависит и итоговая скорость рендеринга, влияющая на комфортность игры. По сравнительному количеству этих блоков в разных видеочипах можно примерно оценить, насколько быстр тот или иной GPU. Характеристик у видеочипов довольно много, в этом разделе мы рассмотрим самые важные из них.

Тактовая частота видеочипа

Рабочая частота GPU измеряется в мегагерцах, в миллионах тактов в секунду. Эта характеристика прямо влияет на производительность видеочипа, чем она выше, тем больший объем работы чип может выполнить в единицу времени, обработать большее количество вершин и пикселей. Пример из реальной жизни: частота видеочипа, установленного на плате RADEON X1900 XTX равна 650 МГц, а точно такой же чип на RADEON X1900 XT работает на частоте в 625 МГц. Соответственно будут отличаться и все основные характеристики производительности. Но далеко не только рабочая частота чипа однозначно определяет производительность, на его скорость сильно влияет и архитектура: количество различных исполнительных блоков, их характеристики и т.п.

В последнее время участились случаи, когда тактовая частота для отдельных блоков GPU отличается от частоты работы всего остального чипа. То есть, разные части GPU работают на разных частотах, и сделано это для увеличения эффективности, ведь некоторые блоки способны работать на повышенных частотах, а другие — нет. Из последних примеров можно назвать семейство GeForce 8800 от NVIDIA, видеочип модели GTS работает на частоте 512 МГц, но универсальные шейдерные блоки тактуются на значительно более высокой частоте — 1200 МГц.

Скорость заполнения (филлрейт)

Скорость заполнения показывает, с какой скоростью видеочип способен отрисовывать пиксели. Различают два типа филлрейта: пиксельный (pixel fill rate) и текстурный (texel rate). Пиксельная скорость заполнения показывает скорость отрисовки пикселей на экране и зависит от рабочей частоты и количества блоков ROP (блоков операций растеризации и блендинга), а текстурная — это скорость выборки текстурных данных, которая зависит от частоты работы и количества текстурных блоков.

Например, пиксельный филлрейт у GeForce 7900 GTX равен 650 (частота чипа) * 16 (количество блоков ROP) = 10400 мегапикселей в секунду, а текстурный — 650 * 24 (кол-во блоков текстурирования) = 15600 мегатекселей/с. Чем больше первое число — тем быстрее видеокарта может отрисовывать готовые пиксели, а чем больше второе — тем быстрее производится выборка текстурных данных. Оба параметра важны для современных игр, но они должны быть сбалансированы. Именно поэтому количество блоков ROP в чипах семейства G7x, на которых построено семейство GeForce 7, меньше количества текстурных и пиксельных блоков.

Количество блоков пиксельных шейдеров (или пиксельных процессоров)

Пиксельные процессоры — это одни из главных блоков видеочипа, которые выполняют специальные программы, известные также как пиксельные шейдеры. По числу блоков пиксельных шейдеров и их частоте можно сравнивать шейдерную производительность разных видеокарт. Так как большая часть игр сейчас ограничена производительностью исполнения пиксельных шейдеров (см. технологические обзоры игр), то количество этих блоков очень важно! Если одна модель видеокарты основана на GPU с 8 блоками пиксельных шейдеров, а другая из той же линейки — 16 блоками, то при прочих равных вторая будет вдвое быстрее обрабатывать пиксельные программы, и в целом будет производительнее. Но на основании одного лишь количества блоков делать однозначные выводы нельзя, обязательно нужно учесть и тактовую частоту и разную архитектуру блоков разных поколений и производителей чипов. Чисто по этим цифрам прямо можно сравнивать чипы только в пределах одной линейки одного производителя: AMD(ATI) или NVIDIA. В других же случаях нужно обращать внимание на тесты производительности в интересующих играх.

Количество блоков вершинных шейдеров (или вершинных процессоров)

Аналогично предыдущему пункту, эти блоки выполняют программы шейдеров, но уже вершинных. Данная характеристика важна для некоторых игр, но не так явно, как предыдущая, так как даже современными играми блоки вершинных шейдеров почти никогда не бывают загружены даже наполовину. И, так как производители балансируют количество разных блоков, не позволяя возникнуть большому перекосу в распределении сил, количеством вершинных процессоров при выборе видеокарты вполне можно пренебречь, учитывая их только при прочих равных характеристиках.

Количество унифицированных шейдерных блоков (или универсальных процессоров)

Унифицированные шейдерные блоки объединяют два типа перечисленных выше блоков, они могут исполнять как вершинные, так и пиксельные программы (а также геометрические, которые появились в DirectX 10). Впервые унифицированная архитектура была применена в видеочипе игровой консоли Microsoft Xbox 360, этот графический процессор был разработан компанией ATI. А в видеочипах для персональных компьютеров унифицированные шейдерные блоки появились не так давно, с появлением плат NVIDIA GeForce 8800. И, похоже, что все DirectX 10 совместимые видеочипы будут основаны на подобной унифицированной архитектуре. Унификация блоков шейдеров значит, что код разных шейдерных программ (вершинных, пиксельных и геометрических) универсален, и соответствующие унифицированные процессоры могут выполнить любые программы из вышеперечисленных. Соответственно, в новых архитектурах число пиксельных, вершинных и геометрических шейдерных блоков как бы сливается в одно число — количество универсальных процессоров.

Блоки текстурирования (TMU)

Эти блоки работают совместно с шейдерными процессорами всех указанных типов, ими осуществляется выборка и фильтрация текстурных данных, необходимых для построения сцены. Число текстурных блоков в видеочипе определяет текстурную производительность, скорость выборки из текстур. И хотя в последнее время большая часть расчетов осуществляется блоками шейдеров, нагрузка на блоки TMU до сих пор довольно велика, и с учетом упора некоторых игр в производительность блоков текстурирования, можно сказать, что количество блоков TMU и соответствующая высокая текстурная производительность являются одними из важнейших параметров видеочипов. Особое влияние этот параметр оказывает на скорость при использовании трилинейной и анизотропной фильтраций, требующих дополнительных текстурных выборок.

Блоки операций растеризации (ROP)

Блоки растеризации осуществляют операции записи рассчитанных видеокартой пикселей в буферы и операции их смешивания (блендинга). Как мы уже отмечали выше, производительность блоков ROP влияет на филлрейт и это — одна из основных характеристик видеокарт всех времен. И хотя в последнее время её значение несколько снизилось, еще попадаются случаи, когда производительность приложений сильно зависит от скорости и количества блоков ROP (см. технологические обзоры игр). Чаще всего это объясняется активным использованием фильтров постобработки и включенным антиалиасингом при высоких игровых настройках.

Нужно еще раз отметить, что современные видеочипы нельзя оценивать только числом разнообразных блоков и их частотой. Каждая серия GPU использует новую архитектуру, в которой исполнительные блоки сильно отличаются от старых, да и соотношение количества разных блоков может отличаться. Компания ATI первой применила архитектуру, в которой количество блоков пиксельных шейдеров было в разы больше числа блоков текстурирования. Это было сделано немного преждевременно, на наш взгляд, но в некоторых приложениях пиксельные блоки используются более активно, чем остальные и для таких приложений подобное решение будет неплохим вариантом, не говоря уже о будущем. Также, в предпоследней архитектуре AMD(ATI) нет отдельных пиксельных конвейеров, пиксельные процессоры не «привязаны» к блокам TMU. Впрочем, у NVIDIA в GeForce 8800 получилось еще сложнее…

Рассмотрим ситуацию на примере видеокарт GeForce 7900 GT и GeForce 7900 GS. Обе они имеют одинаковые рабочие частоты, интерфейс памяти и даже одинаковый видеочип. Но модификация 7900 GS использует GPU с 20 активными блоками пиксельных шейдеров и текстурных блоков, а видеокарта 7900 GT — по 24 блока каждого типа. Рассмотрим разницу в производительности этих двух решений в игре Prey:

Разница в количестве основных исполнительных блоков в 20% дала разный прирост скорости в тестовых разрешениях. Значение 20% оказалось недостижимо потому, что производительность в Prey не ограничена на этих видеокартах только скоростью блоков TMU и ROP. Разница в разрешении 1024×768 составила меньше 8%, а в более высоких достигла 12%, что ближе к теоретической разности в количестве исполнительных блоков.

Объем видеопамяти

Собственная память используется видеочипами для хранения необходимых данных: текстур, вершин, буферов и т.п. Казалось бы, что чем её больше — тем лучше. Но не всё так просто, оценка мощности видеокарты по объему видеопамяти — это наиболее распространенная ошибка! Значение объема памяти неопытные пользователи переоценивают чаще всего, используя его для сравнения разных моделей видеокарт. Оно и понятно — раз параметр, указываемый во всех источниках одним из первых, в два раза больше, то и скорость у решения должна быть в два раза выше, считают они. Реальность же от этого мифа отличается тем, что рост производительности растет до определенного объема и после его достижения попросту останавливается.

В каждой игре есть определенный объем видеопамяти, которого хватает для всех данных, и хоть 4 ГБ туда поставь — у нее не появится причин для ускорения рендеринга, скорость будут ограничивать исполнительные блоки, о которых речь шла выше. Именно поэтому почти во всех случаях видеокарта с 320 Мбайт видеопамяти будет работать с той же скоростью, что и карта с 640 Мбайт (при прочих равных условиях). Ситуации, когда больший объем памяти приводит к видимому увеличению производительности, существуют, это очень требовательные игры в высоких разрешениях и при максимальных настройках. Но такие случаи весьма редки, поэтому, объем памяти учитывать нужно, но не забывая о том, что выше определенного объема производительность просто не растет, есть более важные параметры, такие как ширина шины памяти и ее рабочая частота. Подробнее о выборе объема видеопамяти читайте во второй части статьи.

Ширина шины памяти

Ширина шины памяти является важнейшей характеристикой, влияющей на пропускную способность памяти (ПСП). Большая ширина позволяет передавать большее количество информации из видеопамяти в GPU и обратно в единицу времени, что положительно влияет на производительность в большинстве случаев. Теоретически, по 128-битной шине можно передать в два раза больше данных за такт, чем по 64-битной. На практике разница в скорости рендеринга хоть и не достигает двух раз, но весьма близка к этому во многих случаях с упором в пропускную способность видеопамяти.

Современные видеокарты используют разную ширину шины: от 64 до 512 бит, в зависимости от ценового диапазона и времени выпуска конкретной модели GPU. Для low-end видеокарт чаще всего используется 64- и (значительно реже) 128-бит, для среднего уровня 128-бит и иногда 256-бит, ну а high-end видеокарты используют шины от 256 до 512 бит шириной.

Частота видеопамяти

Еще одним параметром, влияющим на пропускную способность памяти, является её тактовая частота. А как мы поняли выше, повышение ПСП прямо влияет на производительность видеокарты в 3D приложениях. Частота шины памяти на современных видеокартах бывает от 500 МГц до 2000 МГц, то есть может отличаться в четыре раза. И так как ПСП зависит и от частоты памяти и от ширины ее шины, то память с 256-битной шиной, работающая на частоте 1000 МГц, будет иметь большую пропускную способность, по сравнению с 1400 МГц памятью с 128-битной шиной.

Рассмотрим относительную производительность видеокарт с разной пропускной способностью на примере видеокарт RADEON X1900 XTX и RADEON X1950 XTX, которые используют почти одинаковые GPU с одними характеристиками и частотой. Основные их отличия состоят в типе и частоте используемой памяти — GDDR3 на частоте 775(1550) МГц и GDDR4 на 1000(2000) МГц, соответственно.

Хорошо видно, как отстает карта с меньшей пропускной способностью памяти, хотя разница никогда не достигает теоретических 29%. Разница между достигнутой частотой кадров растет с увеличением разрешения, начинаясь с 8% в 1024×768 и достигая 12-13% в максимальных режимах. Но это сравнение видеокарт с небольшой разницей в ПСП, а особенное внимание на параметры ширины шины памяти и частоты ее работы следует уделять при покупке недорогих видеокарт, на многие из которых ставят лишь 64-битные интерфейсы, что сильно сказывается на их производительности. Вообще, покупка решений на базе 64-бит шины для игр вовсе не рекомендуется.

Типы памяти

На видеокарты устанавливают несколько различных типов памяти. Старую SDR память с одинарной скоростью передачи мы рассматривать не будем, её уже почти нигде не встретишь. Все современные типы памяти DDR и GDDR позволяют передавать в два раза большее количество данных на той же тактовой частоте за единицу времени, поэтому цифру её рабочей частоты зачастую указывают удвоенной (умножают на два). Так, если для DDR памяти указана частота 1400 МГц, то эта память работает на физической частоте в 700 МГц, но указывают так называемую «эффективную» частоту, то есть ту, на которой должна работать SDR память, чтобы обеспечить такую же пропускную способность.

Основное преимущество DDR2 памяти заключается в возможности работы на больших тактовых частотах, а соответственно — увеличении пропускной способности по сравнению с предыдущими технологиями. Это достигается за счет увеличенных задержек, которые, впрочем, не так важны для видеокарт. Первой платой, использующей DDR2 память, стала NVIDIA GeForce FX 5800 Ultra. По сути, на ней стояла GDDR2 память, которая не настоящая DDR2, а нечто среднее между технологиями DDR и DDR2. После применения GDDR2 в серии GeForce FX 5800, последующие видеокарты NVIDIA использовали DDR память, но эта память получила дальнейшее распространение в GeForce FX 5700 Ultra и в некоторых более поздних mid-end видеокартах. С тех пор технологии графической памяти продвинулись дальше, был разработан стандарт GDDR3, который близок к спецификациям DDR2, с некоторыми изменениями, сделанными специально для видеокарт.

GDDR3 — это специально предназначенная для видеокарт память, с теми же технологиями, что и DDR2, но с улучшениями характеристик потребления и тепловыделения, что позволило создать микросхемы, работающие на более высоких тактовых частотах. И опять же, несмотря на то, что стандарт был разработан в ATI, первой видеокартой, ее использующей, стала вторая модификация NVIDIA GeForce FX 5700 Ultra, а следующей стала GeForce 6800 Ultra.

Ну а GDDR4 — это последнее поколение «графической» памяти, работающее почти в два раза быстрее, чем GDDR3. Основными отличиями GDDR4 от GDDR3, существенными для пользователей, являются в очередной раз повышенные рабочие частоты и сниженное энергопотребление. Технически, память GDDR4 не сильно отличается от GDDR3, это дальнейшее развитие тех же идей. Первыми видеокартами с чипами GDDR4 на борту стали RADEON X1950 XTX, а у компании NVIDIA продукты на базе этого типа памяти еще не вышли. Преимущества новых микросхем памяти перед GDDR3 в том, что энергопотребление модулей может быть примерно на треть ниже. Это достигается за счет более низкого номинального напряжения для GDDR4.

Итак, видеопамять самых современных типов: GDDR3 и GDDR4, отличается от DDR некоторыми деталями, но также работает с удвоенной передачей данных. В ней применяются некоторые специальные технологии, позволяющие поднять частоту работы. Так, GDDR2 память обычно работает на более высоких частотах, по сравнению с DDR, GDDR3 — на еще более высоких, ну а GDDR4 обеспечивает максимальную частоту и пропускную способность.

www.malbred.com

Почему вместо одной частоты GPU выводится несколько частот и что они означают?

В графических процессорах GeForce 7Х00 и более новых нет больше единой частоты для всего чипа. Разные блоки теперь работают на разных частотах в различных уровнях производительности. В графических процессорах 7Х00 серии представлено три частоты: блоков растеризации (ROP), блоков пиксельных шейдеров (Shader Unit) и блоков геометрии (Geometric unit). В графических процессорах серии GeForce 8Х00 и более новых представлено две частоты: универсальных вычислительных блоков (Shader Unit) и блоков растеризации (ROP).

Частота блоков геометрии/универсальных шейдерных  и частота блоков растеризации связана определенным соотношением. При разгоне через функции драйвера изменяется обычно только частота блока геометрии (универсальных шейдерных блоков), а частоты блоков ROP изменяются синхронно с учетом соотношения. При этом шаг изменения опорной частоты для блока геометрии/шейдеров меньше шага для остальных блоков. На практике это означает необходимость заметного увеличения частоты блока геометрии/шейдеров при разгоне для роста частот блоков ROP, при этом частоты блоков ROP вырастут скачкообразно, в зависимости от опорной частоты осциллятора (кварца).

Дополнительно, для блока геометрии в графических процессорах GeForce 7800 и 7900 предусмотрена работа на повышенной по отношению к другим блокам на определенную постоянную величину (geometric delta), заданную в BIOS видеокарты, частоте режиме 3D. В результате частота работы блока геометрии может быть на 50 с лишним мегагерц выше частот остальных блоков, что при разгоне приводит к резкому повышению температуры чипа и вероятности ошибок в работе блока геометрии. Возможна установка значения geometric delta в 0 в BIOS видеокарты с помощью редактора NiBiTor, после этого все частоты будут равны и шаг изменения будет такой же, как у блока геометрии, однако, подобное изменение может приводить к снижению производительности в отдельных задачах и ложным срабатываниям защиты драйвера.

При использовании драйверов NVIDIA версии 163.67 и более новых с графическими процессорами GeForce 8Х00 и более новыми возможно независимое изменение частот универсальных шейдерных блоков и блоков растеризации. Для этого можно воспользоваться RivaTuner и другими утилитами на её движке (EVGA Precision, MSI Afterburner), либо NVIDIA System Tools.

nvworld.ru

Частота GPU видеокарты Radeon HD 7970 GHz Edition равна 1075 МГц

Известно, что компания AMD увеличит эталонные частоты не только у графических ускорителей на базе процессоров семейства Cape Verde, но и представит новую версию Radeon HD 7970, которая обзаведётся почётным званием GHz Edition. Корейским журналистам с сайта Cooln удалось заполучить один из таких обновлённых экземпляров и даже испытать видеокарту в действии.


Прежде всего, сводная таблица характеристик Radeon HD 7970 GHz Edition, Radeon HD 7970 и GeForce GTX 680:
Модель Radeon HD 7970 GHz Edition Radeon HD 7970 GeForce GTX 680
Частота ядра GPU 1075 МГц 925 МГц 1006-1059МГц
Частота памяти 6000 МГц QDR 5500 МГц QDR 6008 МГц QDR
Шейдерных процессоров 2048 2048 1536
Текстурных блоков 128 128 128
Блоков ROP 32 32 32
Интерфейс памяти 384-bit 384-bit 256-bit
Объём памяти 3096 Мбайт 3096 Мбайт 2048 Мбайт
Скорость закраски 34.4 Гпикс/с 29.6 Гпикс/с 32.2 Гпикс/с
Скорость выборки текстур 137.6 Гтекс/с 118 Гтекс/с 128.8 Гтекс/с
Пропускная способность памяти 288 Гбайт/с 264 Гбайт/с 192.3 Гбайт/с
TDP 250 ватт 250 ватт 195 ватт



Тесты производительности проводились в системе на основе материнской платы Gigabyte GA-Z77X-UD3H, в которую устанавливался процессор Intel Core i7-3770K (4.5 ГГц) и 8 Гбайт памяти DDR-2133. Обновлённый ускоритель приблизительно на 7% быстрее «обычного» Radeon HD 7970, и в среднем равен конкуренту в лице GeForce GTX 680.

Любопытно, но при работе на частоте 1075 МГц видеокарта Radeon HD 7970 GHz Edition потребляет примерно на 10 ватт меньше электроэнергии в сравнении с ранними образцами Radeon HD 7970, работающими на аналогичных частотах. На этом отличия между версиями заканчиваются.