Overclock 4x4 Железо, номер #034, стр. 034-126-1 Разгон системы Quad NVIDIA SLI За последнее время через наш оверклокерский конвейер прошло великое множество видеокарт, и разогнаны они были самыми разными способами: от простого повышения рабочих частот до поднятия напряжений и разблокирования вычислительных блоков. Конфигураций также было немало: когда из одного чипа «выжимать» было уже нечего, в ход шли массивы SLI и Crossfire. Собственно, о количестве чипов мы хотим поговорить и в этот раз, благо у нас появился наилучший для этого повод. Технология Quad NVIDIA SLI наконец выбралась из андеграунда, в котором некоторое время прозябала из-за своей незавершенности и плохой оптимизации под софт, и уже готова вскружить геймерские головы огромными FPS и высоким качеством картинки. Мы же посмотрим, насколько она может вскружить наши головы своим разгонным потенциалом. Появление системы Quad SLI было вполне ожидаемо – если в относительно невысоких разрешениях платы Hi-End уровня чувствуют себя вполне неплохо даже с форсированием полноэкранного сглаживания и анизотропии, то с повышением четкости картинки их мощности уже перестает хватать. К примеру, «топовые» HD-разрешения вполне могут поставить на колени SLI-массив, особенно если им в этом будет помогать приличный FSAA. Что же делать энтузиастам, готовым выкладывать любые деньги за картинку исключительного качества? Ответ был найден быстро – в январе NVIDIA анонсировала элитную новинку, тандем сразу из четырех GPU – Quad SLI, на тот момент доступный только в комплекте с системой Dell XPS Renegade 600. Состоял комплект из двух видеокарт NVIDIA GeForce 7900 GX2, каждая из которых, в свою очередь, держала «на борту» два высокопроизводительных GPU. Вопрос приобретения новинки сразу же стал одним из наиболее «больных» для конечных пользователей. Все дело в том, что NVIDIA посчитала продажу комплектов для сборки Quad SLI слишком большим риском: система пожирала огромное количество энергии, а также создавала уйму проблем с вентиляцией внутри корпуса. Ну а так как основными потребителями четырехчиповых конфигураций компания видела пусть и хардкорных, но не очень знакомых с тонкостями железа геймеров, то было принято простое, но неприятное решение – Quad SLI распространять только в составе готовых систем. Профессиональные сборщики все же с установкой системы справятся гораздо лучше любого энтузиаста, да еще и гарантию на все это дело обеспечат. Как бы то ни было, первый блин NVIDIA на четырехъядерном поприще вышел комом, да еще каким! С одной стороны, Quad SLI тут же навлек на себя гнев со стороны пользователей, недовольных политикой в отношении его продажи. Это, в общем-то, понятно – не каждый решится на приобретение новой тачки только ради обновления видеоподсистемы. С другой дело обстояло еще хуже – четырехъядерная конфигурация ко всему оказалась еще и жутко глючной! Баги проявлялись самых разных масштабов: от артефактов в изображении и тормозов (система далеко не всегда показывала свои преимущества и зачастую сливала самой обыкновенной SLI) до полной неработоспособности приложений. Было ясно, что оптимизация еще не завершена, и выпускать на большой рынок столь сырое решение – настоящее самоубийство. Но и класть идею на полку было рано, ведь все, что требовалось – это основательная работа над ошибками. Ей суждено было выйти очень скоро… NVIDIA GeForce 7950 GX2 ($600+$600) Уже через несколько месяцев NVIDIA анонсировала то, чего так ждали любители быстрого и качественного 3D – ту самую «работу над ошибками», видеокарту NVIDIA GeForce 7950 GX2. Девайс имел значительно сниженное энергопотребление, отличался большей компактностью – в общем, лишился всех тех минусов, которые удерживали NVIDIA от запуска его предшественника в свободную продажу. Тем не менее, поначалу девайс ожидала та же судьба – поставка исключительно в готовых системах. В драйверах же поддержка Quad SLI для двух NVIDIA GeForce 7950 GX2 по-прежнему была отключена. Причину такого поведения понять несложно – доведя «до ума» железо, компания не стала тянуть время с полировкой софта, и вновь отдала продукт в руки системным интеграторам на обкатку. Первым официальным драйвером, поддерживающим Quad SLI, а значит, дающим возможность собрать подобную систему простым пользователям, стала версия NVIDIA ForceWare 91.45, вышедшая 9 августа 2006 года. Именно эту дату можно назвать официальным днем рождения «народной» Quad SLI0. Итак, что же пользователи получили в свое распоряжение? Как ты наверняка уже знаешь, система Quad SLI – это не что иное, как массив из двух двухчиповых видеокарт, каждая из которых представляет собой самостоятельную SLI-систему. Если быть точнее, то NVIDIA GeForce 7950 GX2 – это, по сути, не одно устройство, а две печатных платы с чипами G71, объединенные стандартным для SLI интерфейсом MIO. Разъем PCI Express X16 имеется только на одной плате – ее и следует считать «главной» в тандеме. На ней же находится и мост-коммутатор, обеспечивающий распределение шины PCI Express X16 между двумя GPU. Теперь немного стандартных характеристик. Как мы уже сказали, чипы, используемые в NVIDIA GeForce 7950 GX2, – это 90-нанометровые G71, работающие на частоте 500 МГц каждый. Общее количество пиксельных блоков – 48, вершинных – 16. Память в платах используется стандартная для такого класса – GDDR-3, функционирует она на частоте 600(1200) МГц. Более того, в связи с удвоением количества GPU, в два раза расширилась и ее шина – теперь она составляет 512 бит. Впрочем, это суммарное значение, а в реальности каждый чип использует только собственные 256 бит. Каждая плата оснащена модулями объемом на 512 Мб – суммарный объем памяти составляет 1 Гб, но 3D-приложениям, опять же, доступны «всего лишь» стандартные 512 Мб. Естественно, система Quad SLI создавалась не только с ориентиром на высокий FPS в играх. Плата NVIDIA GeForce 7950 GX2 может похвастаться поддержкой технологии XHD (Extreme High Definition), являющейся, по сути, дальнейшим развитием всеми любимого HD. Благодаря ей максимальное разрешение в 3D теперь может составлять 2560х1600 точек! Только вот для игры с такой сумасшедшей четкостью картинки без двух видях (и, соответственно, четырех чипов) никак не обойтись. Методы расчета картинки в SLI для Quad SLI ничем особенным не отличаются, за одним исключением, о котором упомянем чуть ниже. Основные режимы – это небезызвестные AFR (Alternate Frame Rendering) и SFR (Split Frame Rendering). Первый попросту делит кадры между двумя (для одной платы) или четырьмя (для Quad SLI) чипами – соответственно, одновременно обрабатывается по два или четыре кадра одновременно. Второй, как нетрудно догадаться, уже делит сам кадр – количество частей по прежнему зависит от количества чипов, причем размер каждого «куска» может варьироваться и подстраиваться под уровень загрузки того или иного GPU. Теперь пара слов о новых режимах, доступных эксклюзивно для Quad SLI. Один из них – это AFR of SFR, то есть комбинация из вышеописанных методов рендеринга. Работает довольно просто: если изначально кадры либо делились между чипами, либо же один кадр делился на части, то теперь берется сразу два кадра, но и делятся они каждый пополам. То есть первая карта своими двумя чипами просчитывает один кадр по методу SFR, а вторая – второй, после чего они выводятся уже по методу AFR совместными усилиями двух видях. Последний режим наиболее интересен, и называется он SLI antialiasing. Включение этого метода рендеринга меняет доступные в настройках параметры FSAA на новые, с приставкой «SLI»: SLI AA 8x, SLI AA 16x и SLI AA 32x. «Фишка» данного режима заключается в том, что сглаживание сцены проводится каждым GPU, после чего результаты совмещаются с некоторым сдвигом, и формируется финальная картинка. Нетрудно догадаться, что в случае, когда выбран, скажем, SLI AA 32x, каждый чип трудится над сценой с AA 8x. Соответственно, для режима SLI AA 16x уровень сглаживания на каждом чипе составляет 4x, а для 8x – всего 2x. Надо сказать, нагрузка на чипы при «утяжеленном» сглаживании выходит огромная – при сглаживании 32x четырехпроцессорная конфигурация просаживается до неиграбельных значений FPS! С другой стороны, и качество получается наилучшим, хотя на глаз различить наиболее высокие уровни (вроде SLI AA 16x и 32x) практически невозможно. Подопытные кролики Для тестирования разгонного потенциала новинки мы использовали довольно мощный и функциональный тестовый стенд, предоставленный нам компанией MSI. Видяхи, разумеется, произведены ей же – это две NX7950GX2. Платы являются полной копией референса – охлаждение не изменилось и представляет собой стандартные турбины с медными сердечниками в месте контакта с GPU и тепловыми трубками для улучшенного отвода тепла. Отметим, что если в случае с обыкновенным SLI мы сталкивались с ситуацией, когда вторая плата ухудшала приток воздуха к первой и снижала ее разгонный потенциал (разница в температуре чипов была довольно ощутимой), то с Quad SLI все может оказаться еще хуже. Здесь карты могут влиять на доступ воздуха к «соседке» по цепочке – тем самым, мы можем получить один менее нагретый чип, но его потенциал ничего нам не даст из-за перегревающейся на определенном уровне «троицы». Да и вообще, в системе с двумя видяхами разгонный потенциал всегда будет ограничен наименее разгоняемым из них девайсом. Беглый осмотр плат показал, что микросхемы памяти на них произведены Samsung и имеют латентность 1.4 нс. Легко посчитать номинальную частоту – она составляет 700(1400) МГц, то есть сейчас видяхи даже не используют свои номинальные возможности (напомним, что частота памяти у них составляет 600(1200) МГц). Все остальные характеристики полностью соответствуют референсным, и о них мы уже писали выше. Тестовый стенд Материнская плата: MSI K9N Diamond (NVIDIA nForce 590 SLI) Процессор, ГГц: 2.0, AMD Athlon 64 X2 4000+ (Socket AM2) Память, Мб: 2x1024, Corsair CM2X1024-8500 Кулер: Thermaltake Big Typhoon Жесткий диск, Гб: 320, Western Digital WD3200KS Разгон Для разгона плат нами использовалась последняя на момент написания статьи версия утилиты RivaTuner – RC 16.1. Частоты всех четырех GPU и памяти повышались синхронно. Стабильность системы и наличие артефактов проверялись полным прогоном 3DMark’05, за исключением процессорного теста (он запускается в низком разрешении и роли в нашем тесте не играет). Итак, чипы разогнались до частоты 580 МГц – не ахти какой прирост, но при учете их тесного расположения и не самого лучшего воздухообмена, вполне приличный. Дальнейший оверклок хотя бы на 5 МГц мгновенно отражался редкими, но заметными артефактами, и отметим, что они могли появляться за счет переразгона лишь какого-то одного чипа. В принципе, можно было бы и выявить менее разгоняемую плату, просто оставив в системе сначала одну, а потом вторую и проведя повторный разгон, вот только нас «одиночный» оверклок не интересовал – хотелось определить значения именно для четырех чипов. Память, как и ожидалось, легко покорила свое номинальное значение в 700 МГц. Более того, она успешно взяла планку еще в «полтинник» – итоговая частота составила 750(1500) МГц! Думается нам, это явно не предел – улучшенное охлаждение наверняка добавило бы к оверклоку еще пяток-другой процентов. Добавим, что в процессе разгона мы взглянули на показания термодатчиков каждого GPU – они действительно разнятся, и довольно сильно. Наши предположения по поводу влияния плат на охлаждение друг друга полностью подтвердились. Результаты Массив Quad SLI – довольно трудно нагружаемая в обычных условиях система. «Народные» разрешения вроде 1024x768 или 1280x1024 ей по зубам в совокупности с любой детализацией и степенью сглаживания. Реально нагрузить четыре чипа можно только сочетанием высокого разрешения и не менее крутого antialiasing’а, который, к счастью, у нас как раз имелся в активе (ты ведь еще не забыл о SLI AA?). В список тестов вошли бенчмарки 3DMark’03 и 3DMark’06, а также игры: Far Cry, Quake 4, Serious Sam 2 и F.E.A.R. Бенчмарки прогонялись на стандартных настройках, а вот игры удостоились отдельной чести – их мы запускали с разрешением 1600x1200 в четырех режимах: AA Off, AA 8x, SLI AA 16x и SLI AA 32x (AF 16X для всех). Детализация, понятное дело, была максимальной. Результаты, как и ожидалось, оказались довольно интересными. Бенчмарки, запускаемые на стандартных настройках (с невысоким разрешением), показали совсем небольшой прирост производительности. Если в 2003-ей версии 3DMark еще можно четко наблюдать увеличение попугаев, то в тесте образца 2006 года разница вышла совсем небольшой. Можно это объяснить хотя бы тем, что последняя версия бенчмарка очень прожорлива к скорости процессора, а у нас камень был и так не самый мощный. В играх разница более заметна, особенно с ростом нагрузки – в режиме SLI AA 16x тот же Far Cry получил около 20% прироста! Ну а топовый SLI AA 32x, как оказалось, даже после проведенного оверклока практически неиграбелен – FPS порой проваливается за отметку в 20 кадров/сек. Самое странное творится в нижней «весовой категории» – там мы не только не наблюдаем прироста, но и порой видим падение производительности на 1-2 FPS. Здесь, на наш взгляд, сыграла роль процессорозависимость системы Quad SLI – без увеличения нагрузки (FSAA) видеокарты банально упираются в этот «потолок», а FPS вращается вокруг одной отметки. Погрешность, понятное дело, тоже никто не отменял. Как бы то ни было, результатами мы остались довольны. Выводы Как оказалось, система Quad SLI очень даже хорошо поддается оверклоку – проведенный нами эксперимент не включал в себя ничего экзотического и может быть проделан любым юзером с правильно произрастающими руками и опытом в разгоне видео. Отметим, что простора для фантазии осталось еще немало – взять хотя бы кулер. Тут, правда, заметим, что нестандартный дизайн девайсов исключает применение водянок и сторонних кулеров, не оптимизированных именно для NVIDIA GeForce 7950 GX2. С другой стороны, адаптация водоблоков и воздушных систем уже идет полным ходом, так что энтузиасты с этими платами определенно не заскучают. На наш взгляд, максимальная отдача от разгона Quad SLI возможна именно с применением нестандартного охлаждения – множество плат, тесно связанных друг с другом, слишком сильно зависят от циркуляции и нагрева воздуха между ними. 3dmark03: Прирост заметный, но не очень высокий. Видимо, низкие разрешения – не конек Quad SLI. 3dmark06: Почти вровень. С другой стороны, в этом бенчмарке и 100 баллов трудно назвать погрешностью. Far Cry: Прирост хорош, но только в тяжелых режимах. Q4: До SLI AA 16x прироста нет вообще – FPS меняется только из-за погрешности. Процессорозависимость? SS2: Единственная игра, в которой FPS повысился даже в режиме без сглаживания, пускай и совсем ненамного. FEAR: Нет желания пострелять с 16 FPS? Зато какая качественная картинка…
|