Привіт Гість ( Вхід | Реєстрація )

> Архитектура NVIDIA Fermi найдёт применение в суперкомпьютерах, NVIDIA Fermi — видеопроцессор с зачатками CPU
Tiahin
Oct 1 2009, 13:11
Пост #1


кранчер-новачок
***

Група: Trusted Members
Повідомлень: 58
З нами з: 4-February 09
Користувач №: 919
Стать: Чол
Free-DC_CPID
Парк машин:
Phenom II 940 / ATI 4850 512Mb / 4Gb



NVIDIA утверждает, что это крупнейшее и важнейшее обновление архитектуры с момента выпуска G80 (GeForce 8800 GTX). Итак, что же нового?
  • Потоковые процессоры (CUDA Cores). Их число составляет 512 штук, причём в отличие от GT200, теперь за расчёты с одинарной (FP32) и двойной (FP64) точностью отвечают одни и те же блоки. При использовании FP64 темп работы снижается вдвое, обеспечивая таким образом 256 вычислений с двойной точностью за такт. У GT200, для сравнения, было только 30 выделенных блоков для подобных расчётов. Кроме того, каждое CUDA Core содержит в себе помимо устройства для операций с плавающей запятой, отдельное устройство для целочисленных операций с 64-битной точностью. Все расчёты выполняются этими устройствами за один такт. Никуда не делись и блоки для специальных операций (SFU), которые позволяют вычислять синус, косинус, квадратный корень и другие сложные функции. Но если раньше соотношение SP и SFU составляло 4 к 1, то теперь на каждый SFU приходится 8 SP, т.е. в два раза больше. С другой стороны, их производительность выросла примерно в четыре раза, так что общий удельный прирост можно оценить как двукратный;
  • Иерархическая организация чипа тоже изменилась. Если раньше базовой единицей был TPC (текстурно-процессорный кластер), содержащий в себе восемь блоков выборки текстур (TMU) и три массива потоковых процессоров (SM), то теперь TPC фактически упразднён, уступив место SM, который “располнел” с 8 потоковых процессоров до 32. Таким образом, GF100 (GT300) содержит в себе 16 блоков SM, каждый из которых состоит из 2х16 CUDA Cores, 16 блоков загрузки и выгрузки данных (LSU) и 4 SFU;
  • Два диспетчера потоков на каждом SM обеспечивают фактически аналог технологии Hyper-Threading на GPU, что благоприятно сказывается на эффективности загрузки исполнительных устройств и, следовательно, на производительности;
  • GPU содержит настраиваемые кэши первого уровня суммарным объёмом 1 Мб и кэш второго уровня объёмом 768 Кб.
    Пока это все подробности. Уже можно заметить, что немало изменений направлено на повышение КПД расчётов общего назначения на GPU, однако, будем надеяться, что обновление архитектуры благоприятным образом сказалось и на 3D приложениях. Кроме того, хочется отметить, что новая архитектура изменена настолько, что в ней не осталось фактически ничего от оригинала – G80, и их схожесть улавливается только на схемах с топологией, но не более. Свежая информация будет публиковаться по мере поступления.
Краткое знакомство с архитектурой Fermi, которую будут использовать и игровые видеочипы GF100, позволяет нам утверждать, что свой новый графический процессор NVIDIA в известной степени ориентирует на рынок ускорения вычислений, ёмкость которого достигает $1,1 млрд. в год. Если говорить о рынке дискретных графических решений, то его ёмкость измеряется полутора-двумя миллиардами долларов США в год. Рынок GPGPU, таким образом, находится в зачаточном состоянии, но NVIDIA видит в нём хорошие перспективы роста.

Процессор «Fermi»... появится в составе систем «Tesla»
Кстати, из прогнозов независимых аналитиков становится известно, что 512 потоковых процессоров нового флагмана NVIDIA могут работать на частоте около 1.5 ГГц. Такие характеристики обеспечивают быстродействие на уровне 1,5 трлн. операций с плавающей запятой в секунду. Стоимость системы с уровнем быстродействия в 1 терафлопс ещё несколько лет назад могла достигать $10 000. Это даёт NVIDIA основания утверждать, что архитектура Fermi позволяет создавать суперкомпьютеры, которые в десять раз быстрее существующих ныне. Fermi поддерживает до 6 Гб памяти типа GDDR-5, использующей 384-битную шину. Аналитики предполагают, что частота используемых чипов памяти достигнет 2 ГГц (4 ГГц QDR). Это позволит на треть превзойти GT200 по быстродействию памяти, даже с учётом "сужения" шины памяти с 512 до 384 бит.

Слайд из презентации архитектуры nVidia нового поколения с кодовым названием Fermi
Возвращаясь к теме суперкомпьютеров, нельзя обойти стороной пресс-релиз, в котором NVIDIA рассказывает о перспективах использования архитектуры Fermi в суперкомпьютере, который построит национальная лаборатория Oak Ridge. Эта вычислительная система будет в десять раз быстрее существующих суперкомпьютеров, причём графические процессоры NVIDIA в ней будут сочетаться с центральными процессорами. Кто будет производителем последних, не уточняется, но выбор наверняка ограничится Intel и AMD. Суперкомпьютер Oak Ridge будет заниматься вычислениями в энергетической сфере и поможет изучать проблему изменения климата. Предложенная архитектура в ближайшие десять лет позволит достичь быстродействия свыше тысячи петафлопс, что соответствует миллиону триллионов операций с плавающей запятой в секунду.

Рассказ об nVidia Fermi из первых рук (англ.) на Youtube.com.

via: Overclockers.ru


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
 
Reply to this topicStart new topic
Відповідей
Sergyg
Oct 2 2009, 22:22
Пост #2


Гидробиолог
*******

Група: Trusted Members
Повідомлень: 947
З нами з: 1-April 09
З: Dnipropetrovsk
Користувач №: 980
Стать: Чол
Парк машин:
мозок - понад GPU, CPU та GPU+CPU



а вот и табличка интересная (см. http://www.overclockers.ru/hardnews/34526.shtml)

Ферми, похоже, будет очень сильна, почти на порядок превосходить ЖТХ285, но и Радеон не сильно уступает (если вообще уступает smile.gif )
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

Повідомлення у даній Темі


Reply to this topicStart new topic
1 Користувачів переглядають дану тему (1 Гостей і 0 Прихованих Користувачів)
0 Користувачів:

 



- Lo-Fi Версія Поточний час: 14th July 2025 - 01:17