Архитектура NVIDIA Fermi найдёт применение в суперкомпьютерах, NVIDIA Fermi — видеопроцессор с зачатками CPU

Tiahin	Oct 1 2009, 13:11 Пост #1
кранчер-новачок Група: Trusted Members Повідомлень: 58 З нами з: 4-February 09 Користувач №: 919 Стать: Чол Free-DC_CPID Парк машин: Phenom II 940 / ATI 4850 512Mb / 4Gb	NVIDIA утверждает, что это крупнейшее и важнейшее обновление архитектуры с момента выпуска G80 (GeForce 8800 GTX). Итак, что же нового? Потоковые процессоры (CUDA Cores). Их число составляет 512 штук, причём в отличие от GT200, теперь за расчёты с одинарной (FP32) и двойной (FP64) точностью отвечают одни и те же блоки. При использовании FP64 темп работы снижается вдвое, обеспечивая таким образом 256 вычислений с двойной точностью за такт. У GT200, для сравнения, было только 30 выделенных блоков для подобных расчётов. Кроме того, каждое CUDA Core содержит в себе помимо устройства для операций с плавающей запятой, отдельное устройство для целочисленных операций с 64-битной точностью. Все расчёты выполняются этими устройствами за один такт. Никуда не делись и блоки для специальных операций (SFU), которые позволяют вычислять синус, косинус, квадратный корень и другие сложные функции. Но если раньше соотношение SP и SFU составляло 4 к 1, то теперь на каждый SFU приходится 8 SP, т.е. в два раза больше. С другой стороны, их производительность выросла примерно в четыре раза, так что общий удельный прирост можно оценить как двукратный; Иерархическая организация чипа тоже изменилась. Если раньше базовой единицей был TPC (текстурно-процессорный кластер), содержащий в себе восемь блоков выборки текстур (TMU) и три массива потоковых процессоров (SM), то теперь TPC фактически упразднён, уступив место SM, который “располнел” с 8 потоковых процессоров до 32. Таким образом, GF100 (GT300) содержит в себе 16 блоков SM, каждый из которых состоит из 2х16 CUDA Cores, 16 блоков загрузки и выгрузки данных (LSU) и 4 SFU; Два диспетчера потоков на каждом SM обеспечивают фактически аналог технологии Hyper-Threading на GPU, что благоприятно сказывается на эффективности загрузки исполнительных устройств и, следовательно, на производительности; GPU содержит настраиваемые кэши первого уровня суммарным объёмом 1 Мб и кэш второго уровня объёмом 768 Кб. Пока это все подробности. Уже можно заметить, что немало изменений направлено на повышение КПД расчётов общего назначения на GPU, однако, будем надеяться, что обновление архитектуры благоприятным образом сказалось и на 3D приложениях. Кроме того, хочется отметить, что новая архитектура изменена настолько, что в ней не осталось фактически ничего от оригинала – G80, и их схожесть улавливается только на схемах с топологией, но не более. Свежая информация будет публиковаться по мере поступления. Краткое знакомство с архитектурой Fermi, которую будут использовать и игровые видеочипы GF100, позволяет нам утверждать, что свой новый графический процессор NVIDIA в известной степени ориентирует на рынок ускорения вычислений, ёмкость которого достигает $1,1 млрд. в год. Если говорить о рынке дискретных графических решений, то его ёмкость измеряется полутора-двумя миллиардами долларов США в год. Рынок GPGPU, таким образом, находится в зачаточном состоянии, но NVIDIA видит в нём хорошие перспективы роста. Процессор «Fermi»... появится в составе систем «Tesla» Кстати, из прогнозов независимых аналитиков становится известно, что 512 потоковых процессоров нового флагмана NVIDIA могут работать на частоте около 1.5 ГГц. Такие характеристики обеспечивают быстродействие на уровне 1,5 трлн. операций с плавающей запятой в секунду. Стоимость системы с уровнем быстродействия в 1 терафлопс ещё несколько лет назад могла достигать $10 000. Это даёт NVIDIA основания утверждать, что архитектура Fermi позволяет создавать суперкомпьютеры, которые в десять раз быстрее существующих ныне. Fermi поддерживает до 6 Гб памяти типа GDDR-5, использующей 384-битную шину. Аналитики предполагают, что частота используемых чипов памяти достигнет 2 ГГц (4 ГГц QDR). Это позволит на треть превзойти GT200 по быстродействию памяти, даже с учётом "сужения" шины памяти с 512 до 384 бит. Слайд из презентации архитектуры nVidia нового поколения с кодовым названием Fermi Возвращаясь к теме суперкомпьютеров, нельзя обойти стороной пресс-релиз, в котором NVIDIA рассказывает о перспективах использования архитектуры Fermi в суперкомпьютере, который построит национальная лаборатория Oak Ridge. Эта вычислительная система будет в десять раз быстрее существующих суперкомпьютеров, причём графические процессоры NVIDIA в ней будут сочетаться с центральными процессорами. Кто будет производителем последних, не уточняется, но выбор наверняка ограничится Intel и AMD. Суперкомпьютер Oak Ridge будет заниматься вычислениями в энергетической сфере и поможет изучать проблему изменения климата. Предложенная архитектура в ближайшие десять лет позволит достичь быстродействия свыше тысячи петафлопс, что соответствует миллиону триллионов операций с плавающей запятой в секунду. Рассказ об nVidia Fermi из первых рук (англ.) на Youtube.com. via: Overclockers.ru -------------------- Город24 – заоблачные скидки

Відповідей

(_KoDAk_)

Oct 1 2009, 17:53

Пост #2

BOINC-guru

Група: Trusted Members
Повідомлень: 3 662
З нами з: 11-August 07
З: Kharkov
Користувач №: 569
Стать: Чол
Парк машин:
E3-1245V2@3400-Mhz 16GB 1х GTX760DCMOC2GD5 Q8200@2300-Mhz 4GB + то там то сям

Компания NVIDIA представила архитектуру CUDA нового поколения под кодовым названием "Fermi". Созданная с нуля архитектура Fermi служит основой для первых в мире графических процессоров (GPU), предназначенных в первую очередь для вычислений. Национальная Лаборатория Окриджа (ORNL) уже объявила о планах по созданию нового суперкомпьютера на базе новой архитектуры. Суперкомпьютер будет предназначен для исследований в таких областях, как энергетика и изменение климата.

Архитектура Fermi позволяет повысить производительность в самом широком спектре вычислительных приложений. Кроме того, она обеспечивает восьмикратное повышение производительности арифметических вычислений двойной точности по сравнению с предыдущим поколением графических процессоров NVIDIA. Двойная точность крайне важна для высокопроизводительных вычислений, например, в линейной алгебре, численном моделировании и квантовой химии.

Будучи основой семейства графических процессоров нового поколения NVIDIA GeForce, Quadro и Tesla, архитектура Fermi включает целый набор новых технологий, необходимых для создания вычислительной среды:

C++, в дополнение к поддержке C, Fortran, Java, Python, OpenCL и DirectCompute;
ECC, важный компонент для ЦОД, широко использующих GPU;
512 ядер CUDA с новым стандартом IEEE 754-2008;
NVIDIA Parallel DataCache — первая в мире иерархия кэшей в GPU, которая ускоряет такие алгоритмы, как физический решатель, трассировка лучей и умножение разреженных матриц, где адреса данных заранее неизвестны;
движок NVIDIA GigaThread с поддержкой одновременного исполнения ядер, когда различные ядра одного и того же приложения могут могут исполняться на GPU одновременно;
Nexus — первая в мире полностью интегрированная вычислительная среда разработки приложений в Microsoft Visual Studio.

NVIDIA Nexus радикально повышает продуктивность работы с GPU-вычислениями благодаря использованию популярных инструментов на базе Microsoft Visual Studio. Этому также способствует рабочий процесс в "прозрачном" режиме, без необходимости создавать отдельную версию приложения с включением в него диагностических программных вызовов.

Новая технология обеспечивает возможность запуска кода удаленно, на другом компьютере. Nexus включает передовые инструменты для одновременного анализа эффективности, производительности и скорости как графического, так и центрального процессоров, чтобы разработчики могли тут же оценить, как совместная обработка влияет на приложения.

Nexus состоит их трех компонентов:

Nexus Debugger — отладчик для исходного кода GPU, такого как CUDA C, HLSL и DirectCompute. Он поддерживает контрольные точки исходного кода, контрольные точки данных и прямую проверку памяти GPU. Отладка полностью проводится на аппаратном уровне.
Nexus Analyzer — инструмент настройки производительности системы для просмотра событий GPU (ядра, API вызовы, передача данных в память) и событий CPU (определение ядра, потоки, процессы и ожидания) — все на одной, соотнесенной временной шкале.
Nexus Graphics Inspector — инструмент, который предоставляет разработчикам возможность исправлять и профилировать кадры, отрисованные с помощью API, таких как Direct3D. Разработчики могут применять Graphics Inspector для просмотра вызовов, текстур, буферов вершин и состояния API во всем кадре.

Технология NVIDIA Nexus поддерживает операционные системы Windows 7 и Windows Vista и обеспечивает полную интеграцию с Visual Studio (2008 SP1 стандартной версии и более поздние версии). Бета-версия новой технологи будет доступна 15 октября. После выпуска NVIDIA Nexus будут доступны две версии – стандартная и профессиональная.

--------------------

- "ты говоришь так, будто тебя чай ваше не вставляет "

(Show/Hide)

Спаcибо автору алфавита за любезно предоставленные буквы.

Повідомлення у даній Темі

Tiahin Архитектура NVIDIA Fermi найдёт применение в суперкомпьютерах Oct 1 2009, 13:11

Sergyg youtube - сам по себе феномен, приближающий будуще... Oct 1 2009, 13:33

gow интересно, когда ето чудо появится, и сколько оно ... Oct 1 2009, 14:28

(_KoDAk_) Компания [url=http://www.f1cd.ru/companies/nvidia/... Oct 1 2009, 17:53

(_KoDAk_) http://overclockers.ru/images/news/2009/10/02/ferm... Oct 2 2009, 19:18

Sergyg а вот и табличка интересная (см. http://www.overcl... Oct 2 2009, 22:22

Rilian AMD назвала NVIDIA Fermi "бумажным драконом... Oct 16 2009, 22:12

Sergyg ИМХО АМД пытается любыми способами заработать балл... Oct 17 2009, 01:00

(_KoDAk_) но обидно что у Нвидии есть все теже проблемы с п... Oct 17 2009, 09:00

(_KoDAk_) Компания NVIDIA дала официальный ответ на обвинени... Oct 17 2009, 18:59

(_KoDAk_) Признания AMD: дефицит видеокарт Radeon HD 5xxx су... Oct 18 2009, 10:03

Sergyg вот такая объемистая статейка (перевод на русский)... Mar 10 2010, 18:04

« Попередня тема · Новини з мережі · Наступна тема »

1 Користувачів переглядають дану тему (1 Гостей і 0 Прихованих Користувачів)

0 Користувачів:

Українська команда з розподілених обчислень