Привіт Гість ( Вхід | Реєстрація )

> Сортировка петабайта данных заняла 6 часов 2 минуты.
hunter
Nov 24 2008, 10:40
Пост #1


кранчер-новачок
***

Група: Trusted Members
Повідомлень: 63
З нами з: 3-October 05
З: Kyiv
Користувач №: 129
Стать: Чол
Парк машин:
Athlon 64X2 4800+



Компания Google провела эксперимент по сортировке 1 ПБ данных при помощи фреймворка MapReduce. Данные были представлены в виде 10 триллионов записей, каждая длиной 100 байт. Для сортировки были задействованы 4000 компьютеров. Этот беспрецедентный для такого типа задач объем данных удалось отсортировать за 6 часов 2 минуты.

В ходе эксперимента сотрудникам Google пришлось решать проблему с размещением 1 ПБ данных. Дело в том, что при каждом новом запуске сортировки, выходил из строя хотя бы один из 48 000 используемых жестких дисков. В итоге, было решено дать Google File System команду хранить по три копии каждого файла на разных жестких дисках.

Сортировка меньшего объема данных в 1 ТБ на 1000 компьютерах заняла 68 секунд. Этим самым в Google побили предыдущий рекорд по сортировке аналогичного объема данных, составляющий 209 секунд на 910 компьютерах.

Для сравнения, общий объем фотографий, хранимых в Facebook, составляет 1 ПБ, Большой Адронный Коллайдер будет производить 15 ПБ данных в год, а Google обрабатывает около 20 ПБ данных в день.

Вот так вот, БАКу целый год работы - а гуглу один день посчитать. Гугл может устраивать флешмоб - один день на проект - и он готов smile.gif


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

Повідомлення у даній Темі


Reply to this topicStart new topic
1 Користувачів переглядають дану тему (1 Гостей і 0 Прихованих Користувачів)
0 Користувачів:

 



- Lo-Fi Версія Поточний час: 28th July 2025 - 05:20