Версія даної теми для друку

Натисніть сюди для перегляду даної теми у оригінальному форматі

Розподілені обчислення в Україні _ Find-A-Drug _ Обоснование выбора проекта

Автор: Arbalet Nov 11 2005, 00:38

Не успеваю с рассылкой, братцы! Может поможите, посмотрите материал?

Имеем проблему выбора подходящего проекта для дальнейших распределенных расчетов в медицинском секторе науки. Для решения проблемы предлагаю использовать эвристический метод целевого программирования

Кратко по сути метода в приложении к нашей задаче. Есть несколько факторов, определяющих наш выбор. Каждый из факторов имеет пределенный приоритет, выраженный численно (на основе опыта и дополнительной информации о проектах). Таким образом, каждый из проектов можно представить вектором, состоящим из компонент (значений факторов). Вектор не слишком удобен для конечных выводов о целесообразности перехода на тот или иной проект РВ. Поэтому вектор необходимо свернуть в скаляр. Полученные скалярные значения имеют смысл расстояния до "идеального проекта", т.е. чем меньше скаляр, тем ближе проект к идеалу

Собственно, а что за проекты будем рассматривать?! Ну, безусловно медицинские. Таких проектов немного и все они у нас на слуху. Поэтому без объявления целей и задач оных проектов, перейдем к их списку:
- Folding@home
- Predictor@home
- World Community Grid (WCG)
- Rosetta@home
- grid.org
Что убрать? grid.org? Уверены? Не надо материться! Вычеркиваем этого недоноска, который уже пятый год не может встать на ноги. Rosetta@home??? Но почему?! Оказывается проект Rosetta@Home занимается усовершенствованием расчетного ядра, а не фолдингом белков! И что еще? WCG использует в исследованиях белков последнюю стабильную версию расчетного кода, разработанного в рамках проекта Rosetta@home. Хм, учтем это обстоятельство. Итак, какие проекты у нас остаются?
- Folding@home (F@h)
- Predictor@home (P@h)
- World Community Grid (WCG)

Теперь определимся с факторами, которые больше всего влияют на наше представление о целесообразности искомого проекта. Вот мое личное ИМХО, еще и имеющее наглость отранжирить факторы в порядке личных пристрастий:
1) научная ценность проекта (наличие результатов и их доступность научной общественности, репутация в научном мире основателей проекта и пр.);
2) эффективность (точность) расчетного ядра клиента;
3) стабильность работы проекта (часты ли сбои в работе серверов, бывают ли нехватки заданий, проблемы со статистикой);
4) избыточность расчетов (чем выше, тем, понятно, хуже);
5) наличие сильной украинской команды в проекте!
6) объем траффика;
7) возможность кэширования заданий и их дедлайн;
8) требовательность к ресурсам (оперативной памяти).

Можно еще добавить (эти факторы не вошли в дальнейший расчет):
9) поддержку фермеров-многостаночников;
10) многоплатформенность и пр.

Формула для вычисления предпочтительности проекта выглядит следующим образом:
W = sum [Gi x (Wi-Wmax)^2],
Gi - значение относительной важности фактора i; Wi - количество баллов, начисленных фактору i в рамках проекта (чем лучше проект, тем выше баллы); Wmax - максимально возможное количество баллов. Принимаем пятибальную шкалу для оценки факторов (Wmax=5).

Присвоим каждому из выше упомянутых факторов значение относительной важности Gi, опять же чистое ИМХО:

1) научная ценность проекта - F1 = 5
2) эффективность расчетного ядра - F2 = 4
3) стабильность работы проекта - F3 = 3
4) избыточность расчетов - F4 = 3
5) наличие сильной украинской команды в проекте - F5 = 3
6) объем траффика - F6 = 3
7) возможность кэширования заданий и их дедлайн - F7 = 2
8) требовательность к ресурсам - F8 = 2

Теперь определимся с табличкой баллов, начисленных факторам. В эту табличку вошли все мои недельные изыскания и результаты рысканий по форумам и сайтам проектов и команд :ph34r:
Просто нет сил прямо сейчас обосновывать каждую цифру, приводимую здесь. Поверьте, что это уже совсем не ИМХО - баллы не взяты с потолка. Более того, каждый из вас может заполнить табличку по своему усмотрению и просчитать предпочтительность проектов сообразуясь с собственным представлением о них.

=================================
____||__FAD__|__F@h__|_WCG_|__P@h__||
-----------------------------------------------------------
_F1_||___5___|___5___|___3___|___4___||
_F2_||___4___|___4___|___5___|___3___||
_F3_||___5___|___5___|___4___|___4___||
_F4_||___4___|___5___|___2___|___4___||
_F5_||___5___|___5___|___2___|___2___||
_F6_||___5___|___3___|___4___|___3___||
_F7_||___5___|___3___|___4___|___4___||
_F8_||___5___|___4___|___4___|___3___||
=================================

Считаем:

FAD (как наиболее близкий к идеалу) = 0 + 4x(4-5)^2 + 0 + 3x(4-5)^2 + 0 + 0 + 0 + 0 = 7. Немножко предвзято, но учтите мою недетскую любовь к ФАДу

F@h = 5x(5-5)^2 + 4x(4-5)^2 + 3x(5-5)^2 + 3x(5-5)^2 + 3x(5-5)^2 + 3x(3-5)^2 + 2x(3-5)^2 + 2x(4-5)^2 = 26

WCG = 5x(3-5)^2 + 4x(5-5)^2 + 3x(4-5)^2 + 3x(2-5)^2 + 3x(3-5)^2 + 3x(4-5)^2 + 2x(4-5)^2 + 2x(4-5)^2 = 69

P@h = 5x(4-5)^2 + 4x(3-5)^2 + 3x(4-5)^2 + 3x(4-5)^2 + 3x(2-5)^2 + 3x(3-5)^2 + 2x(4-5)^2 + 2x(3-5)^2 = 76

F@h < WCG < P@h

Чистая победа Folding@home! Теперь уже научно обоснованная

Каждый может пересчитать проекты с учетом своего набора факторов и баллов. Кроме того, приветствуются соображения по поводу усовершенстования предлагаемой модели выбора проекта РВ для нашей команды

Автор: ShuraPAV Nov 11 2005, 21:05

Можно было и не читая этой "городухи" предвидеть - F@h предпочтительнее .
Используя математический подход, переставив чувственное познание и субьективную проблему выбора на нучные рельсы, Arbalet, надеюсь, помог неопределившимся (мне в частности помог ) и разрешил некоторые аспекты методического подхода к выбору для участников команды (в частности) в данном вопросе.
Главное, что интуитивно напрашивающийся вывод подтвержден, Arbalet кинул последнюю недостающую гирю-аргумент на чашу весов. Все что теперь остается для меня - досчитать FAD и, засучив рукава, врукопашную осваивать клиент и сервис F@h :ph34r: . Надеюсь пройти этот путь ипытаний с командой.
Рядовой ShuraPAV.

Автор: -=Vzhik=- Nov 11 2005, 21:38

А я уже начал осваиват FAH. Все хорошо, но вылезли бока с отправкой посчитанных целей обратно, с чем сейчас упорно разбираюсь.

Автор: ReMMeR Nov 14 2005, 10:34

Аналочичные расчёты по системе :
W = sum [ (Wi-Wmax)^Gi],
Gi - значение относительной важности фактора i; Wi - количество баллов, начисленных фактору i в рамках проекта (чем лучше проект, тем выше баллы); Wmax - максимально возможное количество баллов. Принимаем пятибальную шкалу для оценки факторов (Wmax=5).

Результаты несут, возможно, немного другую информативность, но тенденция сохраняется :

FAD_FAH_WCG_РAH
_3___ 15__ 91__60

Автор: uNiUs Jul 2 2007, 00:48

(Arbalet @ Nov 11 2005, 01:38 AM)

Rosetta@home??? Но почему?! Оказывается проект Rosetta@Home занимается усовершенствованием расчетного ядра, а не фолдингом белков!

Бу-гы-га-га-га!! Железный аргумент!! Особенно если учесть, что тот же ФАХ занимается этим же в какой-то мере. Если посмотреть http://folding.stanford.edu/awards.html - , можно заметить, в чем хвалят ФАХ - for his unique approach to employing advances in algorithms that make optimal use of distributed computing (уникального подхода к использованию достижений в алгоритмах, которые делают оптимальное использование распределенных вычислений).
Вообще, на данном этапе нашего развития, чистый "фолдинг" реализовать невозможно - алгоритмы расчетов еще очень далеки от оптимальных. И если иногда удается смоделировать молекулу хоть немного похожую на оригинал - это считается успехом. Поэтому и был создан проект Rosetta - если удастся найти "правильные" алгоритмы - моделирование белков и их сворачивание будет исключительно делом техники и вычислительных мощностей. Тогда уже можно будет делать "фолдинг". А пока мы сворачиваем белки "неправильными" алгоритмами - белки будут сворачиваться "неправильно", т.е. не так, как на самом деле. Так что не стоит так резко отсекать проект, не разобравшись, зачем он нужен.
Кстати, можно посчитать предпочтительность Розетты, но некоторые из названных характеристик кажутся мне слишком уж субъективными.

Автор: Arbalet Jul 3 2007, 15:44

uNiUs, ты бы еще поржал над моими школьными сочинениями

Автор: uNiUs Jul 3 2007, 20:12

(Arbalet @ Jul 3 2007, 04:44 PM)

uNiUs, ты бы еще поржал над моими школьными сочинениями

Да, я видел, что посты старые. откопал по запросу на слово "избыточность". Просто не смог сдержать эмоций по поводу неконструктивной критики любимого проекта, сорри. А в более позднее время кто-то подобные сравнения пытался проводить?

Автор: Arbalet Jul 3 2007, 20:28

(uNiUs @ Jul 3 2007, 09:12 PM)

Просто не смог сдержать эмоций по поводу неконструктивной критики любимого проекта

Тебя бы в то время, когда после ФАД выбирали новый проект РВ. Если смог бы убедить, то может быть теперь считали всей гурьбой именно Розетту. Впрочем, оставим сослагательное наклонение для альтернативной исторической фантастики.

Автор: romko Jul 4 2007, 14:48

uNiUs, ты бы еще поржал над моими школьными сочинениями

Ніхто не бажає зайнятись аналізом за методикою, яку використав Арбалет, тих проектів, в які включилась наша команда зараз? Все ж тоді, 2 роки тому, в нас не було особливого досвіду ні в чому, крім ФАД і ФАХ, а зараз багато хто спробував й інші проекти, має досвід

Автор: KoDAk Aug 20 2007, 22:17

лично я ушел из F@h
из-за не удобной среды вычислений и количества трафика.
и это не смотря, что уже в F@h есть SMP - ядро (и оно эффективней, но пака оно еще в стадии доработки ) чем R@H (

Я согласен с uNiUs...
и Я за то, чтобы Rosetta@Home добавить вторым основным проектом (как это сделано в некоторой команде )
P.S. я даже, не мечтаю сделать Rosetta@Home первым основным проектом ))

Автор: ReMMeR Aug 21 2007, 08:31

(как это сделано в некоторой команде cool.gif )

В отличии от них, у нас вообще нет запрета на участие в каком-либо другом проекте. Даже можно сказать наоборот.

А делать ли основным - тут думаю вопрос поддержки, информации и кол-ва пользователей. Я чтото забыл ?