Допомога - Пошук - Користувачі - Календар
Simap
Розподілені обчислення в Україні | Распределенные вычисления в Украине > Інші проекти розподілених обчислень > Медико-біологічні
1, 2, 3, 4, 5, 6, 7, 8
Waldhausen
IPB Image

Проект "Simap"

----------------------------------------------------------------------------------------------------------ТОП-20 участников:
IPB Image
----------------------------------------------------------------------------------------------------------
Дата основания команды - 08.01.2006 Капитан - Andrey Fenchenko
----------------------------------------------------------------------------------------------------------
Для присоединения к команде Украины:
1. Загрузите BOINC менеджер (Если его у Вас еще нет!)
2. Перейдите в "расширенный вид"
3. Выберите сервис ---> добавить проект
4. Введите адрес проекта http://boincsimap.org/boincsimap/ -- адрес недавно поменялся!
5. Введите свои регистрационные данные.
6. Найдите нашу команду. Она называется Ukraine и адрес ее статистики вы могли видеть выше.
7. Если есть доступные для загрузки задания Вы их получите и начнете расчеты.
----------------------------------------------------------------------------------------------------------
Полезная информация:
Для идентификации пользователя в BOINC могут служить 2 вещи:
1) пара e-mail/пароль
2) межпроектный идентификационный ID (Cross-project ID) - 32значное шестнадцатиричное число.

Если Вы пожелаете подключится ещё и к другому BOINC-проекту, то помните: чтобы не плодить новых аккаунтов при подключении к новому проекту или команде, нужно обязательно везде регистрироваться с одним и тем же e-mail/паролем либо CPID. если при регистрации в проекте указать другие e-mail или пароль, BOINC создаст новый аккаунт с тем же именем!
----------------------------------------------------------------------------------------------------------

О проекте:
http://boincsimap.org/boincsimap/project.php
SIMAP - база данных сходств протеинов. Она содержит почти все опубликованные протеиновые последовательности и постоянно обновляется. Протеиновые последовательности вычисляются с использованием алгоритма FASTA, который обеспечивает оптимальные скорость и чувствительность. SIMAP - единственный известный нам проект, совмещающий исчерпывающее покрытие в отношении всех известных протеинов и возможности инкрементального обновления.

Для чего используется SIMAP?
Огромное количество известных протеиновых последовательностей в публичных базах данных не позволит в ближайшем будущем экспериментально описать большинство из них. Тем не менее, протеины, полученные от общего предка, часто имеют те же функции (так называемые ортологи - orthologs). Таким образом оказывается возможным вывести функцию неохаракеризованного протеина из ортолога с известной функцией. Широко известные примеры - исследования генов и протеинов мыши. Их результаты оказались во многих случаях справедливыми и для человеческих генов и протеинов. Сходства протеинов предоставляют информацию о связях между протеинами и необходимы для предсказания ортологов. Существует множество биоинформационных методов, полагающихся на сходства протеинов. Наша база данных сходств протеинов предоставляет предварительно вычисленные данные о сходстве и представляет известное пространство протеинов. Это открывает абсолютно новые перспективы по сравнению с используемыми методами для повторного пересчёта такого рода данных. SIMAP регулярно обновляется. Матрица сходств расширяется по мере появления новых последовательностей. Использование SIMAP полностью бесплатно для образовательных целей и публичных исследований.

Зачем нам нужны распределённые вычисления для SIMAP?
Стоимость вычислений данных о сходствах протеиновых послеовательностей пропорциональна квадрату количества содержащихся последовательностей. Таким образом, вычислительные усилия для поддержания матрицы в актуальном состоянии постоянно растут. Наших внутренних ресурсов, годами выполняющих вычисления для SIMAP, больше не достаточно для отслеживания новых последовательностей. Вот почему мы реализовали SIMAP-клиента для платформы BOINC (Berkeley Open Infrastructure for Network Computing), основанного на алгоритме FASTA для обнаружения сходств последовательностей.

Какие организации стоят за SIMAP?
SIMAP - это совместный проект GSF Национального исследовательского центра окружающей среды и здоровья в Нойерберге под Мюнхеном и Научного центра жизни и питания в Вайенстефане (Германия). Контактное лицо - Томас Раттай (Отдел геном-ориентированной биоинформатики, Технический Университет, Мюнхен).

Перевёл Вит Сердаковский
Translation by "witdba" from the Boinc-Simap forum.

График ППД команды за последние 60 дней:
(Show/Hide)

IPB Image


02.02.2009
CODE
Project Rank Team Today Last Update Yesterday 2 Days Ago Average Last 7 days Last 28 Days RAC Total Credit
142 Ukraine 0 0 0 0 0 0 3,385 106 279,603


2.03.2009
CODE
140    Ukraine    0    0    628    0    90    628    7,664    126    287,642


----------------------------------------------------------------------------------------------------------
Статус сервера выдачи заданий:

IPB Image

http://webclu.bio.wzw.tum.de/portal/web/simap/

http://www.boinc-af.org/content/view/111/219/

http://www.dp.by/wiki/Projects/Simapathome

CODE
http://wiki.bc-team.org/index.php?title=Simap/en


http://www.irelandboinc.com/projects/40-projects/113-simap

http://distributed.ru/wiki/pro:simap
romko
Дякую за інформацію. Цікава стаття і цікавий проект smile.gif
ReMMeR
(Waldhausen @ Mar 3 2006, 05:54 PM) *

Всем привет. Ниже представлено описание проекта "Матрица сходств протеиновых последовательностей".



Оформляем до уровня статьи - и можно на сайт закинуть
Команда наша там есть как видно smile.gif http://boinc.bio.wzw.tum.de/boincsimap/tea....php?teamid=212

Дополняем статью как подключится, как смотреть статистику, может вопросы какие частые.
Waldhausen
(ReMMeR @ Mar 6 2006, 08:10 AM) *

(Waldhausen @ Mar 3 2006, 05:54 PM) *

Всем привет. Ниже представлено описание проекта "Матрица сходств протеиновых последовательностей".


Оформляем до уровня статьи - и можно на сайт закинуть
Команда наша там есть как видно smile.gif http://boinc.bio.wzw.tum.de/boincsimap/tea....php?teamid=212

Дополняем статью как подключится, как смотреть статистику, может вопросы какие частые.


Упс. Дык, есть же описание. В этом разделе... Общее для BOINC.
Waldhausen
Всім привіт. Нижче наведено опис проекта "Матриця подібностей протеїновиї послідовностей"

Про SIMAP

Що таке SIMAP?
SIMAP - база даних подібностей протеїнів. Вона містить майже всі опубликовані протеїнові последовності и постійно оновлєються. Протеїнові послідовності обчислюються з використанням алгоритма FASTA, який забезпечую оптимальні швидкість та чутливість. SIMAP - єдиний відомий нам проект, що поєднує виключне покриття всіх відомих протеїнів та можливості інкрементального оновлення.

Для чого використовується SIMAP?
Величезна кількість відомих протеїнових послідовностей в публічних базах даних не дозволить в найближчому майбутньому експериментально описати більшість з них. Однак, протеїни, отримані від загального предка, часто мають ті ж самі функції (так звані ортологи - orthologs). Таким чином виявляється можливим вивести функцію ще неохаракеризованого протеїна з ортолога з відомою функцією. Широко відомі приклади - дослідження генів та протеїнів миші. Їх результати виявилися в багатьох випадках справедливими і для людських генів та протеїнів. Подібності протеїнів надають інформацїю про зв'язки між протеїнами та є необхідними для передбачення ортологів. Існуєт багато біоинформаційних методів, що спираються на подібності протеїнів. Наша база даних подібностей протеїнів надає заздалегідь обчислені дані про подібність та представляє відомий простір протеїнів. Це відкриавє абсолютно нові перспективи у порівнянні з методами, що використувуються для повторного обчислення даних такого роду. SIMAP регулярно оновлюється. Матриця подібностей розширюється по мері появи нових послідовностей. Використання SIMAP повністю безкоштовне для освтніх цілей та публічних досліджень.

Навіщо нам потрібні розподілені обчислення для SIMAP?
Вартість обчислень даних про подібності є пропорціональною до квадрату числа послідовностей, що в ній містяться. Таким чином, обчислювальні зусилля для підтримання матриці в актуальному стані постійно зростає. Наших внутрішніх ресурсів, які роками виконують обчислення для SIMAP, більше не вистачає для відстеження нових послідовностей. Ось чому ми реалізували SIMAP-кліента для платформи BOINC (Berkeley Open Infrastructure for Network Computing), в основі якого полягає алгоритм FASTA для виявлення подібностей послідовностей.

Які організації стоятя за SIMAP?
SIMAP - це спільний проект GSF Національного дослідного центра навколишнього середовища та здоров'я в Нойерберзі під Мюнхеном та Научного центра життя та харчування в Вайенстефані (Німеччина). Контактна особа - Томас Раттай (Відділ геном-орієнтованої біоінформатики, Технічний Університет, Мюнхен).
ReMMeR
Задание считается очень быстро - до 10-15 минут.

Задание весит : 1.8 Мб
Результат весит : 0.7 Мб

Это вам не сказки сказывать на 64к smile.gif
Death
присоединился и на тебе

Project status
The project has currently no work (see below).
The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from july 2008 (simap app) and their domains (hmmer app) will start around august 1st.


ГОТОВИМСЯ!

если к первому числу все будут готовы - есть шанс нахапать ВУ и войти в сотню )

32 132 Gentoo Linux Users Everywhere 0 0 0 0 0 0 1,716 55 247,682
33 133 Crunchers Inc 0 0 0 0 0 0 0 1 246,515
34 134 Hewlett-Packard 0 0 0 0 0 0 1,326 40 243,762
35 135 Death Metal Rules 0 0 0 0 0 0 0 0 241,005
36 136 Ukraine 0 0 0 0 0 0 49 6 235,617
Death
фальстарт!

как показало вскрытие к первому числу релизится пачка заданий - расхватывается за два дня и потом народ две недели сливает результаты. таймаут похоже большой у вушек, так чт она экспайр расчитывать не приходится.
проект реально БОЛЬШОЙ! 27к участнегов.
мы в далёком анусе - 144 место.

November 30, 2008
New Workunits: the calculation of similarities and features of approx. 200.000 new sequences, that were imported from protein databases into SIMAP in november, will start in the morning (UTC) of december 1st.

October 28, 2008
New Workunits: the calculation of similarities and features of approx. 100.000 new sequences, that were imported from protein databases into SIMAP in october, will start in the evening (UTC) of october 30th.

вот так вот. я полагаю что к первому числу будет возможно пачка побольше - 300к например.
ну вы поняли ))) надо вытаскивать.

судя по корпстинке 100к в наябре щитались дней 10. в этом месяце следовательно будет дней 20 щитаться.



уж простите что отрываю от абц... я честно даже не предлагаю к симапу подрубаться. есть какбэ приоритеты - магнетизм, абц, 3х+1 вот тоже на финише, офтоп - надо ещё пару дней на сегодняшней скорости чтобы получить +3 в 3х )) дальше бесполезно.

так вот, когда закончится абц и ВУ в магнетизме, поставьте симап хотябы с приоритетом 30 ))) команда не в сотне - вас это не угнетает?

Project status
The project has currently no work (see below).
The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from december 2008 (simap app) and their domains (hmmer app) will start around january 1st.
Algon
Попробуем (+7).
Rilian
The project has currently no work (see below).

The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from december 2008 (simap app) and their domains (hmmer app) will start around january 1st.

до первого января прогреваем процы!
Algon
Мне вчера накидали ~30 заданий на машину и постоянно идут новые по мере отправки результатов. Да и до этого 1-3 задания ежедневно перепадали.
Каждое задание на Core2 3GHz считается около часа, на Athlon 64 X2 6400+ около полутора часов, Celeron-ы вообще похоже застряли надолго (от 2,5 часов/задание).
Deadline заданий: неделя.
Death
да, лут повалил.

RESULTS Approximate #
in database 214,870
unsent 8,799

так шо до первого числа можно малёхо подпихнуться.

они решили до 1 числа не ждать ))

December 14, 2008
New Workunits: an additional batch of workunits has been started for the calculation of similarities and features of approx. 1.500.000 new sequences, that were imported from metagenomes.


шо-то очей понты дают. как команді по 20к в сутки сливают???

Opportunities
Rank Team Score Average Daily Gain Days to Overtake
144 Matrix World Search Team 254,026 0 80 44.69
142 NASCAR Fans 260,340 18 62 158.62
138 Aplin Clan 270,363 0 80 248.28
133 Digi International 281,694 0 80 389.49

пилят.
Algon
Очков маловато дают, к тому-же примерно 70-80% результатов пока pending. Действительно странно, как при таком раскладе некоторые команды умудряются быстро разогнаться.
Rilian
Может они "долго" разгонялись? И на самом деле задания есть независимо от новостей на главной? (Ведь не могут же закончиться протеины в базе)
Algon
Rilian
Задания были и раньше, у меня к проекту подключено несколько машин, ловилось в среднем 1-3 задания в день, так что заранее они набрать вряд-ли могли. По поводу протеинов в базе - у них написано, что база обновляется по мере необходимости (видимо по мере поступления новых данных) и их основная задача - поддерживать "актуальность" базы. В общем ладно, в конце концов очки не главное smile.gif
Death
Riliane, они обещали к 1 января подкинуть пачку, а подкинули 15 декабря. О чём и была новость у них на сайте.

Данные они действительно выкладывают по мере поступления из лабораторий.
Death
понеслась.

Project status
Calculation of SIMAP updates is currently running.
The current workunits calculate the similarities and domains of approx. 400.000 new sequences from public databases imported in december 2008.
After these calculations are finished, next workunits are expected around february 1st.

RESULTS Approximate #
in database 163,969
unsent 6,543
in progress 116,273

Project Rank Team Today Last Update Yesterday 2 Days Ago Average Last 7 days Last 28 Days RAC Total Credit
144 Ukraine 0 0 0 0 200 1,178 17,543 666 265,182
Death
Project status
The project has currently no work (see below).
The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from January 2009 (simap app) and their domains (hmmer app) will start around February 1st.

142 Ukraine 83 83 36 32 472 1,486 29,163 773 279,603

+2 места.

До сотни надо будет не хуже чем в АБЦ навалиться )))
Rilian
присоединился

пока заданий не пришло
Rilian
The calculation of new simap workunits containing the novel proteins from January 2009 (simap app) and their domains (hmmer app) will start around February 1st.

Задания будут 1го февраля
(_KoDAk_)
http://www.dotsch.de/boinc/SIMAP.html
множество расчетных модулей под различные платформы
http://boinc.bio.wzw.tum.de/boincsimap/appdownloads.php
Death
January 31, 2009
New Workunits: the calculation of similarities and features of approx. 300.000 new sequences, that were imported from protein databases into SIMAP in January, will start in the evening (UTC) of February 1st.

Мы на 142-м месте (((
Rilian
НАЛЕТАЙ! punk2.gif punk2.gif punk2.gif punk2.gif 1.gif 1.gif 1.gif 1.gif 1.gif

http://boinc.bio.wzw.tum.de/boincsimap/server_status.php clap_1.gif

Всего 250000 ВЮ (умножить на кворум 2 шт), каждая считается примерно 30 минут на среднем по мощности компе
Burzum
01.02.2009 23:09:33|boincsimap|Message from server: (Project has no jobs available)
Rilian
Повысьте приоритет. ВЮ аплоадятся пачками
Rilian
Да, 15 тыщ ВЮ расхватали за полчаса

кол-во ВЮ на сайте увеличивается, так что надо просто не отключать клиент
Rilian
После 20 минут простоя мой комп отхватил вторую ВЮ. Скоро "рынок" насытится и ВЮ будут разбираться без проблем
Death
Project status
Calculation of SIMAP updates is currently running.
The current workunits calculate the similarities and domains of approx. 250.000 new sequences from public databases imported in January 2009.
After these calculations are finished, next workunits are expected around March 1st.

RESULTS Approximate #
in database 22,185
unsent 24
in progress 21,548
Rilian
QUOTE(Death @ Feb 2 2009, 00:34) *

RESULTS Approximate #
in database 22,185
unsent 24
in progress 21,548

угу. прикинь какая конкуренция на 24 задания среди активных за последнюю неделю 13,001 компов? smile.gif

пс: тока что удалось получить еще 2 ВЮ (после пары десятков безуспешных запросов)
Burzum
Невезучий я... Ніфіга нема для мене... idontno.gif
Rilian
А я тока что зохвотил еще 6 ВЮ. Хватит на пол ночи.

Вобщем техника такова:
1) разрешить принимать задания тока СИМАПу
2) выставить кэш на 1 день
3) Раз в минуту нажимать Update в боинке на этом проекте
Rilian
Итак, зохвотилось еще 12 ВЮ. То есть кэш на день заполнил
Rilian
[quote]Mon Feb 2 22:24:23 2009|boincsimap|Sending scheduler request: Requested by user. Requesting 0 seconds of work, reporting 24 completed tasks
Mon Feb 2 22:24:28 2009|boincsimap|Scheduler request succeeded: got 0 new tasks
Death
а мне 10 свалилось.

как отдать кому-нить?
Rilian
там еще 300000 ВЮ на февраль. Лучше досчитай сам smile.gif
Death
та так и сделаю )))

RESULTS Approximate #
in database 358,840
unsent 9,577
in progress 172,290

мы на 140-м месте гдето.
так шо каждая ву важна!

судоку кончается, реверси кончается, 3х+1 кончился, огр кончится через 2 недели, праймгрид челенж прошёл, может в марте соберёмся и до сотни попробуем рвануть?
Rilian
Ниче-так популярность у проекта. 500 тыщ ВЮ кранчится за день. И потом месяц отдыха
(_KoDAk_)
February 27, 2009 New Workunits in the evening (UTC) of February 28th

New Workunits: the calculation of similarities and features of approx. 200.000 new sequences, that were imported from protein databases into SIMAP in February, will start in the evening (UTC) of February 28th.
Death
28.02.2009 3:16:42 boincsimap Message from server: (Project has no jobs available)

пока нету.
блин страшно смотреть как 200000 ву перемалывают за неделю.

зато такие графики прикольные на фришниках.





ах, да.

мы на 140-м. я включился.....
Rilian
готовимся к 1 марта! Надо нагребать ВУ побольше
Rilian
ПОЯВИЛИСЬ ВЮ! НАЛЕТАЙ!

советую остановить прием ВЮ в других проектах, увеличит кэш на неск дней, дождаться пока вам перепадет много ВЮ (это может занять неск часов так как ВЮ мало а компов много - конкуренция). Потом верните кэш обратно и активируйте другие проекты

Sun Mar 1 00:40:52 2009|boincsimap|Sending scheduler request: To fetch work. Requesting 1462039 smile.gif seconds of work, reporting 0 completed tasks
Sun Mar 1 00:40:57 2009|boincsimap|Scheduler request succeeded: got 10 new tasks
Sun Mar 1 00:40:59 2009|boincsimap|Started download of 9030101.011171
Sun Mar 1 00:40:59 2009|boincsimap|Started download of 9030101.011172
Rilian
В этот раз снова будет 600000 ВЮ и по моим прогнозам они закончатся завтра днем

каждая ВЮ считается по 52 мин на core2duo 2.1GHz
Death
было 200к. уже кончились. ((
надеюсь хоть на 10 мест поднимемся...
Death
ура! дают вухи.

нагребайте ПОБОЛЬШЕ!! 140-е место это сакс. потом ещё месяц работу ждать....
ReMMeR
Хочу Симап ! smile.gif

Тольо такое выставил сразу пошло качать =)

Rilian
У меня в кэше 60 штук = 50 часов smile.gif

Эти ВЮ в 2 раза дольше считаются чем прошлые, поэтому по новому прогнозу они закончатся завтра вечером. Следующие будут не раньше апреля
Rilian
нагреб в кэш на 5 компах 300 ВЮ smile.gif

это примерно 6000 очков
Некто
у мну в кэше 120 заданий
Rilian
Мы поднялись аж на 139 место!

http://boinc.bio.wzw.tum.de/boincsimap/top...edit&offset=120
Rilian
Осталось 50000 заданий и 100000 ВЮ. По прогнозам их разберут до 12 часов утра smile.gif
.
Invision Power Board © 2001-2019 Invision Power Services, Inc.
Источник: http://mcomp.org/