Привіт Гість ( Вхід | Реєстрація )

24 Сторінки V  1 2 3 > »   
Reply to this topicStart new topic
> Simap, создаем базу данных сходств протеинов
Waldhausen
Mar 3 2006, 17:54
Пост #1


Соромлюсь щось писати
*

Група: New Members
Повідомлень: 5
З нами з: 3-March 06
Користувач №: 188
Стать: Чол



IPB Image

Проект "Simap"

----------------------------------------------------------------------------------------------------------ТОП-20 участников:
IPB Image
----------------------------------------------------------------------------------------------------------
Дата основания команды - 08.01.2006 Капитан - Andrey Fenchenko
----------------------------------------------------------------------------------------------------------
Для присоединения к команде Украины:
1. Загрузите BOINC менеджер (Если его у Вас еще нет!)
2. Перейдите в "расширенный вид"
3. Выберите сервис ---> добавить проект
4. Введите адрес проекта http://boincsimap.org/boincsimap/ -- адрес недавно поменялся!
5. Введите свои регистрационные данные.
6. Найдите нашу команду. Она называется Ukraine и адрес ее статистики вы могли видеть выше.
7. Если есть доступные для загрузки задания Вы их получите и начнете расчеты.
----------------------------------------------------------------------------------------------------------
Полезная информация:
Для идентификации пользователя в BOINC могут служить 2 вещи:
1) пара e-mail/пароль
2) межпроектный идентификационный ID (Cross-project ID) - 32значное шестнадцатиричное число.

Если Вы пожелаете подключится ещё и к другому BOINC-проекту, то помните: чтобы не плодить новых аккаунтов при подключении к новому проекту или команде, нужно обязательно везде регистрироваться с одним и тем же e-mail/паролем либо CPID. если при регистрации в проекте указать другие e-mail или пароль, BOINC создаст новый аккаунт с тем же именем!
----------------------------------------------------------------------------------------------------------

О проекте:
http://boincsimap.org/boincsimap/project.php
SIMAP - база данных сходств протеинов. Она содержит почти все опубликованные протеиновые последовательности и постоянно обновляется. Протеиновые последовательности вычисляются с использованием алгоритма FASTA, который обеспечивает оптимальные скорость и чувствительность. SIMAP - единственный известный нам проект, совмещающий исчерпывающее покрытие в отношении всех известных протеинов и возможности инкрементального обновления.

Для чего используется SIMAP?
Огромное количество известных протеиновых последовательностей в публичных базах данных не позволит в ближайшем будущем экспериментально описать большинство из них. Тем не менее, протеины, полученные от общего предка, часто имеют те же функции (так называемые ортологи - orthologs). Таким образом оказывается возможным вывести функцию неохаракеризованного протеина из ортолога с известной функцией. Широко известные примеры - исследования генов и протеинов мыши. Их результаты оказались во многих случаях справедливыми и для человеческих генов и протеинов. Сходства протеинов предоставляют информацию о связях между протеинами и необходимы для предсказания ортологов. Существует множество биоинформационных методов, полагающихся на сходства протеинов. Наша база данных сходств протеинов предоставляет предварительно вычисленные данные о сходстве и представляет известное пространство протеинов. Это открывает абсолютно новые перспективы по сравнению с используемыми методами для повторного пересчёта такого рода данных. SIMAP регулярно обновляется. Матрица сходств расширяется по мере появления новых последовательностей. Использование SIMAP полностью бесплатно для образовательных целей и публичных исследований.

Зачем нам нужны распределённые вычисления для SIMAP?
Стоимость вычислений данных о сходствах протеиновых послеовательностей пропорциональна квадрату количества содержащихся последовательностей. Таким образом, вычислительные усилия для поддержания матрицы в актуальном состоянии постоянно растут. Наших внутренних ресурсов, годами выполняющих вычисления для SIMAP, больше не достаточно для отслеживания новых последовательностей. Вот почему мы реализовали SIMAP-клиента для платформы BOINC (Berkeley Open Infrastructure for Network Computing), основанного на алгоритме FASTA для обнаружения сходств последовательностей.

Какие организации стоят за SIMAP?
SIMAP - это совместный проект GSF Национального исследовательского центра окружающей среды и здоровья в Нойерберге под Мюнхеном и Научного центра жизни и питания в Вайенстефане (Германия). Контактное лицо - Томас Раттай (Отдел геном-ориентированной биоинформатики, Технический Университет, Мюнхен).

Перевёл Вит Сердаковский
Translation by "witdba" from the Boinc-Simap forum.

График ППД команды за последние 60 дней:
(Show/Hide)

IPB Image


02.02.2009
CODE
Project Rank Team Today Last Update Yesterday 2 Days Ago Average Last 7 days Last 28 Days RAC Total Credit
142 Ukraine 0 0 0 0 0 0 3,385 106 279,603


2.03.2009
CODE
140    Ukraine    0    0    628    0    90    628    7,664    126    287,642


----------------------------------------------------------------------------------------------------------
Статус сервера выдачи заданий:

IPB Image

http://webclu.bio.wzw.tum.de/portal/web/simap/

http://www.boinc-af.org/content/view/111/219/

http://www.dp.by/wiki/Projects/Simapathome

CODE
http://wiki.bc-team.org/index.php?title=Simap/en


http://www.irelandboinc.com/projects/40-projects/113-simap

http://distributed.ru/wiki/pro:simap
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Mar 4 2006, 09:45
Пост #2


стааарий кранчер
*******

Група: Trusted Members
Повідомлень: 538
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



Дякую за інформацію. Цікава стаття і цікавий проект smile.gif


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ReMMeR
Mar 6 2006, 08:10
Пост #3


----===[ oO ]===----
*********

Група: Team member
Повідомлень: 3 087
З нами з: 20-October 05
З: Quake arena
Користувач №: 135
Стать: Чол
Free-DC_CPID



(Waldhausen @ Mar 3 2006, 05:54 PM) *

Всем привет. Ниже представлено описание проекта "Матрица сходств протеиновых последовательностей".



Оформляем до уровня статьи - и можно на сайт закинуть
Команда наша там есть как видно smile.gif http://boinc.bio.wzw.tum.de/boincsimap/tea....php?teamid=212

Дополняем статью как подключится, как смотреть статистику, может вопросы какие частые.


--------------------
(Show/Hide)

# Open Door, So I Walk Inside ...


echo 'tuk tuk' > /dev/buben




RC5-72:


OGR-25:


User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Waldhausen
Mar 6 2006, 15:51
Пост #4


Соромлюсь щось писати
*

Група: New Members
Повідомлень: 5
З нами з: 3-March 06
Користувач №: 188
Стать: Чол



(ReMMeR @ Mar 6 2006, 08:10 AM) *

(Waldhausen @ Mar 3 2006, 05:54 PM) *

Всем привет. Ниже представлено описание проекта "Матрица сходств протеиновых последовательностей".


Оформляем до уровня статьи - и можно на сайт закинуть
Команда наша там есть как видно smile.gif http://boinc.bio.wzw.tum.de/boincsimap/tea....php?teamid=212

Дополняем статью как подключится, как смотреть статистику, может вопросы какие частые.


Упс. Дык, есть же описание. В этом разделе... Общее для BOINC.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Waldhausen
Mar 6 2006, 16:40
Пост #5


Соромлюсь щось писати
*

Група: New Members
Повідомлень: 5
З нами з: 3-March 06
Користувач №: 188
Стать: Чол



Всім привіт. Нижче наведено опис проекта "Матриця подібностей протеїновиї послідовностей"

Про SIMAP

Що таке SIMAP?
SIMAP - база даних подібностей протеїнів. Вона містить майже всі опубликовані протеїнові последовності и постійно оновлєються. Протеїнові послідовності обчислюються з використанням алгоритма FASTA, який забезпечую оптимальні швидкість та чутливість. SIMAP - єдиний відомий нам проект, що поєднує виключне покриття всіх відомих протеїнів та можливості інкрементального оновлення.

Для чого використовується SIMAP?
Величезна кількість відомих протеїнових послідовностей в публічних базах даних не дозволить в найближчому майбутньому експериментально описати більшість з них. Однак, протеїни, отримані від загального предка, часто мають ті ж самі функції (так звані ортологи - orthologs). Таким чином виявляється можливим вивести функцію ще неохаракеризованого протеїна з ортолога з відомою функцією. Широко відомі приклади - дослідження генів та протеїнів миші. Їх результати виявилися в багатьох випадках справедливими і для людських генів та протеїнів. Подібності протеїнів надають інформацїю про зв'язки між протеїнами та є необхідними для передбачення ортологів. Існуєт багато біоинформаційних методів, що спираються на подібності протеїнів. Наша база даних подібностей протеїнів надає заздалегідь обчислені дані про подібність та представляє відомий простір протеїнів. Це відкриавє абсолютно нові перспективи у порівнянні з методами, що використувуються для повторного обчислення даних такого роду. SIMAP регулярно оновлюється. Матриця подібностей розширюється по мері появи нових послідовностей. Використання SIMAP повністю безкоштовне для освтніх цілей та публічних досліджень.

Навіщо нам потрібні розподілені обчислення для SIMAP?
Вартість обчислень даних про подібності є пропорціональною до квадрату числа послідовностей, що в ній містяться. Таким чином, обчислювальні зусилля для підтримання матриці в актуальному стані постійно зростає. Наших внутрішніх ресурсів, які роками виконують обчислення для SIMAP, більше не вистачає для відстеження нових послідовностей. Ось чому ми реалізували SIMAP-кліента для платформи BOINC (Berkeley Open Infrastructure for Network Computing), в основі якого полягає алгоритм FASTA для виявлення подібностей послідовностей.

Які організації стоятя за SIMAP?
SIMAP - це спільний проект GSF Національного дослідного центра навколишнього середовища та здоров'я в Нойерберзі під Мюнхеном та Научного центра життя та харчування в Вайенстефані (Німеччина). Контактна особа - Томас Раттай (Відділ геном-орієнтованої біоінформатики, Технічний Університет, Мюнхен).
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ReMMeR
Jan 5 2008, 22:18
Пост #6


----===[ oO ]===----
*********

Група: Team member
Повідомлень: 3 087
З нами з: 20-October 05
З: Quake arena
Користувач №: 135
Стать: Чол
Free-DC_CPID



Задание считается очень быстро - до 10-15 минут.

Задание весит : 1.8 Мб
Результат весит : 0.7 Мб

Это вам не сказки сказывать на 64к smile.gif


--------------------
(Show/Hide)

# Open Door, So I Walk Inside ...


echo 'tuk tuk' > /dev/buben




RC5-72:


OGR-25:


User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Jul 23 2008, 10:29
Пост #7


<script ///>
**********

Група: Moderators
Повідомлень: 6 429
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



присоединился и на тебе

Project status
The project has currently no work (see below).
The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from july 2008 (simap app) and their domains (hmmer app) will start around august 1st.


ГОТОВИМСЯ!

если к первому числу все будут готовы - есть шанс нахапать ВУ и войти в сотню )

32 132 Gentoo Linux Users Everywhere 0 0 0 0 0 0 1,716 55 247,682
33 133 Crunchers Inc 0 0 0 0 0 0 0 1 246,515
34 134 Hewlett-Packard 0 0 0 0 0 0 1,326 40 243,762
35 135 Death Metal Rules 0 0 0 0 0 0 0 0 241,005
36 136 Ukraine 0 0 0 0 0 0 49 6 235,617


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Dec 4 2008, 23:28
Пост #8


<script ///>
**********

Група: Moderators
Повідомлень: 6 429
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



фальстарт!

как показало вскрытие к первому числу релизится пачка заданий - расхватывается за два дня и потом народ две недели сливает результаты. таймаут похоже большой у вушек, так чт она экспайр расчитывать не приходится.
проект реально БОЛЬШОЙ! 27к участнегов.
мы в далёком анусе - 144 место.

November 30, 2008
New Workunits: the calculation of similarities and features of approx. 200.000 new sequences, that were imported from protein databases into SIMAP in november, will start in the morning (UTC) of december 1st.

October 28, 2008
New Workunits: the calculation of similarities and features of approx. 100.000 new sequences, that were imported from protein databases into SIMAP in october, will start in the evening (UTC) of october 30th.

вот так вот. я полагаю что к первому числу будет возможно пачка побольше - 300к например.
ну вы поняли ))) надо вытаскивать.

судя по корпстинке 100к в наябре щитались дней 10. в этом месяце следовательно будет дней 20 щитаться.



уж простите что отрываю от абц... я честно даже не предлагаю к симапу подрубаться. есть какбэ приоритеты - магнетизм, абц, 3х+1 вот тоже на финише, офтоп - надо ещё пару дней на сегодняшней скорости чтобы получить +3 в 3х )) дальше бесполезно.

так вот, когда закончится абц и ВУ в магнетизме, поставьте симап хотябы с приоритетом 30 ))) команда не в сотне - вас это не угнетает?

Project status
The project has currently no work (see below).
The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from december 2008 (simap app) and their domains (hmmer app) will start around january 1st.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Algon
Dec 5 2008, 00:30
Пост #9


Ambulance
*******

Група: Trusted Members
Повідомлень: 899
З нами з: 11-November 08
З: Бердянск, СИЗО ГУВД :)
Користувач №: 862
Стать: Чол
Парк машин:
QX9650, Q8400S, Q8200S, Q6600, E6750, E4500, Xeon 5110, X2 5600+, M540, M420.



Попробуем (+7).


--------------------
(Show/Hide)

User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Rilian
Dec 14 2008, 08:55
Пост #10


interstellar
**********

Група: Team member
Повідомлень: 17 343
З нами з: 22-February 06
З: Торонто
Користувач №: 184
Стать: НеСкажу
Free-DC_CPID
Парк машин:
ноут и кусок сервера



The project has currently no work (see below).

The similarity matrix of the SIMAP project is currently up to date. All workunits from the last calculation period are distributed, thanks to all users for chrunchig them.
The calculation of new simap workunits containing the novel proteins from december 2008 (simap app) and their domains (hmmer app) will start around january 1st.

до первого января прогреваем процы!


--------------------
(Show/Hide)

Миссия проекта Help Fight Childhood Cancer (Помоги Победить Детский Рак) - подобрать белки, блокирующие некоторые виды рака. Подключайтесь!
IPB Image
IPB Image

IPB Image

IPB Image
IPB Image

общая статистика: BOINCstats * FreeDC команда: BOINC команда Ukraine

IPB Image
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Algon
Dec 15 2008, 05:18
Пост #11


Ambulance
*******

Група: Trusted Members
Повідомлень: 899
З нами з: 11-November 08
З: Бердянск, СИЗО ГУВД :)
Користувач №: 862
Стать: Чол
Парк машин:
QX9650, Q8400S, Q8200S, Q6600, E6750, E4500, Xeon 5110, X2 5600+, M540, M420.



Мне вчера накидали ~30 заданий на машину и постоянно идут новые по мере отправки результатов. Да и до этого 1-3 задания ежедневно перепадали.
Каждое задание на Core2 3GHz считается около часа, на Athlon 64 X2 6400+ около полутора часов, Celeron-ы вообще похоже застряли надолго (от 2,5 часов/задание).
Deadline заданий: неделя.


--------------------
(Show/Hide)

User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Dec 15 2008, 22:30
Пост #12


<script ///>
**********

Група: Moderators
Повідомлень: 6 429
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



да, лут повалил.

RESULTS Approximate #
in database 214,870
unsent 8,799

так шо до первого числа можно малёхо подпихнуться.

они решили до 1 числа не ждать ))

December 14, 2008
New Workunits: an additional batch of workunits has been started for the calculation of similarities and features of approx. 1.500.000 new sequences, that were imported from metagenomes.


шо-то очей понты дают. как команді по 20к в сутки сливают???

Opportunities
Rank Team Score Average Daily Gain Days to Overtake
144 Matrix World Search Team 254,026 0 80 44.69
142 NASCAR Fans 260,340 18 62 158.62
138 Aplin Clan 270,363 0 80 248.28
133 Digi International 281,694 0 80 389.49

пилят.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Algon
Dec 16 2008, 05:50
Пост #13


Ambulance
*******

Група: Trusted Members
Повідомлень: 899
З нами з: 11-November 08
З: Бердянск, СИЗО ГУВД :)
Користувач №: 862
Стать: Чол
Парк машин:
QX9650, Q8400S, Q8200S, Q6600, E6750, E4500, Xeon 5110, X2 5600+, M540, M420.



Очков маловато дают, к тому-же примерно 70-80% результатов пока pending. Действительно странно, как при таком раскладе некоторые команды умудряются быстро разогнаться.


--------------------
(Show/Hide)

User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Rilian
Dec 16 2008, 06:35
Пост #14


interstellar
**********

Група: Team member
Повідомлень: 17 343
З нами з: 22-February 06
З: Торонто
Користувач №: 184
Стать: НеСкажу
Free-DC_CPID
Парк машин:
ноут и кусок сервера



Может они "долго" разгонялись? И на самом деле задания есть независимо от новостей на главной? (Ведь не могут же закончиться протеины в базе)


--------------------
(Show/Hide)

Миссия проекта Help Fight Childhood Cancer (Помоги Победить Детский Рак) - подобрать белки, блокирующие некоторые виды рака. Подключайтесь!
IPB Image
IPB Image

IPB Image

IPB Image
IPB Image

общая статистика: BOINCstats * FreeDC команда: BOINC команда Ukraine

IPB Image
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Algon
Dec 16 2008, 08:09
Пост #15


Ambulance
*******

Група: Trusted Members
Повідомлень: 899
З нами з: 11-November 08
З: Бердянск, СИЗО ГУВД :)
Користувач №: 862
Стать: Чол
Парк машин:
QX9650, Q8400S, Q8200S, Q6600, E6750, E4500, Xeon 5110, X2 5600+, M540, M420.



Rilian
Задания были и раньше, у меня к проекту подключено несколько машин, ловилось в среднем 1-3 задания в день, так что заранее они набрать вряд-ли могли. По поводу протеинов в базе - у них написано, что база обновляется по мере необходимости (видимо по мере поступления новых данных) и их основная задача - поддерживать "актуальность" базы. В общем ладно, в конце концов очки не главное smile.gif


--------------------
(Show/Hide)

User is offlineProfile CardPM
Go to the top of the page
+Quote Post

24 Сторінки V  1 2 3 > » 
Reply to this topicStart new topic
2 Користувачів переглядають дану тему (2 Гостей і 0 Прихованих Користувачів)
0 Користувачів:

 



- Lo-Fi Версія Поточний час: 27th March 2024 - 07:12

Invision Power Board v1.3.3 © 1996 IPS, Inc.