Привіт Гість ( Вхід | Реєстрація )

> I Need Help, Проблемы работы обсуждаем здесь!
Sting
Nov 3 2005, 17:43
Пост #1


Так, я створив профіль!


Група: New Members
Повідомлень: 2
З нами з: 1-November 05
Користувач №: 137
Парк машин:
пока одна Athlon 2500+ 1Gb DDR



Обсуждаем любые возникшие проблемы в Folding@Home

Спрашиваем, обсуждаем, решаем!



Це повідомлення відредагував omega.zp: Sep 23 2013, 05:34
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
79 Сторінки V « < 5 6 7 8 9 > »   
Reply to this topicStart new topic
Відповідей(90 - 104)
ShuraPAV
Jan 31 2006, 10:52
Пост #91


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



Интересное наблюдение: некоторые задачи при переходе расчета с ядра iP-III на AMD Athlon XP вылетают (в частности p753_vln2.8nopbc, p988_fkcomp_pop), мало того клиент после этого не может продолжить расчет и пытается загрузить другую задачу. В результате Athlon почти сутками простаивает (машина без инета). В подтверждение привожу кусочки логов:

Protein: p753_vln2.8nopbc

[03:49:41] Writing local files
[03:49:41] Completed 250000 out of 1000000 steps (25)
[04:15:31] Writing local files
[04:15:31] Completed 260000 out of 1000000 steps (26)
[04:41:22] Writing local files
[04:41:22] Completed 270000 out of 1000000 steps (27)
[05:07:13] Writing local files
[05:07:13] Completed 280000 out of 1000000 steps (28)
[05:31:49] Quit 101 - Fatal error: Determinant = 1.#QNAN0

**********************
[18:07:52] (Starting from checkpoint)
[18:07:52] Protein: p988_fkcomp_pop
[18:07:52]
[18:07:52] Writing local files
[18:07:57] Completed 4625 out of 25000 steps (19)
[18:14:01] Writing local files
[18:14:01] Completed 5000 out of 25000 steps (20)
[18:22:03] Writing local files
[18:22:03] Completed 5500 out of 25000 steps (22)
[18:30:07] Writing local files
[18:30:07] Completed 6000 out of 25000 steps (24)
[18:34:57] - Checksums don't match (work/wudata_06.xtc)
[18:34:58] - Could not calculate checksum (work/wudata_06.xtc)
[18:34:59] Checksum not what expected.

**********************
Причем задачи как правило уже посчитаны на том же Athlon'e на 20-30%.
Задачи класса p2305, p1136 считались без запинки на любом ядре, а также при любых преходах iPIII->Athlon & Athlon->iPIII.
Есть ли способ заставить клиента принудительно грузить "нужные" задания (например p1136 и др.). Или приходится вылавливать на удачу - типа что закачает клиент, тем и довольствоваться.
В проекте FAD был возможен выбор типа задач при закачке.
???
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Jan 31 2006, 11:42
Пост #92


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



Якщо кліента поставити сервісом (і, напевне, без УДмона) він буде працювати в цьому випадку?

Буде.

Задачи класса p2305, p1136 считались без запинки на любом ядре, а также при любых преходах iPIII->Athlon & Athlon->iPIII.

Тому що це - нормальні проекти, в розумінні "не експериментальні". p753_vln2.8nopbc, p988_fkcomp_pop - експериментальні, наскільки я розумію.
Есть ли способ заставить клиента принудительно грузить "нужные" задания (например p1136 и др.). Или приходится вылавливать на удачу - типа что закачает клиент, тем и довольствоваться.

Взагалі - немає такого способу, можна лише "підказати" клієнту не витягувати експериментальних завдань, забравши опцію "-advmethods". Якщо припущення на початку - правильне, то це допоможе.


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Jan 31 2006, 18:21
Пост #93


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



Похоже p753 и p988 действительно экспериментальные задачи (хотя считались с использованием FahCore_78 - Gromacs Core V1.86). Видимо ошибочные результаты (или коды ошибок) были отправлены и мне даже засчитали эти жабы как посчитанные WU - 7 и 12 поинтов.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Jan 31 2006, 19:07
Пост #94


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



хотя считались с использованием FahCore_78 - Gromacs Core V1.86

Це нічого не означає. Ядро не експериментальне, білки експериментальні. Нормальна ситуація.
были отправлены и мне даже засчитали эти жабы как посчитанные WU - 7 и 12 поинтов.

Це теж нормально. Частковий результат - частина очків.

Головне, щоб одна і та ж помилка не повторювалась часто. Тоді слід дивитись, що не так з компом.


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Feb 1 2006, 11:10
Пост #95


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



Да в общем может даже и экспериментальная направленность белков p753 и p988 тут ни при чем. Вчера засек проблему на AMD и с белком p2063 (здесь расчетный модуль FahCore_7a то же v1.86). На пеньках считаются, попробовал на разогнанном iCeleron Tualatin. На AMD такая ситуация (AMD Athlon НЕ разогнанный - в штатном режиме!):

[18:23:16] + Processing work unit
[18:23:16] Core required: FahCore_7a.exe
[18:23:16] Core found.
[18:23:16] Working on Unit 04 [January 31 18:23:16]
[18:23:16] + Working ...
[18:23:18]
[18:23:18] *------------------------------*
[18:23:18] Folding@Home GB Gromacs Core
[18:23:18] Version 1.86 (August 28, 2005)
[18:23:18]
[18:23:18] Preparing to commence simulation
[18:23:18] - Ensuring status. Please wait.
[18:23:35] - Looking at optimizations...
[18:23:35] - Working with standard loops on this execution.
[18:23:35] - Previous termination of core was improper.
[18:23:35] - Going to use standard loops.
[18:23:35] - Files status OK
[18:23:35] - Expanded 164875 -> 823883 (decompressed 499.7 percent)
[18:23:35]
[18:23:35] Project: 2063 (Run 149, Clone 3, Gen 17)
[18:23:35]
[18:23:36] Entering M.D.
[18:23:56] (Starting from checkpoint)
[18:23:56] Protein: p2063_abeta_agbnp
[18:23:56]
[18:23:56] Writing local files
[18:23:57] Neighbor list enabled for GB
[18:23:57] GB activated
[18:23:57] Completed 10914 out of 3000000 steps (0)
[18:57:10] Writing local files
[18:57:10] Completed 30000 out of 3000000 steps (1)
[19:49:24] Writing local files
[19:49:24] Completed 60000 out of 3000000 steps (2)
[20:00:01] Quit 101 - Fatal error:
[20:00:01] Step 66100, time 132.2 (ps) LINCS WARNING
[20:00:01] relative constraint deviation after LINCS:
[20:00:01] max 60850.808594 (between atoms 1909 and 1912) rms 1411.851440
************************************
Может расчетные ядра заточены под Intel. Но это противоречит тому, что p2305 нормально посчиталась на AMD (FahCore_78). Кстати с FahCore_65 проблем на AMD не было - p1136_p1130 посчитались быстро и без ошибок.
???
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Feb 1 2006, 15:32
Пост #96


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



стати с FahCore_65 проблем на AMD не было - p1136_p1130 посчитались быстро и без ошибок.

На AMD такая ситуация (AMD Athlon НЕ разогнанный - в штатном режиме!):


Тепер все зрозуміло. Проблема зі стабільністю системи. Те, що проц НЕрозігнаний, нічого не означає. Може в нього проблеми з перегрівом, чи в пам"яті, чи просто пам"ять глючна, або розігнана окремо від процесора, або на ній виставлені не ті тайминги, чи навіть ті, але вона з ними не може витримати навантаження, чи глючить чіпсет. Коротше, конкретних причин може бути чимало, але висновок один - система нестабільна, і повинна бути відлагоджена або відключена від проекту.

Те, що з FahCore_65 проблем на даній AMD машині не було, не лише не заперечує факту нестабільності, а навіть підтверджує його. Справа в тому, що FahCore_65 не використовує SSE/SSE2/3DNow, і використовує не дуже багато пам"яті. Результуюче навантаження на процесор менше, на пам"ять, відповідно, теж, тому при його роботі проблем не було, як і при нормальній роботі з комп"ютером. А лишень навантажили систему по-справжньому (більші Gromacs-завдання), от проблеми і вилізли.

Те, що менші Gromacs-завдання, які споживають менше пам"яті, все ж виконувались нормально, дає певну підказку: треба в першу чергу перевірити стабільність пам"яті.

Может расчетные ядра заточены под Intel.

Звичайно, ні.

В мене теж були подібні проблеми з однією системою на NForce2 з інтегрованим відео. Як тільки я встановлював 2 модулі пам"яті і вмикався 2-канальний режим, байдуже, яких модулів і з якими установками пам"яті, система починала глючити, і рахувались лише Tinker-завдання, і то лише на пониженій частоті пам"яті. З одним модулем в одноканальному режимі можна було рахувати все без збоїв і навіть дещо розганяти проц і пам"ять.


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Feb 1 2006, 18:40
Пост #97


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



После ошибки симуляции, клиент FAH тоже указывал на возможные проблемы с системой:
***************************
[20:00:01] Simulation instability has been encountered. The run has entered a
[20:00:01] state from which no further progress can be made.
[20:00:01] This may be the correct result of the simulation, however if you
[20:00:01] often see other project units terminating early like this
[20:00:01] too, you may wish to check the stability of your computer (issues
[20:00:01] such as high temperature, overclocking, etc.).
***************************
Но это та самая тачка, которая отработала на FAD 1,5 года. И на ней вообще самые разные задачи выполнялись и выполняются, траблов не заметил.
Может для просчета белка p2063 мало 256MB оперативки??? Другая тачка, которая рядом тоже грызет p2063 имеет на борту 384метра и причем работает нормально несмотря на разогнанный проц.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Feb 1 2006, 18:55
Пост #98


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



Но это та самая тачка, которая отработала на FAD 1,5 года. И на ней вообще самые разные задачи выполнялись и выполняются, траблов не заметил.

Значить, ядро FAD не настільки оптимізоване і не настільки навантажує процесор і/або пам"ять і контролер пам"яті в чіпсеті.

Может для просчета белка p2063 мало 256MB оперативки?

Можеш подивитися в Task Manager'і, але не думаю, що там потрібно більше 20 МБ на це завдання. Так що розмір оперативки тут ні до чого.

Пробуй збільшити таймінги пам"яті або зменшити її частоту. Було б також добре спробувати запустити машину з іншим модулем пам"яті.

А щоб переконатись, що це дійсно глючить конкретний комп, запусти Prime95 в режимі Torture test. Скачати можна тут: http://www.mersenne.org/ Ця прога теж навантажує систему по повній, причому можна навантажити лише пам"ять або лише процесор.


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Feb 1 2006, 21:30
Пост #99


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



Тестить машину смысла не вижу, тайминги по памяти - by SPD. Постоянно работаю в Photoshop, юзаю Q3A, HL2, MaxPaine2. Траблов не было. Скорее проблема с той виндой на винте, с которой грузится клиент FAH. Есть так же вероятность кривой работы драйверов чипсета под Win98 на VIA KT266A. В общем из-за радикальной разницы конфигураций двух машин (на работе и дома). Надо попробовать переустановить винду именно на AMD-шном компе и попробовать клиента. Проблем в том, что не могу отказаться от W98 (WinXP более гибок при использовании на разных конфигурациях), т.к. сервис ПО которым пользуюсь написано под эту винду и седьмой DOS и не дружит с XP.
В любом случае спасибо romko за поддержку, любые советы могут помочь, подтолкнуть в нужное русло.
Если чего проясниться - напишу.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Amadey
Feb 3 2006, 13:32
Пост #100


Соромлюсь щось писати
*

Група: New Members
Повідомлень: 9
З нами з: 1-February 06
З: Київ
Користувач №: 171
Парк машин:
12х = AMD 15000+ & Intel 8967MГц



извините, что прерываю вашу заумную беседу... smile.gif

как задать часовой пояс для клиента? а то 2х часовая разница бесит...


--------------------
IPB Image
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Feb 3 2006, 13:57
Пост #101


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



как задать часовой пояс для клиента? а то 2х часовая разница бесит...

А ніяк. Час виводиться для UTC, і все. А я вже звик до різниці, і звертаю увагу лише на хвилини. Бо різниця різна не тільки для часової зони, але і для літнього/зимового часу. smile.gif


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Feb 3 2006, 15:18
Пост #102


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



Вопросы к более опытным кранчерам: стоит ли использовать -advmethod на следующей тачке:
i815+iCeleron Tualatin 1,33G@1,66G+512MB
памяти вроде у нее впритык и проц слабоват, втиснется ли в deadline. Может пусть обычные жабки считает - по
принципу лучше меньше да больше?
И второй вопрос: будет ли толк от такой тачки:
iBX+iCeleron Mendocino 366MHz@550MHz+64MB
стоит ли заморачиваться, что она может успеть посчитать, чтоб вписаться в тот же deadline?
Можь кто на старом железе считает и подскажет нижнюю приемлемую границу для компа.
Из своего опыта могу сказать, что один из процов на серваке типа iPIII-500 считает белок
p1136 ок 12-14 дней.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
romko
Feb 3 2006, 15:57
Пост #103


стааарий кранчер
******

Група: Trusted Members
Повідомлень: 392
З нами з: 30-September 05
З: далеко
Користувач №: 128
Стать: Чол
Парк машин:
1 Core i5-520M@2400 MHz, 2048 MB DDR3@667 MHz



(ShuraPAV @ Feb 3 2006, 04:18 PM) *

Вопросы к более опытным кранчерам: стоит ли использовать -advmethod на следующей тачке:
i815+iCeleron Tualatin 1,33G@1,66G+512MB
памяти вроде у нее впритык и проц слабоват, втиснется ли в deadline. Может пусть обычные жабки считает - по
принципу лучше меньше да больше?

512MB - впритик??? Та ти що! Дуже навіть класна кількість пам"яті smile.gif Можна ставити навіть BigWU, не те що -advmethods. Принаймні -advmethods можеш поставити точно, якщо працює комп без збоїв. Уточнення: -advmethods зовсім не означає QMD, під цю опцію попадає ще кілька проектів зі значно меншими по розміру завданнями. Тим паче, що на Туалетін QMD і не скачалось би, бо це не P4 smile.gif

Але сама по собі опція -advmethods виграшу по очкам не дає, просто з нею буде більший вибір завдань.

(ShuraPAV @ Feb 3 2006, 04:18 PM) *

И второй вопрос: будет ли толк от такой тачки:
iBX+iCeleron Mendocino 366MHz@550MHz+64MB
стоит ли заморачиваться, что она может успеть посчитать, чтоб вписаться в тот же deadline?

Буде толк, але треба ставити прийом тільки deadlinenless завдань (type=2), тобто без кінцевої дати, щоб не думати "вкладеться/не вкладеться".


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
ShuraPAV
Feb 3 2006, 17:03
Пост #104


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 180
З нами з: 25-February 05
З: Донецк
Користувач №: 86
Стать: Чол
Парк машин:
Average Power ~ 190ppd



У меня стоит type=1 (client.cfg)
А где узнать расшифровку значений параметра type???
Еще вопросик - BigWU - тоже для пня 4-го?
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Juvenis
Feb 3 2006, 20:42
Пост #105


Так, я створив профіль!


Група: New Members
Повідомлень: 1
З нами з: 3-February 06
Користувач №: 172
Парк машин:
Duron 900 MHz. Возможно прибавление :)



Здравствуйте!
Есть небольшая проблемка. У меня клиент настроен на прием заданий без дедлайна, но вчера он скачал p1161_L939_K12M_298K_DT_250ps_clones, которое (судя по этой странице) имеет дедлайн. Какие объяснения этому Вы можете предложить?
(В принципе, я скорее всего успею просчитать задание, но просто интересно, в чем же причина.)


--------------------
Если Вы не поняли человека, Вы не имеете права осуждать его.
А если поняли, то, вполне возможно, не пожелаете этого делать.
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

79 Сторінки V « < 5 6 7 8 9 > » 
Reply to this topicStart new topic
1 Користувачів переглядають дану тему (1 Гостей і 0 Прихованих Користувачів)
0 Користувачів:

 



- Lo-Fi Версія Поточний час: 12th July 2025 - 20:41