![]() |
Привіт Гість ( Вхід | Реєстрація )
![]() |
nikelong |
![]() ![]()
Пост
#1
|
Тера ранчер ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Група: Trusted Members Повідомлень: 11 909 З нами з: 19-March 05 Користувач №: 92 Стать: Чол ![]() |
нет логотипа
Проект "Anansi" ----------------------------------------------------------------------------------------------------------
ТОП-20 участников: ![]() ---------------------------------------------------------------------------------------------------------- Дата основания команды - 29.08.2009 Капитан - rilian ---------------------------------------------------------------------------------------------------------- Для присоединения к команде Украины: 1. Загрузите BOINC менеджер (Если его у Вас еще нет!) 2. Перейдите в "расширенный вид" 3. Выберите сервис ---> добавить проект 4. Введите адрес проекта http://canis.csc.ncsu.edu:8005/anansi/ 5. Введите свои регистрационные данные. 6. Найдите нашу команду. Она называется Ukraine и адрес ее статистики вы могли видеть выше. 7. Если есть доступные для загрузки задания Вы их получите и начнете расчеты. ---------------------------------------------------------------------------------------------------------- Новичкам: статья со скриншотами, как поставить и настроить BOINC-менеджер ---------------------------------------------------------------------------------------------------------- Полезная информация: Для идентификации пользователя в BOINC могут служить 2 вещи: 1) пара e-mail/пароль 2) межпроектный идентификационный ID (Cross-project ID) - 32значное шестнадцатиричное число. Если Вы пожелаете подключится ещё и к другому BOINC-проекту, то помните: чтобы не плодить новых аккаунтов при подключении к новому проекту или команде, нужно обязательно везде регистрироваться с одним и тем же Именем и EMAIL. если при регистрации в проекте указать другой e-mail , BOINC создаст новый аккаунт с тем же именем! В этом случае рекомендуется зайти во все ваши аккаунты и во все проекты и где надо поменять емейл на нужный. Через некоторое время ваши аккаунты сольются в один с одним cross-project-id. ---------------------------------------------------------------------------------------------------------- О проекте: Anansi is a research project that uses Internet-connected computers to explore web resources around the world. Basically we want to do an evaluation regarding accuracy and performance on a distributed web crawler, and BOINC is our final choice after consideration. Measurements in such a system including accuracy, robustness, flexibility and performance will be evaluated. In Anansi, clients returned only URIs been crawled associate with URI's http status code that indcating availability of it. Only URIs with scheme http itself that can be reached by the public will be crawled. No E-mail address, words content or user, password will be collected. It is an non-cpu-intensive project, which is trying to reduce CPU loads on the client. Associative information such as robots exclusion and some page contents are being collected and used by BOINC Volunteers during crawling, but none of them will be returned to Anansi server. The data(URIs) collected by Anansi will be used by a Map-reduce engine that calculates priorities for each URI. The priority is established upon In-degree, out-degree and timestamp created by Anansi Server. Anansi server take it into consideration for revisit plans, which maintains a continuely working system. Anansi is currently maintained by Operating Systems Research (OSR) Lab @ North Carolina State University Ссылки по теме: http://wiki.bc-team.org/index.php?title=Anansi/en Це повідомлення відредагував nikelong: Sep 18 2010, 18:56 |
![]() ![]() |
Rilian |
![]()
Пост
#2
|
![]() interstellar ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() ![]() Група: Team member Повідомлень: 17 162 З нами з: 22-February 06 З: Торонто Користувач №: 184 Стать: НеСкажу Free-DC_CPID Парк машин: ноут и кусок сервера ![]() |
Oct 2, 2009
So far around 150,000 urls have been crawled by Anansi. Some plans are already made as below and being tested now: * 1. Statistics chart of Popularity of collected web pages (based upon in-degree and out-degree) * 2. Performance on Hadoop MapReduce Framework ( Relationship between input(edges) and time for MapReduce program) : The MP program crashes for when first 800,000 urls have been crawled, but works fine so far after restart. * 3. Accuracy of BOINC Infrastructure: Some cheating users are found and a Validator and latest app version is updated for that. * 4. Some reports on failure on Apps on Ubuntu version. We are considering remove that and concentrating on Windows. надо вынести в отдельную ветку проект работает, ВЮ есть! ояебу, ВЮ на 27 часов БТВ ананси не потребляет процессор и крутится в отдельном слоте -------------------- |
![]() ![]() |
![]() |
Lo-Fi Версія | Поточний час: 2nd August 2025 - 01:24 |