Привіт Гість ( Вхід | Реєстрація )

> Majestic12.co.uk, альтернатива гуглу
nikelong
Feb 11 2007, 15:40
Пост #1


Тера ранчер
**********

Група: Trusted Members
Повідомлень: 11 909
З нами з: 19-March 05
Користувач №: 92
Стать: Чол



IPB Image

Проект "Majestic-12" IPB Image

----------------------------------------------------------------------------------------------------------
Официальный сайт

Официальная статистика по команде "Ukraine"
Расширенная статистика по команде Украины
Выбор оптимального DNS сервера

----------------------------------------------------------------------------------------------------------
Дата основания команды - 08.02.2007 Капитан - Tamagoch
----------------------------------------------------------------------------------------------------------
Для присоединения к команде Украины:
1. Убедитесь в том что у Вас безлимитный доступ в интернет
2. Проверьте, установлен ли в Вашей системе NET 2.0 (пуск - панель управления - установка и удаление программ. В открывшимся списке должна присутствовать строчка NET Framework 2.0). Если нету - идем на windows update;
3. Загрузите клиент (1.2 Мб), предпочтение - версии Installer;
4. введите логин/пароль/прочие данные в самом клиенте, и нажмите кнопку регистрации. Если что-то непонятно - читаем на английском более подробное описание. либо спрашиваем тут на форуме и сразу же получаем ответ. Как вариант - обращаемся в командный чат на скайпе (пишите в личку Nikelong )
5. Зайдите на сайт проекта и залогинтесь под собой (введите те логин и пароль шо вводили при регистрации клиента)
6. Зайдите в профиль нашей команды и нажмите ссылку Join this team
7. Если всё сделано верно то в данный момент Вы уже являетесь членом нашей команды. Поздравляем!
----------------------------------------------------------------------------------------------------------
О проекте:
Раздел по Majestic12 у нас на сайте.

http://mj12.sonnigelichtung.de/

Сколько выставлять воркеров и букетов?
http://xplusy.oos.cc/web/Velocity2.pdf

График производительности команды:
IPB Image

Добавить сайты в маджестик12 - аддурилка
Majestic12 Add Url

QUOTE
Зачем мы создаём поисковую систему, когда все могут просто использовать гугл(яху/яндекс и т.д)?

Это сложный вопрос, так как на него нет единственного ответа. Мини-ответы разбиты на социальные и персональные категории для того, чтобы попытаться и начать объяснять хотя бы часть причин работы этого проекта:

Социальные:
1) Вы можете представить себе жизнь без Интернета? А как вам Интернет без поисковых систем? Поисковики являются важной частью жизни, будь то работа или досуг и отсутствие возможности контролировать ИХ в известной степени не очень хорошая вещь.

2) Потому что мы можем -- персональные компьютеры и связи достигли того уровня, когда массовые масштабные проекты делают подобное возможным.
Задумайтесь над этим: один компьютер с инетом в 512к может собрать 500 000 страниц в день, так что имея всего 8000 участников в сети, можно в день проиндексировать столько страниц, сколько нет у Гугла во всей его базе данных! И это всего да один день! Мы раельно можем побить Гугл по крайней мере в части размера и глубины базы даннх.

3) Вы когда-нибудь, вглядываясь в чистое звёздное небо, не хотелы бы узнать, сколько там звёзд? Собственно, мы тут не звёзды считаем, но аналогично этому примеру, никто точно не знает, насколько сейчас велика ''Международная Паутина''. Всё, что мы знаем, дак это то, что она намного больше, чем её проиндексировали крупнейшие поисковые системы. Проект постарается обеспечить ответ на этот сложный вопрос, собирая каждый линк и каждую страницу Интернета.

Персональные:
1) Я, Александр Чудновский, хочу взяться за решение задачи, требующей мировых возможностей и амбиций (в последнем я уверен, а насчёт предпоследнего - время покажет ).

2) Я хочу посмотреть, сможет ли Microsoft's .NET справиться с этим (в особенности её cross-platform angle)

3) Я хочу предоставить людям различие в поиске чего-либо в Интернете. Интернет является большой частью моей жизни и был ей достаточно долгое время, и это правильно, что я использую все свои навыки в попытке сделать лучше другим людям.


Клиент создаёт очень большой траффик, он использует всю ширину Вашего канала. Поэтому его нужно устанавливать только в том случае, если вы имеете безлимитный доступ в интернет.

IPB Image


Це повідомлення відредагував Rilian: Aug 23 2012, 18:02
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
41 Сторінки V « < 23 24 25 26 27 > »   
Reply to this topicStart new topic
Відповідей(360 - 374)
nikelong
Dec 15 2009, 13:29
Пост #361


Тера ранчер
**********

Група: Trusted Members
Повідомлень: 11 909
З нами з: 19-March 05
Користувач №: 92
Стать: Чол



Death,
Тю, новость. Я 1.6.11 уже недели 2 как юзаю...


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
nikelong
Jan 2 2010, 18:05
Пост #362


Тера ранчер
**********

Група: Trusted Members
Повідомлень: 11 909
З нами з: 19-March 05
Користувач №: 92
Стать: Чол



http://mj12.sonnigelichtung.de/

Различная статистика.

А вот этот .пдф нужно прочесть всем активным учаснегам нашй команды. Ну и потенциальным - тожеsmile.gif

http://xplusy.oos.cc/web/Velocity2.pdf

rtfm.gif rtfm.gif rtfm.gif rtfm.gif rtfm.gif


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
nikelong
Jan 9 2010, 01:53
Пост #363


Тера ранчер
**********

Група: Trusted Members
Повідомлень: 11 909
З нами з: 19-March 05
Користувач №: 92
Стать: Чол



Распределенный поиск Majestic-12 мечтает о лаврах Google
http://habrahabr.ru/blogs/i_am_clever/16719/
(Show/Hide)

О чем недвусмысленно намекает такой картинкой на своем сайте:
Основная идея - вместо тысяч серверов переложить работу по индексации на локальные машины пользователей, которые бесплатно предоставляют свои ресурсы. Для этого нужно зарегистрироваться и скачать программу-клиент.
На сайте есть статистика - кое кто сто гигабайт своего трафика в день на этот проект выделяет.

Сам проект скорее требует хорошее подключение, чем мощный процессор, в отличие от того-же Seti@home, где трафика мало - но процессор загружен по максимому. Так что безлимитка только приветствуется.
Пока проиндексированно 37,534,707,760 URL, учитывая распределенную структуру проекта объем и скорость индексирования может превысить возможности GOOGLE. Проект амбициозный - но потенциал у него есть. Я удивляюсь что сам Google не создал нечто подобное. Революция против монополии Google? Who knows...

 

Majestic SEO: лучший в своем роде инструмент для анализа беклинков
http://www.inoseo.com/archives/158
(Show/Hide)

8.09.08

Majestic SEO (http://www.majesticseo.com/) – сервис анализа беклинков, разработанный Majestic 12 (http://www.majestic12.co.uk/), делающий возможным исчерпывающий отчет по беклинкам, который точно теперь может конкурировать и стать отличной альтернативой Yahoo! Site Explorer (http://www.searchenginejournal.com/more-issues-with-yahoo-link-operator-and-possible-remedies/7568/).

Инструмент становится бесплатным, как только Вы запросили отчет для своего вебсайта (Вам нужно будет доказать свое право собственности, переслав пустую страницу на корень своего сайта). Если же Вы хотите просмотреть отчеты по беклинкам для сайтов конкурентов, придется заплатить.

Текущий размер индексации Majestic SEO просто поражает:

«32,690,802,864 индексированных страниц (в общем, 211,051,271,656 уникальных урлов) и 81,502,004 уникальных доменов (685,461,105 с субдоменами), ~1.5 триллиона линковых отношений».

Методология, качество индексации, источник данных (http://www.majesticseo.com/research/anchor-index-quality.php)

«Существует два источника данных: первый и основной – это наш собственный краулинг, которым мы занимаемся с конца 2004 года, и для качественной верификации данных мы используем также отчеты по беклинкам Google и Yahoo.

Наша метотология позволяет оценить, насколько точен наш индекс в терминах качества по отношению к тем, которые используются другими поисковыми системами».

Сервис предлагает перечень ценных отчетов:

1. Обзор домена
• Ведущие анкоры
• Ведущие домены
• Ведущая страница (основывается на “A-Citation-Rank’ – зависит от количества уникальных внешних доменов)

2. Анкоры – внушительный список внешнего анкор-текста, включая важные данные:

• Общее количество беклинков
• Внешние беклинки
• Ссылающиеся домены

3. Ссылающиеся домены высшего уровня

4. Ссылающиеся домены: таблица, отображающая домены, ссылающиеся на сайт (и самая главная страница, на которой был найден линк)

5. Ежедневные доменные апдейты: отображает новые ссылки. По словам сотрудника компании:

«…как только домен добавлен на контрольную панель, мы обеспечим ежедневные обновления беклинков – мы краулим 150-170 млн. страниц каждый день, и если мы находим беклинки на этот домен в какой-либо день, мы добавляем их в недавний список краулинга».

Дополнительные преимущества:

• (если ранее страница переадресовывалась с помощью 301 редиректа) инструмент проведет поиск ссылок на старую и новую версию урла
• инструмент ищет ссылки на www и не-www версии сайта
• сервис предлагает опцию поиска ссылок либо на домен, либо на страницу
• инструмент предлагает легкую в использовании функцию «export-to-CSV»

Что можно улучшить?

• Больше сортирующих и фильтрующих опций (списки и таблицы просто огромны – нет никакой возможности сортировать их online). Хотя всегда можно экспортировать данные материалы и сортировать их в Excel, несколько таких опций для работы online были бы как раз кстати.
• Некоторые данные немного застарели (дата последней индексации – конец мая 2008 года, но есть обещание провести полный апдейт индекса в конце этого месяца). Цитирую сотрудника компании, у которого успела взять интервью:

«В данный момент мы не совсем up-to-date – нахождение свежих ссылок может занять 2-4 месяца, но, надеюсь, эта ситуация измениться в последующие месяцы, так как мы планируем переключиться на автоматический рекраулинг важных сайтов – а это, в свою очередь, уменьшит время для нахождения новых ссылок с важных страниц к нескольким неделям, а может, и дням».

Важный вокабуляр, на который стоит обратить внимание:

Короткий домен (также «домен второго уровня») – самая короткая форма домена без каких-либо субдоменов.

ACRank – очень простое определение того, насколько важна страница, оценивая ее общую значимость от 0 (самый низкий бал) до 15 (самый высокий). Оценка зависит от количества уникальных внешних коротких доменов.

Disclaimer: не полагайтесь только на изложенную здесь информацию. Я рекомендую проводить большое количество тестов до того, как принять окончательное решение (и если можно, поделитесь здесь своими выводами).

http://www.searchenginejournal.com/majesti...ysis-tool/7634/


 

О распределённых поисковых машинах, Enabot и HyperTable
http://ivbeg.livejournal.com/101627.html
(Show/Hide)

Весьма интересное в загадочном боте EnaBot (http://www.enaball.com/crawler.html) - это то, откуда он приходит - ec2-67-202-55-112.compute-1.amazonaws.com

А это не что иное как Amason EC2, не удивлюсь если при таком раскладе и база хранится в Amazon S3 и Amazon SimpleDB, наверняка не скажешь, но по логике и производительности это должно быть быстрее чем держать свою распределённую базу. Мне вспомнилась одна из обзорных статей по Simple DB - несмотря на сильно упрощённые интерфейсы, это одна из наиболее сильных воплощённых идей. Я ещё раз хочу повторить своё предсказание что рано или поздно IBM купит Amazon. Это, однозначно, их актив.

Из других интересных поисковых технологий трудно не обратить внимание на Hypertable, реализацию аналога BigTable от Google в открытых исходных кодах и под GPL v3. Мне, правда, до сих пор не вполне ясно чем эта разработка превосходит HDFS (HaDoop File System), но думаю что отличия есть раз такая разработка появилась.

Чуть отвлекаясь от технических вопросов и переходя к бизнес модели стоит обратить внимание что не просто так BigTable была и есть закрытая разработка Google которую они и не планировали раскрывать. Это то что можно назвать ключевой технологией, конечно, одной из, но тем не менее важной. Простота и доступность аналогов значительно повышают возможности построения своих поисковых машин конкурентами. Если использовать связку Hadoop + Nutch + HyperTable или же адаптированный индексатор с бэкэндом на Amazon Simple DB, то планка вхождения новых игроков на рынок поиска значительно снижается.

Более того я подозреваю что рано или поздно конкуренция тут начнётся исключительно на алгоритмическом уровне и способности к применению алгоритмов семантического веба. Например, как это делают в немецком поисковике Semager , подробнее о нём можно прочитать в переводе на английский черезе Google Translate - http://urlus.ru/u/11

Другая, интересная идея в извлечении онтологической модели из выбранного текста. Например, в одном из планов Wikia было использование Text2Onto. Пример когда довольно сложные разработки по обработки текстов постепенно находят технологическую реализацию. В одном я точно согласен с авторами, семантизация должна обеспечиваться не людьми, а алгоритмами.

Ещё одна тенденция - это рост популярности распределённых поисковых роботов, работающих на принципах P2P. У такого подхода есть свои ощутимые плюсы - возможность индексации даже тех сайтов которые этому всячески сопротивляются. Невозможно заблокировать индексацию по IP адресу, необходимы фильтры по числу обращений в период времени, а они есть не у всех сайтов.

Навскидку только те что я знаю.

* Yacy.net - open source GPL2
* Grub - open source, GPL, используется в Wikia Search
* Majestic12 - как я понимаю разработка на C# с приличным объёмом проиндексированных страниц. Весьма интересно как как они организуют хранение данных, ибо данных там огого. У них же интересная задумка - Majestic SEO, показ обратных ссылок, как раз того что ведущие поисковики сейчас блокируют.

Итого суммарно 3 тенденции:

* упрощение создание своей поисковой системы с нуля - появление услуг обеспечения инфраструктуры для подобных систем;
* внедрение семантических алгоритмов анализа текстов;
* использование распределённых поисковых роботов;

И один вывод - технологии популяризируются и меняются. Ситуация в которой сейчас находится Майкрософт, когда несмотря на понимание и желание выхода на рынок SaaS это желание сдерживается значительной инертностью текущей структуры доходов, в итоге им приходится идти на риск приобретения Yahoo.

Точно также в случае появления “чёртей из табакерки” новых поисковиков обладающими всеми вышеперечисленными возможностями, поисковая монополия Гугла может сойти на нет. Когда алгоритмы, объёмы данных и инфраструктура конкурентов выравниваются, то начинается ничто иное как война “брендов”, а это то нечто на что нужны лишь деньги.

Кросспост из Иван Бегтин. Комментарии можно оставлять здесь или здесь.


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Roamer
Jan 15 2010, 20:29
Пост #364


мрію про ферму...
*****

Група: Trusted Members
Повідомлень: 159
З нами з: 24-December 08
З: г.Киев
Користувач №: 890
Стать: Чол
Free-DC_CPID
Парк машин:
1. AMD 5950X@4400, 4x16Gb G.SKILL F4-3600C14D-32GTZN, 24/7 (home) 2. X5690@3700, 3x4096Mb Kingston 1600 MHz, 24/7 (home)



Пусть с опозданием, но приветствуем пополнение Команды :

a1ex01, _Ro ! cool2.gif
Добро пожаловать ! welcomeani.gif drinks2.gif


--------------------
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
A1ex01
Jan 17 2010, 00:59
Пост #365


round catcher)
********

Група: Trusted Members
Повідомлень: 1 365
З нами з: 27-August 08
З: Kyiv
Користувач №: 809
Стать: Чол
Парк машин:
хз*X2/2/500/хз*5870 ц7x64



(Roamer @ Jan 15 2010, 20:29) *

Пусть с опозданием, но приветствуем пополнение Команды :

a1ex01, _Ro ! cool2.gif
Добро пожаловать ! welcomeani.gif drinks2.gif

пока на "Воле" безлимит до февраля koc.gif


--------------------
Stats: RC5-72 OGR-(26 /27 /28 ) Mag@(free-dc /boinc)
support: BTC 3Po6aejsoZM7bQvo138fuYwaLc67bzMfEr
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Jan 17 2010, 11:28
Пост #366


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



a u menya tak doma i ne zarabotal. timeout i pisec.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
A1ex01
Jan 17 2010, 11:55
Пост #367


round catcher)
********

Група: Trusted Members
Повідомлень: 1 365
З нами з: 27-August 08
З: Kyiv
Користувач №: 809
Стать: Чол
Парк машин:
хз*X2/2/500/хз*5870 ц7x64



(Death @ Jan 17 2010, 11:28) *

a u menya tak doma i ne zarabotal. timeout i pisec.

esli ty pro modem, to podogdi minut 10-20
ili na noch ostawj


--------------------
Stats: RC5-72 OGR-(26 /27 /28 ) Mag@(free-dc /boinc)
support: BTC 3Po6aejsoZM7bQvo138fuYwaLc67bzMfEr
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Jan 17 2010, 14:16
Пост #368


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



u menya dlink 2540
maj posle kakogo-to obnovlenija to li vindi, to li .net perestal kravlit i tupit s timeoutami.
i postojanno perezapuskaetsa. 9 10 i 11 versii odinakovo. perestavljat vse dotneti mne vlom, eto 3-5 rebutov. ja ne vinesu. u menya planovij rebut 1 raz v nedelu maximum.

v logah nifiga netu. mozhet segodnya ve4erom sjadu i razduplu. skolko mozhno to uzhe.

A1ex01, 11% HS? %-)


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
A1ex01
Jan 17 2010, 20:36
Пост #369


round catcher)
********

Група: Trusted Members
Повідомлень: 1 365
З нами з: 27-August 08
З: Kyiv
Користувач №: 809
Стать: Чол
Парк машин:
хз*X2/2/500/хз*5870 ц7x64



(Death @ Jan 17 2010, 14:16) *

u menya dlink 2540
maj posle kakogo-to obnovlenija to li vindi, to li .net perestal kravlit i tupit s timeoutami.
i postojanno perezapuskaetsa. 9 10 i 11 versii odinakovo. perestavljat vse dotneti mne vlom, eto 3-5 rebutov. ja ne vinesu. u menya planovij rebut 1 raz v nedelu maximum.

v logah nifiga netu. mozhet segodnya ve4erom sjadu i razduplu. skolko mozhno to uzhe.

A1ex01, 11% HS? %-)


запусти под админом. у меня перезапускается на висте если от юзера запустить
...
11% HS- так этож ВАР...)


--------------------
Stats: RC5-72 OGR-(26 /27 /28 ) Mag@(free-dc /boinc)
support: BTC 3Po6aejsoZM7bQvo138fuYwaLc67bzMfEr
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Jan 17 2010, 23:19
Пост #370


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



xp x32
снёс дотнеты, потом ещё запустил дотнет клинап тул от майкрософта, потом поставил с апдейта все обновления и всё равно на маджестиковской либе 50% таймаутов. потом перезапускается и 99% таймаутов.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
A1ex01
Jan 18 2010, 19:44
Пост #371


round catcher)
********

Група: Trusted Members
Повідомлень: 1 365
З нами з: 27-August 08
З: Kyiv
Користувач №: 809
Стать: Чол
Парк машин:
хз*X2/2/500/хз*5870 ц7x64




запустил мадж на виртуалке потестить:
DNS: 29.5%, Conn: 34.2%



--------------------
Stats: RC5-72 OGR-(26 /27 /28 ) Mag@(free-dc /boinc)
support: BTC 3Po6aejsoZM7bQvo138fuYwaLc67bzMfEr
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Feb 5 2010, 23:38
Пост #372


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



http://www.broadband.org.ua/content/view/2094/1/

Broadband.org.ua представляет самый честный рейтинг телекоммуникационных компаний Украины
Проведя анализ нескольких лучших рейтингов-награждений провайдеров и операторов Украины в 2009 - 2010 годах, можно прийти к выводу, что настоящего честного и открытого рейтинга телекоммуникационных компаний в Украине не существует.
Поэтому команда broadband.org.ua, несмотря на огромные сложности и искушения решила сделать самый честный рейтиг-награждение ведущих компаний на рынке Украины по итогам 2009 года.

надо найти контакт Влада, может разместит пару статей про мадж.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Feb 9 2010, 17:36
Пост #373


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



http://www.majestic12.co.uk/wallpaper.php обои с маджем.


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Death
Feb 11 2010, 21:39
Пост #374


<script ///>
**********

Група: Moderators
Повідомлень: 6 371
З нами з: 5-November 03
З: Kyiv
Користувач №: 26
Стать: НеСкажу
Free-DC_CPID
Парк машин:
гидропарк
jabber:deadjdona@gmail.com



добавил в мадж ещё 1к доменов пп.юа
будет что кравлить по украине.

http://search.majestic12.co.uk:8181/submit/ добавлять сайты тут


--------------------
wbr, Me. Dead J. Dona OGR-27
User is offlineProfile CardPM
Go to the top of the page
+Quote Post
Rilian
Feb 11 2010, 21:57
Пост #375


interstellar
**********

Група: Team member
Повідомлень: 17 161
З нами з: 22-February 06
З: Торонто
Користувач №: 184
Стать: НеСкажу
Free-DC_CPID
Парк машин:
ноут и кусок сервера



По ходу там база чистится периодически, потому что я добавил наш домен и оно "приняло задание"...


--------------------
(Show/Hide)


IPB Image

IPB Image

IPB Image
IPB Image

загальна статистика: BOINCstats * FreeDC команда: BOINC команда Ukraine

IPB Image

IPB Image
User is offlineProfile CardPM
Go to the top of the page
+Quote Post

41 Сторінки V « < 23 24 25 26 27 > » 
Reply to this topicStart new topic
1 Користувачів переглядають дану тему (1 Гостей і 0 Прихованих Користувачів)
0 Користувачів:

 



- Lo-Fi Версія Поточний час: 7th July 2025 - 17:37