Кому нужен этот Google

Кому нужен этот Google

В далеком уже 1997 году два товарища котрых звали Сергей Брин и Ларри Пейдж, вдруг ни с того ни с сего решили, что наилучшим показателем качества документа будет количество ссылающихся на него других документов. Долго ли коротко, но соорудили они свою поисковую систему, в основе которой лежала их свежевыдуманная технология PageRank.

В те далекие времена, ученые люди которые преподавали в университете, да и студенты читали много книжек, на основе которых писали свои диссертации, дипломы и даже рефераты. И в конце любого научного мануала было принято оставлять ссылки на документы, из которых уважаемые студенты и профессора заимствовали какие-либо мысли. Это явление до сих пор распространено в научной среде.

На основе нехитрой мысли, что на хорошие документы будет больше ссылок чем на плохие, господа Брин и Пейдж и вывели свою технологию. Осталось только подсчитать сколько ссылок имеет каждый документ.

Сначала это было очень легко, так как поиск ограничивался только сетью университета. Ученые по достоинству оценили новую систему поиска, т.к. находили только полезные и нужные документы. Правда в связи с этим, документы, которые появлялись раньше имели все больше и больше ссылок, в то же время новые диссертации, дипломы и даже рефераты плелись в самом конце списка, и не смотря на их научное качество никому не попадались на глаза.

Ну да не об этом сейчас идет речь. А идет она о том, что вышеозначенные господа Брин да Пейдж решили перенести свою безусловно удачную идею на весь остальной мир. Решили, так сказать, осчастливить человечество. Решили и сделали.

И как же хороша оказалась их поисковая система. Находила хорошие документы, а плохих вообще не показывала. И жизнь была бы прекрасна, если бы все пользователи интернета были профессорами, да докторами наук.

По этой технологии оказалось, что качество документа определяется не пользователями интернета, а вебмастерами, коих, как логично будет предположить, на несколько порядков меньше, чем рядовых пользователей. Таким образом принципиальное отличие университетской сети заключается в том, что студенты и профессора, были “пользователями” и “вебмастерами” одновременно, т.е. количество заинтересованных в поиске лиц было равно количеству лиц которые оценивали качество документов.

И вот пришла беда откуда не ждали. Вебмастера, которые теоретически должны были ставить ссылки на понравившиеся им документы, и пользователи ссылающиеся на сайты в форумах и гостевых книгах стали делать что-то не то. Когда все правильно и логично, то “вес” ссылок должен быть тем выше, чем глубже внутри сайта они запрятаны, ведь форум развивается постоянно. Но хитрые спамеры быстро смекнули что очень дешево будет выкладывать ссылки на форумах и гостевых книгах, что в результате привело к тому, что некоторые страницы с именами “forum” и “guestbook” вообще перестали учитываться некоторыми системами. Но хитрые и изворотливые люди пошли дальше: начали создавать сайты на бесплатных хостингах только для того, чтобы расставить там как можно больше ссылок; и начали покупать ссылки на уже готовых сайтах, вебмастера которых таким образом нашли неплохой способ заработать.

В результате таких манипуляций поисковые системы стали выдавать информацию не ту которая полезна пользователям, а ту которая полезна вебмастерам. Поисковикам пришлось выдумать различные искусственные способы ограничения таких накруток, в результате чего поиск в интернете стал не просто обычным делом, а целым искусством, т.к. найти нужный документ стало очень сложно.

Теоретически лучшим показателем качества сайта должен был стать показатель количества людей пользующихся этим сайтом, попросту говоря счетчик. Но как известно счетчики накручиваются еще лучше, чем покупаются ссылки. По всему выходит что дальнейшее развитие получат рейтинговые системы, с прямым голосованием пользователей (фантастика), и системы учета трафика встроенные в браузеры по типу Alexa.

На данном этапе поисковые системы путем усилий вебмастеров превращаются в странные каталоги непонятных ссылок.

Статья опубликована на сайте bechtold.biz — 18 сентября 2007 г.
Поисковые технологии

Комментарии (7)

  1. Сергей, 10.12.2007 00:18

    статья странная скажем коротко, о PR прогнозах и Google Rang лучше расскажет сервис на pagerank-estate-spb.ru, кто кому нужен покажет время!

  2. gene, 10.12.2007 07:57

    смысл названия “Кому нужен этот Google” именно в вопросе :)
    это не фраза которая отрицает его полезность

  3. morzh, 07.04.2008 18:04

    это было давно
    гугль учитывает очень много критериев при ранжировании результатов
    и хоть пагеранк и очень важный, но не единственный

  4. gene, 07.04.2008 18:30

    ну в принципе это очевидно. например гугл еще учитывает ключевые слова ;)

  5. morzh, 07.04.2008 18:37

    да чего он только не учитывает
    главно что ето всё в хороших пропорциях и сочетании
    отлично ищет - меня устраивает сполна :)
    я кстати реализовывал подобную систему для определения важности страниц - хорошая вещь, вот только всякие баннерные системы не банились автоматически.
    по количеству ссылок - плохой критерий

  6. aoglib, 11.04.2008 00:52

    “По всему выходит что дальнейшее развитие получат рейтинговые системы, с прямым голосованием пользователей (фантастика), и системы учета трафика” - траффик как и прямое голосование можно перенаправить, например, за получение 1 файла mp3 перейди на сайт и проголосуй или что то в этом роде. Эта идея тоже не совсем идеальная.

  7. gene, 11.04.2008 16:01

    для этого надо привлекать совершенно посторонних участников, а народ обычно ленивый, чаще всего плюнут и пойдут качать mp3 в другое место. да и не факт, что такое голосование возможно будет отследить.

Оставить комментарий

Да, я человек!