Февраль
1

Почему яху все жрет и жрет...

10.08.2005 20:04 [cut]

Yahoo! увеличила свою базу интернет-документов до 20 миллиардов
Комментарии
На пути к абсолютному знанию – 2
04.05.2005
Идея всемирной интернет-библиотеки наткнулась на многополярность современного мира

Компания Yahoo! заявила об увеличении своей базы проиндексированных интернет-документов до 20 миллиардов, сообщает агентство AP. Это число является беспрецедентным в истории Интернета, ранее рекорд удерживался компанией Google, которая на главной странице своего сайта в настоящее время сообщает о 8 с лишним миллиардах обработанных документов.
Данный показатель не говорит о том, что Yahoo! становится однозначно более эффективной поисковой машиной, чем Google или какой-либо другой сайт. В первую очередь это свидетельствует только о том, что в компании провели масштабную модернизацию своей базы. По словам представителей Yahoo! в заявленные 20 миллиардов "объектов" входят 19,2 текстовых документа и 1,6 миллиард картинок. Google же оценивает свою базу отдельно в 8,2 миллиарда текстов и 2,1 миллиард изображений.

Эксперты полагают, что шаг Yahoo! является маркетинговым ходом, связанным с серьезными намерениями компании ощутимо расширить свои сервисы и привлечь большее число посетителей. В последнее время Yahoo! провела серию различных усовершенствований.

lenta.ru/news/2005/08/09/yhoo/
Рефам сюда


10.08.2005 20:21 ykar

Теперь ястно чего Гугл так сильно жрет все …
Догоняет


10.08.2005 20:26 [cut]

20 миллиардов
8,2 миллиарда

разница существенная
Рефам сюда


10.08.2005 20:50 zpromo

Не удивительно, Гугль давно уже не все странички показывает.
Линки на те же дорвеи в Яхе смотреть удобнее. Мне нравится, как Яхо ищет. Вот уж где найдется все…


10.08.2005 21:18 [b

Сообщение от [b
Цитата[/b] (zpromo @ Авг 10 2005,16:50)]Не удивительно, Гугль давно уже не все странички показывает.
Линки на те же дорвеи в Яхе смотреть удобнее. Мне нравится, как Яхо ищет. Вот уж где найдется все…Google расслабился.

А расслаблятся нельзя …

Бородатая притча: Папа идет с маленьким сыном, вдруг видят кобель заскаеивает на сучку и давай … Сынок говорит – пап а что это собачки делают. Папа ??? Ну … одна собачка напрягается … а … другая расслабляется ….

Так что мораль такова – не расслабляйся ато выебут


10.08.2005 22:37 uncopyrightable

Я этого понта не понимаю: если по любому запросу возвращают не более тысячи результатов, то можно нихуя не индексируя приписать по каждому запросу пару ноликов к кол-ву возвращаемых документов и на этом расслабиться
Если вы хотите, чтобы Бог рассмеялся, расскажите ему о своих планах


10.08.2005 23:41 [b

Сообщение от [b
Цитата[/b] (uncopyrightable @ Авг 10 2005,18:37)]Я этого понта не понимаю: если по любому запросу возвращают не более тысячи результатов, то можно нихуя не индексируя приписать по каждому запросу пару ноликов к кол-ву возвращаемых документов и на этом расслабиться Чем больше страниц проиндексировано, тем релевантнее эта тысяча должна быть, теоретически.

А вобще с гугловским песком так и выходит, выбрали по 1000 избранных на самые жирные запросы и показывают их.

Может Google выдавать AdWords вместо сайтов по конкурентным запросам выдавать, зачем выдачу зря тратить на чужие сайты. Тогда и с дорами бороться не нужно и прибыль в разы увеличится


10.08.2005 23:56 Dmitry

>если по любому запросу возвращают не более тысячи результатов
ключевая фраза – по ЛЮБОМУ запросу… представь, сколько таких запросов существует и по каждому надо выдать 1к более-менее релевантных результатов…
смотрим базу вордтрекера – сейчас в этой базе 302.567.565 запросов… пусть бОльшая часть запросов в этой базе уникальна и ей можно пренебречь, но все равно можно примерно представить кол-во запросов, по которым гугл стремится выдавать релевантные результаты… да и опять же, кому нужны 1к результатов, если только не сеошникам/спамерам/хакерам?


11.08.2005 01:01 [b

Сообщение от [b
Цитата[/b] ]
Чем больше страниц проиндексировано, тем релевантнее эта тысяча должна быть, теоретически.Каким это боком? Полнее -да. Релевантнее – нет. Если учесть, что одним из параметров релевантности являются внешние ссылки на документ, то достаточно индексировать документы на которые такие ссылки есть. А если добавить сюда ПР, то можно безболезненно игнорировать ещё большее количество страниц.

Dmitry, не понял твоей тирады. Абсолютно.

Вот вопрос на засыпку: долгое время лидером по количеству проиндексированных документов был alltheweb. Однако, лидером по количеству юзеров он никогда не был.
Если мне мой склероз не изменяет, то alltheweb aka fast приобрела Яху. Как раз для того, чтобы догнать и обогнать Гугль по количеству проиндексированных документов. (И раза уже обгоняла, пусть не так сильно). Отразится ли этот факт на количестве пользователей Яхи, если учесть, что словарный запас среднего американца не превышает 2-3К слов, а соновная масса запросов однословная?
Если вы хотите, чтобы Бог рассмеялся, расскажите ему о своих планах


0