RosInvest.Com

Рунет перевалил за миллиард

Понедельник, 16 мая 2005 г.

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e

Участники проекта Nigma.ru провели оценку суммарного объема Рунета и получили следующий результат: по состоянию на 16 мая 2005 года в Сети имеется примерно 1 млрд. 52 млн. русскоязычных документов.

Это вторая попытка группы посчитать размер Рунета. Первая окончилась неудачно, т.к. предложенный тогда алгоритм не обладал устойчивостью - при изменении некоторых параметров оценка количества документов не колебалась около "равновесного решения", а резко изменялась. Новый алгоритм лишен этого недостатка - он основывается на "закачивании" случайных запросов, созданных на базе частотного словаря, сравнении общего объема выданных результатов со всех поисковых машин, с которыми работает Nigma.ru, и эталонной поисковой машины, о которой известен размер ее базы.

Первоначально устранение дублей происходило по URL и заголовкам документов, однако во второй версии, с использованием частотного словаря, количество дублей резко сократилось, и сейчас используется только URL. Если исключить из алгоритма одну из поисковых машин, оценка в среднем падает всего на 12%. Соответственно, возможно, что не более 20–30% документов Рунета осталось непроиндексированными ни одной из поисковой машин, использующихся в проекте Nigma.ru. Не совсем корректно называть полученное число как объем "базы" поисковой системы Nigma.ru, т.к. собственной базы у проекта нет. Вместо этого предлагается воспринимать это число как оценку общего количества русскоязычных документов в интернете.

Следите за нами в ВКонтакте, Телеграм'e и Twitter'e

Просмотров: 1041
Рубрика: Hi-Tech

Архив новостей / Экспорт новостей

Ещё новости по теме:

18:40

Авторы Star Citizen решили больше не публиковать «долгосрочные» планы развития игры

18:40

Видеокарта за 4000 долларов с проблемной памятью и без перспективы широких продаж. Новые подробности о GeForce RTX 3090 Ti

18:40

Почему в одной семье не все заражаются коронавирусом

18:40

Четыре шага, которые помогут предотвратить развитие диабета

18:40

На eBay начали продавать AirTag с отключёнными динамиками. Обнаружить слежку с такими намного сложнее

18:40

Как правильно тормозить на механике: два простых способа

18:40

Почему алюминиевая фольга с одной стороны глянцевая, а с другой матовая: факт, который вы точно не знаете

18:40

Ошибаются 60% водителей: вопрос из ПДД, из-за которого вы можете попасть в ДТП

18:40

Математическая задача, которая заставит вас вспомнить школу: решат только настоящие отличники

18:40

Редкие деревья-долгожители помогают поддерживать жизнь леса

18:20

В какое время суток нужно есть овощи и фрукты: рассказывает диетолог

18:20

Акции Facebook рухнули на 25% после провального отчета. Это крупнейшее падение в истории компании

18:20

Суперяхта американского миллиардера не может пройти под исторических мостом в Нидерландах. Поэтому мост демонтируют

18:20

Рассерженный американский хакер в одиночку отключил весь интернет в Северной Корее

18:00

Учёные доказали, что жестокие компьютерные игры делают детей бездушными

18:00

Военные США отправили робособак патрулировать границы страны

18:00

Дуров раскритиковал WhatsApp за незащищённость переписки

18:00

Опасности и вызовы мира Horizon Forbidden West — в свежем геймплейном трейлере

17:40

Проблемы с памятью не только у вас: мы все стали более забывчивыми в пандемию. А что делать?

17:40

Мошенник годами сдавал по гарантии поддельные iPhone и получал вместо них новые

17:40

Почему люди выгорают на работе и как можно справиться с этим состоянием

17:40

Ядовитое вулканическое озеро как пример жизни на Марсе

17:20

Ситилинк продаёт партию из видеокарт GeForce RTX 3050 по цене 26 500 рублей – условия акции

17:00

Разработчики игр остались довольны работой со Steam Deck

16:40

Вещь. Кольцевая лампа для съёмки видео в TikTok и Instagram

16:40

Какие цветы могут быть опасны для животных?

16:20

Создан новый способ борьбы с раковыми опухолями с помощью специальных металлических сфер

16:20

Учёные вырастили в пробирке мышиные почки, которые невозможно отличить от настоящих

16:20

Крупнейший отзыв в истории Tesla охватывает почти 820 тыс. машин

16:20

Почему люди-«совы» не должны начинать работать в 9 утра

16:00

Уязвимость в iPhone использовала еще одна израильская шпионская фирма

Условия размещения рекламы

Наша редакция

Обратная связь

RosInvest.Com не несет ответственности за опубликованные материалы и комментарии пользователей. Возрастной цензор 16+.

Ответственность за высказанные, размещённую информацию и оценки, в рамках проекта RosInvest.Com, лежит полностью на лицах опубликовавших эти материалы. Использование материалов, допускается со ссылкой на сайт RosInvest.Com.

Архивы новостей за: 2018, 2017, 2016, 2015, 2014, 2013, 2012, 2011, 2010, 2009, 2008, 2007, 2006, 2005, 2004, 2003