Новые старые Базы Пастухова

Автор: | 14 марта 2014

Не так давно я уже писал про то, что знаменитые базы Макса Пастухова стали еще больше и теперь насчитывают целый миллиард запросов, а теперь настало время написать про то, что Макс сделал одно поистине революционное изменение в их структуре.

Все, кто так или иначе с ними работает, прекрасно знают, что скорость формирования списка ключевиков в базе достаточно низкая. Порой, на выборку из 500 000 запросов может уходить вплоть до получаса, что точно не добавляет им привлекательности, поэтому немало народу предпочитает делать выборку через тот же KeyCollector, однако, в прошлом месяце Макс сделал революционное изменение в файлах базы и теперь даже самая большая выборка будет собираться не более 10 секунд!

Для примера я решил взять запрос «смартфон» и сделать по нему выборку в размере 500 000 запросов. На все про все у меня ушло 3 секунды на компе с отнюдь не топовой конфигурацией.

На мой взгляд, это самое нужное изменение за все время существования баз, но не единственное. Теперь кроме практически мгновенного сбора базы, увеличился максимальный лимит — с 2 миллионов ключей до 10 миллионов, а количество потребляемой памяти упало в три раза — до 740 мегабайт. При этом, цена баз осталась прежней.

А вот халявных «плюшек» и мануалов по работе с базами сегодня не будет, потому что, если честно, я уже исчерпал все идеи по показу возможностей баз Пастухова, а повторяться не хочется 🙁

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *