Обзор баз Пастухова в моем блоге стал уже традицией — как-никак, а в третий раз 🙂
В общем, опять со мной связался Максим и дал для теста свежую базу (за февраль 2012 года) на 210 миллионов слов. Всего эта база идет в двух вариантах: со статистикой по цене в Бегуне и без нее. Со статистикой в распакованном виде займет 85 гигабайт, а без нее — 31 гигабайт. И в том, и в другом случае придется освобождать место на диске. Поскольку цена слов по Бегуну мне не нужна, да и места под такую базу не нашлось бы, то я скачал облегченную версию.
Кроме рекордно большого файла со словами (12 гигабайт), в комплекте идут файлы с популярностью по Яндексу и Рамблеру.
Если раньше я писал про то, как пользоваться базой и про получение семантического ядра, то теперь уделю внимание словам, представленным в базе.
Сначала честно хотел подсчитать количество слов по нишам, но потом понял, что столько синонимов я не подберу и поэтому дам статистику по определенным словам:
- финансы — 45 000 запросов
- бизнес — более 500 000
- интернет — более 500 000
- порно — более 500 000
- Apple — 21 600
- мобильный телефон — 58 000
- android — 17 000
- женский — 84 000
- компьютерные игры — 18 000
- футбол — 395 000
- политика — 180 000
- новости — 345 000
- недвижимость — 214 000
- строительство — 213 000
- бесплатно — более 3 000 000, а дальше просто не хватило памяти
- скачать — более 5 500 000
Насчет ниш сам Макс пишет:
В базе есть все ниши: финансы, бизнес, компьютеры, здоровье, культура, новости, наука, общество, шоппинг, спорт, недвижимость, игры, промышленность и многое другое.
Т.е. выбор слов по нишам вам обеспечен.
Более подробно про базы можно прочитать тут.
Привет! Речь об этих базах заходит не впервые, можете почитать полный обзор опубликованный раннее. Все, кто более менее вникал в тему подбора ключевых слов, и пошел дальше чем стандартный метод парсинга с вордстат , тот что-нибудь уже слышал про базы Пастухова.