Поиск по блогу:

AGGRESS Parser под Windows проиндексированных страниц в индексе Яндексе 💎

20 марта 2009

Схожий пост был написан с использованием этого-же парсера, про то как парсить бэклинки по yahoo тут.

Теперь пришла мысль, скорее ее нужно назвать потребностью, проверять свои сайты на кол-во страниц в индексе, и увидеть список всех страниц, а не только их количество.

Всем уже известно, что перейдя по ссылке

yandex.ru/yandsearch?surl=rap.ru&pag=u&numdoc=50&rd=0 то с легкостью можно узнать сколько страниц в индексе сайта rap.ru, но отсортировать все ссылки, в кучу вряд ли удастся.

Чтобы собрать все напарсенные ссылки в кучу мы скачаем парсер «AGGRESS Parser» vector-seo.info/parser/AGRPsetup.exe нароем у себя папочку C:\Program Files\AGGRESS\Parser\search

Сделаем такой файлик с настройками на парсинг Яндекса и Назовем его YandexUrl.txt
Url-http://www.yandex.ru
AbsoluteUrl-http://www.yandex.ru/yandsearch?surl={REQUEST}&pag=u&numdoc=50&rd=0&lr=187
UntilTextAfter-href="{TEXT}"
UntilNextLinkAfter-<a id="next_page" href="{NEXTLINK}">
Pattern-{TEXT}{BLACKWORD(yandex|yandsearch|yandpage|google|msn|yahoo|rambler|aport|meta|wow.ya.ru|onclick|advanced|amp;|numdoc|all_services|favicon.ico|opensearch|/setup/|/info/)}

Если что непонятно, то валим в эту тему, там подробнее расписано..

__

Да и один из самых мне известных парсеров datacol вот.

Подписаться на Telegram
seo софт, парсер
Может именно ты позволишь себе сейчас, запилить свой комментарий ниже, от автора моментальный респект и благодарность!?
Подписывайся на рассылку блога ↓, чтобы быть в курсе.
Категории блога
.com .htaccess .ru .рф 301 редирект Adsense adwords Ajax Alexa Analytics Blogspot CMS CMS wordpress CPA CSS CTR DLE DNS Dreamweaver статьи firefox FTP клиенты H1 HTML HTML теги icq ie JS ladycash letitbit livejournal интернете MFA MFS mosquito cms Google маркетинг nofollow noindex nolix opera pagerank phpbb robots.txt rss Sape SEO Description SeoQuake SEO плагины для wordpress seo программы для windows seo сервис seo софт sitemap sitemap.xml textpattern ucoz whois WMZ wr-board Xenu zebrum lite Базы Пастухова Бегет ВС Из жизни НЧ НЧ запросы Примеры MFA СДЛ ЧПУ агс анализ топа анкор арбитраж аудит сайта баннерная реклама бесплатно хостинг бэклинки веб-мастер вес страницы внешние ссылки внутренние ссылки внутренняя оптимизация вордстат яндекс граббер гс для истории домены дополнительный индекс дорвей женский сайт индексация сайта интервью итоги года карта сайта каталоги сайтов кейсы кириллица кириллические домены клоакинг комментарии wordpress конкурс контекстная реклама контент конфенция Маул мои сайты мой софт монетизация сайта наращивание ТИЦ ноутбук обзор сайта обмен постовыми основной индекс парсер партнерки для блоггеров перелинковка пинг поисковые тэги покупка ссылок покупные ссылки постовые правильные ссылки продажа ссылок продвижение запросов продвижение неизбежно произвольные поля развод редирект блог релевантность сателлиты свежий сайт сервисы серч сетка сайтов синонимайзер скрипт сми сниппет спам сплог ТИЦ трафик уникальность урлы файлообменник фильтр финстрип хостинг шаблон эксперименты юзабилити
Вкусности:
wlad2 2009 - 2024 - этот SEO Блог работает на WordPress © Copyright - Мы используем файлы Cookie для лучшего представления сайта (блога). Продолжая использовать сайт, вы соглашаетесь с использованием файлов Cookie. Политика конфиденциальности и Пользовательское соглашение - Карта сайта, рубрики блога - адрес почты Email me@wlad2.ru - ссылки на соцсети Вконтакте, YouTube. Если нужно продвинуть интернет-магазин? Пишите в форму.