Этот Datacol парсер мне понадобился для реставрации старой доски объявлений, когда-то еще созданной на движке wr-board.
Первым делом Datacol может парсить по разнообразным шаблонам и все что угодно, но в моем случае предпочел запихнуть нужные мне урлы которые нужно спарсить и вытянуть части текста.
Да и правильно будет упомянуть что причиной реставрации сайта стало то, что сайт долгое время не индексируется Яндексом, так как нет премодерации и новые объявления попадают, а там и дубли и неуникальные тексты и непонятные размером.
Так вот главная задача спарсить только те страницы на которых более 500 символов текста, а мы знаем что именно чем больше текста тем приятнее индексирует Яндекс.
И так на денвере запустил доску объявлений на движке wordpress с плагином ads-wordpress, Datacol через XML-RPC запостил все спарсенные обьявы в доску.
Старый сайт распологался на старом домене и я решил поставить 301 редирект на новый домен с новыми объявами, точнее старыми но тщательно отобранными.
Ну и самый главный вопрос тем кто еще не понял как-же заработать много бабла с помощью этой программы.
Отвечаю: находите те ресурсы которые не в индексе Яндекса, но имеют уникальный контент, а таких очень много... к примеру блоги на blogspot... дальше мучайте свою фантазию...
В зависимости от ваших знаний в оптимизации сайтов решаете продавать ссылки, постовые или только контекстными способами и тизерами... монетизировать созданные темы.
В моем случае эта программа собрала армию сателлитов для продвижения моих СДЛ проектов статейными ссылками... такие страницы когда они размещаются на личных сайтах не жалко и продвигать постовыми и следить за их плотной индексацией...
Скринов программы не будет, потому что на сайте автора http://web-data-extractor.net/ есть и обучающее видео и миллион статей что и как делать... даже тугодуму понравится что там и как.
Очень вкусным саму прогу делает не только ее цена в 90$? но и то что она постоянно дорабатывается и создаются новые плагины... такие как «Массовый постинг в блоги на wordpress.com, blogspot.com и livejournal.com», «Уникализация контента», «парсинг Vkontakte»
Если вы хотите скидку в 15$ от меня, то покупать тут в итоге будет стоить 75$
Ну и если не через меня, то покупай тут за 90$
Но перед тем как купить заюзай демку http://web-data-extractor.net/last-release/DatacolSetup.msi
Так-же я успел посмотреть отзывы других блоггеров которые то-же сказали немаловажные выводы, к примеру http://hyperseo.ru/?p=4233 «выгодней приобрести Datacol, чем тратить время или деньги на написание парсера для каждого конкретного случая.» я всеми руками за.
И вот эта цитата «Посчитайте, сколько мы тратим драгоценного времени на всякую рутинную нудятину и умножьте все это на отложенные в долгий ящик «проекты».» http://mikkilan.ru/glavnaj/parser-datacool/ прям в точку.
то что может парсить по количеству заданных символов, это то что мне нужно
буду копить на нее =)
хы, =) вижу читал обзор
Можете подсказать каким образом собирать домены которые не в индексе яндекса и ещё по нужной тематике, что бы в дальнейшем с помощью Datacol парсить контент?
по нужной тематике? это как?
Пример вбиваем ключевое слово «Турагентство» и парсер отбирает все домены (сайты посвещёные Турагентству) при этом отбирает только те домены. которых нет в индексе яндекса
откуда он их отбирает?
Вот на этот вопрос и нужен ответ))
я ниче не понял, вам нужно парсить сайт или выдачу и сортировать потом?