Сложный парсинг сайтовЕсли вы создаете крупный портал в какой-то области, вам могут понадобиться какие-то специфические данные, которые можно найти в поисковых системах или на других сайтах, но вручную вы все эти скопировать не сможете, а значит вам понадобится парсинг других сайтов или каталогов. Банальный пример – вы хотите спарсить 300 тысяч фильмов с кинопортала с картинками и трейлерами. Именно для этого и создан сервис Лаборатория GrabLab предлагающая услуги сложного парсинга сайтов и сбора данных.

Что умеет сервис GrabLab

Самое простое – это осуществлять парсинг любых сайтов и извлечение с них нужных вам данных в любом удобном для вас формате (csv, xml, json, sql-database и так далее – как договоритесь). Можно осуществить сбор данных с сайтов русскоязычных или англоязычных. В качестве примера выполненных работ – парсинг англоязычного каталога компаний или парсинг 230 тысяч страниц с американского сайта с данными о врачах.

Парсинг поисковых систем – в любом виде, это и сбор ссылок по запросам и парсинг ключевых слов и парсинг движков, а также – анализ полученных результатов парсинга и формирование удобных для пользователя отчетов. В качестве примера: парсинг результатов баскетбольных матчей за 2012-2011 сезон, где было собрано, обработано и выведено в CSV файл 1300 матчей.

Поиск и сбор нишевых данных – ищется в различных источниках, сайтах, каталогах, форумах, поисковых системах – любая интересующая вас информация. Это и сбор медиаконтента по интересующей вас тематике и сбор данных для каталогов. Пример – была собрана более чем с десяти сайтов разношерстная информация для немецкого сайта-каталогона, обработана и выведена в удобном едином виде.

Все скрипты и парсеры – сервис запускает на собственных серверах, собирая и анализируя для вас необходимые данные. Вы же – лишь получаете нужный вам результат в том формате, что для вас наиболее удобен. Также можно заказать написание специальных парсеров и скриптов – специально для вас, для установки на ваши сервера и подключение их к вашим Интернет ресурсам.


Подпишись на обновления блога по Сайтовед по RSSRSS, RSS по EmailEmail, twitter hennertwitter!


Интересные посты на "Сайтоведе":

2 комментариев

  1. Здравствуйте. А вы сможете данные подготовить в таком же виде, как базы представлены на datarama.biz? Мне нужны базы различных товаров, но там программисты не принимают пока мой заказ из-за загруженности серверов. Можно скинуть мне ответ на почту. Спасибо.

    Ответить

    • А почему вы это мне пишете? Я это не автор данного проекта, я только обзор написал. А вопросы – вы им задавайте, там есть обратная связь и все контакты разработчиков.

      Ответить

Оставить комментарий

Ваш email не будет опубликован. Обязательные поля отмечены *

Вы можете использовать это HTMLтеги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

X

Забыли пароль?