Сложный парсинг сайтовЕсли вы создаете крупный портал в какой-то области, вам могут понадобиться какие-то специфические данные, которые можно найти в поисковых системах или на других сайтах, но вручную вы все эти скопировать не сможете, а значит вам понадобится парсинг других сайтов или каталогов. Банальный пример — вы хотите спарсить 300 тысяч фильмов с кинопортала с картинками и трейлерами. Именно для этого и создан сервис Лаборатория GrabLab предлагающая услуги сложного парсинга сайтов и сбора данных.

Что умеет сервис GrabLab

Самое простое — это осуществлять парсинг любых сайтов и извлечение с них нужных вам данных в любом удобном для вас формате (csv, xml, json, sql-database и так далее — как договоритесь). Можно осуществить сбор данных с сайтов русскоязычных или англоязычных. В качестве примера выполненных работ — парсинг англоязычного каталога компаний или парсинг 230 тысяч страниц с американского сайта с данными о врачах.

Парсинг поисковых систем — в любом виде, это и сбор ссылок по запросам и парсинг ключевых слов и парсинг движков, а также — анализ полученных результатов парсинга и формирование удобных для пользователя отчетов. В качестве примера: парсинг результатов баскетбольных матчей за 2012-2011 сезон, где было собрано, обработано и выведено в CSV файл 1300 матчей.

Поиск и сбор нишевых данных — ищется в различных источниках, сайтах, каталогах, форумах, поисковых системах — любая интересующая вас информация. Это и сбор медиаконтента по интересующей вас тематике и сбор данных для каталогов. Пример — была собрана более чем с десяти сайтов разношерстная информация для немецкого сайта-каталогона, обработана и выведена в удобном едином виде.

Все скрипты и парсеры — сервис запускает на собственных серверах, собирая и анализируя для вас необходимые данные. Вы же — лишь получаете нужный вам результат в том формате, что для вас наиболее удобен. Также можно заказать написание специальных парсеров и скриптов — специально для вас, для установки на ваши сервера и подключение их к вашим Интернет ресурсам.


Подпишись на обновления блога по Сайтовед по RSSRSS, RSS по EmailEmail, twitter hennertwitter!


Интересные посты на "Сайтоведе":

Комментарии (2)

  1. Здравствуйте. А вы сможете данные подготовить в таком же виде, как базы представлены на datarama.biz? Мне нужны базы различных товаров, но там программисты не принимают пока мой заказ из-за загруженности серверов. Можно скинуть мне ответ на почту. Спасибо.

    Ответить

    • А почему вы это мне пишете? Я это не автор данного проекта, я только обзор написал. А вопросы — вы им задавайте, там есть обратная связь и все контакты разработчиков.

      Ответить

Добавить комментарий для Хэннер Отменить ответ

Ваш e-mail не будет опубликован. Обязательные поля помечены *

Можно использовать следующие HTML-теги и атрибуты: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>