Долго собираются данные. Что делать?

В сервисе временами бывает, что данные долго собираются и кажется, что задача зависла. Перед тем, как писать в поддержку или в чат, проверьте, что на странице идет процесс сбора данных https://arsenkin.ru/tools/queue/ и нет статуса “зависла“. Если вы видите статус “зависла“, то перезапустите его.

Возможно, что ваша задача уже выполнилась и его можно найти на отдельной странице https://arsenkin.ru/tools/reports/.

Мы в статье хотим рассмотреть самые частые причины долгого сбора данных и дальнейших ваших действиях в конкретной ситуации. Перед тем, как перечислить причины, хотим подчеркнуть, что сервис данные собирает разными способами: собираем самостоятельно или данные предоставляют наши партнеры. Частые причины:

Долго собирается поисковая выдача

Да, это обычно частый случай долгого выполнения задачи. Ситуации разные бывают: большая очередь в сервисе, ПС усилили защиту парсинга, некорректные входные данные, долгий ответ от самих поисковых систем.

Решение: ждать окончания сбора, дополнительные задачи не нужно запускать, вы тем самым отсрочиваете сбор данных по первой вашей задаче. В крайнем случае написать в техническую поддержку, чтобы мы обратили внимание на проблему.

Долго собирается частотность Яндекс Вордстат

Основная причина долгого сбора данных - забанили аккаунты Яндекса или ПС улучшили защиту от парсинга.

Решение: ждать окончания сбора частотности или поисковых фраз. Если аномально долго собираются, напишите нам в поддержку, чтобы мы своевременно отреагировали. Частотность используется в инструментах Яндекс Вордстат и Кластеризатор.

Долго собирается контент сайта

Это редкая проблема для нас, так как у нас сайты парсятся в десятки потоков. Где встречаемся с защитой, то пробуем получить контент через браузер (через браузер время парсинга увеличивается).

Решение: ждать окончания парсинга URL/сайтов. Используется активно в инструментах ТЗ на копирайтинг, парсинг тегов, парсинг SEO-текстов.

Не может спарсить контент сайтов

Основная причина - в хорошей защите от парсинга у анализируемого сайта. Скорее, мы даже попробовали спарсить контент даже через браузер. 

Решение: Прислать нам пример сайта, который мы не смогли спарсить, чтобы мы улучшили характеристики нашего робота и улучшили парсинг. В остальном, смириться и проанализировать контент страницы руками.

Ошибка входных данных

Редко, но бывает, что на входе вы указали некорректный формат данных.

Решение: необходимо внимательно посмотреть, какие параметры вы указываете для инструмента. Например, вместо ключевых фраз указываете целые абзацы текста. Конечно же, в таком случае инструменты ничего не выведут.

Ошибка 500

Техническая ошибка на стороне сервиса. В таких случаях мы моментально получаем уведомления и подключаем для решения программистов и администраторов серверов.

Решение: ждать восстановления сервиса.

 

Куда нам писать?