Как мы избежали ложных данных в анализеСтоит отметить несколько моментов:
С января по март мы разместили большое количество публикаций в крупнейших job-сообществах VK и получили большой массив данных для анализа. Анализ был проведен на большой выборке, что позволило исключить искажение данных и формирование некорректных выводов .
При анализе отдельно оценивались два временных параметра: дни недели и часы, в которые публиковалась реклама. Такой подход позволяет давать рекомендации в связке: день недели выхода + время выхода.
Отдельные группы дали недостаточно данных для “почасового” анализа, поскольку публикаций здесь было мало. В таких случаях мы ориентировались на время суток, условно поделив выборку на утро/день/вечер.
Собрав материал для анализа, мы перешли к выбросам
Получив данные из Метрики и VK, важно было привести их в порядок, убрав выбросы. Выбросы — это значения, которые резко отличаются от общей выборки. Выброс может создать пост, набравший аномальное количество посещений. Удаление выбросов – необходимое условие для достоверного анализа. Один из простейших путей решения проблемы выбросов – воспользоваться статистической
формулой расчета квартилей, которая встроена в Excel и дает возможность убрать выбросы как в верхней границе, так и в нижней.
Почистив данные, их стоит визуализировать. На рисунке ниже вы можете видеть диаграмму, которую использовали мы.