Читать книгу: «Аналитика для руководителей. Стратегия и развитие бизнеса на базе данных, а не на интуиции», страница 2
Кристофер Пенн, автор блога «Пробуди в себе супергероя»1, описал 5 этапов, которые проходит компания на пути к полноценному управлению на основе данных.
1 этап. Data-resistant (ограниченное использование данных). Здесь компания пока не рассматривает данные как стратегический актив. Информация используется только для стандартной отчетности: финансовой, регуляторной и т. д. Организация сосредоточена на том, чтобы создать и вывести продукт на рынок, а не на аналитике. Для вас первый этап уже точно позади, иначе вы бы не читали эту книгу.
2 этап. Data-curious (заинтересованность данными). В компании начинают создавать первые таблицы с информацией и собирать сведения: например, выгружать показатели из рекламных кабинетов, чтобы оценить успешность маркетинговой кампании.
3 этап. Data-aware (осведомленность о данных). В компании появляются энтузиасты и отдельные руководители, понимающие потенциальную ценность данных (возможно, это как раз вы). Они запускают пилотные проекты, строят отчеты и дашборды и начинают разбираться, какие метрики существуют и как их правильно оценивать. Все больше подразделений осознают ценность данных и включаются в работу.
4 этап. Data-savvy (понимание данных). Организация использует данные в большинстве производственных процессов. Например, начинает сегментировать рассылки, пробует выделить группы наиболее ценных клиентов по самым значимым параметрам.
В далеком 2009 году, когда я работал аналитиком в компании «Лента»2, мы решили провести кластеризацию данных на основе предпочтений клиентов и дать постоянную 5 % скидку всем держателям карт магазина. А еще организовали «клуб любителей алкоголя» и персонально, по электронной почте, отправляли актуальные скидки. Это простое действие принесло впечатляющий результат – более чем 20 % членов клуба купили предложенные товары!
И, наконец, 5 этап. Data-driven (управление на основе данных). Организация непрерывно развивается на основе данных и аналитики. Результаты анализа влияют на ключевые бизнес-процессы.
Если вы узнали свою компанию в описании 2-го, 3-го или 4-го этапов – отлично: в следующих частях мы разберем все те вопросы, которые пока мешают вам подняться выше, и подготовим почву для перехода на пятый этап. А для начала определимся с основами: из чего состоит работа с данными и какие моменты важно учитывать.
Глава 3
Основополагающие направления работы с данными
Чтобы эффективно работать с данными, компании следует уделять внимание трем направлениям: стратегии, управлению и аналитике (рис. 3).

Рис. 3. Основные направления работы с данными
1. Стратегия данных – это дорожная карта компании: план по использованию данных, определяющий долгосрочные цели и принципы работы с ними.
Стратегия отвечает на вопрос «Зачем использовать данные?». И здесь могут быть конкретные ответы: чтобы увеличить доходы, сэкономить на расходах, управлять рисками, повысить качество обслуживания клиентов и т. д. Мы сейчас не будем подробно говорить о том, как составить и оформить эту стратегию. Для каждой компании она своя. Но каждая часть книги позволит вам найти ответы на вопросы и выбрать необходимые инструменты в соответствии с задачами вашей компании.
Грамотно составленная стратегия помогает не просто «держать руку на пульсе» и следить за показателями бизнеса, но и делать прогнозы и принимать решения, основанные на данных.
Без нее не будет четкого плана, как двигаться дальше. Как развивать продукт? Как сделать его более привлекательным и ценным для покупателей? Как построить маркетинг и продажи? Какие направления развивать и каких людей нанимать?
Да, эти решения можно принимать наугад, руководствуясь опытом, интуицией или надеждой на удачу. Но стратегия помогает избежать частых ошибок – таких как выпуск продуктов, неинтересных пользователям или неконкурентоспособных на рынке; трата ресурсов на неподходящие инструменты или бесперспективные проекты.
2. Управление данными – это все процессы работы с данными: политика компании, определяющая порядок сбора, хранения и использования данных; роли сотрудников – кто за какой процесс отвечает; стандарты работы с данными, благодаря которым записи эффективно используются и помогают достигать целей, обозначенных в стратегии.
Управление данными означает создание правил и распределение ролей:
• Какие данные нам нужны?
• Как мы их собираем и где храним?
• Какие инструменты для этого используем?
• Кто этим занимается?
• У каких людей есть доступ к разным данным в компании?
Это помогает всем сотрудникам компании говорить на одном языке и придерживаться одинаковых стандартов. Управление информацией позволяет избежать ситуаций, когда разные отделы одни и те же метрики собирают и считают по-своему.
Управление данными не стоит путать с созданием отдела аналитики (об этом поговорим позднее). Это более высокоуровневый процесс, чем найм специалистов, поскольку он обеспечивает безопасный, удобный и прозрачный доступ к данным для всех сотрудников – не только для дата-команды.
Важно настроить все процессы управления, ведь без этого может наступить настоящий хаос. Если данные разбросаны по разным хранилищам, ваши сотрудники вряд ли найдут информацию, необходимую для работы.
Но также важно и ограничивать доступ к ним, иначе работники могут увидеть показатели, которые им видеть не следует. К примеру, маркетолог должен знать, где лежат результаты разных рекламных кампаний, но иметь доступ к данным о зарплатах коллег ему вовсе не обязательно.
3. Аналитика – это, собственно, процесс анализа данных компании. То есть то, как мы трактуем и используем их.
Мы написали стратегию – что и зачем нам нужно анализировать. Настроили процессы управления – то есть определили, как мы будем работать с данными. Теперь пожинаем плоды – извлекаем из собранных данных полезные для бизнеса выводы.
Польза – это то, ради чего все и затевается.
Вряд ли тут надо расписывать, что получится, если игнорировать аналитику, – компания будет просто копить данные, но не сможет извлечь из них выгоду и получить дополнительный доход.
Следующие главы будут посвящены тому, как правильно выстроить процесс, собственно, работы с данными, чтобы они были пригодны для анализа. То есть как их собирать, хранить, обрабатывать и трактовать так, чтобы в них не было искажений и ошибок. Ошибки в данных – ошибки в выводах, а вашей компании такой опыт совсем не нужен.
Глава 4
Жизненный цикл данных
Все данные, с которыми работает компания, собираются, затем используются и в итоге удаляются/архивируются, когда становятся ненужными. Период времени, включающий в себя все эти этапы, называется жизненным циклом данных.
Можно условно выделить пять последовательных этапов:
1. Создание. Это физическое возникновение информации. На этом этапе определяют, какие данные в принципе будут собираться и для каких целей.
2. Прием или загрузка в хранилище.
3. Преобразование. Сюда включается любая подготовка данных к использованию: сортировка, очистка, объединение и так далее.
4. Практическое применение – в нашем случае анализ и прогнозирование.
5. Архивирование или удаление. После завершения работы данные архивируются, сопровождаются подробным описанием (метаданными) и хранятся до следующего использования.
Довольно сложно предсказать, какие именно записи понадобятся даже в среднесрочной перспективе. Поэтому хранить приходится если не всю информацию, то значительную ее часть. Какую именно и как долго?
Здесь есть две крайности: либо избавляться от накопленных данных сразу после их использования, либо хранить вообще все, ничего не удаляя. Первый вариант не подходит для большинства компаний, потому что им важно знать историю бизнес-активности для анализа повторяющихся кризисов. Поэтому аналитики держат в своем арсенале и «старые запасы» данных. Второй вариант использует, например, «ВКонтакте», где годами хранятся даже черновики пользовательских постов и сообщений в переписке. Это требует огромных ресурсов и дополнительных вложений в безопасность. Эта крайность вам тоже вряд ли будет интересна.
Поэтому рациональный ответ на вопрос, каков срок годности данных, будет таким:
информацию имеет смысл использовать, пока она соответствует действительности.
Конкретные сроки будут зависеть от частоты обновления записей и в целом от задач и сферы деятельности. Например, для ретейла маркетинговые данные 10-летней давности уже не так актуальны, как данные о продажах за последний квартал. В целом для прогнозирования не рекомендуется использовать данные старше 5–7 лет, иначе прогнозная модель начнет учитывать неактуальные сведения о бизнесе. В то же время банки и производственные компании, наоборот, по закону обязаны анализировать и хранить данные за десятки лет.
Жизненный цикл данных часто рассматривается по аналогии с жизненным циклом проектов. Такой взгляд позволяет обновлять информацию сообразно задачам бизнеса и экономить ресурсы. А заодно помогает понять, какие специалисты нам понадобятся.
Скорее всего, вам, как руководителю, придется формировать соответствующий отдел, если бизнес достаточно крупный. А потому остановимся на этом вопросе подробнее.
Глава 5
Ключевые специалисты аналитического отдела
Команда по работе с данными, как и другие функциональные отделы, – это компания внутри компании. Как почти все структурные подразделения фирмы, она проходит этапы от одного-двух «многостаночников» до формирования полноценного отдела с четким разделением обязанностей. Однако если группы по финансам, кадрам, маркетингу уже стали традиционными для любого бизнеса, то с аналитикой сложнее. Сфера довольно новая, а потому с ходу сложно понять, с чего именно начать.

Рис. 4. Задачи аналитического отдела
На этапе создания аналитический отдел может состоять из двух специалистов: аналитика и инженера.
Если мы вернемся к жизненному циклу данных, то инженер будет отвечать за все этапы, связанные со сбором, обработкой и хранением информации, а аналитик – за ее практическое применение, то есть анализ и прогнозирование. Первый готовит, второй использует.
Дальше, по мере роста потребностей, можно открывать другие позиции, увеличивая штат. Задачи второго уровня на схеме (рис. 4) распределяются между инженерами данных (Data engineer) и архитекторами данных (Data architect), а те, что обозначены голубым и розовым цветом, – между аналитиками (Data analyst) и специалистами по данным (Data Scientist).
Первую пару разделить достаточно просто: архитектор проектирует то, чем потом пользуется инженер. То есть архитектор создает систему правил, политик, стандартов и моделей сбора, использования и хранения информации. А следом за ним вступает в работу инженер, внедряя и обслуживая конвейер данных согласно плану.
Со второй парой чуть сложнее, так как их сферы ответственности пересекаются, а еще Data Scientist часто тоже называют аналитиком, как и Data analyst. Тем не менее они отличаются.
Аналитик (Data analyst) чаще всего не строит прогнозы: он ищет закономерности и тенденции в данных, делает выводы и передает полученные результаты другим сотрудникам. Для этого он визуализирует информацию, то есть использует графики и диаграммы.
Выводы аналитика помогают находить закономерности, на основе которых другие отделы – продажи, финансы, маркетинг и так далее – принимают правильные решения.
Специалист по данным (Data Scientist), в свою очередь, подробнее изучает и расписывает результаты аналитиков. Он не просто ищет взаимосвязи, а пытается понять причины тех или иных явлений, определить факторы, влияющие на изменение данных. Кроме того, он может моделировать задачи и затем создавать прогнозы. Его суперсила – умение вычленять из информации сокрытое, находить неизвестные ранее закономерности.
Организации часто нанимают сначала аналитика, а после уже – специалиста по данным, чтобы он сконцентрировался на самых трудоемких задачах.
Теперь у нас в аналитическом отделе четыре специальности, четыре сферы ответственности: их легко запомнить, если провести аналогию с процессом строительства.
Архитекторы данных – это те же самые архитекторы, что проектируют здание и все его системы.
Инженеры данных – строители. Они претворяют в жизнь план архитектора.
Аналитики – это арендаторы помещений: используют построенное, чтобы удовлетворять потребности других отделов.
А специалисты по данным – это те люди, которые понимают, как все работает на детальном уровне. Это дает им возможность контролировать работу объекта: они делают замеры, снимают показания счетчиков и следят за порядком.
Разумеется, это не финальная версия аналитического отдела. По мере того как усложняются задачи и разрастаются отдельные этапы жизненного цикла информации, создаются новые рабочие места и появляются новые специальности: собственные разработчики, администраторы баз данных, проджект-менеджеры и другие. Мы вернемся к ним в пятой части книги, когда вы уже хорошо разберетесь с основными инструментами и задачами, которые в целом должен решать аналитический отдел. И тогда уже поговорим подробнее о необходимых компетенциях каждого специалиста, а также более предметно разберем их должностные обязанности.
А сейчас переходим к следующей большой теме: как организовать хранение данных.
Начислим
+17
Покупайте книги и получайте бонусы в Литрес, Читай-городе и Буквоеде.
Участвовать в бонусной программе