Цитаты из книги «Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики», страница 2

Если при исследовании 20 000 факторов устанавливается уровень доверия в 99 %, то можно ожидать, что 200 совершенно ложных факторов будут признаны статистически значимыми.

Еще одна тенденция последнего времени – увеличение количества потоковых данных, особенно в связи с развитием датчиков и Интернета вещей. Потоковые данные часто бывают структурированными и, как следует из названия, представляют собой непрерывный, быстрый и крупномасштабный поток. Для их обработки используется, в частности, такая набирающая популярность дисциплина, как обработка сложных событий (CEP). При этом подходе CEP анализирует данные по мере их поступления и часто еще до того, как они загружаются в хранилище. Идея состоит в том, чтобы анализировать данные во время их перемещения из источника к месту хранения и таким образом максимально сократить время на принятие решений. Аналитика в CEP может включать в себя большинство других аналитических дисциплин. Отличие CEP в том, что аналитика здесь применяется максимально быстро и за пределами традиционных окружений. По своей природе CEP предназначена для применения в операционных целях.

Оптимизация нацелена на поиск вариантов, которые позволяют наилучшим образом достичь поставленной цели с учетом

широкого разнообразия факторов и ограничений. Если моделирование по методу Монте-Карло позволяет исследовать и количественно оценить множество различных вариантов, то цель оптимизации – найти оптимальный вариант.

В последнее время все более широкое применение находит моделирование. В частности, особенно популярно моделирование по методу Монте-Карло. В основе его лежит очень простая концепция и, если вы прибегали к пенсионному планированию, то, скорее всего, применяли этот метод. Для того чтобы спрогнозировать пенсионные накопления, необходимо учесть множество допущений, например:

• Какова будет средняя годовая доходность инвестиций?

• Насколько волатильной будет доходность на протяжении рассматриваемого периода времени?

• Каким будет темп инфляции?

При моделировании по методу Монте-Карло исследуется широкий спектр комбинаций допущений по всему диапазону возможных значений. Какие сценарии приведут к хорошим результатам, позволив достичь намеченных финансовых показателей, а какие к плохим?

Смоделировав тысячи или даже миллионы сценариев, процесс Монте-Карло обозначает распределение успехов и неудач. В идеале широкий диапазон разумных допущений должен привести к положительному исходу. Если этого не произойдет, то намеченная цель может быть попросту нереалистичной.

Вы не можете наладить производство миллионов штук печенья с шоколадной крошкой без рецепта и налаженного производственного процесса. Рецепт можно будет разработать, а процесс наладить путем тестирования на мелких партиях. Аналогичный подход применяется и в операционной аналитике. Сначала нужно создать работающий базовый процесс, а уже затем превращать его в операционный.

Операционная аналитика сосредоточена на обработке данных и принятии решений в режиме реального времени и, как правило, применяется к конкретному клиенту, продукту или двигателю именно в тот момент, когда это необходимо. Тем самым она отличается от пакетной аналитики, где данные по всем клиентам, продуктам или двигателям анализируются одновременно в виде единого пакета и в произвольное время.

Еще одна популярная парадигма – модель SEMMA, разработанная компанией SAS Institute[62]. Аббревиатура SEMMA расшифровывается как sample (отобрать), explore (исследовать), modify (модифицировать), model (моделировать) и assess (оценить). На веб-странице SEMMA говорится: модель предполагает, что бизнес-задача уже определена, а внедрение рассматривается как дополнение завершающей фазы.

Политика конфиденциальности должна стать гораздо более гибкой с тем, чтобы позволить клиентам выражать свои предпочтения. Сегодня уже недостаточно иметь простой перечень, озаглавленный «Не звонить» или «Не отправлять имейлы». Возможно, я не хочу

получать звонки или письма с предложением не интересующих меня продуктов, но хотел бы получать информацию о возможностях обновления продуктов, которыми уже владею.

Например, мой банк может звонить мне, чтобы предложить более выгодную схему ипотечного кредита по сравнению с той, что у меня уже есть, но я не хочу, чтобы мне звонили по поводу сберегательного счета.

Большие данные становятся Большим Братом? Ваш оператор сотовой связи точно знает, где вы были. Если вы регулярно пользуетесь приложениями с функцией геолокации на вашем смартфоне, то поставщики этих приложений также знают, где вы побывали. Ваш провайдер электронной почты, возможно, хранит копии всех полученных и отправленных вами писем. Ваш провайдер кабельного или спутникового телевидения знает, что вы смотрели, какие рекламные ролики пропустили и когда нажимали на паузу. Ваша кредитная история в файлах у многих организаций, и ваша история болезни оцифровывается все чаще. Теперь вы представляете себе общую картину: все больше и больше третьих лиц узнают о вас все больше и больше, чем когда-либо прежде.

После обнаружения инсайта, достойного превращения его в операционный, процесс операционализации будет повторяться тысячи или миллионы раз в день. В этом случае на счету будет каждая секунда, если не миллисекунда. Следовательно, имеет смысл потра-

тить дополнительные часы, дни и даже недели на отладку и оптимизацию этого процесса, чтобы добиться максимальной скорости и кратчайшего времени выполнения. Дополнительные усилия позволят повысить производительность миллионов операций и поэтому потребуют очень малых затрат, если распределить их между всеми случаями выполнения процесса. Однако такие действия должны выполняться только тогда, когда подтверждена их окупаемость.

Возрастное ограничение:
12+
Дата выхода на Литрес:
01 января 2016
Дата перевода:
2016
Дата написания:
2014
Объем:
431 стр. 36 иллюстраций
ISBN:
978-5-9614-4132-1
Переводчик:
Правообладатель:
Альпина Диджитал
Формат скачивания: