Цитата из книги «Революция в аналитике. Как в эпоху Big Data улучшить ваш бизнес с помощью операционной аналитики»

Одна из причин использовать Hadoop заключается в том, что данные неравноценны по своей природе. Например, данные об операциях по текущим банковским счетам отражают реальный факт перемещения денег, тогда как пост на Twitter – всего лишь чье-то мнение. Твиты далеко не так ценны, как сведения о финансовых транзакциях, поэтому нет смысла хранить их в дорогостоящей системе, где они скорее всего редко будут использоваться. Hadoop же позволяет организациям хранить малоценные данные на тот случай, если вдруг они пригодятся. Также в ней можно хранить необработанные лог-файлы, из которых извлечены фрагменты с важной информацией. Благодаря архивированию необработанных файлов в Hadoop всегда можно вернуться к ним позже и извлечь из них дополнительную информацию, если в ней возникнет необходимость. Использование Hadoop для целей архивирования похоже на непрерывное резервное копирование файлов с последующим легким к ним доступом – вместо неудобной заправки ленты. Наконец, архивирование необработанных данных может очень пригодиться в случае аудиторских проверок или возникновения юридических вопросов.
Другие цитаты
Возрастное ограничение:
12+
Дата выхода на Литрес:
01 января 2016
Дата перевода:
2016
Дата написания:
2014
Объем:
431 стр. 36 иллюстраций
ISBN:
978-5-9614-4132-1
Переводчик:
Правообладатель:
Альпина Диджитал
Формат скачивания: