Пример дорожной карты для создания хранилища данных
Опубликовано: 2018-03-30Хранилище данных, метод объединения всех ваших организационных данных в одном месте для более легкого доступа и лучшей аналитики, является мечтой каждого заинтересованного лица. Однако настройка хранилища данных — довольно сложная задача, и еще до того, как вы сделаете первые шаги, вы должны быть абсолютно уверены в ответе на эти два вопроса:
- Цели вашей организации
- Ваш подробный план создания хранилища данных
Любой из этих вопросов, если оставить его без ответа, может дорого стоить вашей организации в долгосрочной перспективе. Это относительно новая технология, и вы создадите много возможностей для ошибок, если не будете знать о конкретных потребностях и требованиях вашей организации. Эти ошибки могут сделать ваш склад очень неточным. Что еще хуже, ошибочное хранилище данных хуже, чем отсутствие данных вообще, и незапланированная стратегия может в конечном итоге принести вам больше вреда, чем пользы.
Поскольку существуют разные подходы к разработке хранилищ данных, и каждый из них зависит от размера и потребностей организаций, невозможно создать универсальный план.
Сказав это, давайте попробуем составить пример дорожной карты, которая поможет вам разработать надежное и эффективное хранилище данных для вашей организации:
Оглавление
Настройка хранилища данных
Хранилище данных чрезвычайно полезно при организации больших объемов данных для эффективного извлечения и анализа. По той же причине необходимо проявлять крайнюю осторожность, чтобы обеспечить быстрый доступ к данным. Одним из подходов к проектированию системы является использование многомерного моделирования — метода, который позволяет эффективно и быстро запрашивать и анализировать большие объемы данных. Поскольку большинство данных, присутствующих в хранилищах данных, являются историческими и стабильными — в некотором смысле они не изменяются часто, вряд ли есть необходимость в использовании повторяющихся методов резервного копирования. Вместо этого после добавления каких-либо данных можно сразу выполнить резервное копирование всего хранилища вместо регулярного резервного копирования.
Инструменты для хранения данных можно условно разделить на четыре категории:
- Инструменты извлечения,
- инструменты управления таблицами,
- Инструменты управления запросами и
- Инструменты целостности данных.
Каждый из этих инструментов очень удобен на разных этапах разработки хранилища данных. Исследования с вашей стороны помогут вам больше узнать об этих инструментах и позволят вам выбрать те, которые соответствуют вашим потребностям.
Ключевые понятия хранилища данных: обзор
Теперь давайте рассмотрим пример дорожной карты, которая поможет вам создать более надежное и содержательное хранилище для вашей организации:
Оцените свои цели
Первым шагом в настройке хранилища данных вашей организации является оценка ваших целей. Мы упоминали об этом ранее, но мы не можем не подчеркнуть этого достаточно. Большинство организаций теряют ценную информацию только потому, что им не хватает четкого представления о задачах, требованиях и целях своей компании. Например, если вы представляете компанию, стремящуюся к своему первому значительному прорыву, вы можете захотеть вовлечь своих клиентов в установление взаимопонимания, поэтому вам нужно будет следовать другому подходу, чем организация, которая хорошо зарекомендовала себя и теперь хочет использовать хранилище данных для улучшения своей работы. Внедрение собственного хранилища данных — это большой шаг для любой организации, и его следует выполнять только после должной осмотрительности с вашей стороны.
Анализировать существующие технологические системы
Задавая своим клиентам и бизнес-партнерам конкретные вопросы, вы можете получить представление о том, как работает ваша текущая техническая система, с какими проблемами она сталкивается и какие улучшения возможны. Кроме того, они могут даже узнать, насколько подходит их текущий стек технологий, тем самым эффективно решая, следует ли его сохранить или заменить. Различные отделы вашей организации могут способствовать этому, предоставляя отчеты и отзывы.
Наиболее распространенные примеры интеллектуального анализа данных
Информационное моделирование
Информационная модель представляет собой представление данных вашей организации. Он концептуален и позволяет сформировать представление о том, какие бизнес-процессы должны быть взаимосвязаны и как их связать. Хранилище данных в конечном итоге будет набором коррелирующих структур, поэтому важно концептуализировать индикаторы, которые необходимо связать вместе, и создать методы максимальной производительности — это то, что известно как информационное моделирование. Самый простой способ разработать эффективную информационную модель — собрать ключевые показатели эффективности в таблицы фактов и связать их с различными параметрами, такими как клиенты, сотрудники, продукты и т. д.

Изучите курсы по науке о данных в лучших университетах мира. Участвуйте в программах Executive PG, Advanced Certificate Programs или Master Programs, чтобы ускорить свою карьеру.
Проектирование склада и отслеживание данных
После того, как вы собрали информацию о своей организации и подготовили эффективную информационную модель, настало время перенести ваши данные в хранилище и отслеживать его производительность. На этапе проектирования важно спланировать, как связать все данные из разных баз данных, чтобы информация могла быть взаимосвязана, когда мы загружаем ее в таблицы нашего хранилища данных. Инструменты ETL могут потребовать много времени и денег, и для их успешного внедрения могут потребоваться специалисты. Поэтому важно знать, какие инструменты нужны в нужное время, и выбирать наиболее экономичный из доступных вариантов. Хранилище данных занимает значительный объем дискового пространства, поэтому вам необходимо спланировать, как архивировать данные с течением времени. Один из способов сделать это — сохранить систему хранения данных с тройной детализацией (мы поговорим об этом позже). Однако проблема детализации заключается в том, что зернистость данных будет откладываться на определенный период. Таким образом, вы должны проектировать свою систему таким образом, чтобы разная степень детализации соответствовала определенной структуре данных.
Выполнить план
Теперь, когда вы разработали свой план и связали фрагменты данных вместе, пришло время реализовать вашу стратегию. Внедрение Data Warehouse — это грандиозный шаг, и существует жизнеспособная основа для планирования проекта. Проект должен быть разбит на части и выполняться по одной части за раз. Рекомендуется определить этап завершения для каждого фрагмента задачи и, наконец, сопоставить все биты после завершения. При такой систематической и продуманной реализации ваше хранилище данных будет работать намного эффективнее и предоставлять столь необходимую информацию, необходимую на этапе анализа данных.
Что такое хранилище данных и интеллектуальный анализ данных
Обновления
Ваше хранилище данных готово выдержать испытания временем и точностью. Он должен оставаться согласованным в течение длительного времени и на многих уровнях детализации. На этапе проектирования установки вы можете выбрать различные планы хранения, связанные с неповторяющимся обновлением. Например, ИТ-менеджер может настроить системы ежедневного, еженедельного или ежемесячного хранения зерна. В дневном зерне данные могут храниться в исходном формате, в котором они были собраны, могут храниться 2-3 года, после чего их необходимо обобщить и перенести в недельное зерно. Теперь данные могут оставаться в недельной зернистой структуре в течение следующих 3-5 лет, после чего они будут перемещены в месячную зернистую структуру.
Следование вышеупомянутой дорожной карте гарантирует, что вы находитесь на правильном пути в предстоящей долгой гонке. Если у вас есть какие-либо вопросы, не стесняйтесь оставлять их в комментариях ниже.
Что такое хранилище данных?
Хранилище данных — это своего рода система управления данными, предназначенная для облегчения и поддержки бизнес-аналитики и аналитики.
Хранилища данных позволяют выполнять логические запросы, создавать надежные модели прогнозирования и выявлять важные тенденции в вашей компании. в
Сколько времени занимает создание хранилища данных?
Время — это распространенная проблема, связанная с хранением данных и бизнес-аналитикой на рынке. Хотя цифры спорны, давайте придерживаться традиционного понимания того, что хранилищам данных часто требуется много времени, чтобы увидеть результаты.
Затраты времени на настройку аналитики просто слишком велики. Время, необходимое для создания хранилища данных, может варьироваться от 12 до 24 месяцев. Но это того стоит, поскольку успешные проекты хранилища данных могут полностью изменить процессы и видение организации. У них есть возможность пролить свет на проблемы, указать путь к новым перспективам и помочь сотрудникам на всех уровнях улучшить свою повседневную работу.
Каковы некоторые из наиболее важных функций хранилища данных?
Некоторые из основных компонентов типичного хранилища данных:
1. Центральная база данных. Краеугольным камнем вашего хранилища данных является база данных. Это были обычные реляционные базы данных, которые можно было использовать локально или в облаке. Тем не менее, базы данных в оперативной памяти быстро набирают популярность в результате больших данных, необходимости реальной скорости в реальном времени и значительного снижения стоимости оперативной памяти.
2. Интеграция данных. Различные технологии интеграции данных, такие как ETL (извлечение, преобразование, загрузка), репликация данных в режиме реального времени, обработка массовой загрузки, преобразование данных, качество данных и т. д., используются для сбора данных из исходных систем и их изменения таким образом. что он готов к быстрому аналитическому потреблению.
3. Метаданные: в нем подробно описаны наборы данных в источнике вашего хранилища данных, использование, значения и другие характеристики. Есть бизнес-метаданные, которые придают смысл вашим данным, и технические метаданные, которые объясняют, как получить доступ к данным, например, где они хранятся и как они организованы.
4. Инструменты доступа к хранилищу данных. Пользователи могут взаимодействовать с данными в вашем хранилище данных с помощью таких инструментов доступа, как инструменты запросов и отчетов, инструменты разработки приложений, инструменты интеллектуального анализа данных, инструменты OLAP и т. д.