Комментарии по теме

«Игровой ролик: SAP для Retail»
Александр Дублин:
Суть ролика: если хотите спать в рабочее время, унижать подчиненных, то с решением от SAP вам это будет удобно. Сценарий ролика - продолжения истории: top-lap.livejournal.com/502664.html
«Авто­ма­ти­за­ция те­сти­ро­ва­ния BEx-о­тче­тов»
бабкен минасян:
Очередная реализация sendkey. Пробовал подобное для другой задачи автоматизации - эмуляция действий пользователя по массовому переводу пользователей в домен. Жуткая штука! При работе скрипта...
«Авто­ма­ти­за­ция те­сти­ро­ва­ния BEx-о­тче­тов»
Сергей Трофимик:
Столкнулся с трудностью, возможно, подскажете как ее обойти. Ввод пароля не проходит. Даже смещение по полям в данном окне не возможно.   WinWaitActive("Вкл. SAP-Logon BRD") Send("пароль")

База знаний

Вы можете подписаться на эту колонки этого автора, если авторизируетесь или зарегистрируетесь

Ритэйл ориентированные хранилища данных (ч.2 Сервер).

02 февраля 2012, 12:42

Итак, решение о внедрении ХД принято.
Ключевые пользователи будущей системы опрошены, проблемы локализованы, цели внедрения обозначены, показатели успешного выполнения проекта KPI определены, самое время задуматься о приобретении хорошего сервера.

Мысль, с которой, увы придется смириться при внедрении ХД для ритейла – ресурсов сервера всегда будет мало. Причина кроется не только в большом объеме данных, но и в пользователях системы! Работая в старых системах бизнес-пользователи часто лишены возможности проводить оперативный анализ данных и довольствуются выборками, которые готовит им ИТ, часто с большим запаздыванием. При  внедрении ХД все данные становятся доступны для анализа в любой момент времени, открываются перспективы выполнения сравнительного анализа разных периодов, появляется возможность выявления закономерностей, анализа рекламных и маркетинговых мероприятий по всей торговой сети, появляется возможность выполнять OLAP анализ и «проваливаться» до первичных документов учетных систем. Аппетит бизнеса начинает расти по мере появления данных в информационном хранилище.

Исходя из такой тенденции, в основу выбора серверных мощностей должны лечь возможность их дальнейшего наращивания и масштабирования. Один из вариантов гибкого решения, который не стоит сбрасывать с рассмотрения – размещение ХД на удаленном хостинге в специализированном Дата-центре. Вариант удаленного хостинга имеет немаловажное преимущество для перспективы перехода на технологию InMemory (SAP HANA), в этом случае, задачи обеспечения ИТ инфраструктуры могут успешно решаться хостинг-провайдером.

Для успешного подбора серверного оборудования желательно сразу определиться с количественным составом различных категорий  пользователей, т.к. выполняемые ими в ХД действия определяют приоритет смещения производительности.

Матрица №1 «Категории потребителей системы»
Тип пользователей % от общего числа пользователей* Вид активности Готовые статические  отчеты Отчеты с возможностью OLAP анализа Первичные документы

Число пользова

телей

Эксперты, бизнес-аналитики <5% Глубокий анализ данных 10% 30% 60%  
Бизнес-пользователи 25% Регулярное формирование  отчетов и анализ данных 50% 50%    
Пользователи 70% Работа с готовыми отчетами, редкий анализ данных 80% 20%    

    * - Проценты могут меняться в зависимости от организации бизнес-процессов компании и является в данном примере справочным.

Второй существенный момент, требующий обязательного учета при расчете производительности серверов – это средняя и пиковая нагрузка на сервер, выраженная в количестве записей данных, которые необходимо системе загрузить за выделенный промежуток времени (это может быть  поток POS данных, поток документов движения материалов, финансовый поток).

Тип действия
(Загрузка данных)
Тип загрузки
(средняя или пиковая)
интервал времени (год, период, час) Число записей за период Start время периода
загрузки
Stop время периода загрузки

 

Своевременное понимание пиковой и средней нагрузки на этапе подготовки к внедрению, когда проводится тендер по выбору информационной системы хранения данных, позволяет правильно сформулировать требования к серверному оборудованию и производительности системы в целом.

Не забывайте о пиках возникающих в предпраздничные периоды.

При оценке нагрузок, необходимо закладывать требования по максимально допустимому интервалу времени, отводимому на загрузку данных (обычно требование формулируется таким образом, чтобы за ночь, с 23.00 до 06.00 все данные сети были собраны и загружены в систему).
Примеры конфигураций серверов для Retail ориентированных ХД:
 

Торговая сеть магазинов и гипермаркетов формата «Товары для дома» - 84 магазина
Сервер: SUN SPART M5000
CPU - выделено 40 ядер
RAM – 48Gb
HDD – дисковый массив 4Gbps, использовано 1,7Tb (2 года работы)


Торговая сеть магазинов бытовой техники – 27 магазинов
Сервер: HP BL485 (x86)
CPU – выделено 62 ядра
RAM - 96Gb
HDD – дисковый массив 4Gbps, использовано 500Gb (6 месяцев работы)


Расчет дискового пространства лучше проводить в два этапа:
•    Сначала выполнить предварительный расчет исходя из тех данных и их объемов, которые планируются для хранению в ХД.
•    Второй, повторный расчет необходимо выполнить позже, опираясь на результаты  проектирования и реализации задач ХД, т.е. на этапе тестирования реализации. На этот момент становятся известны все промежуточные структуры хранения данных, используемые в ETL преобразовании.

Для выполнения такого расчета, в частности для хранилища данных SAP BW, потребуется  информация, которая может быть получена на этапе обследования потребностей Заказчика исходя из результатов опроса будущих пользователей системы.
 

Для информационных кубов:

Число измерений куба Число показателей куба Число инициали-зирующих записей Число записей загружаемых за одну периодическую загрузку % Доля мастер данных в кубе Среднее число уникальных записей % доля показателей с высокой степенью детализации % доля показателей с одним уникальным значением

Для объектов хранения данных:

Количество числовых полей Количество символьных полей Средняя длина символьных полей в байтах Флаг «Объект оптимизирован для записи» Число инициали-зирующих записей Число записей загружаемых за одну периодическую загрузку Число загрузок которые будут храниться в объекте

Как видно из данных таблиц, более или менее точный расчет требований к дисковому пространству может быть выполнен только на том этапе, когда разработка основной инфраструктуры ХД уже завершена.

Ролевое назначение : Руководитель / Manager

Функциональная область : Информационные технологии / IT, Basis, ABAP, Бизнес аналитика / BI

Ключевые слова : Business Information Warehouse, SAP for Retail