Меню

Введение в SAP HANA Enterprise Information Management (EIM): новый способ загрузки данных в SAP HANA

Изучите, что нужно сделать для настройки задачи в SAP Enterprise Information Management (EIM) для реплицирования в реальном времени и настройки потока данных в SAP HANA из внешней базы данных. Узнайте как интегрировать преобразования Smart Data Integration и Smart Data Quality в EIM для очистки, соединений и других обработок данных через SAP HANA studio или в облаке.

Ключевое понятие

Support Package 9 для SAP HANA содержит новый инструментарий, SAP HANA Enterprise Information Management (EIM). Используя его, можно загружать, обрабатывать и очищать данные из других баз данных перед загрузкой в SAP HANA.

   

SAP Enterprise Information Management (EIM) представляет собой новый инструментарий встроенный в SAP HANA и предназначенный для extraction, transformation, and loading (ETL) совмещенный с существующей технологией репликации данных SAP HANA использующей SAP Replication Server (SRS) Этот инструмент добавляется к длинному списку инструментов SAP предназначенных для загрузки данных в SAP HANA. Существующие ранее инструменты включают Direct Extraction Connection (DXC), SAP Landscape Transformation (SLT), SAP BusinessObjects Data Services (BODS) и SRS как отдельный инструмент.

Хотя я не занимаюсь управлением продуктами в SAP, очевидно, что SAP HANA EIM, как и любой новый продукт, все еще развивается. В своем текущем состоянии он представляет собой инструментарий с графическим интерфейсом для построения трансформаций работающий совместно с репликацией в реальном времени и является достаточно удобным инструментом. Замечу, что ИТ ландшафт значительно различается в разных компаниях. Я надеюсь (и SAP тоже), что скоро все компании перейдут на SAP HANA. Но до этого момента компании будут использовать гетерогенный ландшафт с различающимися базами данных и не-SAP приложениями. Я уверен, что существуют более сильные руководства по позиционированию где-нибудь на SAP.com но я не смог найти их. Поэтому, мне кажется, что если ваш проект сильно зависит от SAP HANA, то лучше использовать SAP HANA EIM везде, где его функциональность (описанная в Документация по SAP HANA EIM) соответствует вашим потребностям, так как он включает множество функций по очистке и преобразованию данных SAP data services вместе с мощью репликации в реальном времени SRS.

Причины, по которым возможно вы не захотите его использовать (по состоянию на май 2015) это, к примеру, отсутствие поддержки всех баз данных как источников данных. Еще одна причина — это то, что поток данных строится на уровне таблиц и представлений, что означает невозможность использования экстракторов BW (как это возможно в SAP Data Services (BODS)) По этим и другим причинам связанным с загрузкой данных в SAP HANA, SAP продолжает поддерживать существущие инструменты DXC, SLT, SRS, and BODS.

Шаги по первоначальной настройке и установке SAP HANA EIM

Как и другие продукты SAP HANA, SAP HANA EIM сначала требует установки различных программных компонентов, затем присвоения ролей, содержащих полномочия, пользователям, которые будут осуществлять моделирование в EIM. Лучший перечень задач, которые необходимо выполнить для установки и настройки EIM можно найти здесь: SAP HANA EIM Master Guide. Можно начать с просмотра списка задач содержащихся в табл. 8этого руководства, фрагмент которого показан на рис. 1.

   

Рис. 1. Список (неполный) задач по установке и использованию SAP HANA EIM

   

Как можно понять из списка задач, в столбце «Где найти дополнительную информацию» приведен список руководств, которые дадут вам источники информации для детального описания шагов по установке и использованию SAP HANA EIM. Некоторые шаги опциональны в зависимости от того, какие именно функциональности SAP HANA EIM вы планируете использовать.

После установки необходимо выполнить несколько тривиальных задач по разработке. Среди них создание депозитария для совместного использования наработок с коллегами и создание проекта. Т.к. эти шаги не являются специфичными для SAP HANA EIM, я не буду подробно описывать их. Вкратце, они включают:

  1. В перспективе моделирования, нужно создать пакет для упорядочения контента.
  2. Переключиться на перспективу разработок SAP HANA.
  3. Переключиться на закладку репозитария в перспективе разработки и создать репозиторий с местом хранения по умолчанию для временного хранения объектов перед активацией
  4. И последнее, создать проект в родительской папке (т.е. пакет созданный на шаге 1) на закладке Project Explorer в перспективе разработки.

Рис. 2 показывает эти установки по умолчанию. В частности, на нем показан проект разработки связанный с системой SAP HANA. Этот проект в пакете названном I008705.

Рис. 2. Проект разработки подготовленный для SAP HANA EIM

  

Теперь у вас есть папка для размещения вашей работы, далее перейдем к сути проекта: схема данных (flowchart) SAP HANA EIM.

Примечание

Для более подробной информации о настройке разработки, перейдите по ссылке показанной на рис. 2 или посетите обучение SAP HA350 SPS 09 Training Class. 

    

Создание схемы данных SAP HANA EIM

Настройка интеграции между PPM и Solution SAP HANA EIM моделируется в объекте схемы данных. Ближайшая аналогия к схеме данных — это веб-версия потока данных BODS. Схема данных это контейнер, который содержит пошаговый ETL процесс, который и составляет SAP HANA EIM. Для создания схемы данных откройте проект разработки и (через контекстное меню) выбрать New > Other. Далее раскрыть опцию SAP HANA Database Development для получения доступа к списку доступных мастеров (wizards) (рис. 3). Выберите пункт Flowgraph Model и нажмите кнопку Next.

Рис. 3. Создать новую flowgraph model к пакету SAP HANA EIM

  

Это откроет экран, где будет предложено ввести имя файла (к примеру nedf1) и система добавит тип файла hdbflowgraph к имени (показано на рис. 4). Дополнительно, я выбрал Flowgraph for Activation as Task Plan. С этой опцией можно использовать репликацию в реальном времени, наряду с прочими опциями детально описанными в SAP HANA EIM Configuration Guide.

Рис. 4. Определение имени файла для SAP HANA flowgraph model

  

Нажмите кнопку Finish, после которой будет переход к Application Function Modeler GUI для сборки ETL процесса (рис. 5). Начальный экран, показанный на рисунке, содержит свойства в целом для модели. Каждый следующий узел в ETL процессе будет иметь собственные свойства обработки, как я расскажу позже.

Рис. 5. Общие установки контейнера для SAP HANA EIM flowgraph

  

На этой первой панели свойств контейнера можно определить используемую схему. Есть выбор запускать данную задачу как репликацию в реальном времени (выбором опции Realtime). В данном случае я не устанавливал данную опцию, но если вы хотите узнать больше об этом, вот здесь есть хорошее видео HANA Academy: ECC Replication.

Перед тем, как продолжить построение flowgraph, необходимо выполнить один подготовительный шаг. Необходимо создать ссылку на таблицу в удаленной системе — так называемую виртуальную таблицу. Для этого необходимо во-первых установить связь с удаленным источником данных. В данном случае я буду использовать предварительно настроенный удаленный источник, HPM_800 ( систему ECC запущенную на Oracle ). Детальное описание этого шага выходит за рамки данной статьи, но я включил снимок экрана и путь к удаленному источнику на рис. 6 для иллюстрации.

Оформите подписку sappro и получите полный доступ к материалам SAPPRO

У вас уже есть подписка?

Войти