Комментарии по теме

«Ре­ко­ме­нда­ции по обе­спе­че­нию бе­зо­па­сно­сти и контроля SAP HANA»
Дмитрий Буслов:
(1) Автор начинает с того, что HANA — это СУБД, позволяющая хранить записи в колонках и работающая в оперативной памяти. Я бы, хотел сделать акцент на том, что HANA — не просто СУБД,...
«Различие между двумя текущими версиями HANA»
Олег Точенюк:
Спасибо конечно... я вот не понимаю как консалт выживает в этом мире, когда есть такой чудесный традиционный сайт help.sap.com/ :-)
«Упрощаем работу с ADBC»
Леонид Мартынов:
Спасибо за отзыв!   Я согласен для HANA актуальна  HANA studio. Но я имел опыт с тем, что например доступ к ней разработчик по каким-либо причинам не имеет, а новый Open SQL не поддерживает...

Интеллектуальный анализ данных в HANA

2572

Введение.

HANA - платформа современного предприятия. А раз так, значит возникает вопрос: как обстоят дела с интеллектуальной обработкой данных?  Как из сырых данных получить действительно важную и интересную бизнесу информацию? Быстро обработать данные, проводить стихийных анализ и т.п. на текущий момент достаточно большинству, но что делать тем, кто хочет больше?
Предлагаю рассмотреть возможности, которые есть в HANA:

  1. AFL-PAL
  2. Возможность вызова процедур написанных на R

Первая возможность

Устанавливается библиотека AFL  (Application Function Library) которая включает библиотеку PAL (Predictive Analysis Library)
Библиотека AFL представляет из себя частично набор хранимых процедур в базе данных HANA, а частично наблор шаблонов, а процедуры ещё необходимо сгенерировать[1]. Для этого сначала создаются две процедуры afl_wrapper_generator и afl_wrapper_eraser , а уже потом с их помощью создаются PAL – процедуры. Более подробную информацию можно найти в мануалах на help.sap.com

У человека, который первый раз видит такой механизм, возникает закономерный вопрос, - «Зачем это сделано так?». Ответ на него крайне прост. Потому что, когда генерируется процедура – её имя указывается имя как новое. То есть разные версии могут использовать разные процедуры на основе единого шаблона. Также, данные процедуры обслуживает отдельный сервис HANA – scripserver.Это сделано для обеспечения большей стабильности.

Библиотека PAL включает в себя целый список различных алгоритмов по кластеризации, классификации, ассоциации, анализу отклонений и т.д.
Список дополняется и расширяется с каждым следующим Service Pack-ом.

Тот же Predictive Analysis умеет использовать  эти процедуры, тем самым перенося всю логику вычислений на уровень БД.

Вторая возможность

Использовать язык R (язык программирования для статистической обработки данных). В HANA можно писать процедуры на языке R и вызывать их.

Стоит поподробнее описать возможности этого языка, потому что R – это язык, распространяемый бесплатно. Он очень активно используется для статистического анализа. На хабре есть куча статей по нему, вплоть до статей о том, как проанализировать те же статьи на хабре.

Использование BO Predictive Analysis

В Predictive Analysis визуализация возможна «своя», а возможна с использованием языка R (Рис 1).

Ограниченный доступ

Для прочтения полной версии статьи необходимо зайти как зарегистрированный пользователь.


Любое воспроизведение запрещено.
Копирайт © «Издательство ООО «Эксперт РП»