Как увеличить производительность корпоративного хранилища?
Заказчик

Заказчиком выступила компания, оказывающая услуги по процессингу операций с банковскими платежными карточками, в том числе авторизацию карточных операций, ведение идентификационных баз данных карточек, банкоматов и терминалов, персонализацию карточек, процессинг и клиринг операций с карточками платежных систем.

Проблема

В рамках проекта перед специалистами стояла инженерная задача по созданию хранилища исторических данных из различных систем-источников, объем генерируемых данных в которых достигал сотни миллионов операций (записей) в день.

Кроме этого, компания-заказчик для формирования отчетности, применяемой при принятии управленческих решений, использовался в том числе ручной сбор и агрегация данных из трех различных источников, методология сбора из которых не была согласованной и отличалась в зависимости от исполнителя операции. В рамках проекта специалисты Invento Labs должны были спроектировать и внедрить BI-платформу, состоящей как из статических, так и из аналитических отчетов, которая позволяла бы в автоматическом режиме получать оперативные данные в короткие сроки.

Решение

Первым, на что обратили свое внимание специалисты Invento Labs, был выбор необходимого инструментария. 

В качестве хранилища исторических данных архитекторами Invento Labs было предложено использовать распределенную базу данных MPP GreenPlum. Предлагаемое программное обеспечение снимало ряд проблем и предоставляло дополнительные преимущества:

После разворачивания MPP GreenPlum команда Invento Labs приступила к разработке  процессов сбора, трансформации и агрегации данных (ELT/ETL) на базе open-source решения Apache Airflow.

Для реализации визуализации аналитической отчетности были выбраны продукты, обеспечивающие решение различных задач:

Технологии
MPP GreenPlum
Apache Airflow
Tableau
ReportServer
Результат

В результате внедрения предложенного решения для хранилища исходных данных и BI-платформы Заказчик смог: