Заказчиком выступила компания, оказывающая услуги по процессингу операций с банковскими платежными карточками, в том числе авторизацию карточных операций, ведение идентификационных баз данных карточек, банкоматов и терминалов, персонализацию карточек, процессинг и клиринг операций с карточками платежных систем.
В рамках проекта перед специалистами стояла инженерная задача по созданию хранилища исторических данных из различных систем-источников, объем генерируемых данных в которых достигал сотни миллионов операций (записей) в день.
Кроме этого, компания-заказчик для формирования отчетности, применяемой при принятии управленческих решений, использовался в том числе ручной сбор и агрегация данных из трех различных источников, методология сбора из которых не была согласованной и отличалась в зависимости от исполнителя операции. В рамках проекта специалисты Invento Labs должны были спроектировать и внедрить BI-платформу, состоящей как из статических, так и из аналитических отчетов, которая позволяла бы в автоматическом режиме получать оперативные данные в короткие сроки.
Первым, на что обратили свое внимание специалисты Invento Labs, был выбор необходимого инструментария.
В качестве хранилища исторических данных архитекторами Invento Labs было предложено использовать распределенную базу данных MPP GreenPlum. Предлагаемое программное обеспечение снимало ряд проблем и предоставляло дополнительные преимущества:
После разворачивания MPP GreenPlum команда Invento Labs приступила к разработке процессов сбора, трансформации и агрегации данных (ELT/ETL) на базе open-source решения Apache Airflow.
Для реализации визуализации аналитической отчетности были выбраны продукты, обеспечивающие решение различных задач:
В результате внедрения предложенного решения для хранилища исходных данных и BI-платформы Заказчик смог: