¿Qué es Business Intelligence?

Más que una definición de diccionario, me gustaría tratar de explicar los componentes, características y ventajas de un sistema de Business Intelligence.

Business Intelligence surge en los 70’s como la contraparte a los sistemas transaccionales. Mientras los sistemas transaccionales (OLTP) se encargaban de registrar la mayor cantidad de información sobre la operación de las organizaciones (comerciales, financieras, milicia, etc.), los sistemas de BI pretendían tomar toda esa información y consolidarla, y obtener tendencias y patrones de comportamiento de una manera relativamente rápida.

En aquel entonces no existían las PC’s, ni los sistemas operativos gráficos (tampoco había Excel), así que los sistemas no eran en absoluto lo que hoy vemos en nuestras pantallas. Conforme fue evolucionando el hardware y el software también lo fue haciendo el BI (y al haber más computadoras, más personas pudieron utilizar las aplicaciones de BI).

Hasta aquí podemos identificar los siguientes componentes:

  1. El hardware: Los cálculos (al vuelo, o pre-calculados) para mostrar la información consolidada, mostrar tendencias y encontrar patrones de comportamiento requieren de una capacidad enorme en un equipo de cómputo, tanto de almacenamiento como de memoria. ¿Qué tan grande? Todo depende de con cuánta información se cuente y del nivel de granularidad (detalle) que desees tener en tu BI, la velocidad de respuesta esperada, y el número de usuarios concurrentes.
  2. Los orígenes de datos (Data Sources): Es cada medio donde guardamos los datos transaccionales de la organización, y puede ser casi cualquier cosa, archivos de texto, hojas de Excel, páginas web, correos electrónicos, bases de datos de ERP, CRM, MRP, MRP II, etc.
  3. Procesos de transformación: Formalmente ETL (extracción, transformación y carga de datos). Es un software que se conecta a los orígenes de datos, y, de acuerdo a los objetivos perseguidos por el proyecto, aplica reglas de negocio para leer los datos necesarios y transformarlos en estructuras adecuadas a un modelo analítico. Esto es, los datos normalizados los des-normaliza para agilizar la lectura, principalmente.
  4. Área de almacenamiento temporal: También conocido como Staging Area, es un componente muy importante (comúnmente una base de datos relacional), pues aquí se almacena en primera instancia un volumen importante de datos ya homogenizados, ordenados y limpiados, se gestionan los catálogos o datos maestros del BI (master data), y se prepara todo para cargarse al data warehouse.

(continua…)