El análisis exploratorio de datos (EDA) en las herramientas de Business Intelligence típicamente se realiza por medio de la manipulación de cubos multidimensionales OLAP. Estos cubos son básicamente una manera de representar los datos a trabajar, separando las variables en Dimensiones y Medidas. Por ejemplo, para una empresa del sector retail, las dimensiones pueden ser Producto (con una jerarquía de Categoría-Línea-Producto), Cliente (País-Región-Comuna-Cliente) y Tiempo (Año-Mes-Dia). La medida típica sería las Ventas. La aplicación que utiliza el usuario final es como una gran tabla dinámica, que le permite ver sus medidas, a través de los distintos niveles de las dimensiones. Así, por ejemplo, un analista podría plantearse y responder a este tipo de preguntas:
¿Cuál ha sido la evolución de las ventas totales por año, durante los últimos 5 años?
Durante este año, ¿cuál ha sido la distribución de ventas por Categoría?
¿Cuál es la línea que más aumentó sus ventas en los últimos 6 meses?
¿Cómo es la distribución geográfica de mis ventas?
¿Hay estacionalidad Anual (ej. navidad), Mensual (fin de mes), Semanal (fin de semana) en mis ventas?
Para que el analista pueda responder estas preguntas sólo debe entender bien las dimensiones y medidas del modelo, y cómo usar estas para construir esta tabla dinámica y los gráficos asociados. Pentaho tradicionalmente ha ofrecido la herramienta JPivot para hacer este tipo de análisis, pero recientemente se ha anunciado la integración de una nueva herramienta: Pentaho Analyzer. Este ofrece importantes mejoras de funcionalidad y facilidad de uso para los usuarios finales, entre los que podemos mencionar:
Drag and Drop de Campos (se arrastran)
Nuevo panel de filtros
Ordenamiento y Filtrado (inclusión/exclusión) con un click
Medidas definidas por el usuario
Permite cambiar tamaño y formatos de columnas dinámicamente
Agregar/quitar subtotales
Gráficos Mejorados
Además de mantener otras características como ser 100% web, permitir guardar las vistas y compartirlas con otros analistas y exportar a Excel, PDF o CSV. Para quienes deseen interiorizarse más en este nuevo producto, recomendamos el sigueinte video: Sneak-Peek at Pentaho Analyzer y probarlo directamente en la siguiente demo. Este producto estará disponible como un plugin de la nueva versión 3.5, embedido para todos los suscriptores de Pentaho Enterprise Edition. Además Pentaho Analyzer se ofrecerá de manera independiente para quienes tengan la versión community y sólo desean integrar este módulo.