guía del usuario de exploraciones - ibm · visualización de tarjetas en el panel de navegación....

94
IBM Cognos Analytics Versión 11.1.0 Guía del usuario de exploraciones IBM

Upload: others

Post on 27-May-2020

4 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

IBM Cognos AnalyticsVersión 11.1.0

Guía del usuario de exploraciones

IBM

Page 2: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel
Page 3: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Contenido

Capítulo 1. Getting started with Explorations......................................................... 1Exploraciones...............................................................................................................................................1

Cargar datos............................................................................................................................................1Iniciar una exploración desde un panel de instrumentos o historia existente ....................................1Iniciar una nueva exploración desde el menú Nuevo........................................................................... 1Iniciar una nueva exploración desde un activo de datos en la página de bienvenida..........................2Añadir un origen de datos...................................................................................................................... 2

Capítulo 2. Exploring relationships.........................................................................3Explorar relaciones en sus datos.................................................................................................................3

Abrir el diagrama de relaciones............................................................................................................. 7

Capítulo 3. Visualizations...................................................................................... 9Visualizaciones.............................................................................................................................................9

Visualización de tarjetas en el panel de navegación ............................................................................ 9Crear una visualización...........................................................................................................................9Comparación de dos visualizaciones...................................................................................................10Comparar dos puntos de datos en una visualización..........................................................................11Análisis avanzado de datos..................................................................................................................11Seleccionar otro tipo de visualización................................................................................................. 11Informaciones en visualizaciones........................................................................................................42Elegir informaciones correlacionadas................................................................................................. 43Elección de las visualizaciones recomendadas...................................................................................43Elegir una visualización relacionada....................................................................................................43

Capítulo 4. Forecasting........................................................................................ 45Predicción.................................................................................................................................................. 45

Características de previsión ................................................................................................................45Opciones de previsión ......................................................................................................................... 46Tipos de visualizaciones que dan soporte a la previsión ................................................................... 49Datos de previsión ...............................................................................................................................49Detalles estadísticos de la previsión................................................................................................... 52Modelos de previsión .......................................................................................................................... 55

Capítulo 5. Principles of advanced data analytics................................................. 59Principios del análisis de datos avanzado.................................................................................................59

Preparación de datos........................................................................................................................... 59Preparación de datos para campos numéricos................................................................................... 60Preparación de datos para campos categóricos................................................................................. 60Preparación de campos para campos objetivo................................................................................... 61Controladores clave unidireccionales................................................................................................. 62Controladores clave bidireccionales....................................................................................................62Árbol de decisiones.............................................................................................................................. 63Informaciones en visualizaciones........................................................................................................65Detalles del lenguaje natural............................................................................................................... 74Relaciones ........................................................................................................................................... 78Diferencias entre Cognos Analytics y Watson Analytics con respecto al análisis de datos

avanzado..........................................................................................................................................79

Capítulo 6. Assistant............................................................................................85

iii

Page 4: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Asistente.................................................................................................................................................... 85Mandatos del asistente........................................................................................................................ 86

iv

Page 5: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 1. Getting started with Explorations

ExploracionesExplore es un espacio de trabajo flexible en el que puede descubrir y analizar datos. También puedeexplorar una visualización existente desde un panel de instrumentos o una historia. Puede descubrir lasrelaciones ocultas e identificar los patrones que convierten los datos en conocimientos. Lasinformaciones correlacionadas se representan mediante un icono verde con un número en el eje X, en eleje Y o en el título de un gráfico.

Iniciar exploraciones

Puede utilizar uno de los diversos métodos existentes para iniciar las exploraciones.

Cargar datosCargue un activo de datos en la carpeta Mi contenido para utilizar en su exploración.

Procedimiento

1. Pulse el icono Nuevo y después pulse Cargar archivos.

2. Navegue hasta donde ha guardado el activo de datos y selecciónelo.El activo de datos aparece en la carpeta Mi contenido.

Iniciar una exploración desde un panel de instrumentos o historia existenteCuando trabaja en un panel de instrumentos o en una historia, puede crear o editar una exploracióndirectamente desde una visualización.

Acerca de esta tareaComplete los siguientes pasos para abrir una visualización en una nueva exploración o para añadirla a unaexploración existente:

Procedimiento

1. Abra un panel de instrumentos o una historia existente.2. Seleccione una visualización.

3. Pulse el icono Exploraciones en la barra de herramientas.4. Seleccione Nueva exploración o Añadir a existente.

Iniciar una nueva exploración desde el menú NuevoEn la página de bienvenida, puede iniciar una nueva exploración desde el menú Nuevo.

Procedimiento

1. Pulse Nuevo y, a continuación, pulse Exploración.2. Seleccione un origen de datos y pulse Añadir.

Se genera una página de puntos de inicio desde el origen de datos que ha seleccionado.

© Copyright IBM Corp. 2018, 2020 1

Page 6: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Iniciar una nueva exploración desde un activo de datos en la página de bienvenidaPuede seleccionar el menú Acción en un activo de datos utilizado recientemente en la página sebienvenida.

Procedimiento

1. En la página de bienvenida, el activo de datos que desea utilizar se muestra como un mosaico en el

área Recientes, pulse Menú de acciones .2. Seleccione Crear exploración.

Añadir un origen de datosPuede añadir un origen de datos a la exploración para explorar sus datos.

Procedimiento

1. En el panel Orígenes seleccionados, pulse el icono Añadir un origen .2. Vaya a Mi contenido o a la carpeta Contenido de equipo y seleccione el origen de datos que desea

añadir. Pulse Añadir.3. Expanda el origen de datos en el panel Orígenes seleccionados para ver lo que hay disponible.4. Utilice la página de puntos de inicio para generar un diagrama de relación a partir de sus datos.

2 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 7: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 2. Exploring relationships

Explorar relaciones en sus datosCuando crea una exploración, puede comenzar desde un origen de datos. Se muestra una página depuntos de inicio con sugerencias para la iniciación.

Puede escribir un nombre de columna que se muestra en el origen de datos. O puede pulsar una de lascolumnas sugeridas que el sistema identifica como interesantes. Si no está seguro sobre en qué columnacomenzar, pulse Omitir - mostrar cualquier cosa para ver un diagrama de relaciones con algunasvisualizaciones de puntos de inicio sugeridos.

En el diagrama de relaciones, la columna con la que comienza es el foco principal y se representa con unnodo azul oscuro. Los campos relacionados se representan con nodos púrpura. Las líneas conectan losnodos y presentan las relaciones. El grosor de la línea indica la intensidad de la relación.

© Copyright IBM Corp. 2018, 2020 3

Page 8: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

De forma predeterminada, se muestran las relaciones primarias más fuertes que son las relacionesdirectas entre el foco principal y los campos relacionados. Las relaciones secundarias son las relacionesentre los demás campos relacionados directa o indirectamente con el destino.

Para ver las relaciones primarias y las relaciones secundarias, seleccione el cuadro Relacionessecundarias bajo Editar diagrama.

4 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 9: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

El diagrama de relaciones traza estos campos en función de una evaluación estadística de los elementosrelacionados. El diagrama de relaciones no es una imagen del modelo de datos. No obstante, el modelopuede ser un mayo que influya en el análisis. Para mejorar el rendimiento, cuando hay muchas filas en elorigen de datos, el análisis se basa en una muestra representativa de todos los datos.

Puede interactuar con el diagrama de relaciones seleccionando un nodo que le interese. A medida que lohace, se actualiza la lista de puntos de inicio sugeridos que se muestra a la izquierda del diagrama paraincluir los campos que ha seleccionado. También puede utilizar Ctrl+clic para seleccionar varios nodos.

Pulse Restablecer original si desea restablecer el ámbito y la vista de todos los campos del diagrama derelaciones a su valor predeterminado.

Puntos de inicio sugeridos

Visualizaciones de puntos de inicio sugeridos que se muestran como miniaturas junto al diagrama derelaciones. Seleccione nodos de forma individual o varios nodos del diagrama de relaciones para generarestas visualizaciones.

Pulse una visualización si desea añadirla a la exploración y verla al mismo tiempo. Pulse el icono enla visualización de puntos de inicio para añadirla a la exploración y conservar la vista actual.

Capítulo 2. Exploring relationships 5

Page 10: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

6 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 11: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Abrir el diagrama de relacionesSi está en una visualización y desea volver al diagrama de relaciones, utilice la Tarjeta de relaciones dedatos para volver a la vista de puntos de inicio.

Acerca de esta tarea

Complete los pasos siguientes para volver a la vista de puntos de inicio para ver un diagrama derelaciones y los puntos de inicio sugeridos.

Procedimiento

1. Pulse el icono Exploraciones en el panel lateral.

2. Pulse la Tarjeta de relaciones de datos.

Consejo: También se puede acceder a la Tarjeta de puntos de inicio desde el menú Nueva tarjeta dela barra de herramientas.

Capítulo 2. Exploring relationships 7

Page 12: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

8 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 13: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 3. Visualizations

VisualizacionesPuede cambiar el tipo de visualización o cambiar las columnas que se utilizan en la visualización.

Visualización de tarjetas en el panel de navegaciónPuede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel de navegación a laizquierda de la vista principal.

Acerca de esta tarea

Las tarjetas son una colección de visualizaciones en la Exploración. Utilice las tarjetas para abrir susvisualizaciones para ver información detallada y para modificarlas utilizando las ranuras de datos.

Procedimiento

1. Pulse el icono Exploraciones en el panel lateral.

Sus tarjetas se listan aquí.2. Haga clic en una tarjeta que muestre una miniatura de visualización que desee abrir.

La visualización se abrirá en la vista principal.3. Puede ver el texto generado en la pestaña Detalles o añadir más elementos de datos en la pestaña

Ranuras de datos.Si no ve las pestañas Detalles y Ranuras de datos, pulse el icono Mostrar detalles y ranuras dedatos .

Ver detalles de visualizaciónAl abrir una visualización, se abre en el área de exploración principal. El panel de exploración muestra lapestaña Detalles, la pestaña Campos y la pestaña Propiedades.

Si no ve el panel de exploración, pulse el icono Mostrar detalles y campos .

Detalles de visualización

La pestaña Detalles muestra el texto que se genera para describir los aspectos de los datosrepresentados en las visualizaciones. Estos detalles no resultan obvios solo mirando la visualización. Porejemplo, los detalles pueden revelar un promedio de los valores a lo largo del tiempo.

Campos

La pestaña Campos es donde se añaden columnas para generar y modificar visualizaciones. Añada unacolumna a cada campo obligatorio.

Propiedades

La pestaña Propiedades es donde puede modificar las propiedades que se aplican a sus visualizaciones.

Crear una visualizaciónMientras trabaja con su exploración, puede que decida que necesita otra visualización.

© Copyright IBM Corp. 2018, 2020 9

Page 14: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Acerca de esta tareaComplete los pasos siguientes para crear una visualización.

Procedimiento

1. En la barra de herramientas, seleccione Nuevo.2. Seleccione la tarjeta en blanco Individual.3. En la ventana Orígenes, expanda el activo de datos que desea utilizar.

Si se abre un activo de datos distinto, pulse Retroceder junto al nombre del activo de datos que estáabierto.

4. Para crear una nueva visualización, complete una de las acciones siguientes:

• Arrastre y suelte elementos de datos en el área Crear una visualización.

IBM® Cognos Analytics crea una visualización que se ajuste a los elementos de datos. Por ejemplo,si añade Año o Departamento, se crea una tabla. Si arrastra una medida como por ejemploIngresos, se crea una visualización de barras.

• Pulse Elegir un tipo y seleccione un tipo de visualización. A continuación, añada un elemento dedatos en cada ranura de datos.

Comparación de dos visualizacionesPuede crear su propia comparación para analizar los datos entre dos visualizaciones. O puede comenzarcon una comparación recomendada. En cualquiera de los casos, se genera un resumen de la informaciónclave y las diferencias entre las dos visualizaciones.

Acerca de esta tarea

Complete los pasos siguientes para crear una comparación entre dos visualizaciones.

Nota: Cuando se crea una nueva visualización, puede seleccionar una tarjeta de comparación en blancocon dos ranuras para visualizaciones.

Procedimiento

1. Pulse el icono Exploraciones en el panel lateral.Se abrirá el panel Tarjetas.

2. Seleccione una tarjeta para crear una comparación.Se muestra una visualización.

3. En la barra de herramientas, pulse Comparar.Se muestra la página ¿Cómo desea comparar? para guiarle en el proceso de crear su propiacomparación o se inicia con una recomendación.

4. Pulse el icono Añadir tarjeta en una tarjeta en miniatura para añadirla a la lista de tarjetas delpanel de navegación. O pulse la tarjeta en miniatura para añadir la nueva tarjeta y verlainmediatamente.

5. Opcionalmente, modifique los datos de una visualización para compararlos con la otra visualización.a) Seleccione una de las dos visualizaciones.b) En la pestaña Ranuras de datos, modifique la visualización de alguno de los modos siguientes, por

ejemplo:

• Eliminar filtros.• Mostrar recuento superior e inferior.• Eliminar elementos de datos.

10 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 15: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

• En el panel Orígenes, añada nuevos elementos de datos o filtros.

Comparar dos puntos de datos en una visualizaciónPuede seleccionar dos puntos de datos en una visualización existente y comparar los datos.

Procedimiento

1. Pulse el icono Exploraciones en el panel lateral.Se abrirá el panel Tarjetas.

2. En el panel Tarjetas, seleccione la tarjeta que muestra la miniatura de visualización que desea abrir.La visualización se abrirá en la vista principal.

3. Seleccione dos puntos de datos en la visualización.4. Pulse con el botón derecho del ratón y después pulse Comparar por.5. Escriba una columna para comparar los dos puntos de datos.

Una tabla muestra información sobre la comparación entre los dos puntos de datos.

Análisis avanzado de datosIBM Cognos Analytics es una herramienta de business intelligence para gestionar y analizar datos.Incluye diversas características de autoservicio que permiten a los usuarios preparar, explorar ycompartir datos. Como parte de esta oferta,Cognos Analytics incluye diversas técnicas predictivas,descriptivas y exploratorias, conocidas también como inteligencia numérica. Cognos Analytics utilizadiversas pruebas estadísticas para analizar los datos. Es importante comprender las definiciones de estaspruebas puesto que se aplican a Cognos Analytics.

Para obtener más información, consulte la publicación IBM Cognos Analytics Guía del panel de control ylas historias.

Seleccionar otro tipo de visualizaciónLas visualizaciones comunican comparaciones, relaciones y tendencias. Resaltan y hacen más claras lascifras. Para elegir un tipo de visualización, piense qué desea ilustrar con la visualización y qué llama laatención al público de la visualización.

Antes de empezar

Para obtener más información sobre los tipos de visualizaciones, consulte la documentación sobre lasvisualizaciones en la publicación IBM Cognos Analytics Paneles de control e historias, Guía del usuario.

Procedimiento

1. En el panel Tarjetas, seleccione la tarjeta que representa la visualización que desea abrir.

2. Pulse el icono Elegir tipo de visualización de la barra de herramientas.3. Pulse el tipo de visualización que desea utilizar.

Fíjese en cómo cada tipo de visualización comunica los datos de forma diferente. Por ejemplo, utiliceuna visualización en barras, columnas o líneas para comparar un conjunto de valores. Utilice unavisualización de áreas o de líneas para rastrear relaciones. Utilice un mapa de árbol o la visualizaciónde gráfico circular para ver las partes de un todo.

ÁreasUtilice una visualización de áreas para enfatizar la magnitud del cambio a lo largo del tiempo.

Los gráficos de áreas son como gráficos de líneas, con la diferencia de que las áreas por debajo de laslíneas están rellenadas con colores o modelos. Los gráficos apilados son útiles para comparar lascontribuciones proporcionales en una categoría. Trazan el valor relativo con el que cada serie de datoscontribuye al total.

Capítulo 3. Visualizations 11

Page 16: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Puesto que una visualización de áreas aplica los resultados para cada columna o elemento, el total detodos los resultados se ve fácilmente.

Por ejemplo, una visualización de áreas es excelente para consultar los ingresos a lo largo del tiempo endiversos productos.

Por ejemplo, esta visualización de áreas muestra el valor de duración de clientes para cada clase devehículo por mes. Puesto que la visualización de áreas apila los resultados, puede ver los totales de cadames.

La visualización de áreas se ha creado arrastrando los siguientes elementos de datos desde el panelOrígenes:

• Arrastre el tipo Mes de caducidad al campo Eje-x.• Arrastre Clase de vehículo al campo Color.• Arrastre Valor de duración de clientes al campo eje-x.

12 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 17: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Ejemplos

Puede ver un ejemplo de una visualización de nube de palabras en el informe de ejemplo Análisis delvalor de duración de clientes. Puede encontrar el ejemplo aquí: Contenido del equipo > Ejemplo >Informes > Análisis del valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

BarrasUtilice una visualización de barras para comparar valores de una o más columnas, tales como las ventasde productos o las ventas de productos de cada mes.

Las visualizaciones de barras usan marcadores de datos horizontales que se disponen en grupos paracomparar valores individuales. Puede utilizar visualizaciones de barras para comparar distintos datos opara mostrar tendencias a lo largo del tiempo.

Una visualización de barras puede mostrar los cambios durante un período de tiempo específico o puedecomparar y contrastar dos o más columnas durante un período de tiempo a lo largo del tiempo. Si haytantas barras que no permiten la lectura de las etiquetas, filtre los datos para centrarse en unsubconjunto de los datos o utilice un mapa de árbol.

Utilice el campo Destino para mostrar las medidas que se han de comparar con un valor de destino.

Utilice el campo y-start para definir dónde debe iniciarse la medida.

BurbujasUtilice una visualización de burbujas para mostrar relaciones entre columnas que contienen valoresnuméricos, como ingresos y beneficios.

Una visualización de burbujas utiliza puntos de datos y burbujas para trazar medidas en cualquier lugar alo largo de una escala. Se traza una medida a lo largo de cada eje. El tamaño de la burbuja representa unatercera medida. Utilice las visualizaciones de burbujas para representar datos financieros o cualesquieraotros datos relacionados con valores de medidas.

Las burbujas tienen diferentes tamaños y colores. El eje X representa una medida. El eje Y representa otramedida, y el tamaño de las burbujas representa la tercera medida. En el ejemplo que se muestra acontinuación, el color se representa como una cuarta medida.

El ejemplo que se muestra representa los meses desde la incepción de políticas.

Capítulo 3. Visualizations 13

Page 18: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Cree la visualización de burbuja arrastrando los elementos de datos siguientes desde Análisis de

clientes al panel Orígenes :

• Arrastre Meses desde incepción de políticas al campo eje-x.• Arrastre Importe total reclamado al campo eje-y.• Arrastre Valor de duración de clientes al campo Tamaño.• Arrastre Estado laboral a Color

Puede personalizar el gráfico de burbujas. Por ejemplo, para que se muestre el eje-x del gráfico deburbujas como se muestra en el ejemplo, siga estos pasos:

1. Pulse la visualización, a continuación, en el panel Datos pulse el elemento de datos <Importe totalreclamado>.

2. Pulse

3. Junto a Formato de datos, pulse y establezca las opciones siguientes:

• Tipo de formato: Moneda• Símbolo de moneda: K• Posición del símbolo de moneda: Final• Número de posiciones decimales: 0• Escala: -3 (presenta valores en millares).

4. Pulse Aceptar.

Para cambiar el tamaño de la visualización, pulse la visualización, a continuación, establezca la siguienteopción en el panel de propiedades:

• Tamaño - Anchura: 700 px, Altura: 300 px

Pulse para cerrar el panel Propiedades.

Ejemplos

Puede ver ejemplos de las visualizaciones en el informe de ejemplo Análisis del valor de duración declientes. Puede encontrar los ejemplos aquí: Contenido del equipo > Ejemplos > Informes > Análisisdel valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

ViñetasPuede utilizar gráficos de viñetas para mostrar medidas que se tienen que comparar con un valor dedestino.

14 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 19: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

En un centro de llamadas, se puede utilizar un gráfico de viñetas para medir métricas tales como elvolumen de llamada, la velocidad de respuesta de llamada y el porcentaje de llamadas abandonadas.

En fabricación, se puede utilizar un gráfico de viñetas para realizar el seguimiento de métricas tales comoel número de defectos y los pedidos enviados.

En un contexto de fitness, se puede utilizar un gráfico de viñetas para medir métricas tales como lospasos que se hacen y las calorías que se han quemado.

Las visualizaciones de viñetas comparan una medida real (la viñeta) con una medida de destino (eldestino). Las visualizaciones de viñetas también relacionan las medidas comparadas con regionescoloreadas en el fondo que proporcionan mediciones más cualitativas, como por ejemplo bueno,satisfactorio y pobre. Las visualizaciones de viñetas pueden mostrarse en pequeño tamaño, sin dejar deexpresar información de manera efectiva.

Una visualización de viñetas presenta una sola medida primaria. Por ejemplo, los ingresos actuales delaño a la fecha. Y compara esa medida con una o varias otras medidas para enriquecer su significado. Porejemplo, en comparación con un destino. La medida principal se visualiza en el contexto de un rango derendimiento cualitativo, como por ejemplo, pobre, satisfactorio y bueno.

Si selecciona una visualización de viñeta, especifique los campos siguientes:

• El campo Barra real especifica la medida real.• El campo Destino especifica la medida de destino.• El campo Rango mínimo especifica el rango cualitativo mínimo.• El campo Rango medio especifica el rango cualitativo medio.• El campo Rango máximo especifica el rango cualitativo máximo.

Nota: La obtención de detalles no está disponible para una visualización de viñetas.

Asegúrese de que los rangos mínimo, medio y máximo se relacionan con la medida real y la medida dedestino.

La visualización viñetas se ha creado arrastrando los siguientes elementos de datos desde el panelOrígenes:

• Arrastre Rango mínimo al campo Rango mínimo.• Arrastre Rango mínimo al campo Rango mínimo.• Arrastre Rango máximo al campo Rango máximo.• Arrastre Rango máximo a campo Barra real.• Arrastre Destino al campo Destino.• Arrastre Clase de vehículo al campo Datos adicionales.

Capítulo 3. Visualizations 15

Page 20: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Ejemplos

Puede ver un ejemplo de una visualización de viñetas en el informe de ejemplo Análisis del valor deduración de clientes. Puede encontrar el ejemplo aquí: Contenido del equipo > Ejemplo > Informes >Análisis del valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

ColumnasUtilice una visualización de columna para comparar valores de una o varias columnas, tales como ventasde productos y ventas de productos mensuales.

Las visualizaciones de columnas usan marcadores de datos verticales que se disponen en grupos paracomparar valores individuales. Utilice visualizaciones de columnas para comparar distintos datos o paramostrar tendencias a lo largo del tiempo.

Una visualización de columnas muestra un cambio en un periodo de tiempo específico o puede comparary contrastar dos o más columnas en un periodo de tiempo o a lo largo del tiempo. Si hay tantas barras queno permiten la lectura de las etiquetas, filtre los datos para centrarse en un subconjunto de los datos outilice un mapa de árbol.

Por ejemplo, los ingresos de cada línea de producto se agrupa por trimestre, lo que resalta el rendimientode cada trimestre.

Utilice el campo Destino para mostrar las medidas que se han de comparar con un valor de destino.

Utilice el campo y-start para definir dónde debe iniciarse la medida.

Tabla de referencias cruzadasUtilice una tabla de referencias cruzadas cuando desee mostrar las relaciones entre tres o más columnas.Las tablas de referencias cruzadas muestran datos en filas y columnas con información resumida en lospuntos de intersección.

16 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 21: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Por ejemplo, esta tabla de referencias cruzadas muestra los costes de los cursos de cada departamentopor organización.

A partir de Cognos Analytics versión 11.1.4, puede arrastrar datos desde el panel Orígenesseleccionados e insertar datos en una columna/fila o soltar los datos sobre los datos existentes parasustituirlos.

Reproductor de datosUtilice un reproductor de datos para ver una animación del impacto de una columna en las otrasvisualizaciones.

Árbol de decisionesUn árbol de decisiones muestra una jerarquía conectada de cuadros que representan valores de registros.

Los registros se segmentan en grupos, que se denominan nodos. Cada nodo contiene registros que sonestadísticamente similares entre sí con respecto al campo de destino. Por ejemplo, un nodo puedecontener los registros de los hombres que tienen más de 18 años de educación. A continuación, losnodos se pueden utilizar para predecir el valor de campo de un destino. Por ejemplo, el nodo sobre loshombres y la educación se puede utilizar para predecir el salario.

Cada rama de un árbol de decisiones corresponde a una regla de decisión. Para obtener más informaciónsobre las reglas de decisión, consulte “Visualización de reglas de decisión” en la página 20

Para mejorar el rendimiento, debido al número de filas en el origen de datos, el análisis se basa en unamuestra representativa de todos los datos.

Por ejemplo una visualización de árbol de decisiones puede tener el aspecto siguiente;

Capítulo 3. Visualizations 17

Page 22: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Nota: No se admiten filtros en las visualizaciones de árbol de decisiones.

Para obtener más información, consulte “Exploración de una visualización de árbol de decisiones” en lapágina 18.

Exploración de una visualización de árbol de decisionesSe utiliza una visualización de árbol de decisiones para ilustrar cómo los datos subyacentes predicen undestino seleccionado y resaltan conocimientos clave sobre el árbol de decisiones.

Acerca de esta tarea

La capacidad de pronóstico de un árbol de decisiones determina el grado hasta el cual las decisiones,representadas por cada una de las ramas que aparecen en el árbol, predicen el valor del destino.

Los árboles de decisiones tienen un único destino. Si el campo de destino del árbol de decisiones escontinuo, los indicadores de conocimientos clave resaltan normalmente grupos de valores altos o bajos.Si el campo de destino del árbol de decisiones es categórico, el conocimiento clave es la modalidad delnodo. La modalidad del nodo es la categoría o categorías que aparecen con más frecuencia del campo dedestino dentro del grupo.

Para mejorar el rendimiento, debido al número de filas en el origen de datos, el análisis se basa en unamuestra representativa de todos los datos.

Al revisar un árbol de decisiones:

• Si desea ver todos los controladores, utilice la pestaña Diagrama de árbol o la pestaña Reglas.• Si desea centrarse en los controladores clave, utilice la pestaña Proyección solar de árbol.

Para editar o añadir controladores clave, pulse el en el campo de destino.

Las informaciones son diferentes en función del tipo del destino. Si está prediciendo una medidacontinua, por ejemplo, ingresos, antigüedad o beneficios, el árbol de decisiones muestra dentro del nodoel valor promedio del destino dadas las condiciones hasta ahora dentro del grupo representado por elnodo. Por ejemplo, si tiene un árbol para predecir los ingresos y tiene una rama que tiene género ydespués ciudad. Si sigue la ruta desde hombre hasta Chicago, el valor que hay en el nodo de Chicago es elpromedio de ingresos de los hombres en Chicago.

18 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 23: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Procedimiento

1. Si tiene una medida continua, el ejemplo siguiente ilustra el árbol de decisiones.

El color muestra si el valor del nodo está asociado a valores altos, medianos o bajos del destino. Elcolor del nodo se basa en el promedio del destino para esa medida. Cuanto más alto sea el valorpromedio del destino para un nodo, más oscuro será el color.

Por ejemplo, a continuación se muestra la visualización detallada de gastos de restaurante. Laterminal internacional es un fuerte predictor del alto gasto en restaurantes para los viajantes denegocios. Una mala limpieza del aeropuerto es un predictor de unos gastos bajos para los viajantes deconferencias y convenciones.

El minimapa le permite desplazarse mejor por las distintas áreas del árbol. El minimapa esespecialmente útil si hay muchos nodos.

En este ejemplo, los cinco valores más altos del destino se indican con un número. Puede elegir entrelas opciones siguientes:

• Árbol completo. No se indican específicamente los valores más altos ni los más bajos.

• Cinco valores más altos de destino. Se muestran los cinco valores más altos del destino

• Cinco valores más bajos de destino. Se muestran los cinco valores más bajos del destino

Si tiene una medida categórica, seleccione la categoría para la que desea ver los cinco destinossuperiores o inferiores en el menú 5 nodos superiores para: o en el menú 5 nodos inferiores para:.

Si ha alejado demasiado el zoom, no se pueden ver los cinco primeros nodos ni los cinco últimosnodos.

2. Si tiene una medida categórica, el ejemplo siguiente ilustra el árbol de decisiones.

El color muestra el valor o valores de campo que está más representado.

Capítulo 3. Visualizations 19

Page 24: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

En la pestaña Proyección solar de árbol, puede ver que si las medidas dentro del árbol de decisiónson predictores fuertes de un valor o valores de destino, los colores prevalecen en ese nodo. Losvalores no significativos se dejan fuera.

Por ejemplo, a continuación se muestra la visualización detallada del estado civil en a pestañaProyección solar de árbol. Muestra que estar empleado es un fuerte predictor de estar casado.

En la pestaña Diagrama de árbol, los nodos muestran visualmente la distribución de la gente porestado civil.

Visualización de reglas de decisiónUna regla de decisión predice un resultado en el campo de destino. La visualización de las reglas dedecisión le ayuda a determinar qué condiciones es más probable que generen un resultado específico.

Por ejemplo, imagine unas hipotéticas reglas de decisión para predecir el abandono. Estas reglas podríanidentificar las clasificaciones según los rangos de edad de los clientes y el número de reclamaciones

20 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 25: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

anteriores. A partir de esas reglas, podría observar que los clientes que no tienen ninguna reclamación otienen sólo 1 y son clientes mayores de 50 son más propensos a abandonar.

Cada rama de un árbol de decisiones corresponde a una regla de decisión.

Procedimiento

1. En un árbol de decisiones, pulse Reglas.2. Revise las reglas de decisión.3. Para volver a la visualización, pulse Diagrama de árbol.

Análisis de controladoresUna visualización de análisis de controladores muestra los controladores clave, o los predictores clave deun destino. Cuánto más a la derecha esté el controlador, más fuerte es.

IBM Cognos Analytics utiliza sofisticados algoritmos para ofrecer conocimientos altamente interpretablesbasados en modelado complejo.. No es necesario que sepa qué pruebas estadísticas debe ejecutar sobresus datos. Cognos Analytics utiliza las pruebas correctas para los datos.

Los controladores clave para destinos continuos y categóricos están disponibles en la visualización deanálisis de controlador en paneles de control y exploraciones.

Para obtener más información, consulte la documentación sobre Pruebas estadísticas en la IBM CognosAnalytics Guía del usuario de paneles de control e historias.

Por ejemplo, esta visualización de análisis de controladores muestra que la combinación de satisfacciónglobal, la puntuación de señalización, la puntuación de seguridad y la puntuación artística son loscontroladores más fuertes de la puntuación del aeropuerto de destino.

Para editar o añadir controladores clave, pulse el en la ranura de datos de destino.

Para mejorar el rendimiento, debido al número de filas en el origen de datos, el análisis se basa en unamuestra representativa de todos los datos.

Si pasa el cursor por un punto de datos, el análisis de controladores muestra qué condiciona lapuntuación global del aeropuerto.

Si pulsa un punto de datos del árbol, se muestran otras visualizaciones recomendadas.

Capítulo 3. Visualizations 21

Page 26: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Nota: No se admiten filtros en las visualizaciones de análisis de controladores.

Mapa de uso críticoUtilice una visualización de mapa de uso crítico para ver la relación entre columnas, representadas en unavista de tipo matriz.

Una visualización de mapa de uso crítico utiliza el color y la intensidad del color para mostrar la relaciónentre dos columnas.

Por ejemplo, esta visualización de mapa de uso crítico muestra el valor promedio de duración de clientespor género y educación.

Cree la visualización de mapa de uso crítico arrastrando los elementos de datos siguientes desde el panel

Orígenes :

• Arrastre Género al campo Filas.• Arrastre Educación al campo Columnas.• Arrastre Valor de duración de clientes al campo Uso crítico.

Ejemplos

Puede ver ejemplos de las visualizaciones en el informe de ejemplo Análisis del valor de duración declientes. Puede encontrar los ejemplos aquí: Contenido del equipo > Ejemplos > Informes > Análisisdel valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

JerarquíaUtilice una jerarquía cuando desee ver los datos en filas y columnas.

Por ejemplo, esta jerarquía muestra tipos de producto.

22 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 27: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Burbuja de jerarquíaPuede utilizar una visualización de burbujas de jerarquía cuando desee mostrar relaciones entrecolumnas que contengan valores, como por ejemplo pérdidas netas. Es parecida a la visualización deburbujas, pero las burbujas están agrupadas en lugar de dispersadas por una cuadrícula. Las burbujasutilizan anidamiento para representar la jerarquía. Una visualización de burbuja de jerarquía muestra unagran cantidad de datos en un espacio reducido.

El tamaño de cada burbuja muestra una dimensión cuantitativa de cada punto de datos. Muestra muchosniveles dentro de una jerarquía y las relaciones entre grupos en base a los atributos asignados. Utiliza eltamaño y el color de la burbuja para transmitir información comparativa sobre las categorías.

Las burbujas tienen diferentes tamaños y colores.

Por ejemplo, esta visualización de burbujas de jerarquías muestra el valor de duración de clientes porclase de vehículo y por tamaño de vehículo. Cada burbuja es una clase de vehículo diferente en untamaño de tres vehículos. El tamaño de cada burbuja lo determina el valor de duración de clientes dedicha clase de vehículo. Los colores de las burbujas se determinan por el tamaño del vehículo.

Capítulo 3. Visualizations 23

Page 28: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

La visualización de burbujas empaquetas jerárquicas se ha creado arrastrando los siguientes elementosde datos desde el panel Orígenes:

• Arrastre Clase de vehículo y Clase de vehículo al campo Burbujas.• Arrastre Valor de duración de clientes al campo Tamaño.• Arrastre Tamaño de vehículo al campo Color

Ejemplos

Puede ver un ejemplo de una visualización de nube de palabras en el informe de ejemplo Análisis delvalor de duración de clientes. Puede encontrar el ejemplo aquí: Contenido del equipo > Ejemplo >Informes > Análisis del valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

KPIUtilice una visualización KPI para mostrar un indicador de rendimiento clave (KPI) que contiene dosmedidas relacionadas, tales como ingresos reales e ingresos objetivo. Opcionalmente, puede visualizaruna sparkline y una forma descriptiva en sus visualizaciones KPI.

Una visualización KPI compara un valor base con un valor de destino y muestra la varianza entre las dosmedidas.

24 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 29: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Por ejemplo, esta visualización KPI muestra los ingresos reales en rojo con una flecha abajo que indicaque han bajado los ingresos en comparación con el valor de destino. En este caso, el valor de destino sonlos ingresos objetivo. Una sparkline muestra la forma de la variación a lo largo del tiempo y tiene el mismocolor que el valor base.

Cree una visualización KPI similar arrastrando las medidas de su propio origen de datos a los campos deuna visualización KPI vacía:

1. En la barra lateral, pulse el icono Visualizaciones y luego pulse KPI.2. Arrastre una medida al campo Valor de destino.3. Arrastre otra medida al campo Valor base. Este es el valor de destino real.4. Arrastre otra medida al campo Tiempo. Este valor crea una sparkline de su visualización KPI. Puede

añadir varias medidas, por ejemplo Años y Meses, al campo Tiempo.

Utilice las propiedades para personalizar una visualización KPI. Por ejemplo, de forma predeterminada,las propiedades se establecen en un color verde condicional cuando se cumple el valor de destino y en uncolor rojo condicional si no se cumple el valor de destino. Para visualizar el destino actual en otro color,puede seleccionar el conmutador Color condicional para desactivar la función y, a continuación,seleccionar un color en Color de elemento.

Realice los pasos siguientes para inhabilitar la función Color condicional y seleccione un colorpersonalizado para el valor base y sparkline:

1. Seleccione la visualización KPI en su panel de control.

2. Pulse el icono Propiedades .3. En la pestaña Visualización, pulse Color. El conmutador Color condicional está habilitado de forma

predeterminada.4. Seleccione el conmutador Color condicional para inhabilitar los colores rojo y verde condicionales.5. En Color de elemento, seleccione un color.

Capítulo 3. Visualizations 25

Page 30: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Cuando está habilitado el Color condicional, puede personalizar las propiedades de la visualización KPI.La información siguiente describe cada una de las propiedades KPI bajo Establecer rango:

• Escala

Utilice la propiedad Escala para elegir entre Numérico o Porcentaje cuando seleccione los valores paralos rangos. Seleccione Numérico para utilizar el rango con el que se ha de comparar el valor base.Seleccione Porcentaje para ver una comparación del porcentaje del valor base con el valor de destino.

• Número de rangos

Puede elegir los rangos 1 - 3.

La información siguiente describe las propiedades KPI bajo Establecer rango:

• Valor inicial y Valor final

Seleccione un rango y establezca Valor inicial y Valor final.

Consejo: No puede especificar Mínimo y Máximo como valores. Para restaurar el valor Mínimo delValor inicial en el primer rango del valor, o el valor Máximo del Valor final en el último rango, suprimael campo que desee restaurar.

• Color del texto

Seleccione un rango y establezca el color del valor base, sparkline y forma de indicador.• Forma de indicador

Seleccione un rango y elija una forma para mostrarla en la visualización KPI cuando el valor base estéincluido entre el valor inicial y el valor final de este rango. Por ejemplo, es posible que desee mostraruna flecha abajo cuando el valor base esté por debajo de un umbral determinado en comparación con elvalor de destino.

La información siguiente describe cómo ocultar la sparkline:

• Para ocultar la sparkline, en la pestaña Visualización, bajo Gráfico, seleccione el conmutador Mostrarsparkline para inhabilitar la característica.

Mapa existenteUtilice un mapa existente cuando quiera ver los modelos de sus datos según la geografía. Los mapasexistentes se pueden utilizar sin conexión a internet.

Por ejemplo, esta visualización de mapa existente muestra los ingresos por país de minorista; un colormás oscuro indica mayores ingresos.

Para obtener más información, consulte https://www.ibm.com/support/knowledgecenter/SSEP7J_11.1.0/com.ibm.swg.ba.cognos.ug_ca_legacymaps.doc/ug_ca_legacymaps.pdf.

26 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 31: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

LíneasUtilice una visualización de línea para mostrar tendencias a lo largo del tiempo.

Una visualización de líneas puede comparar las tendencias y los ciclos, inferir relaciones entre lasvariables o mostrar el rendimiento de una sola variable en el tiempo.

Para que una visualización de líneas sea eficaz, utilice una columna temporal en el eje x, como años,trimestres, meses o días. Si el eje x muestra algo distinto, como el Canadá, Países Bajos, Reino Unido yEstados Unidos, utilice una visualización de barras o columnas.

Por ejemplo, esta visualización de líneas muestra la tendencia en los costes de los cursos pordepartamento durante el año.

Líneas y columnasUtiliza una visualización de líneas y columnas para resaltar relaciones entre múltiples series de datoscombinando barras y líneas en una visualización.

Por ejemplo, esta visualización de líneas y columnas muestra la relación entre el coste del curso y losgastos totales por departamento.

Capítulo 3. Visualizations 27

Page 32: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

ListaPuede utilizar una visualización de lista para crear una visión general de los datos en forma jerárquica.

Otro uso de la visualización de la lista es para crear el widget de filtro. En el ejemplo siguiente se muestracómo puede utilizar la visualización de lista como widget de filtro.

28 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 33: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

MapaUtilice un mapa cuando quiera ver los patrones de sus datos por geografía.

El activo de datos debe contener datos geográficos, tales como países, estados, provincias o continentes.

Nota: Los mapas no muestran animaciones si se definen los valores del sistema con el fin de facilitar elacceso para que no se muestren las animaciones.

Los mapas de Cognos Analytics dan soporte a los siguientes continentes:

• Norteamérica• América del sur• África• Asia• Europa• Antártica• Oceanía

Para determinar si una columna se puede expresar en un mapa, Cognos Analytics analiza una muestra de2000 valores en la columna de ubicación en busca de nombres de lugares reconocibles. Si se reconoce el80 % o más como valores de mapa, Cognos Analytics genera un mapa.

Por ejemplo, tiene cuatro países en la columna de ubicación: Brasil, China, India y Rusia. El errortipográfico de India significa que solo el 75 % de los valores son nombres de lugares reconocibles y noverá un mapa como punto de inicio. Pero si tiene cinco países y uno tiene un error tipográfico, verá unmapa.

Por ejemplo, esta visualización de mapa muestra los ingresos por país de minorista; un color más oscuroindica mayores ingresos.

Capítulo 3. Visualizations 29

Page 34: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

MarimekkoUna visualización de Marimekko es similar a una visualización de columnas apiladas. Muestra los datosmediante diversas alturas e incluye una dimensión adicional de los datos a través de diferentes anchurasde columna. El ancho de las columnas se basa en el valor que se asigna al campo de anchura. La altura decada segmento individual es un porcentaje del valor total de la columna respectiva.

Permite detectar rápidamente segmentos grandes como, por ejemplo, una vertical específica que tieneuna gran parte de una región. También permite identificar espacios en blanco, como por ejemplo unavertical subrepresentada en una región específica.

La visualización de marimekko es útil para comparaciones de una parte con el todo, donde necesitemostrar un medida/variable extra.

La visualización de Marimekko permite representar los datos en dos dimensiones simultáneamente. Porejemplo, los segmentos de mercado a menudo se distribuyen a lo largo del eje X, y la anchura de cadacolumna corresponde al valor financiero de un segmento. Puede utilizar visualizaciones de marimekko encasos, por ejemplo, donde desee mostrar la contribución de ingresos por línea de producto. O el productointerior bruto por país.

La visualización de Marimekko puede mostrar el número total o parcial. Si desea utilizar porcentajesapilados en lugar de un número, utilice la opción Mostrar como gráfico de porcentajes apilados.

El ejemplo siguiente muestra la contribución del valor de duración de clientes y estado de empleo en lasdiferentes clases de vehículos con la opción Mostrar como gráfico de porcentajes apilados habilitada.

30 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 35: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

La visualización marimekko se ha creado arrastrando los siguientes elementos de datos desde el panelOrígenes:

• Arrastre Clase de vehículo al campo Barras.• Arrastre Valor de duración de clientes al campo Longitud.• Arrastre Estado laboral al campo Color

Ejemplos

Puede ver un ejemplo de una visualización de nube de palabras en el informe de ejemplo Análisis delvalor de duración de clientes. Puede encontrar el ejemplo aquí: Contenido del equipo > Ejemplo >Informes > Análisis del valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

RedUtilice una visualización de red si desea ver las conexiones entre columnas de su activo de datos. Unavisualización de red resulta una buena opción para mostrar conexiones, redes y puntos de intersección.

Las visualizaciones de red muestran un conjunto de nodos, representados por símbolos, y enlaces,representados por rutas, para mostrar la relación entre entidades o elementos.

Utilice los campos Desde y Hasta para definir la relación que desea investigar.

Por ejemplo, una visualización de red puede mostrar la aceptación de oferta por clase de vehículo.

Capítulo 3. Visualizations 31

Page 36: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Cree la visualización de red arrastrando los siguientes elementos de datos desde la sección Ofertas al

panel Orígenes :

• Arrastre Oferta al campo Desde.• Arrastre Clase de vehículo al campo Hasta.• Arrastre Aceptado al campo Anchura de línea.

A continuación, establezca las propiedades de tamaño y nodo.

1. Pulse la visualización y, a continuación, pulse . Establezca las opciones siguientes en el panelPropiedades:

• Tamaño - Anchura: 500 px, Altura: 300 px• Tamaño mínimo de nodos: 20• Tamaño máximo de nodos: 100

2. Pulse para cerrar el panel Propiedades.

Ejemplos

Puede ver ejemplos de las visualizaciones en el informe de ejemplo Análisis del valor de duración declientes. Puede encontrar los ejemplos aquí: Contenido del equipo > Ejemplos > Informes > Análisisdel valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

Burbujas empaquetadasUtilice una visualización de burbujas empaquetadas cuando desee mostrar relaciones entre columnasque contengan valores numéricos, como por ejemplo ingresos. Es parecida a la visualización de burbujas,pero las burbujas están agrupadas en lugar de dispersadas por una cuadrícula. Una visualización deburbujas empaquetadas muestra una gran cantidad de datos en un espacio pequeño.

Las burbujas tienen diferentes tamaños y colores.

Por ejemplo, esta visualización de burbujas empaquetadas muestra contrataciones externas pordepartamento. Cada burbuja es un departamento distinto. El tamaño de cada burbuja viene determinadopor el número de contrataciones externas del departamento.

32 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 37: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Gráfico circularUtilice una visualización de gráfico circular para resaltar las proporciones. Cada porción muestra larelación relativa de cada parte con el conjunto.

Por ejemplo, esta visualización de gráfico circular muestra el número de días de curso de cadadepartamento.

PuntosUtilice una visualización de puntos para mostrar tendencias a lo largo del tiempo.

Una visualización de puntos puede comparar las tendencias y los ciclos, inferir relaciones entre lasvariables o mostrar el rendimiento de una variable a lo largo del tiempo.

Capítulo 3. Visualizations 33

Page 38: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Una visualización de puntos es como un gráfico de líneas sin las líneas de conexión.

Para que una visualización de líneas sea eficaz, el eje X debe mostrar el tiempo, como por ejemplo años,trimestres, meses o días. Si el eje x muestra algo distinto, como por ejemplo Canadá, Países Bajos, ReinoUnido y Estados Unidos, utilice una visualización de barras.

Los valores de datos se trazan verticalmente.

Por ejemplo, esta visualización de líneas muestra los ingresos de un trimestre por tipo de método depedido. Los pedidos web han crecido drásticamente durante este período.

RadialEn una visualización de radiales, cada barras se representa como un círculo y las barras más largasrepresentan valores más grandes. Pase el cursor por encima de una barra para ver detalles sobre lamisma, como el valor exacto representado por la barra. Cada barra comienza a las 12 del mediodía y vaen el sentido de las agujas del reloj en caso de valores positivos y en el sentido contrario a las agujas delreloj en caso de valores negativos.

Las visualizaciones de radiales, también conocidas como gráficos de dial o de velocímetro, muestran lainformación como una lectura en un dial. La visualización de radiales sólo es válida con una categoría.

Por ejemplo, esta visualización muestra las renovaciones por tipo de oferta y género.

34 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 39: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Cree la visualización de radiales arrastrando los siguientes elementos de datos desde la sección Análisis

de clientes al panel Orígenes :

• Arrastre Renovar tipo de oferta al campo Barras.• Arrastre Número de políticas al campo Longitud.• Arrastre Género al campo Color.

El paso siguiente es establecer las propiedades de clasificación para Renovar tipo de oferta y Género.

1. Pulse la visualización, a continuación en el panel Datos pulse el elemento de datos <Renovar tipo deoferta>.

2. Pulse 3. En el panel Propiedades, para Orden de clasificación, seleccione Ascendente.4. En el panel Datos, pulse el elemento de datos <Género>.5. En el panel Propiedades, para Orden de clasificación, seleccione Descendente.

6. Pulse para cerrar el panel Propiedades.

Ejemplos

Puede ver ejemplos de las visualizaciones en el informe de ejemplo Análisis del valor de duración declientes. Puede encontrar los ejemplos aquí: Contenido del equipo > Ejemplos > Informes > Análisisdel valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

DispersiónLas visualizaciones de dispersión utilizan puntos de datos para trazar dos medidas en cualquier lugar a lolargo de una escala, no solo en las marcas de escala regulares.

Las visualizaciones de dispersión son útiles para explorar correlaciones entre diferentes conjuntos dedatos.

En el ejemplo siguiente se muestra la correlación entre los ingresos y el beneficio bruto de cada tipo deproducto.

Capítulo 3. Visualizations 35

Page 40: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

EspiralUna visualización en espiral le muestra los controladores clave, o predictores, para un destinodeterminado. Cuanto más cerca del centro está el controlador, más fuerte es.

IBM Cognos Analytics utiliza sofisticados algoritmos para ofrecer conocimientos altamente interpretablesbasados en modelado complejo.. No es necesario que sepa qué pruebas estadísticas debe ejecutar sobresus datos. Cognos Analytics utiliza las pruebas correctas para los datos.

Los controladores clave para destinos continuos y categóricos están disponibles en la visualización enespiral y las exploraciones.

Para obtener más información, consulte la documentación sobre Pruebas estadísticas en la publicaciónIBM Cognos Analytics Paneles de control e historias Guía del usuario.

Por ejemplo, esta visualización en espiral muestra que la combinación de clase de vehículo, tipo deubicación, cobertura, estado civil y estado laboral son los controladores más importantes del destino,Importe total de reclamación.

Puede excluir controladores del análisis. Pulse con el botón derecho del ratón sobre un controlador y

pulse el icono Editar controladores . Seleccione los controladores que desea incluir en el análisis.

Para editar o añadir controladores clave, pulse el en la ranura de datos de destino.

Para mejorar el rendimiento, debido al número de filas en el origen de datos, el análisis se basa en unamuestra representativa de todos los datos.

36 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 41: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Nota: No se admiten filtros en las visualizaciones en espiral

Barras apiladasUtilice una visualización de barras apiladas para comparar contribuciones proporcionales para cadaelemento con el total, como ventas de productos y ventas de productos mensuales.

Una visualización de barras apiladas puede mostrar los cambios producidos durante un período detiempo específico o comparar las contribuciones proporcionales de cada elemento con el total. Si haytantas barras que no permiten la lectura de las etiquetas, filtre los datos para centrarse en unsubconjunto de los datos o utilice un mapa de árbol.

Columnas apiladasUtilice la visualización de columnas apiladas para comparar las contribuciones proporcionales de cadaelemento con el total, como las ventas de productos y las ventas de productos mensuales.

Capítulo 3. Visualizations 37

Page 42: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Una visualización de columnas apiladas puede mostrar los cambios durante un período de tiempoespecífico o puede comparar las contribuciones proporcionales de cada elemento con el total. Si haytantas barras que no permiten la lectura de las etiquetas, filtre los datos para centrarse en unsubconjunto de los datos o utilice un mapa de árbol.

ResumenUtilice una visualización de resumen si desea ver el total de una medida o el recuento de una columnacategórica.

Por ejemplo, esta visualización de resumen muestra los ingresos totales de todos los tipos de producto.

Por ejemplo, esta visualización de resumen muestra el número de departamentos de su organización.

38 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 43: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

SunburstUna visualización Sunburst se utiliza para ilustrar cómo los datos subyacentes pronostican un destinoseleccionado y resaltar conocimientos clave.

Para obtener más información sobre la visualización Sunburst, consulte “Exploración de una visualizaciónde árbol de decisiones” en la página 18.

TablaUtilice una tabla para mostrar información detallada de su base de datos, como listas de productos ylistas de clientes. Una tabla muestra datos en filas y columnas. Cada columna muestra todos los valorespara un elemento de datos de la base de datos o un cálculo que se basa en los elementos de datos de labase de datos.

Por ejemplo, esta tabla muestra el coste del curso de cada departamento.

Adición de más columnas a una tabla

Puede centrarse en puntos que sean de su interés añadiendo más datos a la visualización.

1. Arrastre otra columna al campo donde desee datos adicionales.2. Suelte la columna al lado de la columna existente.

A partir de Cognos Analytics versión 11.1.4, puede arrastrar datos desde el panel Orígenesseleccionados e insertar datos en una columna/fila o soltar los datos sobre los datos existentes parasustituirlos.

Capítulo 3. Visualizations 39

Page 44: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Mapa de árbolUtilice una visualización de mapa de árbol para identificar modelos y excepciones en un activo de datosextenso y complejo.

Los mapas de árbol muestran relaciones entre un gran número de componentes utilizando la codificaciónde tamaño y color en un conjunto de rectángulos anidados.

Un mapa de árbol coloreado por categoría identifica la categoría nivel 1 por color. Los tamaños de losrectángulos representan los valores. En un mapa de árbol coloreado por valor, los tamaños de losrectángulos representan uno de los valores y el color representa un segundo conjunto de valores. Noutilice datos que incluyan números negativos. Los mapas de árbol omite los números negativos.

Muchos activos de datos tienen una estructura jerárquica. Por ejemplo, puede tener datos acerca delmargen de beneficio de alimentos en una tienda de comestibles. Bajo la categoría general de frutas, hayuna categoría para cítricos. Aparecen listados varios cítricos, como pomelos, naranjas y limones. Un mapade árbol le indica cómo está rindiendo cada uno de los cítricos cuando se comparan entre sí y con otrostipos de alimentos.

Por ejemplo, esta visualización de mapa de árbol muestra los costes del curso por organización.

Para anular la selección de un recuadro que haya seleccionado, Ctrl+clic el recuadro seleccionado.

CascadaUtilice una visualización en cascada para comprender el efecto acumulativo que tiene de una serie devalores positivos y negativos sobre un valor inicial. Las barras de una visualización en cascada no sontotales.

Una visualización en cascada muestra cómo aumenta y disminuye un valor inicial mediante una serie devalores intermedios, que genera un valor acumulativo final visualizado en la columna del extremoderecho. Los valores intermedios pueden estar basados en el tiempo o en categorías.

Las siguientes son algunas visualizaciones en cascada de ejemplo:

• Visualizar el ingreso neto después de añadir los aumentos y descensos de ingresos y costes para unaempresa a lo largo de un trimestre.

• Las ventas acumulativas de productos a lo largo de un año con un total anual.

40 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 45: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Esta visualización en cascada muestra el delta de asegurado por mes.

Creación de una visualización en cascada

1. Cree una nueva exploración. Para obtener más información, consulte “Iniciar una nueva exploracióndesde el menú Nuevo” en la página 1.

2. Abra el módulo de datos de ejemplo: Seleccionar un origen > Contenido del equipo > Ejemplos >Datos > Análisis del cliente.

3. Pulse Visualizaciones y pulse Cascada para añadir la visualización en cascada a la exploración.4. Pulse Orígenes

5. Arrastre los elementos de datos siguientes desde la sección Asegurados:

• Arrastre Mes al eje-x.• Arrastre Delta al eje-y.

Nube de palabrasUtilice una visualización de nube de palabras cuando desee ver una visualización basada en texto de unacolumna. La altura del texto representa la escala. El propio nombre representa los diferentes miembrosde la columna.

Consejo: El activo de datos debería contener al menos 15 columnas y al menos 100 filas para crear unanube de palabras efectiva.

Por ejemplo, esta visualización de nube de palabras muestra el valor de tiempo de vida de cliente portamaño y clase de vehículo.

Capítulo 3. Visualizations 41

Page 46: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

La nube de palabras se ha creado arrastrando los siguientes elementos de datos desde el panel Orígenes:

• Arrastrando el tipo Tamaño de vehículo al campo Palabras.• Arrastrando CLTV medio al campo Tamaño.• Arrastrando Clase de vehículo al campo Color

Ejemplos

Puede ver un ejemplo de una visualización de nube de palabras en el informe de ejemplo Análisis delvalor de duración de clientes. Puede encontrar el ejemplo aquí: Contenido del equipo > Ejemplo >Informes > Análisis del valor de duración de clientes.

Si falta cualquiera de los objetos de ejemplo, póngase en contacto con el administrador.

Informaciones en visualizacionesIBM Cognos Analytics proporciona informaciones analíticas que le ayudan a detectar y validar relacionesimportantes y diferencias significativas basadas en los datos que presenta la visualización.

Para acceder a los conocimientos, pulse el icono Conocimientos de las visualizaciones elegibles. Alactivar las informaciones, el resumen aparece en el recuadro Informaciones y se resaltan los elementosde visualización relacionados y se proporcionan detalles en el mensaje de ayuda contextualcorrespondiente. Puede controlar cada una de las informaciones disponibles por separado.

Procedimiento

1. En una visualización que admita informaciones, pulse el icono informaciones .2. Según la visualización, se muestran las siguientes informaciones:

• Promedio: Proporciona la media del valor de destino visualizado.• Fuerza predictiva: Muestra la fuerza predictiva de la relación entre los campos de destino y

explicativo.• Línea de ajuste: Muestra cuando existe una relación lineal o cuadrática entre los campos de destino

y explicativo.

42 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 47: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

• Diferencias significativas: Muestra los valores que son significativamente más altos o más bajosque el promedio o la tendencia.

• Más frecuente: Muestra los valores que se notifican con más frecuencia.

Elegir informaciones correlacionadasBasándose en su visualización, se le presentará información correlacionada basada en estadísticas.

Acerca de esta tarea

Si hay informaciones correlacionadas disponibles relacionadas con la visualización principal, se muestra

un icono verde con un número en el eje x o en el eje y. Este número indica las informacionescorrelacionadas disponibles.

Para acceder a las visualizaciones correlacionadas, realice las acciones siguientes:

Procedimiento

1. Desde la visualización, pulse el icono verde .2. Haga clic en cualquiera de las informaciones basadas en estadísticas que se presentan en el menú.

Se crea una nueva tarjeta.

Elección de las visualizaciones recomendadasLas visualizaciones recomendadas son miniaturas que muestran visualizaciones que pueden seradecuadas para sus datos.

Procedimiento

1. En el panel Tarjetas, seleccione la tarjeta que representa la visualización que desea abrir.

2. Pulse Seleccionar tipo de visualización en la barra de herramientas.Se visualizan las visualizaciones recomendadas.

3. Haga clic en la miniatura de la visualización recomendada con la que desea trabajar.

Elegir una visualización relacionadaCuando tiene el foco puesto en una visualización en su exploración, el sistema le recomienda algunasvisualizaciones relacionadas que no son específicamente la que ha solicitado. Estas visualizaciones,basadas en el análisis de datos, pueden resultarle de interés.

Acerca de esta tareaLas visualizaciones relacionadas sustituyen a uno de los elementos de datos en la visualización o añadenotro elemento de datos para crear una nueva visualización. Las visualizaciones relacionadas utilizan unacombinación de interacciones de usuario aprendidas, estadísticas y grado de interés para sugerirsiguientes pasos útiles.

Para acceder a las visualizaciones relacionadas, realice las acciones siguientes:

Procedimiento

1. En el panel Tarjetas, seleccione la tarjeta que representa la visualización que desea abrir.

2. Pulse Relacionadas en la barra de herramientas.

Capítulo 3. Visualizations 43

Page 48: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

44 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 49: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 4. Forecasting

PredicciónUtilice la predicción en IBM Cognos Analytics para descubrir y modelar la tendencia, la estacionalidad y ladependencia temporal de los datos.

Puede realizar previsiones en IBM Cognos Analytics utilizando herramientas automatizadas que modelandatos que dependen del tiempo. La selección del modelado y ajuste automatizados facilita el uso de lasprevisiones, incluso si no está familiarizado con el modelado de las series temporales.

Las previsiones y sus límites de confianza se muestran en las visualizaciones como una continuación delos datos históricos. También puede ver detalles estadísticos para los modelos generados si desea ver eltrasfondo técnico.

Especificar series temporales en previsiones suele requerir la manipulación de datos. Cognos Analyticsda soporte a una amplia gama de series temporales sin que sea necesaria la manipulación, desde tipos defecha y hora estándar a campos temporales periódicos y cíclicos anidados. Cuando los datos sereconocen como una serie temporal, se automatiza la preparación de datos. Se detectan los periodosestacionales y de tendencia y se seleccionan modelos de un conjunto de nueve tipos de modelosdiferentes.

Puede realizar previsiones en visualizaciones de líneas, barras y columnas. La previsión permite analizarcentenares de series temporales por visualización. Se calculan las previsiones y los límites de confianzapara cada serie temporal y se muestran en la visualización como extensiones de los datos actuales.Puede inspeccionar cada serie temporal por separado y adaptar la previsión y los resultados a suspropios datos y requisitos.

Si está familiarizado con los modelos de previsión, puede ver el tipo de modelo seleccionado, losparámetros estimados del modelo, las medidas de precisión estándar y la información de resumen deprocesos.

Características de previsiónLa previsión proporciona el modelado de datos de series temporales y previsiones basadas en los datosde las visualizaciones.

Para utilizar la previsión, la visualización debe ser una visualización de líneas, barras o columnas, losdatos deben estar soportados para la previsión y la previsión debe estar habilitada. Cuando está

habilitada la previsión, está disponible un cuadro de diálogo Previsión en el ángulo superior derechode una visualización, donde puede modificar los valores del modelo y la previsión y también los límites deconfianza. Los modelos de series temporales adecuados para la visualización son una estimación, y lasprevisiones se muestran en la visualización. También puede ver la especificación del modelo de seriestemporales y el resumen del proceso de datos en la bandeja de datos.

El ejemplo siguiente muestra los valores de previsión y los límites de confianza de una visualización.

© Copyright IBM Corp. 2018, 2020 45

Page 50: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Opciones de previsiónPuede modificar sus previsiones estableciendo un número de opciones de periodo y nivel de confianza en

el cuadro de diálogo Previsión .

46 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 51: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Un periodo es el intervalo de tiempo más pequeño entre puntos próximos en los datos.

Las siguientes opciones están disponibles.

Periodos de previsiónEl número de pasos para la previsión posterior.El valor predeterminado es Automático, el cual es el 20% de la longitud de los datos históricos.También se pronosticará cualquier valor ausente al final de una serie específica, pero no se contaráen el número de periodos de previsión especificado.

Últimos periodos ignoradosOmite un número de puntos de datos al final de una serie temporal cuando se genera el modelo y secalculan las previsiones. También se pronosticará, cualquier valor que falte al final de una parte noignorada de una serie. El último valor de periodos ignorado se debe especificar como un entero nonegativo, por ejemplo: 0, 1, 2, 3.El valor predeterminado es 0, de modo que se utilizan todos los datos históricos para la generacióndel modelo y el primer punto de previsión va después del último punto de datos históricos. Se puedenignorar hasta 100 puntos de datos.Ignorar el último periodo de datos puede resultar útil cuando los datos están incompletos. Porejemplo, es posible que esté realizando una previsión a mediados de un mes. Excluya este mes de laprevisión estableciendo Últimos periodos ignorados en 1.

La visualización siguiente muestra una previsión que ignora los resultados de septiembreestableciendo Últimos periodos ignorados en 1.

Capítulo 4. Forecasting 47

Page 52: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Nivel de confianzaLa certeza con la que se espera que el valor verdadero esté en el rango concreto. Para ver el intervalode confianza correspondiente pase el cursor por cualquier valor de previsión para obtener unasugerencia. El intervalo de confianza se muestra como el límite superior e inferior.Puede seleccionar tres niveles de confianza: 90%, 95% y 99%. El valor predeterminado es el 95% y ellímite inferior y superior definen el rango en que puede estar un 95% seguro de que el valor verdaderoestá dentro de dicho rango.

Periodo estacionalLa estacionalidad con la que se ha de crear el modelo. La estacionalidad es cuando la serie temporaltiene una variación cíclica predecible. Por ejemplo, durante un periodo festivo cada año.

El valor predeterminado es Automático. El valor Automático detecta automáticamente laestacionalidad creando varios modelos con diferentes periodos estacionales y seleccionando elmejor.

Puede especificar la estacionalidad especificando un entero no negativo, por ejemplo: 0, 1, 2, 3 comoel periodo estacional.Para especificar un modelo no estacional, establezca el Periodo estacional en 0 o 1. Solo se muestraun modelo con la estacionalidad especificada por el usuario si el modelo estacional es más precisoque todos los modelos no estacionales.

Conocimientos

Cuando las visualizaciones tienen habilitados los conocimientos y las previsiones, se muestra el cuadrode diálogo Conocimientos junto al cuadro de diálogo Previsión. Cada función proporciona un conjunto deresultados de análisis independiente. Para obtener más información, consulte “Informaciones envisualizaciones” en la página 65.

48 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 53: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Tipos de visualizaciones que dan soporte a la previsiónLas previsiones están soportadas en visualizaciones de líneas, barras y columnas.

En la tabla siguiente se comparan las características de la visualización de previsión para cadavisualización.

Características deprevisión

Gráfico de líneas Gráfico de barras Gráfico de columnas

Puntos de previsión Círculo abierto Barra de bandas Columna de bandas

Visualizar intervalo deconfianza

Región sombreada Línea continua Línea continua

Activar intervalo deconfianza

Pulsar en cualquierpunto

Pulsar una barra deprevisión

Pulsar una columna deprevisión

Número de intervalos deconfianza visualizados

Todos 1 1

En la imagen siguiente se muestra una previsión en visualizaciones de líneas y barras con intervalos debarras activados.

Conocimientos y previsiones

Los conocimientos en las visualizaciones proporcionan conocimientos analíticos que pueden ayudar a losusuarios a detectar y validar cualquier relación importante y las diferencias significativas en función delos datos que presenta la visualización. Los conocimientos funcionan junto con la previsión en lasvisualizaciones soportadas. Los conocimientos proporcionan un conjunto separado de resultados deanálisis y los resultados son únicamente para valores históricos. Para obtener más información, consulte“Informaciones en visualizaciones” en la página 65.

Datos de previsiónLos datos adecuados para la previsión tienen valores de medidas que se corresponden con puntostemporales espaciados con regularidad. El tiempo y las medidas se especifican en las visualizacionesarrastrando los campos de hora y los campos de medidas a las ranuras de visualización. Opcionalmentetambién puede especificar campos de grupo que dividen los valores de medidas por categorías.

La tabla siguiente es un resumen de los tipos de campos y de las ranuras de visualizacióncorrespondientes soportadas en la previsión:

Capítulo 4. Forecasting 49

Page 54: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Ranura Campos de hora(necesario)

Campos de medida(necesario)

Campos de grupo(opcional)

Ranura de gráfico delíneas

eje x eje y Color

Ranura de gráfico debarras

Barras Longitud Color

Ranura de gráfico decolumnas

Barras Longitud Color

No se da soporte a otras visualizaciones o ranuras de visualización, con la excepción de la ranura Filtroslocales

Campos de hora en los datos de previsiónUn campo de hora se identifica por el icono de hora ubicado en la parte frontal de la etiqueta del campoen el panel Datos.

Puede especificar las propiedades del campo de hora utilizando las propiedades siguientes: Tipo dedatos o Representa la hora.

Tipo de datos

Un campo se reconoce como un campo de hora si tiene uno de los tipos de datos siguientes: Fecha, Horao Indicación de fecha y hora. El tipo de datos se hereda del origen de datos y no se puede modificar.

Los tipos de datos Fecha, Hora e Indicación de fecha y hora se han diseñado para dar soporte a un rangode formatos de fecha y hora cubiertos por los formatos básicos y ampliados de ISO 8601. La tablasiguiente muestra los tipos de datos soportados junto con un ejemplo de formato y un ejemplo de datospara cada uno.

Tipo de datos Ejemplo de formato Ejemplo de datos

Date yyyy-mm-dd 2019-07-01

Hora hh:mm:ss 12:34:56

Indicación de fecha y hora yyyy-mm-dd’T’hh:mm:ss 2019-07-01T12:34:56

Representa la hora

Un campo se reconoce como un campo de hora si la propiedad de datos Representa se ha establecido enHora. Los campos Texto y Entero que contienen datos de hora también se reconocen como campostemporales. Los campos de hora se definen automáticamente durante la importación o la mejora. Lasdefiniciones posibles son Fecha, Año, Trimestre, Estación, Mes, Semana, Día, Hora, Minuto o Segundo.

Si los campos de hora no se reconocen automáticamente, puede especificarlos como campostemporales. Asegúrese de que los valores de los campos tengan uno de los formatos soportados, de locontrario es posible que se muestre un error de tipo Formato de fecha no soportado.

Campos temporales anidados

Puede arrastrar varios campos de hora a una misma ranura de visualización para especificar un campo dehora anidado. Por ejemplo, un campo que representa la Semana se puede arrastrar a la ranura junto conun campo que representa el Día para crear una previsión de Días de la semana.

50 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 55: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Los campos anidados de la ranura deben estar en el orden de la jerarquía de tiempo. Por ejemplo,Semana debe estar sobre Día.

Los campos anidados no pueden omitir los niveles de la jerarquía de tiempo, de lo contrario, se generauna ambigüedad. La tabla siguiente describe las jerarquías aceptables.

Campo de hora Campos inferiores aceptables

Año Trimestre, Mes, Semana, Día

Trimestre Mes

Mes Día

Semana Día

Día (del Año, Mes o Semana) Hora, Tiempo

Hora Minuto

Minuto Segundo

Si Año está ausente en la jerarquía de tiempo, el sistema toma como valor predeterminado el año actual.Esto puede causar problemas debido a la diferencia entre años bisiestos y no bisiestos. Considere laposibilidad de proporcionar el año en estos casos.

Orden cronológico de datos

Los campos de tiempo especificados definen un orden cronológico para los puntos temporales de lavisualización. Se utilizan para ordenar los puntos de la visualización por orden cronológico cuando estáhabilitada la previsión. El orden cronológico incluye los puntos históricos, junto con los nuevos puntosprevistos. Se ignora cualquier otro criterio de clasificación que se especifique para la visualización cuandoestá habilitada la previsión.

Cualquier etiqueta de tiempo no válida se traslada al principio de la secuencia y se excluye de la creacióndel modelo y del cálculo de la previsión.

Detección del intervalo de tiempo

La detección del intervalo de tiempo es posible cuando los datos están clasificados por ordencronológico. El intervalo de tiempo tiene el tamaño del intervalo más pequeño entre dos puntostemporales adyacentes, tal como "2 semanas". Si se detectan intervalos de tiempo variables, deben sertodos múltiplos de entero del intervalo más pequeño. De lo contrario, los datos serán irregulares y no sepodrán pronosticar. Los puntos temporales no existentes que se generan debido a múltiples intervalos,se rellenan para el intervalo detectado. Los valores de medida correspondientes se establecen como noexistentes. Si el número de valores no existentes supera el 33% de la longitud de la serie, se notifica elerror Faltan demasiados valores.

Campos de medida

Se pueden especificar uno o varios campos de cualquier tipo como campos de medida para los análisis deprevisión, añadiéndolos a una ranura de visualización correspondiente. Cada campo de medida se analizapor separado. También se pueden especificar varias series temporales añadiendo un campo a la ranuraColor, separando los valores de medida por las categorías del campo especificado.

Capítulo 4. Forecasting 51

Page 56: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Todos los valores del campo de medida que se corresponden con el mismo punto temporal se resumenutilizando uno de los siguientes niveles de resumen: Suma, Mínimo, Máximo, Promedio, Recuento yRecuento distinto. El campo debe ser numérico para dar soporte al resumen Suma, Mínimo, Máximo oPromedio. Todos los tipos de datos y niveles de resumen posibles están soportados para la previsión. Noobstante, tenga en cuenta los puntos siguientes:

• Un número pequeño de valores de medidas diferentes puede generar previsiones imprevistas o sininformación. Por ejemplo, cuando se utiliza el resumen Recuento distinto.

• Los valores de medidas de cero pueden tener una influencia negativa en los resultados, sobretodocuando representan medidas que faltan.

Interpolación de valores que faltan

El algoritmo Interpolación lineal calcula los valores no existentes y los rellena. El cálculo está basado enlos vecinos más próximos en una serie temporal ordenada alfabéticamente con el intervalo de tiempodetectado. El nuevo valor es (valor anterior + valor siguiente)/2. Por ejemplo, con losvalores [3, 6, ausente, 12], el valor interpolado para sustituir el valor ausente es (6 + 12) / 2 o 9. Elalgoritmo de interpolación también puede manejar valores ausentes contiguos.

Los puntos de datos con valores ausentes en el primer punto temporal histórico, o en el último, seexcluyen de las series antes de generar un modelo. Los valores ausentes de los últimos puntostemporales históricos también se pronostican.

Detalles estadísticos de la previsiónLa ejecución de una previsión genera previsiones y detalles estadísticos de previsión. Los detallesestadísticos de previsión están ubicados en la bandeja de datos en la parte inferior de cada visualización.Hay una única de detalles estadísticos para cada serie temporal de la visualización. Los destalles de laprevisión se generan a lo largo de los puntos temporales con un espaciado equitativo.

La información de previsión contiene el Estado de la previsión para las series temporales específicas.Cuando el estado Correcto, los otros campos proporcionan detalles sobre el modelo y los datos utilizadospara la previsión. Cuando el estado es Error, algunos de los otros campos, incluido el campo Notas,proporcionan detalles relacionados con la causa del error. También se proporcionan resúmenes decualquier error en los avisos de la visualización.

52 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 57: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

La información del Modelo especifica el tipo de Tendencia y Estacionalidad que se ha seleccionado parala estimación de los datos de series temporales cuando el estado es correcto. La tabla siguiente lista losdiferentes tipos disponibles.

Componente Tendencia Componente Estacional

N

NINGUNO

A

ADITIVO

M

MULTIPLICATIVO

N

NINGUNO

(N, N) (N, A) (N, M)

A

ADITIVO

(A, N) (A, A) (A, M)

Ad

ADITIVO_AMORTIGUADO

(Ad, N) (Ad, A) (Ad, M)

Medidas de precisión

Las medidas de precisión MAE (Mean Absolute Error), MASE (Mean Absolute Scaled Error), Porcentaje deprecisión, RMSE (Root Mean Squared Error), MAPE (Mean Absolute Percent Error) y AIC (AkaikeInformation Criterion) están basas en los datos de series temporales utilizados para generar el modelo.Todas las medidas de precisión están basadas en datos históricos. Las medidas de precisión también sepueden utilizar como un indicador de la precisión de la previsión pero no conllevan valores futuros.

Mean Absolute Error (MAE)Se calcula como la diferencia absoluta promedio entre los valores ajustados por el modelo (un pasopor delante de la previsión de muestra) y los datos históricos observados.

Mean Absolute Scaled Error (MASE)La medida de error que se utiliza para la precisión del modelo. Es el MAE dividido por el MAE delmodelo ingenuo. El modelo ingenuo es el que pronostica el valor en el punto del tiempo t, como elvalor histórico anterior. El escalado por este error significa que puede evaluar hasta qué punto esbueno el modelo en comparación con el modelo ingenuo. Si el MASE es mayor que 1, el modelo espeor que el modelo ingenuo. Cuando más bajo sea el MASE, mejor será el modelo en comparacióncon el modelo ingenuo.

Porcentaje de precisión (% de precisión)El indicador primario de la precisión del modelo basada en los valores ajustados. Se especifica comoel porcentaje de reducción del error absoluto medio para el modelo ingenuo. Se calcula restando elMASE de 1 y se expresa como un porcentaje. Si el MASE es mayor o igual a 1, la precisión seestablece en el 0%, ya que el modelo no mejora sobre el modelo ingenuo. Una precisión mayor indicael error de modelo inferior relativo al modelo ingenuo.

Mean Squared Error (MSE)La suma de la diferencia cuadrática entre los valores ajustados por el modelo, y los valoresobservados divididos por el número de puntos históricos, menos el número de parámetros delmodelo. El número de parámetros del modelo se resta del número de puntos históricos para que seacoherente con la estimación de varianza del modelo no sesgado.

Root Mean Squared Error (RMSE)La raíz cuadrada del MSE. Está en la misma escala que los valores de datos observados.

Mean Absolute Percent Error (MAPE)La diferencia de porcentaje absoluto promedio entre los valores ajustados por el modelo y los valoresde datos observados.

Capítulo 4. Forecasting 53

Page 58: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Akaike Information Criterion (AIC)Una medida de selección de modelo. El AIC penaliza los modelos con muchos parámetros, de modoque intenta elegir el mejor modelo prefiriendo los modelos más sencillos. El AIC es la suma dellogaritmo del MSE no ajustado multiplicado por el número de puntos históricos y el número deparámetros del modelo y los estados de ajuste iniciales que se multiplican por 2.

Parámetros

Están disponibles el periodo estacional detectado y las estimaciones para otros parámetros que seutilizan en el modelo de ajuste exponencial seleccionado.

Periodo estacionalEl número de pasos temporales de un periodo estacional utilizado en el modelo de ajusteexponencial.

AlfaEl factor de ajuste para los estados de nivel del modelo de ajuste exponencial. Los valores alfa bajosaumentan la cantidad de ajuste, es decir, cuando el valor alfa es bajo se tienen más en cuenta losvalores históricos. Los valores alfa elevados reducen la cantidad de ajuste, es decir, se da más peso alas observaciones más recientes. Cuando el valor alfa es 1, se da todo el peso a la observación actual.

BetaEl factor de ajuste para los estados de tendencia del modelo de ajuste exponencial. Este parámetro secomporta del mismo modo que alfa, pero es para tendencias y no para estados de niveles.

GamaEl factor de ajuste para los estados estacionales del modelo de ajuste exponencial. Su rol es similar aalfa, excepto para el componente estacional del modelo.

PhiEl coeficiente de amortiguación del modelo de ajuste exponencial. Las previsiones a largo plazopueden generar resultados no realistas por lo que es útil tener un factor de amortiguación paraamortiguar la tendencia a lo largo del tiempo y generar previsiones más conservadoras.

Diagnósticos

La información incluye Falta recuento, Longitud de serie, Periodos ignorados, Fuerza de tendencia, Fuerzade estacionalidad e intervalo de Fecha/hora.

Falta recuentoIndica el número de filas de datos que tienen valores ausentes o puntos temporales ausentes y queestán posicionadas entre el primer y último valor de serie válido. Los puntos temporales no válidos,así como los puntos con valores ausentes en el primer o último punto temporal histórico, no seincluyen.

Longitud de seriesIndica el número de puntos de datos utilizado para el modelado de series temporales. Solo seincluyen los puntos entre el primer y último valor de serie válido.

Periodos ignoradosUn entero, m, que ignora los últimos m puntos de datos de las series, cuando se genera el modelo deajuste exponencial y se calculan las previsiones. También se pronosticará, cualquier valor noexistente al final de una parte de una serie no ignorada. El valor predeterminado para este parámetroes 0, lo que significa que se utilizan todos los datos históricos para la generación del modelo cuandono hay valores no existentes. Se puede ignorar un máximo potencial de 100 puntos. Los periodosignorados excluyen los puntos de datos cuando se crea un modelo, por lo que es posible que falle laprevisión debido a factores, como los requisitos de longitud de datos mínima y una proporción devalores no existentes por encima del 33%.

Fuerza de tendenciaComparar el modelo original, M, con el mismo modelo, pero con el componente de tendenciaeliminado. La fuerza de tendencia M es la diferencia de precisión entre el modelo M y el modelo M conel componente de tendencia eliminado.

54 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 59: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Fuerza de estacionalidadComparar el modelo original, M, con el mismo modelo, pero con el componente de estacionalidadeliminado. La fuerza de estacionalidad de M es la diferencia de precisión entre el modelo M y elmodelo M con el componente de estacionalidad eliminado.

Intervalo de fecha/horaEl intervalo de fecha/hora representa el intervalo de tiempo de los datos clasificados por ordencronológico. El intervalo de tiempo se identifica como la diferencia más pequeña entre puntos vecinosde los datos cuando se clasifican por orden cronológico.

Modelos de previsiónLos modelos de ajuste exponencial son una clase popular de modelos de series temporales.

Los modelos de ajuste exponencial se aplican a un único conjunto de valores que se registran únicamentesobre incrementos de tiempo iguales. No obstante, dan soporte a propiedades que se encuentranfrecuentemente en las aplicaciones empresariales, tales como tendencia, estacionalidad y dependenciadel tiempo. Todas las características del modelo son estimadas y se basan en los datos observadosdisponibles. De este modo, se puede utilizar un modelo estimado para la previsión de valores futuros yproporcionar los límites de confianza superior e inferior para los valores de previsión.

Cada modelo se adapta al modelado de una combinación de propiedades diferentes encontradas en losdatos. El tipo de modelo que puede proporcionar la mejor coincidencia en los datos observados seselecciona para el modelado de los datos observados y se utiliza para la previsión de cualquier valorfuturo.

Algoritmos de estimación de modelo

Los modelos se especifican mediante ecuaciones de ajuste que incluyen los parámetros del modelo y losestados de ajuste iniciales. La estimación de los parámetros del modelo se realiza con los valores queminimizan el error del modelo.

Ecuaciones de ajuste

El nombre de los modelos de ajuste exponencial se deriva de las ecuaciones de ajuste que especifica elmodelo. Proporcionan fórmulas para calcular los estados de ajuste de cada punto observado utilizando elvalor observado actual y los estados de ajuste anteriores. Las ecuaciones de ajuste proporcionapromedios ponderados del valor actual y los estados anteriores de las series temporales. La ponderacióndel valor o estado actual la proporciona un parámetro del modelo entre 0 y 1, mientras que lasponderaciones de los valores anteriores disminuyen exponencialmente.

Ecuaciones de ajuste de nivel

Todos los tipos de modelos calculan un estado de nivel para cada punto de serie temporal utilizando laecuación de ajuste de nivel correspondiente. Los estados de nivel para el modelo sin componentes detendencia y estacionalidad se calculan como un promedio ponderado del valor de series temporales en elpunto actual y el estado de nivel en el punto anterior. La ponderación asociada al valor actual es unparámetro alpha, con su valor restringido entre 0 y 1. Para otros modelos, también se incluyen losestados de tendencia y estacionalidad anteriores en la ecuación de ajuste de nivel.

Ecuaciones de ajuste de tendencia

Los tipos de modelos de tendencia aditiva o amortiguada calculan un estado de tendencia para cadapunto de series temporales utilizando la ecuación de ajuste de tendencia correspondiente. El estado detendencia del punto actual está basado en la diferencia de los estados de nivel en el punto actual yanterior, y en el estado de tendencia del punto anterior. La ponderación asociada a la diferencia deestados de nivel en el punto actual y anterior es un parámetro beta con su valor restringido entre 0 y 1.Se añade un parámetro adicional, phi, a las ecuaciones de ajuste de tendencia amortiguada. Phimultiplica la contribución de los estados de tendencia del punto anterior y su valor también estárestringido entre 0 y 1. La finalidad de este parámetro es calcular el grado de amortiguación de tendenciadesde un punto al siguiente.

Capítulo 4. Forecasting 55

Page 60: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Ecuaciones de ajuste estacional

Los tipos de modelos que dan soporte a la estacionalidad aditiva o multiplicativa calculan un estadoestacional para cada punto de series temporales. Los estados estacionales se calculan utilizandoecuaciones de ajuste estacional. El estado estacional del punto actual incluye la diferencia del valor deseries temporales y el estado del nivel actual para la estacionalidad aditiva o la proporción de los dosmismos valores para la estacionalidad multiplicativa. La ponderación asociada a este término es unparámetro, gamma, con su valor restringido entre 0 y 1. El resto de la contribución procede del estadoestacional correspondiente del periodo estacional anterior. Tenga en cuenta que el periodo estacionaltiene una longitud fija y, aunque el estado estacional puede cambiar para cada punto, en las ecuacionesde ajuste estacional solo se tienen en cuenta conjuntamente los índices estacionales coincidentes deperiodos diferentes.

Estados de ajuste inicial

Se deben especificar valores para estados de nivel, tendencia y estacionalidad para los puntos anterioresa las series temporales. Los valores son necesarios para las ecuaciones de ajuste. Para calcular losdiferentes estados en el primer punto de la serie temporal se requieren valores de estado en los puntosanteriores correspondientes.

Parámetros del modelo

Cada ecuación de ajuste utiliza parámetros de modelo correspondientes:

alphaControla los estados de nivel.

betaControla los estados de tendencia.

gammaControla los índices estacionales entre periodos estacionales.

phiUn parámetro adicional que se utiliza para especificar la tendencia amortiguada.

Los cuatro parámetros tienen valores entre 0 y 1. Los valores más altos de alpha, beta y gamma indicanque las observaciones más recientes tienen una ponderación más elevada, mientras que los valores másbajos indican ponderaciones más altas para las observaciones más antiguas. Un valor más alto de phi secorresponde con un grado más alto de amortiguación de la tendencia de previsión.

Estimación del modelo

La estimación de los parámetros del modelo en las ecuaciones de ajuste se basa en los datos de seriestemporales. La estimación de los parámetros no se puede realizar directamente utilizando una fórmula.La estimación se realiza mediante un proceso interactivo que busca los valores de parámetros queminimizan el error del modelo. El error del modelo se calcula como un MASE (Mean Absolute ScaledError). Las iteraciones se detienen cuando ya no se puede reducir más el error del modelo. Los valores delos parámetros correspondientes junto con los estados de ajuste iniciales especifican el modelo estimadocompleto. Se utilizan para calcular los estados del modelo para todos los otros puntos de datos y generarlas previsiones del modelo utilizando la ecuación de previsión correspondiente.

Algoritmos de previsiónEn la previsión se utilizan varios algoritmos.

Un paso posterior

Cada modelo soporta las previsiones de tipo "un paso posterior" basadas en la ecuación de previsióncorrespondiente. Las previsiones de tipo "un paso posterior", son necesarias para calcular los errores delmodelo durante el proceso de estimación del modelo.

56 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 61: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Las previsiones de tipo "un paso posterior", se calculan secuencialmente para cada punto de datosutilizando el nivel calculado, los estados de tendencia para el punto actual y los estados estacionalespara el último periodo estacional.

El error de previsión se calcula restando el valor de previsión en el punto anterior del valor observado enel punto actual. El error de modelo global, que se utiliza para una estimación del modelo, se calcula comoun valor promedio de los errores de previsión absolutos. Los errores más pequeños corresponden a unmejor ajuste del modelo. Las medidas de precisión que se muestran en Detalles estadísticos deprevisión proporcionan varios resúmenes de los errores de la previsión de tipo "un paso posterior" delmodelo.

paso-k posterior

Las previsiones de tipo paso-k posterior se utilizan para realizar predicciones para cualquier número devalores futuros siguiendo los datos de series temporales observados. Están basadas en las mismasecuaciones de previsión que las previsiones de un paso posterior para el modelo especificado.

De forma predeterminada, el número de valores de previsión que se genera es el 20% de la longitud delas series de datos históricas. Puede especificar un número exacto de valores para su previsión en elcuadro de diálogo Previsión. También se pronosticará cualquier valor ausente al final de una serieespecífica, pero no se contará en el número de periodos de previsión especificado.

Límites de confianza

Los límites de confianza proporcionan el nivel de incerteza asociado a cada valor de previsión.Normalmente, los límites pasan a ser más amplios en el futuro, ya que las previsiones más distantes sonmenos fiables. Los límites de confianza proporcionan conocimientos relevantes sobre el comportamientofuturo de las series temporales observadas.

El cálculo de los límites de confianza está basado en la varianza global de los errores de previsiónestimados sobre los datos observados y un factor que depende del modelo especificado y del número depasos desde el último punto observado.

Selección de modelos automatizada en las previsionesSe utilizan varios tipos de modelos para crear modelos candidatos para cada serie temporal de unaprevisión. Normalmente, se utilizan los nueve tipos de modelos disponibles, excepto cuando está ausenteun componente estacional. Solo hay tres tipos de modelos disponibles que no se tienen en cuenta para laestacionalidad de los datos.

El valor predeterminado, Automático, para la opción Periodo estacional, detecta el periodo estacionalcomparando varios modelos, cada uno de los cuales tiene un periodo estacional candidato.

Se comparan varios modelos utilizando un error de modelo y el número de parámetros del modelo. Porejemplo, cuando los errores del modelo son iguales para dos modelos, se prefiere el modelo con menosparámetros. El último modelo proporciona una representación más condensada de los datos observadosy suele generar previsiones más fiables.

Capítulo 4. Forecasting 57

Page 62: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

58 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 63: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 5. Principles of advanced data analytics

Principios del análisis de datos avanzadoIBM Cognos Analytics es una herramienta de Business Intelligence para gestionar y analizar datos.Incluye características de autoservicio que permiten a los usuarios preparar, explorar y compartir datos.Cognos Analytics incluye técnicas predictivas, descriptivas y exploratorias, conocidas también comointeligencia numérica. Cognos Analytics utiliza diversas pruebas estadísticas para analizar los datos.

Es importante comprender las definiciones de estas pruebas puesto que se aplican a Cognos Analytics.

Los algoritmos numéricos se utilizan como parte del flujo de trabajo para proporcionar características alusuario que comunican información acerca de las propiedades y relaciones numéricas en sus datos.

Orientado a la empresa

A diferencia del software estadístico tradicional, donde el público objetivo es un analista de datos conexperiencia, los algoritmos de Cognos Analytics van dirigidos a los usuarios que están familiarizados, perono son expertos, en el análisis de datos. Esto significa que cuando Cognos Analytics tiene en cuenta lascompensaciones, se prefiere la utilidad antes que la complejidad.

Fiable

Los datos de empresa son mucho más complicados que los ejemplos de libros de texto que se utilizan encursos de estadísticas o en búsquedas web y ejemplos. Cognos Analytics utiliza algoritmos que sonsólidos y que pueden abarcar una amplia gama de variedad de datos poco usuales. Cognos Analytics lohace porque aunque los algoritmos que son más frágiles pueden obtener unos resultados ligeramentemejores que los algoritmos sólidos, es necesario asegurarse de que puedan aplicarse y que creentransformaciones correctas de datos para que los resultados sean útiles. Una pequeña caída en laprecisión garantiza la seguridad que proporciona un algoritmo, que no da resultados erróneos cuando losdatos no son como se supone que son.

Inteligente

Casi todos los algoritmos requieren que se tomen decisiones sobre ellos; los niveles de confianza, quécombinaciones de campos de han de explorar, las transformaciones de datos. Los detalles de estasdecisiones se pueden encontrar en las descripciones.

Cognos Analytics elige los valores apropiados automáticamente examinando las propiedades de losdatos. Como usuario, es posible que no descubra todas las decisiones que se toman.

Resumen

En Cognos Analytics, los algoritmos numéricos y los procedimientos se han diseñado para generarresultados fiables de forma automática. Para obtener la mejor predicción, clasificación o análisis posibles,un estadístico profesional analiza los datos utilizando IBM SPSS Statistics o IBM SPSS Modeler. Elobjetivo de Cognos Analytics es proporcionar conocimientos cualitativos que le ayuden a comprender susdatos y sus relaciones, y a hacerlo automáticamente para una gran variedad de tipos de datos. CognosAnalytics tiene el objetivo de proporcionar resultados parecidos a un estadístico profesional sin hacerlodel mismo modo que el usuario del negocio.

Preparación de datosLa preparación de los datos es un paso de análisis previo que se utiliza en la mayoría de los algoritmosanalíticos de datos para garantizar que los datos sean adecuados para uso analítico.

© Copyright IBM Corp. 2018, 2020 59

Page 64: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Visión general

La preparación de datos es crítica en IBM Cognos Analytics. Solo los datos preparados para entrar en elanálisis de controladores clave, árboles de decisiones y relaciones se muestran en las visualizaciones deanálisis avanzados: Espiral, Análisis de controladores, Árbol de decisiones, Sunburst y Explorarrelaciones. Los datos no se preparan automáticamente para otras visualizaciones y sus conocimientoscorrespondientes.

Algoritmos

Todos los algoritmos aplicados se basan en valores de un solo campo a la vez. Los valores que faltan seeliminan o se manejan para cada campo; todos los campos del controlador del predictor numérico seagrupan. Todos los campos categóricos se ajustan para un gran número de categorías y los valoresatípicos se manejan en el campo objetivo. Si bien la preparación de todos los datos influye en losresultados del análisis, actualmente no se le informa sobre los resúmenes correspondientes de lapreparación de los datos.

Detalles

La preparación de los datos y los controladores clave posteriores, los árboles de decisiones y lasrelaciones están basados en un ejemplo de datos de aproximadamente 10,000 filas cuando los datosoriginales son más grandes. El muestreo aleatorio de Bernoulli, igual que la probabilidad sin muestreoaleatorio de reemplazo, se aplica a los datos cargados y a cualquier origen de datos conectado queadmita el muestreo aleatorio. De lo contrario, se utiliza un muestreo sistemático.

Preparación de datos para campos numéricosUn campo se trata como numérico siempre que contiene información numérica y su propiedad de uso seestablece en medida.

Visión general

Dado que los datos numéricos pueden variar en su distribución, IBM Cognos Analytics transforma loscampos numéricos que no campos objetivo en grupos ordinales, lo que reduce la dependencia de losalgoritmos analíticos en el formato de los datos numéricos.

Algoritmos

El algoritmo básico que se utiliza es la agrupación de frecuencias iguales. Los datos numéricos se dividenen un número fijo de grupos que están intentando colocar un número igual de filas de datos en cadagrupo. Los valores ausentes se ubican en su propio grupo. Cognos Analytics intenta utilizar elconocimiento sobre los valores ausentes en los campos de predictor para generar un modelo mejor. Porejemplo, si se representa un campo de datos cuando se ha probado un elemento, Cognos Analytics utilizavalores ausentes (lo cual puede indicar que no se ha probado nunca un elemento) para ayudar a predecirlos valores de otros campos.

Detalles

Se aplican determinados criterios de exclusión de campos a los campos numéricos. Se excluye un camponumérico de cualquier análisis posterior si solo tiene un único valor, incluido el valor ausente. De locontrario, el campo numérico se agrupa y el número predeterminado de grupos es 5. Si un campo notiene más de 10 valores numéricos exclusivos, no se intenta realizar la agrupación y se otorga a cadavalor exclusivo su propia categoría. Si aparece un cero en más del 40% de las filas, siempre se le otorgauna categoría separada. Los valores ausentes se colocan en su propio grupo y no afectan alprocedimiento de agrupación.

Preparación de datos para campos categóricosUn campo se trata como categórico siempre que su propiedad de uso se establezca como atributo oidentificador.

60 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 65: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Visión general

La información principal que se extrae de los campos categóricos es la frecuencia observada para cadavalor de categoría exclusivo. Los métodos analíticos apropiados se aplican a los campos categóricos, perosu precisión y rendimiento pueden verse afectados negativamente cuando aumenta el número decategorías diferentes. El paso principal de preparación de datos es comenzar a fusionar categoríascuando su número pase a ser grande.

Algoritmos

El algoritmo básico que se utiliza es la fusión de categorías. Las categorías se ordenan por su frecuenciaen orden descendente y las categorías más allá del número predeterminado se combinan en una solacategoría. Los valores perdidos se tratan como una única categoría individual. En otras palabras, IBMCognos Analytics utiliza valores de una forma parecida que para los campos numéricos. Los camposcategóricos se tratan como nominales. El orden intrínseco no se asume entre categorías.

Detalles

Se aplican determinados criterios de exclusión de campos a los campos categóricos. Un campocategórico se excluye de un análisis adicional si solo tiene un valor único o el número de categoríasexclusivas no fusionadas supera el 50% del número de filas de datos válidas.

De lo contrario, el campo categórico se fusiona y el número predeterminado de categorías no fusionadases 49. El resto de las categorías se fusiona en una categoría extra única. También se fusionan todas lascategorías con un recuento de filas inferior a 3. Un campo categórico también se excluye si el porcentajede filas de datos válidos correspondiente a la categoría fusionada supera el 25%.

Los valores perdidos se tratan como una categoría separada y se tienen en cuenta en el paso de fusióncomo tal.

Preparación de campos para campos objetivoLa especificación del campo objetivo es necesaria para los controladores clave y las visualizaciones delárbol de decisiones.

Visión general

Especifique siempre el campo objetivo y, como mínimo, un campo adicional. Los modelos se entrenanutilizando valores objetivo proporcionados y se usan para detectar relaciones predictivas y, finalmente,para predecir valores objetivo dados los valores del campo de entrada. La preparación de datos para elcampo objetivo difiere de la preparación de datos para el resto de los campos. Los valores que faltan en elobjetivo no se utilizan para crear modelos, pero el resto de la información se conserva y, a veces, seajusta para obtener modelos imparciales.

Algoritmos

El principal paso de preparación de datos relacionado con los campos objetivo es eliminar todas las filasde datos con un valor objetivo ausente. Esto se lleva a cabo antes de cualquier otro paso de preparaciónde datos. Aunque garantiza que solo se utiliza información fiable para la creación de modelos, el númerode filas eliminadas puede ser sustancial. Es posible que el modelo resultante tenga un ámbito limitado enestos casos. Los campos objetivo numéricos no están agrupados, pero los valores atípicos extremos semanejan para que no resulten afectados negativamente los modelos que se creen posteriormente. Loscampos objetivo categóricos se tratan de un modo muy similar a de otros campos categóricos. La únicadiferencia es que se han eliminado los valores ausentes para los objetivos categóricos.

Detalles

Los valores atípicos extremos se detectan en función de los límites inferior y superior. El límite superiorse crea utilizando un percentil superior, de modo que solo el 2,5% de los valores objetivo tengan un valorsuperior. La diferencia entre el percentil superior y la mediana se multiplica por 2,5 y se agrega a lamediana para obtener el limite superior. Se aplican pasos similares para obtener el límite inferior. Los

Capítulo 5. Principles of advanced data analytics 61

Page 66: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

valores objetivo que se encuentran más allá de los límites calculados se sustituyen por el valor de límitecorrespondiente en todos los análisis subsiguientes.

Controladores clave unidireccionalesLos controladores unidireccionales son una herramienta de exploración basada en modelos.

Visión general

Dado un campo objetivo, la herramienta utiliza un modelo estadístico para analizar cualquier otro campode datos disponible y calcula su fuerza predictiva de los valores de destino. Estos campos de datos sedenominan controladores o predictores de destino. Se analiza cada campo de datos potencialmenterelevante y solo se visualizan los controladores principales en función de su fuerza predictiva. Puedeobtener conocimientos sobre los controladores disponibles y su clasificación según su fuerza predictivapara el objetivo especificado en los datos. Los resultados del análisis del controlador unidireccional estándisponibles tanto en el análisis del controlador como en las visualizaciones en espiral. Solo en Exploreestá habilitada la obtención de más detalles visuales en cada controlador por separado para lavisualización del análisis del controlador.

Algoritmos

El análisis de cada controlador unidireccional se basa en un modelo estadístico que incluye el destino yun único predictor categórico. El modelo se aplica después del paso de preparación de datos para elcampo objetivo y todos los campos de predictor potenciales. Por ejemplo, todos los campos de predictornuméricos se agrupan durante el paso de preparación de datos y se tratan como categóricos en elanálisis. Se aplica ANOVA unidireccional a los objetivos numéricos y a la prueba de independencia de Chi-cuadrado para objetivos categóricos con el ajuste de chi-cuadrado para datos difusos.

Para cada campo de la lista de controladores potenciales, se lleva a cabo una prueba de hipótesis acercade si el campo tiene un impacto importante sobre el objetivo. Solo se seleccionan como posiblescontroladores clave unidireccionales los campos que pasan la prueba y tienen un fuerza predictivasuficientemente alta.

Detalles

El análisis preliminar basado en prestaciones inteligentes reduce el número de controladores potencialesen algunos casos. El objetivo es eliminar los campos irrelevantes o redundantes. La lista de controladoresutilizados está disponible en la IU y se pueden añadir al análisis los controladores que hayan sidoexcluidos inicialmente. Los 20 primeros controladores resultantes con una fuerza predictiva superior al10% están disponibles para su visualización.

Se imponen algunas restricciones en el tamaño de los datos para mejorar el rendimiento y la velocidad. Silos datos contienen más de 250 campos, se excluyen los campos menos relevantes antes del análisis delcontrolador. Puede volver a añadir los campos que han sido excluidos del análisis utilizando la interfaz deusuario, tal como se ha descrito anteriormente. Si los datos especificados contienen más de 10,000 filas,el muestreo se puede reducir a aproximadamente 10,000 filas para el análisis de controladores. Semuestra un aviso en estos casos: Para mejorar el rendimiento, debido al número de filas del origen dedatos, el análisis está basado en una muestra representativa de la totalidad de los datos. Se espera quelos resultados se aproximen a los resultados que se podrían obtener en caso de utilizar todas las filas delos datos originales.

Controladores clave bidireccionalesLos controladores clave bidireccionales se basan en pares de modelado y clasificación de predictorescategóricos al mismo tiempo.

Visión general

Dado un campo objetivo, IBM Cognos Analytics utiliza un modelo estadístico para el análisis de un par decampos de datos diferentes y realiza una estimación de la fuerza predictiva de los valores objetivo. Labúsqueda de distintos pares de predictores no suele ser exhaustiva y también es posible que algunos

62 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 67: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

pares de alto nivel queden excluidos de los resultados finales. El objetivo es proporcionar una visióngeneral y una variedad de pares de predictores que mejoren la fuerza predictiva de los modelos de unúnico predictor que se muestran como controladores unidireccionales. Por lo tanto, se expanden losconocimientos obtenidos a partir de los controladores unidireccionales y se obtiene informaciónrelevante sobre los pares de campos en los datos. Los resultados del análisis de controladorunidireccional y bidireccional están disponibles en los gráficos del análisis en espiral y del análisis delcontrolador. Se pueden ver por separado seleccionando una opción de visualización de gráficocorrespondiente. Cada uno de los controladores unidireccional o bidireccional se puede ampliar en unanueva visualización directamente desde la visualización del análisis del controlador en Explore.

Algoritmos

El análisis para cada controlador bidireccional está basado en un modelo estadístico que incluye eldestino y un par de predictores categóricos. El modelo se aplica después de la preparación de los datos yla creación de todos los controladores unidireccionales. El primer predictor del par se selecciona entre losprimeros 50 controladores unidireccionales y el segundo se selecciona entre los 25 controladoresunidireccionales principales. Esta estrategia de búsqueda garantiza que se consideren para el modeladola mayor parte de los pares de los predictores con la clasificación más alta. El análisis ANOVAbidireccional (análisis de varianza) se aplica a los destinos numéricos y a la prueba de independencia deChi-cuadrado para destinos categóricos con el ajuste de chi-cuadrado para datos difusos.

Para cada par de campos considerado, se realiza una prueba de hipótesis sobre si el par tiene un impactosignificativo en el objetivo. Solo se seleccionan como posibles controladores bidireccionales los pares quepasan la prueba y tienen una fuerza predictiva suficientemente alta.

Detalles

La restricción de la selección de campos de datos y filas de datos para los controladores unidireccionalestambién se aplica a los controladores bidireccionales. Esto es lo que está previsto, ya que los campos depredictor potenciales para los controladores bidireccionales se seleccionan entre los controladoresunidireccionales principales, en función de su fuerza predictiva respectiva. No obstante, la importanciadel modelo de un controlador unidireccional y la fuerza predictiva mínima no son necesarias para suentrada en un modelo bidireccional. Un controlador bidireccional resultante debe tener una fuerzapredictiva superior al 10% y debe proporcionar una mejora relativa superior al 10% por encima de lafuerza predictiva de cada uno de los controladores unidireccionales incluidos. La mejora relativa secalcula como el porcentaje de la diferencia entre el 100% y la fuerza predictiva del controladorunidireccional anidado. Los controladores bidireccionales resultantes que cumplen con estos criterios seclasifican según su fuerza predictiva y los 20 principales pasan a estar disponibles para su visualización.

Árbol de decisionesLos árboles de decisiones son modelos más complejos que los controladores unidireccionales ybidireccionales. Amplían la secuencia como los modelos de combinación. La principal diferencia es quelos árboles de decisiones admiten el descubrimiento de la interacción entre varios predictores y, por lotanto, conocimientos más profundos que los controladores.

Visión general

Dado el campo objetivo, el algoritmo busca en todos los demás campos de datos y los añade al modelopara mejorar su fuerza en la predicción de los valores de destino. La búsqueda a través de diferentespredictores es iterativa; después de que la búsqueda agregue un predictor, la búsqueda continua paraagregar el siguiente predictor para que mejore el modelo al máximo. El objetivo es encontrar el mejorconjunto de predictores y una forma óptima de combinarlos para que se calcule un modelo óptimo. Losconocimientos que se obtienen de los árboles de decisiones se presentan en forma de reglas de decisiónen las que la combinación de predictores y los valores correspondientes proporcionan una predicciónúnica para el valor objetivo. Las reglas de decisión se clasifican por fuerza para que pueda encontrarfácilmente las reglas más relevantes e interesantes. Las reglas de decisión que genera el árbol dedecisiones se excluyen mutuamente. Las reglas de decisión también proporcionan un completo conjuntode reglas, de tal modo que existe una regla correspondiente para cualquier combinación de valores de

Capítulo 5. Principles of advanced data analytics 63

Page 68: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

predictor en los datos. Además, está disponible la fuerza predictiva del árbol de decisiones global queproporciona una mejora relativa en relación con el modelo básico. Los resultados están disponiblesmediante tres visualizaciones diferentes: expansión, árbol y reglas de decisión. Cada uno de ellas tieneciertas ventajas al visualizar la estructura del árbol de decisiones y el contenido de las reglas dedecisiones correspondiente. La fuerza predictiva del árbol de decisiones general también está disponibleen la visualización del análisis del controlador.

Algoritmos

El modelo del árbol de decisiones se calcula después de preparar los datos y crear todos loscontroladores unidireccionales. El primer predictor del árbol se selecciona como controladorunidireccional superior. Las categorías del predictor se fusionan cuando el impacto adverso de la fuerzapredictiva es inferior a un umbral determinado. El siguiente paso es encontrar el mejor predictor paradividir cada nodo de árbol que conste de las categorías combinadas. El proceso continúa hasta que seaplica una regla de parada a un nodo de árbol. Las opciones posibles para detener son que todas lascategorías para cada predictor candidato se fusionen en un solo nodo o que el número de nodossobrepase el número máximo de nodos. Las categorías con menos de un número mínimo de filas sefusionan siempre con otra categoría. Esto significa que ninguno de los nodos del árbol puede contenermenos que el número mínimo de filas. El mismo procedimiento se utiliza para los objetivos continuos ycategóricos, sólo la función de impurezas es distinta.

DetallesFunciones de impureza

Los valores de la función de impureza se utilizan como criterio principal para la división y fusión denodos de árbol potenciales. El total de la función de impureza de los árboles continuos es la suma decuadrados por nodo, mientras que la medida de impurezas de Gini se utiliza para los objetivoscategóricos. El total de impurezas de Gini se calcula como una suma de cuadrados de proporcionesde recuento en todas las categorías de destino por nodo que se resta de uno y los resultados que semultiplican por el número de filas. La mejora en el valor de la función de impureza es la ganancia deinformación.

Al dividir cada nodo, IBM Cognos Analytics busca un campo de predictor con una mayor ganancia deinformación calculada como impureza total, en todos los nodos hijo potenciales restados de laimpureza del nodo padre. Antes de que Cognos Analytics seleccione el predictor, Cognos Analyticsintenta fusionar algunos de los nodos hijo potenciales que inicialmente corresponden a cadacategoría de predictor. La pérdida de información se calcula restando la impureza de los nodos nofusionados a partir de la impureza de los nodos fusionados. Siempre que la pérdida de informaciónsea más pequeña que un umbral, los nodos se fusionan. Este proceso ayuda a crear árbolesrelativamente pequeños que son fáciles de visualizar y comprender, a la vez que conservan la fuerzageneral del árbol.

Reglas de detención

Los nodos candidatos siempre se fusionan si están basados en menos de 25 filas. Si se fusionan todaslas categorías de un predictor, no se puede utilizar para dividir un nodo determinado. Cuando ningunode los predictores puede dividir el nodo específico, el proceso se detiene para el nodo. El procesoglobal de generación del árbol se detiene cuando ninguno de los nodos se puede dividir o cuando elnúmero de nodos generados supera los 36.

Importancia de la variable

La importancia de la variable corresponde a una reducción de error de árbol relativo cuando seincluye el correspondiente predictor en el árbol. Se calcula comparando los errores de un árbol inicialy un árbol restringido generados por el resto de los predictores del árbol inicial. El error del árbolinicial se resta del error del árbol restringido y el resultado se divide por el error del árbol restringido.Las variables con importancia cero o negativa se eliminan del árbol. El error de árbol se calcula comola suma de cuadrados de los destinos continuos y como error de clasificación de los objetivoscategóricos.

64 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 69: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Fuerza predictiva

La fuerza predictiva de un árbol con objetivo continuo se calcula de forma similar a la de loscontroladores clave. Se tiene en cuenta el contenido de los nodos de hoja. La contribución de varianzade cada nodo de hoja se añade y se divide por la varianza general de los datos. Se trata del errorrelativo del árbol. Se resta de uno para obtener la fuerza predictiva que es compatible con la medida Rcuadrado que se utiliza para controladores de clave.

Para objetivos categóricos, Cognos Analytics calcula la precisión de la clasificación en el error declasificación que se añade desde todos los nodos de hoja. La mejora de la precisión de la clasificaciónrelativa sobre el modelo básico, también conocida como R cuadrado ajustado, se notifica como lafuerza predictiva del árbol. Se calcula restando el error del árbol del error del modelo básico ydividiendo el resultado por el error del modelo básico. Por ejemplo, la precisión de clasificación delmodelo puede ser tan alta como un 95%, pero si la clase mayoritaria aparece en el 90% de las filas delos datos, la fuerza predictiva del árbol sólo se notifica como un 50%. Esto es paralelo al caso delobjetivo continuo en el que el modelo básico se representa mediante el valor medio global. La fuerzapredictiva que se mide por R cuadrado se basa en la mejora relativa del árbol en la reducción de lavarianza global.

Cognos Analytics solo muestra los árboles que tienen una fuerza predictiva superior al 10%. Sevisualiza un árbol para el objetivo continuo en un análisis de controlador o en una visualización enespiral si su fuerza predictiva es superior a la fuerza predictiva del controlador clave más fuerte. De locontrario, no se visualiza en estos gráficos ya que los controladores clave ya proporcionan todos losconocimientos relevantes.

La fuerza predictiva de un árbol de decisiones se calcula si utiliza los mismos datos que se utilizanpara generar el árbol de decisiones. Se sabe que esto introduce un margen de error y proporcionaestimaciones optimistas acerca del rendimiento del árbol de decisiones en datos similares del mismoorigen de datos. Cognos Analytics ha reducido la discrepancia ajustando el algoritmo para minimizarel sobreajuste de los datos de formación.

Informaciones en visualizacionesLos conocimientos en las visualizaciones proporcionan conocimientos analíticos que pueden ayudar a losusuarios a detectar y validar cualquier relación importante y las diferencias significativas en función delos datos que presenta la visualización.

Visión general

Los conocimientos se controlan y resumen en el recuadro Conocimientos disponible en cadavisualización elegible. Al activar los conocimientos, el resumen aparece en el recuadro Conocimientos ylos elementos de visualización relacionados se resaltan. Se proporcionan detalles en el correspondientemensaje de ayuda contextual. Puede controlar cada una de las informaciones disponibles por separado.

Algoritmos

El tipo de conocimiento depende de los datos mostrados por la visualización. Los tipos de conocimientosdisponibles son Promedio, Fuerza predictiva, Diferencias significativas, Línea de ajuste y Másfrecuente. El promedio proporciona la media de los resúmenes visualizados y Más frecuente la categoría,o la categoría que se muestra con mayor frecuencia en los datos. El resto de los conocimientos dependende los análisis más avanzados y de las pruebas estadísticas. El objetivo es proporcionar información fiableque puede utilizar para una descripción mejorada de los datos visualizados y el descubrimiento decualquier relación que se espera que se encuentre en la población que está representada por estos datos.

Detalles

El análisis de conocimientos siempre se basa en las mismas filas de datos que se utilizan para crear losresúmenes que se muestran en la visualización. Esto significa que los datos completos se utilizan paraobtener información a menos que se aplique un filtrado a los datos originales.

Capítulo 5. Principles of advanced data analytics 65

Page 70: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Algunas pruebas estadísticas y análisis que se utilizan en los conocimientos requieren no solo losresúmenes de datos que se muestran en la visualización, sino también algunos resúmenes adicionales.Por ejemplo, la prueba de diferencias significativas en múltiples categorías de un campo explicativorequiere recuentos y variaciones para cada categoría, además de la media mostrada. Estos resúmenesadicionales se obtienen de una base de datos junto con los resúmenes que son necesarios para lavisualización. Los conocimientos procesan todos los resúmenes, pero solo los resúmenes necesariosestán disponibles en la visualización. El análisis de conocimientos siempre se basa en las mismas filas dedatos que se utilizan para crear los resúmenes que se muestran en la visualización.

Restricciones

Si los conocimientos no están disponibles de forma inmediata en una visualización, es posible que seaplique una de las razones siguientes:

• El tipo de visualización en sí no da soporte a los conocimientos.• Es posible que los datos de la visualización se hayan recortado.• La combinación de nivel de resumen, tipo de campo y rol de campo de un campo seleccionado no

coincide con los requisitos de cualquiera de los conocimientos disponibles.

Tipos de visualización soportados para conocimientos

Los siguientes tipos de visualización dan soporte a conocimientos:

• Áreas• Barras• Burbujas• Columnas• Mapa de calor• Burbuja de jerarquía• Líneas• Líneas y columnas• Mapa• Burbujas empaquetadas• Gráfico circular• Puntos• Radial• Dispersión• Barras apiladas• Columnas apiladas• Mapa de árbol• Nube de palabras

Se da soporte a varias extensiones pequeñas para algunos conocimientos, incluidos Más frecuente yDiferencias significativas.

Niveles de resumen

Los niveles de resumen soportados son: Recuento, Promedio, Suma, Mínimo y Máximo. Es posibleque cualquier otro valor como Recuento distinto impida que se sugieran conocimientos. Algunosalgoritmos determinados solo admiten niveles de resumen específicos. Cambiar el nivel de resumenpredeterminado por uno de los valores soportados potencialmente puede ayudar a habilitar losconocimientos.

Tipos de campos

Los tipos de campos se pueden designar internamente como continuos o categóricos, en función delos valores del campo seleccionado.

66 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 71: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Tipo de campo Descripción

Categórico Una variable que puede tomar un número limitado de valores posibles ynormalmente fijo. Una variable categórica asigna cada unidad deobservación individual u otra unidad a un grupo determinado o a unacategoría nominal basándose en algún tipo de propiedad cualitativa. Porejemplo, el país en el que vive una persona.

Continuo Se utiliza una variable para describir valores numéricos como, por ejemplo,un rango de 0-100 o 0.75-1.25. Un valor continuo puede ser un entero, unnúmero real o una fecha y una hora.

Roles de campo

IBM Cognos Analytics asigna un rol a cada una de las ranuras de campo de una visualizaciónsoportada. Se puede designar un rol de campo como uno de los siguientes, en función de la ranura dela visualización.

Rol de campo Descripción

Respuesta Una variable que se ha pronosticado y a la que también se puede hacerreferencia como variable de destino o variable dependiente. Normalmenteestá en el eje Y.

Explicativo Una variable que ayuda a explicar los cambios en la respuesta y a la quetambién se hace referencia como predictor o variable independiente.Normalmente está en el eje X.

Grupo Una variable que se trata como explicativa o un factor agrupado opcionalque ayuda a determinar el número de modelos creados en el algoritmo.Por ejemplo, puede corresponder a la ranura de color o a una visualizaciónde columnas.

Ponderación Un variable que define las ponderaciones de regresión opcionales, que seutilizan para calcular el modelo de regresión. Por ejemplo, puedecorresponder a la ranura de tamaño o a una visualización de burbujas.

Repetición Una variable que crea pequeños múltiplos, con la visualización repetidauna vez para cada valor distinto de la variable. Por ejemplo, puedecorresponder a la ranura Repetición (filas) o a una visualización circular.

Puntos Un variable que define la forma de los datos y los puntos de datos que seutilizan para calcular el modelo. Por ejemplo, puede corresponder a laranura Puntos o a una visualización de dispersión.

Como ejemplo general, en una visualización de barras con las ranuras siguientes, las correlaciones deroles de esta visualización se definen como:

• Barras (eje y), explicativas• Longitud (eje x), respuesta• Color, grupo

Conocimientos en visualizaciones para recuentosLos conocimientos para recuentos están disponibles siempre que se visualiza el recuento para cadacategoría de un solo campo categórico.

También están disponibles cuando se muestra el recuento para cada combinación de categorías de unpar de campos categóricos en la visualización. En este último caso, es posible que el par sean doscampos explicativos, como en las filas y columnas de mapa de uso crítico, o un campo explicativo y uncampo de repetición, como en las barras y repetición (columna) de un gráfico de barras.

Capítulo 5. Principles of advanced data analytics 67

Page 72: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Los conocimientos para los recuentos de categorías combinadas de tres campos categóricos estánsoportados para un campo explicativo y la combinación de dos campos de repetición, tal como en lossegmentos, repetición (columna), y repetición (fila) de una visualización circular.

Visión general

Utilice estas visualizaciones cuando esté interesado en comparar el número de elementos en categoríasdiferentes, o la combinación de categorías.

Algoritmos

IBM Cognos Analytics notifica el recuento promedio en todas las categorías del campo de respuestaespecificado y aplica pruebas estadísticas para detectar categorías en las que los recuentos sonestadísticamente más diferentes de la media.

Las visualizaciones con dos o tres campos categóricos y los recuentos de cada combinación de categoríasse tratan de forma diferente. Cognos Analytics no sólo compara los recuentos entre las categorías, sinoque detecta cualquier relación entre los campos categóricos . Cognos Analytics trata un campo como larespuesta y los otros como un campo explicativo.

Cognos Analytics informa sobre la categoría más frecuente en las visualizaciones con un campoexplicativo categórico, uno o dos campos de repetición categóricos y un campo de respuesta de recuento.

DetallesCampo categórico único

La primera prueba que se aplica es la prueba de chi-cuadrado de frecuencias iguales para establecersi hay recuentos disponibles que son significativamente diferentes de la media. Si el resultado de laprueba es significativo, Cognos Analytics aplica la prueba de chi-cuadrado de influencia para cadacategoría por separado. Cognos Analytics calcula el tamaño de efecto para las categorías en las que laprueba de influencia es estadísticamente significativa e informa de las categorías con el mayortamaño de efecto bajo las diferencias significativas.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativa Grupo Ponderación

Puntos

Conocimientos

Exactamente 1

Nivel de resumen =Recuento

N/D N/D N/D N/D Promedio

Diferenciassignificativas

Dos campos categóricos

Cognos Analytics trata un campo categórico como la respuesta y el otro como el campo explicativo. Elcampo de recuento original se utiliza como entrada para los algoritmos.

La prueba de chi-cuadrado de independencia con el ajuste para datos dispersos se utiliza paraestablecer si existe una relación entre el campo de respuesta y el campo explicativo. Si el resultadode la prueba es importante, Cognos Analytics calcula la fuerza predictiva de este modelo como unrecuento R-cuadrado ajustado, con las categorías de baja frecuencia filtradas. La relación se declarafiable y se informa sobre la fuerza predictiva si es superior al 10%.

Si el resultado de la prueba anterior es significativo, se analizan todas las combinaciones decategorías explicativas y respuestas aplicando la prueba chi-cuadrado de influencia a cadacombinación. Las combinaciones de las categorías explicativas y de respuestas en las que la pruebade influencia es significativa se consideran influyentes. Se calcula el tamaño del efecto para cada

68 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 73: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

combinación de categorías influyentes y se notifican las combinaciones cuyo tamaño de efecto esmayor bajo las diferencias significativas.

Si los roles de los dos campos categóricos son explicativo y repetición, se aplica el algoritmo másfrecuente. Los recuentos se suman sobre cada categoría diferente del campo explicativo. Se notificala suma más elevada, junto con el número de categorías que tienen dicha suma. Tenga en cuenta queeste algoritmo no utiliza el campo de repetición, sino que solo se desencadena cuando se aplica elalgoritmo.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo

Ponderación

Puntos

Repetición Conocimiento

Exactamente 1

Nivel de resumen =Recuento

Exactamente 2

Categórico

N/D

N/D

N/D

N/D Fuerza predictiva

Diferenciassignificativas

Exactamente 1

Nivel de resumen =Recuento

Exactamente 1

Categórico

N/D

N/D

N/D

Exactamente 1

CategóricoFuerza predictiva

Diferenciassignificativas

Más frecuente

Tres campos categóricos

Estos algoritmos solo se aplican cuando existe un campo explicativo y dos campos de repetición. Lacombinación de los dos campos de repetición se considera un único campo categórico, en el que lascategorías son los pares de categorías de los dos campos de repetición.

La fuerza predictiva se calcula exactamente como en el caso de dos campos categóricos, utilizando loscampos de repetición emparejados como el predictor del campo explicativo. La prueba chi-cuadrado deindependencia con el ajuste para datos difusos se utiliza para probar la importancia de la relación, y elrecuento R-cuadrado ajustado con categorías de baja frecuencia filtradas se utiliza para buscar la fuerzapredictiva.

Las diferencias significativas se calculan exactamente como en el caso de dos campos categóricos,identificando las combinaciones del campo explicativo y los campos de repetición emparejados para losque el recuento es inusual. La prueba chi-cuadrado de influencia se utiliza para probar la importancia decada combinación, y se notifican las combinaciones con un tamaño de efecto más grande.

Se aplica el algoritmo más frecuente exactamente igual que en el caso de los dos campos categóricos,sumando los recuentos para cada categoría diferente del campo explicativo. Se notifica la suma máselevada, junto con el número de categorías que tienen dicha suma. Tenga en cuenta que este algoritmono utiliza los campos de repetición, sino que solo se desencadena cuando se aplica el algoritmo.

Respuesta Explicativo Grupo

Ponderación

Puntos

Repetición Conocimientos

Exactamente 1

Nivel de resumen =Recuento

Exactamente 1

Categórico

N/D N/D N/D Exactamente 2

CategóricoFuerza predictiva

Diferenciassignificativas

Capítulo 5. Principles of advanced data analytics 69

Page 74: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Respuesta Explicativo Grupo

Ponderación

Puntos

Repetición Conocimientos

Más frecuente

Diferencias entre Cognos Analytics versión 11.1 R2 y R3

Para las visualizaciones con dos campos categóricos, cuando el campo de respuesta tiene una categoríaque representa los datos ausentes (la categoría "(no value)"):

• En Cognos Analytics versión 11.1 R2 el cálculo R-cuadrado de recuento ajustado para la fuerzapredictiva omitía valores de datos para la categoría que representa los datos ausentes. En CognosAnalytics versión 11.1 R3 se incluyen los valores. Esto puede afectar a la fuerza predictiva notificadapara mapas de uso crítico en los que la ranura de datos de uso crítico tiene datos de recuento agregadoy las filas y columnas son dos campos categóricos.

• En Cognos Analytics versión 11.1 R2 las diferencias significativas no notificaban ninguna celda inusualasociada a la categoría que representa los datos ausentes. En Cognos Analytics versión 11.1 R3 senotifican las celdas. Esto puede afectar a las diferencias significativas mostradas para mapas de usocrítico en los que la ranura de datos de uso crítico tiene datos de recuento agregado y las filas ycolumnas son dos campos categóricos.

Conocimientos en visualizaciones para resúmenes por uno o más campos descriptivosLos conocimientos para resúmenes están disponibles cuando el nivel de resumen, la suma, el valormínimo o máximo de un campo son un promedio para un campo de respuesta continua. Losconocimientos se calculan y muestran en cada categoría de un campo descriptivo categórico individual oen cada combinación de categorías de un par de campos descriptivos de categorías en la visualización.

Visión general

Estas visualizaciones se utilizan cuando interesa comparar los valores de una medida entre distintascategorías, o entre combinaciones de categorías de campos descriptivos.

Algoritmos

Si el nivel de resumen es promedio, IBM Cognos Analytics detecta cualquier relación entre los campos derespuesta y los campos explicativos y calcula la fuerza predictiva del modelo correspondiente. Si lasdiferencias de los valores promedio entre las categorías explicativas son importantes estadísticamente,Cognos Analytics identifica las categorías explicativas más diferentes o la combinación de categorías bajolas diferencias significativas.

Cuando el nivel de resumen es suma, Cognos Analytics calcula la suma promedio entre categoríasexplicativas o combinaciones de categorías. Si las diferencias de las sumas entre las categoríasexplicativas son importantes estadísticamente, Cognos Analytics identifica las categorías explicativasmás diferentes o la combinación de categorías bajo las diferencias significativas.

Para todos los gráficos aplicables, el conocimiento medio muestra el valor medio de respuesta resumidaen todas las categorías explicativas. Cuando el nivel de resumen para la respuesta es el promedio, secalcula la media ponderada utilizando el valor visualizado y el recuento para cada categoría explicativa.

DetallesPromedio por un único campo explicativo

Cuando el nivel de resumen para el campo de respuestas es promedio y hay disponible un únicocampo explicativo categórico, Cognos Analytics aplica un análisis unidireccional ANOVA. CognosAnalytics utiliza la estadística F para probar si los valores promedios entre las categorías explicativasson equivalentes. Si hay alguna diferencia importante, Cognos Analytics calcula el R cuadrado

70 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 75: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

ajustado como fuerza predictiva de la relación entre el campo de respuesta y el explicativo. Larelación fiable y su fuerza predictiva se notifican al usuario si la fuerza predictiva excede el 10%.

Si la diferencia entre promedios es importante, Cognos Analytics realiza una prueba t de influenciapara detectar las categorías que son más diferentes de la media global. Esto implica calcular el errorestándar para cada promedio de categoría y comparar el promedio con la media global utilizando laestadística de prueba t. Para aquellas categorías con diferencias importantes, Cognos Analyticstambién calcula el correspondiente tamaño de efecto y notifica las categorías con el tamaño de efectomayor que están sujetas a diferencias significativas.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen =Promedio

Continuo

Exactamente 1

Categórico

N/D Opcional

Cualquiera

N/D Promedio

Fuerzapredictiva

Diferenciassignificativas

Promedio por dos campos explicativos

Para los gráficos en los que el nivel de resumen para el campo de respuesta es del promedio y existendos campos explicativos categóricos disponibles, Cognos Analytics aplica el análisis ANOVAbidireccional. Cognos Analytics utiliza la estadística F para probar si los valores promedios de lascombinaciones de categorías explicativas son equivalentes. Si las diferencias son importantes,Cognos Analytics calcula el R cuadrado como fuerza predictiva de la relación entre el campo derespuesta y los dos campos explicativos. Cognos Analytics también calcula el R cuadrado ajustadopara modelos unidireccionales que incluyen un único campo explicativo cada uno. Si la fuerzapredictiva de un modelo bidireccional es superior al 10% y su mejora de la fuerza predictiva relativasobre los modelos unidireccionales es superior al 10%, Cognos Analytics muestra la fuerza predictivade un modelo bidireccional y notifica una relación fiable entre los campos de destino y explicativos.De lo contrario, si la fuerza predictiva máxima de los modelos unidireccionales excede el 10%,Cognos Analytics notifica una relación fiable entre la respuesta y el correspondiente campoexplicativo único junto con su fuerza predictiva. Si la capacidad de pronóstico máxima de un modelounidireccional no excede el 10%, Cognos Analytics no notifica ninguna relación entre los camposdestino y explicativos.

Cuando la diferencia entre promedios de todas las combinaciones de categorías es importante,Cognos Analytics también dirige una prueba t de influencia para detectar las categorías que son másdiferentes de la media global. Esta prueba es similar a la prueba que se utiliza para un único campoexplicativo. La diferencia principal es que, en lugar de tener en cuenta categorías de un único campoexplicativo, Cognos Analytics considera las combinaciones de categorías a partir de dos camposexplicativos. Las combinaciones de categorías con el tamaño de efecto más grande se notifican segúnlas diferencias más importantes.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Capítulo 5. Principles of advanced data analytics 71

Page 76: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen =Promedio

Continuo

Exactamente 2

CategóricoOpcional (setrata comoexplicativo)

Categórico

Opcional N/D Promedio

Fuerzapredictiva

Diferenciassignificativas

Suma de uno o dos campos explicativos

Para los gráficos en los que el nivel de resumen para el campo de respuesta es la suma y haydisponibles dos campos explicativos categóricos, Cognos Analytics aplica la prueba de comparaciónde suma. Esta prueba detecta si alguna de las sumas es distinta del valor de suma promedio en todaslas categorías explicativas o combinaciones de categorías. Si esta prueba es significativa, CognosAnalytics continúa realizando la prueba de influencia de suma que compara la suma para cadacategoría o combinaciones de categorías con la suma promedia. Para cada prueba significativa,Cognos Analytics también calcula el correspondiente tamaño de efecto. Las categorías ocombinaciones de categorías con los tamaños de efecto más grandes se notifican marcando lasdiferencias más significativas.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen =Suma

Continuo

1 o 2

CategóricoOpcional (setrata comoexplicativo)

Categórico

N/D N/D Promedio

Diferenciassignificativas

Mínimo o máximo de uno o dos campos explicativos

Para los niveles de resumen mínimo o máximo, solo está disponible el conocimiento promedio. Secalcula como el valor promedio del mínimo o máximo de la respuesta entre todas las categoríasexplicativas o combinaciones de categorías.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen = Míno Máx

Continuo

1 o 2

Categórico

N/D N/D N/D Promedio

Conocimientos en visualizaciones para dos campos continuosLos conocimientos para dos campos numéricos están disponibles cuando una visualización implica doscampos continuos y un campo de grupo categórico o de puntos opcional.

72 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 77: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Visión general

Utilice las visualizaciones como diagrama de dispersión para los dos campos continuos, posiblementedivididas por categorías del campo de grupo. El objetivo principal es detectar cualquier relación entre elcampo continuo y también incluir el campo de grupo categórico. Los resultados contienen una fuerzapredictiva de la relación descubierta, la descripción de la relación proporcionada por líneas de ajuste, ycualquier punto con una gran discrepancia de las líneas de ajuste como diferencias significativas.

Algoritmos

IBM Cognos Analytics calcula varios modelos de regresión que implican uno de los campos como larespuesta y los campos continuos como un campo explicativo. El campo de grupo categórico opcional seutiliza como un factor de modelo. Además de las contribuciones de modelo aditivas correspondientes alcampo explicativo, Cognos Analytics considera el cuadrado del campo explicativo y cualquier término deinteracción que incluya un factor. Se selecciona un modelo que proporciona un ajuste óptimo para losdatos entre varios modelos posibles. La línea de ajuste correspondiente se deriva del modelo lineal o decurva cuadrática. En el caso de que se haya proporcionado un campo de grupo categórico opcional, puedegenerar una línea o curva cuadrática para cada categoría del factor. Actualmente se tiene en cuenta unfactor con un máximo de tres categorías para no sobrecargar la visualización.

Cada punto de una visualización representa un número de filas en los datos y se define mediante elcampo Puntos. Los recuentos de filas correspondientes que se basan en el campo de respuesta definenlas ponderaciones de frecuencia que se utilizan para crear los modelos de regresión. Las ponderacionesde regresión se utilizan independientemente del peso de frecuencia cuando Cognos Analytics calcula losmodelos de regresión.

DetallesDos campos continuos

Cuando Cognos Analytics aplica una regresión lineal múltiple a dos campos continuos, se elige unocomo la respuesta y el otro como explicativo en el modelo. Cognos Analytics tiene en cuenta lostérminos del modelo lineal y cuadrático. Si el modelo cuadrático es significativo en función de laprueba F y su mejora de intensidad de predicción relativa es superior al 10% sobre el modelo lineal,Cognos Analytics informa de su intensidad predictiva y muestra la curva cuadrática basada en elmodelo calculado. Esta curva muestra los valores pronosticados de la respuesta en función de losvalores correspondientes del campo explicativo. De lo contrario, se tiene en cuenta el modelo depredictor lineal. Si es importante y su fuerza predictiva es superior al 10%, Cognos Analytics notificasu fuerza predictiva y muestra una línea que representa los valores pronosticados de la respuesta, enfunción de los valores explicativos correspondientes. Si no se califica ningún modelo lineal, elpromedio se notifica como línea de ajuste y no se notifica ninguna relación entre los dos camposcontinuos.

Cuando se detecta una relación lineal o cuadrática, Cognos Analytics también inspeccione lasdiferencias entre los valores pronosticados y observados del campo de respuesta. Estas diferenciasse denominan residuos y Cognos Analytics lleva a cabo una prueba de residuos estudentizados paradetectar valores atípicos. Los puntos se visualizan en las diferencias importantes en el gráficocorrespondiente.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen =cualquiera

Exactamente 1

Continuo

N/D Opcional

Continuo

Opcional

CualquieraFuerzapredictiva

Línea de ajuste

Capítulo 5. Principles of advanced data analytics 73

Page 78: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Continuo Diferenciassignificativas

Campo de grupos categóricos

Cuando se especifica un campo de grupo categórico además de dos campos continuos, se utilizacomo factor en la regresión múltiple lineal, donde se elige uno de los dos campos numéricos como elcampo de respuesta y el otro como el campo descriptivo. Cognos Analytics tiene en cuenta lostérminos del modelo lineal y cuadrático para la explicación continua combinada con contribucionesdel factor. Si el modelo cuadrático o lineal que incluyen el factor es significativo en función de laprueba F y su mejora de la fuerza predictiva relativa es superior al 10% sobre el modelo lineal solocon explicación continuada, Cognos Analytics genera cuatro modelos adicionales. Estos modelosincluyen todas las interacciones posibles de la explicación continuada y el factor. Se selecciona unmodelo con R cuadrado máximo ajustado que también es significativo como modelo final. Se utilizapara crear una línea de ajuste para cada categoría del predictor categórico. De lo contrario, se pruebala importancia del modelo lineal con el explicativo continuo y se notifica si su fuerza predictiva essuperior al 10%. Si no se califica el modelo lineal, no se establece ninguna relación fiable entre loscampos y el promedio global se notifica como línea de ajuste.

Cuando se detecta una relación fiable, Cognos Analytics también comprueba la diferencia entre losvalores pronosticados y observados del campo de respuesta. Cognos Analytics dirige una prueba deresiduos estudentizados para detectar valores atípicos y los muestra marcando las diferenciassignificativas en el correspondiente gráfico.

Restricciones

La siguiente tabla describe las condiciones que determinan si deben sugerirse conocimientos paraeste algoritmo.

Respuesta Explicativo Grupo Ponderación Puntos Conocimientos

Exactamente 1

Nivel deresumen =cualquiera

Continuo

Exactamente 1

Continuo

Exactamente 1

Categórico

Opcional

Cualquiera

Opcional

CualquieraFuerzapredictiva

Línea de ajuste

Diferenciassignificativas

Campo de ponderaciones de regresión

Se puede utilizar un campo continuo opcional para especificar las ponderaciones de regresión delmodelo. La ponderación de regresión para un valor disponible corresponde a la influencia de laobservación en los parámetros del modelo calculados.

Detalles del lenguaje naturalLos detalles del lenguaje natural son una característica de texto que mejora las visualizaciones con másresúmenes. Los detalles proporcionan conocimientos que se obtienen a partir de un análisis de datosadecuado relevante para el usuario.

Visión general

Esta característica está disponible para las visualizaciones que se crean en una exploración y los detallestextuales se muestran en el panel de detalles coincidentes. Con esta información puede obtener lainformación más relevante para los datos visualizados en un formato de lenguaje natural. También semuestran más resúmenes y detalles que no están disponibles en la visualización.

74 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 79: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Algoritmos

Los detalles básicos proporcionan resúmenes simples de los datos que no se ven fácilmente en lavisualización mostrada. Aunque puede obtener esta información especificando otras visualizacionesrelacionadas, estos pasos de exploración dejan de ser necesarios debido a que los resúmenesrelacionados están disponibles como detalles textuales.

Los detalles basados en conocimientos en las visualizaciones proporcionan una descripción textual de losdetalles que se pueden obtener mediante el cuadro de diálogo Conocimientos en la visualización que semuestra o en las visualizaciones relacionadas. Proporcionan más claridad a los conocimientos queaparecen en pantalla y también permiten añadir más conocimientos que no están disponibles en lavisualización en pantalla.

Detalles

Los detalles se basan en los campos que se muestran en la visualización coincidente. El análisisrelacionado puede basarse en resúmenes adicionales, pero no incluye ningún campo no especificado enla visualización. Los resúmenes y los detalles se convierten en texto traducible utilizando plantillas, enlugar de un servicio de generación de lenguaje natural completo. Esto puede generar que el lenguaje searepetitivo en el texto representado, pero no disminuye la cantidad o calidad de la información mostrada.

Detalles del lenguaje natural básicoLos detalles del lenguaje natural básico proporcionan resúmenes adicionales de los datos que semuestran en la visualización o resaltan la información disponible con detalles adicionales.

Visión general

Esta información proporciona una vista más completa de los datos mientras sigue siendo relevante paralos resúmenes visualizados que está considerando. Si se cambia el nivel de resumen que se especificapara el campo de respuesta también se cambian algunos o todos los detalles básicos desde que se hamodificado el foco de la visualización. Se proporciona información adicional en el contexto de la tareaprincipal.

Algoritmos

Los detalles básicos calculados dependen del nivel de resumen que se especifica para el campo derespuesta en la visualización correspondiente. Los posibles niveles de resumen de respuesta sonrecuento distinto y recuento para cualquier campo y suma, promedio, mínimo y máximo para camposnuméricos. Aunque se utilizan detalles basados en recuento en la mayor parte de los niveles de resumende respuesta, se suministran resúmenes coincidentes extras con los niveles de resumen de respuestasuma, promedio, mínimo y máximo. Se generan los mismos resúmenes basados en recuento para elrecuento y para los niveles de resumen de respuesta diferentes.

DetallesRecuento global

Se muestra el recuento global para la respuesta y para cualquier campo explicativo en lavisualización. El recuento no incluye los valores ausentes de la respuesta y se calcula, excepto si elnivel de resumen para la respuesta es de suma o promedio. Todos los campos categóricos que seespecifican en la visualización se tratan como campos explicativos para fines de detalles.

Recuento de campos explicativos

También se calcula el recuento para cada categoría del campo explicativo visualizado, excepto si elnivel de resumen para la respuesta es de suma. El algoritmo selecciona y notifica las categoríasprincipales, los recuentos correspondientes y los porcentajes de recuento relativos al recuento globalpara el campo explicativo. Este procedimiento se aplica a cada uno de los campos explicativos delgráfico.

Capítulo 5. Principles of advanced data analytics 75

Page 80: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Suma

Cuando el nivel de resumen visualizado es de suma para un campo de respuesta numérico, IBMCognos Analytics resume la suma total correspondiente del campo de respuesta. Si la visualizacióncontiene varios campos categóricos explicativos, se calcula la suma para cada categoría y para cadacampo explicativo. El algoritmo selecciona y notifica las categorías superiores, las sumascorrespondientes y los porcentajes de suma en relación con la suma total de cada campo explicativo.

Promedio

Cuando el nivel de resumen visualizado es promedio para un campo de respuesta numérico, CognosAnalytics resume el promedio global del campo de respuesta correspondiente.

Rango

Los resúmenes de rango se proporcionan según el mínimo y el máximo cuando se calcula la suma o elpromedio del nivel de resumen para un campo de respuesta numérico en todas las categorías decombinación de los campos explicativos especificados. Si solo se especifica un único campoexplicativo, también se muestran las categorías donde aparecen los mínimos y máximos.

Mínimo y máximo

Cuando el nivel de resumen visualizado es un mínimo o un máximo para un campo de respuestanumérico, Cognos Analytics muestra el valor mínimo o máximo correspondiente en todas lascategorías de un campo categórico explicativo. Si se especifican varios campos categóricosexplicativos, el mínimo o el máximo se calculan en todas las combinaciones de categorías posibles.

Detalles del lenguaje natural básico basado en conocimientosLos detalles basados en conocimientos proporcionan una descripción de texto de los conocimientos quese pueden obtener a través del cuadro de diálogo Conocimientos en la visualización.

Visión general

Los detalles basados en conocimientos también proporcionan conocimientos relacionados convisualizaciones que son informativos y fáciles de comprender en el contexto del gráfico actual. Estopermite obtener más detalles relacionados con la visualización actual.

Algoritmos

Los detalles basados en conocimientos utilizan directamente el ámbito completo de los cálculos y laspruebas estadísticas soportados por los conocimientos. Los detalles también obtienen resultados paralas visualizaciones relacionadas y los compilan en un mensaje significativo. Los detalles tambiénproporcionan un análisis adicional que se basa en la salida de los conocimientos generando más detallesadecuados a la salida textual.

DetallesCampo explicativo único

Dado un campo de respuesta y un campo explicativo categórico, los detalles utilizan conocimientospara detectar la relación entre el campo de respuesta y el campo explicativo. El análisis se aplica enfunción de si el nivel de resumen de la respuesta es promedio o recuento y se notifica la fuerzapredictiva si se descubre una relación relevante.

Si el campo explicativo es numérico y los conocimientos generan una línea de ajuste, IBM CognosAnalytics notifica la inclinación positiva o negativa para el ajuste lineal e indica si se detecta unarelación cuadrática. Si la relación es cuadrática, Cognos Analytics también notifica el punto deextremo. Cognos Analytics calcula el valor mínimo o máximo de la respuesta y el valor explicativo enel que se genera la respuesta extrema.

Dos campos explicativos

Cuando están disponibles dos campos explicativos, Cognos Analytics detecta la relación entre larespuesta y los dos campos explicativos y la relación entre la respuesta y cada campo explicativo por

76 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 81: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

separado. Si la fuerza predictiva de la relación con ambos explicativos proporciona una mejorarelativa superior al 10% sobre cada relación separada, Cognos Analytics notifica que la respuesta estáafectada por los dos campos explicativos. De lo contrario, resultada afectada por un solo campoexplicativo o por cada campo explicativo por separado, pero no conjuntamente.

Diferencias significativas

Los detalles notifican todas las diferencias significativas descubiertas por los conocimientos para losdatos que se utilizan cuando el nivel de resumen de la respuesta es recuento, promedio o suma. Senotifican para las categorías de cada campo explicativo por separado, así como para lascombinaciones de categorías para dos campos explicativos. También se proporcionan indicacionessobre si los valores son inusualmente altos o bajos.

Árboles de decisiones

Los detalles notifican la fuerza predictiva para un árbol de decisiones y una lista de campos depredictor que se utilizan para dividir nodos de árbol. Se notifica acerca de un campo de predictor conla importancia variable más alta y su mejora de tasa de importancia variable sobre otros campos delos árboles de decisiones si la relación es mayor que dos. Se pueden visualizar detalles similares paraun campo con la importancia variable más baja.

Detalles del lenguaje natural para las series temporalesLos detalles para las series temporales proporcionan conocimientos textuales basados en el análisis delos datos de series temporales y los modelos de previsión correspondientes.

Visión general

IBM Cognos Analytics notifica los detalles de las series temporales para una visualización creada en unaexploración, cuando los datos de la visualización contienen una única serie temporal y se calcula unmodelo de previsión. Si los datos son adecuados, se generan los conocimientos de series temporales,incluso si el cuadro de diálogo Previsión no está presente en la visualización. Cuando está presente elcuadro de diálogo Previsión, después de activarlo, genera el mismo modelo predeterminado que losconocimientos de series temporales. Los puntos de series temporales se ordenan automáticamente pororden cronológico para detectar los conocimientos, pero a diferencia de la función de previsión, lospuntos temporales que se muestran en la visualización no se ordenan.

Algoritmos

Los detalles de las series temporales están basados en un modelo de ajuste exponencial para los datosde series temporales observados. Los valores de series temporales observados y los componentes delmodelo calculados se utilizan para crear conocimientos para las series temporales: valores inusuales,efectos estacionales y conocimientos de tendencias. Cada tipo de conocimiento depende de unacombinación de datos diferente y de los componentes del modelo de ajuste exponencialcorrespondientes.

Detalles

Valores inusuales

Un modelo de ajuste exponencial proporciona una valor pronosticado para cada punto temporalobservado. Un valor pronosticado en un punto temporal es una previsión de tipo "un paso posterior" en elpunto temporal anterior. Se calcula un intervalo de confianza para cada valor pronosticado que utiliza lavarianza del valor pronosticado correspondiente que depende del modelo. Un valor de series temporalesobservado que se encuentra fuera del intervalo de confianza para el valor pronosticado correspondiente,en función del modelo, se considera un valor inusual.

Los valores inusuales se detectan en función del modelo de ajuste exponencial seleccionado para lasseries temporales. El nivel de confianza que se utiliza para calcular los intervalos de confianza depredicción es el 99.74%. Se notifican un máximo de cinco valores inusuales listando los puntostemporales correspondientes. Cognos Analytics no lista los puntos por orden cronológico, sino que loslista en orden descendente, en relación con la distancia del intervalo de confianza. Los puntos más

Capítulo 5. Principles of advanced data analytics 77

Page 82: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

inusuales se listan en primer lugar. Los valores inusuales se especifican como inusualmente altos oinusualmente bajos.

Si se detecta un valor inusual en el último punto temporal, se notifica por separado. Esto puede indicarque los datos no están completos. Por ejemplo, el valor resumido del último mes puede reflejar los datosdiarios únicamente hasta mediados del mes.

Efectos estacionales

Los conocimientos de los efectos estacionales revelan la longitud estacional de una serie temporalidentificada por el modelo. La longitud estacional corresponde a la duración fija de un patrón estacionalestablecido en la serie temporal. Por ejemplo, la variación promedio de la temperatura durante 12 mesesestablece un patrón anual. Estos conocimientos también proporcionan la longitud de los efectosestacionales y notifican los periodos con valores estacionales más altos y más bajos.

La longitud estacional se obtiene a partir del modelo seleccionado. Se deriva del periodo estacional y delintervalo de fecha o de hora que se notifica en los detalles estadísticos de la previsión. Un modeloestacional solo se selecciona si proporciona un ajuste superior a todos los modelos no estacionales. Elperiodo estacional para el modelo estacional seleccionado se obtiene comparando los modelos conmúltiples periodos estacionales candidatos.

Los efectos estaciones se notifican como débiles, moderados o fuertes, en función del valor de fuerzacalculado. La fuerza de los efectos estacionales se calcula como una reducción del error de modelo pormodelo estacional, comparada con la coincidencia del modelo no estacional y dividida por el error demodelo no estacional. Es distinta a la fuerza estacional notificada en los detalles estadísticos de laprevisión, en los que se notifica la precisión entre dos modelos.

Los valores estacionales más altos y más bajos se calculan en función de los valores promedio delcomponente del modelo estacional subyacente entre todos los patrones estacionales de las seriestemporales. Los periodos correspondientes se notifican si los valores promedio son los más altos o losmás bajos de forma continuada, en relación con la mayor parte de los patrones estacionales.

Tendencia

Los conocimientos de tendencia notifican una dirección positiva o negativa global de los valores de seriestemporales cuando están presentes. También notifica la fuerza de la tendencia.

Los componentes de nivel y de tendencia se extraen del modelo de ajuste exponencial correspondiente.Solo se utiliza el componente de nivel si el modelo no tiene ningún componente de tendencia. Esto defineuna curva de tendencia para los datos de series temporales. A continuación, se calcula la medida tau deKendall de la asociación y la prueba estadística para la curva de tendencia. Detectan una direcciónpositiva o negativa de los valores de las series temporales. Los diferentes rangos del valor tau definen elgrado de fuerza notificado para la tendencia: débil, moderado o fuerte.

Para obtener más información sobre los modelos de ajuste exponencial, consulte “Modelos de previsión ”en la página 55.

RelacionesInicialmente, las visualizaciones de las relaciones de una exploración se muestran cuando se especificandatos para la exploración.

Visión general

IBM Cognos Analytics proporciona una visión general rápida de las relaciones entre pares de campos quese centran en un único campo de interés. La visualización consta de varias pestañas, cada una de ellaspara un campo de interés diferente. Esta información es muy útil como orientación, en lo relacionado conla gran cantidad de relaciones relevantes disponibles en los datos que se han de explorar adicionalmente,según sea necesario.

Algoritmos

Aunque el campo inicial de interés se determina en función del análisis de datos semántico, puedeespecificar un campo de interés diferente. Cada pestaña proporciona un gráfico de red con campos como

78 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 83: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

nodos y enlaces entre los pares de nodos, que representa la fuerza relativa de la relación entre los nodos.Aunque los enlaces del campo de interés dominan el gráfico, también se muestran otros pares de camposrelacionados con relaciones sólidas. Puede ajustar un control deslizante para ver un número mayor omenor de nodos en la red.

DetallesDatos para el análisis

Las relaciones utilizan datos no resumidos para calcular la fuerza de la relación entre todos los paresde campos considerados. Para estandarizar la medida de la fuerza de la relación, de modo que sepueda comparar con todos los pares de campos, como primer paso se agrupan todos los camposnuméricos. Todos los campos de los datos se tratan como categóricos. La agrupación que se aplicaequivale a una agrupación de frecuencia que genera cuatro grupos. Encontrará más detalles en lasección sobre cómo preparar los datos para campos numéricos.

Fuerza de la relación

En primer lugar, los datos de cada par de campos categóricos se tabulan para todas lascombinaciones de categorías de los campos que se encuentran en los datos. En función de los datostabulados, IBM Cognos Analytics aplica la prueba de independencia de chi-cuadrado para evaluar silos campos son independientes. Si la salida de independencia es importante, Cognos Analyticscalcula el tamaño de efecto basándose en la estadística de chi-cuadrado. Se trata de la V de Cramerque se utiliza ampliamente como medida de asociación entre dos campos categóricos. Los valores deesta medida se encuentran entre 0 - 1 y Cognos Analytics notifica el valor de intensidad de relaciónque se expresa como porcentaje. Las relaciones con una fuerza inferior al 10% no se notifican, ya quese consideran demasiado débiles como para ser de valor práctico.

Limitaciones de rendimiento

Calcular la intensidad de las relaciones entre todos los pares de campos del conjunto de datos esprohibitivo cuando se trata de datos de gran tamaño. Cognos Analytics limita el número de camposprocesados a 100 para poder proporcionar una respuesta rápida. Sin embargo, estos campos losselecciona otro proceso y se minimiza la posible pérdida de relaciones relevantes. Si los datoscontienen más de 10,000 filas, Cognos Analytics obtiene una muestra aleatoria de este tamaño pormotivos de rendimiento. Este tamaño de datos garantiza una pérdida mínima en la precisión de laestimación de intensidad de las relaciones.

Diferencias entre Cognos Analytics y Watson Analytics con respecto al análisis de datosavanzado

Los métodos de análisis avanzado de Watson Analytics se han adaptado y mejorado en IBM CognosAnalytics. Como resultado, se pueden observar una serie de diferencias.

Preparación de datos

La preparación de datos es crítica tanto en Cognos Analytics como en IBM Watson Analytics ya que sólose introducen datos preparados en los análisis para los controladores clave y los árboles de decisiones.La preparación de datos difiere entre los dos paquetes en varios aspectos importantes.

Diferencia Cognos Analytics Watson Analytics

Valores que faltan Los valores que faltan en el campo dedestino se manejan de la misma formaen ambos productos; las filas con unvalor ausente en el campo de destino seexcluyen de todos los análisisposteriores. Sin embargo, los valoresausentes se manejan de forma distintapara los campos de predictor.

Imputado basado en la relación entre eldestino y un predictor.

Watson Analytics excluye campos depredictor con más del 25% de valoresperdidos.

Capítulo 5. Principles of advanced data analytics 79

Page 84: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Diferencia Cognos Analytics Watson Analytics

Una categoría aparte para lospredictores categóricos.

Los predictores numéricos siempre seagrupan y los valores perdidos se tratancomo una bandeja separada.

Fusión decategorías

Cognos Analytics ordena las categoríassegún su frecuencia de aparición en losdatos y agrupa todas las categorías queempiezan por 50s en una únicacategoría. Todas las categorías con unafrecuencia inferior a 3 también sefusionan. Un requisito es que lascategorías fusionadas representenmenos del 25% de las filas de datos. Delo contrario, el campo no se utiliza parael análisis. Las categorías de destinotambién se fusionan.

Las categorías que se fusionan para lospredictores dependen de los valores dedestino. Solo se fusionan las categoríasque tienen valores de campos dedestino suficientemente similares.

Gestión de valoresatípicos

Los valores atípicos en campos dedestino continuos se manejanestableciendo los valores de límiteextremo y reemplazando los valores quevan más allá de los límites por losvalores de límite correspondientes parafines de análisis. Esto mejora el análisistanto para los controladores clave comopara los árboles de decisiones, ya quehace que las relaciones con el destinosean más fáciles de detectar. Losvalores atípicos que se manejan en lapreparación de datos predictivos no senotifican en la visualización.

El manejo de valores atípicosautomatizado no está disponible.

Muestreo Cognos Analytics analiza la muestra dedatos que contiene unas 10,000 filas silos datos originales superan estetamaño. Se muestra un aviso siempreque se realiza el correspondienteanálisis en una muestra de datos, perose espera que la fuerza predictiva de loscontroladores clave y los árboles dedecisiones generados se aproxime a lafuerza predictiva de los modelos que seobtienen en los datos completoscorrespondientes.

Watson Analytics utiliza un conjunto defilas completo en los datos para generarcontroladores clave y árboles dedecisiones. Esto ralentizar elrendimiento.

Controladores clave

Diferencia Cognos Analytics Watson Analytics

Controladoresclave

Cognos Analytics ofrece controladoresclave para destinos continuos y

Los controladores clave para losobjetivos continuos y categóricos están

80 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 85: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Diferencia Cognos Analytics Watson Analytics

categóricos en la visualización delanálisis en espiral y del controlador.

Aunque los pasos de preparación dedatos afectan tanto a los controladoresclave unidireccionales y bidireccionales,el análisis de Cognos Analytics para loscontroladores bidireccionales difiere delde Watson Analytics, en el criterio quese utiliza para seleccionar loscontroladores que se mostrarán alusuario.

disponibles en la visualización enespiral.

Pruebasestadísticas

Para los destinos categóricos, CognosAnalytics utiliza la prueba deindependencia de Chi-cuadrado paradeterminar si dos campos categóricosson independientes.

Watson Analytics utiliza la prueba deíndice de probabilidad para destinoscategóricos.

Criterio deselección

Cognos Analytics necesita que la fuerzapredictiva del controlador bidireccionalproporcione una mejora relativa de másdel 10% al compararla con la fuerzapredictiva de los controladoresunidireccionales correspondientes. Lamejora relativa de la resistenciapredictiva se mide por el porcentaje dereducción de errores del controladorclave bidireccional en relación con elerror mínimo de los dos controladoresclave unidireccionalescorrespondientes. Este criterio garantizaque solo surjan los controladoresbidireccionales relevantes.

Watson Analytics utiliza la interacciónbidireccional como criterio de selecciónpara los controladores bidireccionales.Un controlador clave bidireccionalnecesita tener un tamaño de efecto deinteracción superior a un umbralconcreto para ser seleccionado.

Fuerza predictiva La fuerza predictiva de los análisis enespiral o de controlador con destinocontinuo se calcula como R-cuadradoajustado.

La fuerza predictiva para el destinocategórico se calcula como el recuentoR-cuadrado ajustado. Se obtienecalculando de la mejora de precisión enla clasificación de modelos sobre elmodelo constante y diviéndolo por elerror de clasificación de modeloconstante. El modelo constante siemprepredice la modalidad de destino y suprecisión de clasificación se estimasegún la frecuencia de la modalidad. Senotifica una relación de predicción fiablecuando la fuerza predictiva del modeloes superior a un umbral predeterminadodel 10 %.

La fuerza predictiva para el destinocontinuo se calcula como R cuadrado.

La fuerza predictiva para el destinocategórico se calcula como precisión declasificación.

Capítulo 5. Principles of advanced data analytics 81

Page 86: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Diferencia Cognos Analytics Watson Analytics

Como resultado, la fuerza predictivapara la visualización en espiral con undestino categórico puede diferir enWatson Analytics y Cognos Analytics,incluso para destinos y entradascomparables.

Árbol de decisiones

Diferencia Cognos Analytics Watson Analytics

Árbol dedecisiones

Además de las visualizaciones de reglasde árbol y decisiones, Cognos Analyticsproporciona la nueva visualización deexpansión. Las diferencias al generar unárbol de decisiones entre CognosAnalytics o Watson Analytics dependendel destino continuo o categórico. Lafuerza predictiva para los árboles dedecisiones se muestra en lavisualización en espiral y en el análisisde controlador en Cognos Analytics,pero solo cuando es superior a la fuerzapredictiva del controlador claveprincipal.

Hay disponibles visualizaciones de árboly de decisiones. La fuerza predictiva delárbol siempre está disponible en lavisualización en espiral.

Destino continuo Los árboles de decisiones para eldestino continuo se generan en base a lasuma de cuadrados en Watson Analyticsy Cognos Analytics.

Cognos Analytics utiliza directamente laaportación de información relacionadacon el tamaño del efecto para la pruebaF en Watson Analytics, cuando sefusionan y dividen nodos de árbol. Estoproporciona divisiones de varias víaspara los nodos de árbol de decisiones.

Watson Analytics utiliza el algoritmoCHAID y las pruebas F correspondientescuando se fusionan y se dividen losnodos de árbol. Esto proporcionadivisiones de varias vías para los nodosdel árbol de decisiones.

Reglas dedetención

Cognos Analytics limita el número denodos de árbol a 36.

El número mínimo de filascorrespondiente a los nodos de árbol esde 25.

Los campos sin ninguna contribución defuerza predictivas se eliminan de losárboles de Cognos Analytics. CognosAnalytics genera árboles más pequeñosque son más adecuados para fines devisualización y conocimientos, mientrasque se generan árboles de una precisióncomparable y, en ocasiones, superior ala de Watson Analytics.

Watson Analytics limita el tamaño delárbol limitando el número de niveles deárbol a 5.

El número mínimo de filascorrespondiente a los nodos de árbol esde 50.

Los árboles en Watson Analytics tiendena ser más precisos solo cuandocontienen un número mucho mayor denodos.

82 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 87: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Diferencia Cognos Analytics Watson Analytics

Importancia de lavariable

La importancia de la variable se calculacomo la mejora relativa en la fuerzapredictiva cuando la variable se añade alárbol de decisiones. Los predictores conimportancia variable que están en elnivel del umbral o por debajo del mismo,se excluyen del árbol de decisiones. Elumbral se establece en cero para lamayoría de los árboles. El umbral seincrementa ligeramente para los árbolesen base a un número más pequeño defilas de datos y que tiene fuerzaspredictivas más pequeñas para reducirlos posibles efectos de sobreajuste.

La importancia de la variable se calculaen función de la sensibilidad de losresultados cuando la variable tomavalores diferentes.

Fuerza predictiva La fuerza predictiva para los árboles dedecisiones con el objetivo continuo secalcula como R-cuadrado.

La fuerza predictiva para el destinocategórico se calcula como el recuentoR-cuadrado ajustado.

El recuento ajustado R-cuadrado restael error de clasificación de árbol delerror de clasificación básico que seobtiene al seleccionar siempre lacategoría de destino más frecuente ydivide el resultado por el error declasificación básico. Representa unamejora relativa que se consiguemediante el árbol de decisiones. Comoresultado, la fuerza predictiva para elárbol de decisiones con destinocategórico puede diferir en WatsonAnalytics y Cognos Analytics, incluso enárboles de decisiones comparables.

La fuerza predictiva para los árboles dedecisiones con el objetivo continuo secalcula como R-cuadrado.

La fuerza predictiva para el destinocategórico se calcula como precisión declasificación.

Controles del usuario

Diferencia Cognos Analytics Watson Analytics

Controles delusuario

El usuario especifica el campo comocontinuo estableciendo las propiedadesde datos Uso en Medida, o comocategórico(nominal) estableciendo elUso en Identificador o Atributo.

Permite excluir e incluir los predictoresdirectamente en las visualizacionescorrespondientes mediante el cuadro dediálogo de los controladores de edición.

Especifique los campos que se utilizaráncomo continuos, nominales u ordinalesestableciendo las propiedades de datosapropiadas en Refinar.

Permite excluir e incluir los predictoresen los modelos mediante otra propiedadRefinar datos.

Capítulo 5. Principles of advanced data analytics 83

Page 88: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

84 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 89: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Capítulo 6. Assistant

AsistenteIBM Cognos Analytics incluye un asistente integrado que soporta la entrada basada en texto y le ayuda aobtener conocimientos rápidos rápida sobre sus datos y simplificar su analítica. En unos pocos pasos,puede acceder a orígenes de datos clave, crear visualizaciones y arrastrarlas a su lienzo de Exploración oPanel de instrumentos. La entrada de texto solo admite el idioma inglés.

Puede utilizar dos interfaces:

1. Panel de asistente completo2. Panel de asistente compacto

Panel de asistente completo

El panel de asistente completo está formado por tres secciones: barra de herramientas, salida y campode entrada. Puede ejecutar acciones de la barra de herramientas, tal como restablecer su historial. Lasalida se muestra en un área desplazable que incluye todas las respuestas anteriores. En el campo deentrada, etiquetado de forma predeterminada como Hacer una pregunta, puede escribir una entrada deconversación basada en texto.

Abra la vista de panel completo pulsando el icono Asistente . Si utiliza el panel compacto, solo enExploración, puede cambiar al panel completo pulsando Abrir en vista completa.

Panel de asistente compacto

El panel compacto sólo está disponible en la interfaz de Exploración. Puede abrir el panel completopulsando Formular una pregunta en el área del panel compacto.

El panel compacto solo muestra la última entrada y respuesta. Para ver el historial completo, pulse el

enlace Abrir en vista completa en el panel compacto o el icono Asistente .

En el campo Formular una pregunta, puede pulsar la tecla de flecha arriba o flecha abajo para ver unalista de los mandatos recomendados. A medida que escribe el texto, una característica de escrituraanticipada ofrece sugerencias sobre lo que puede preguntar. Este es un gran modo de formular laspreguntas adecuadas y escribir menos.

Para repetir la última pregunta, pulse la burbuja de respuesta o utilice el acceso directo del teclado(Mayús + flecha arriba) y luego pulse Intro. Puede desplazarse por las preguntas anteriores pulsandoMayús + flecha arriba/abajo.

Las visualizaciones que aparecen en al panel Asistente están condensadas y pueden excluir algunainformación. Puede ver los detalles completos de la visualización en Explorar o Panel de control. En elAsistente, puede arrastrar visualizaciones a un lienzo de Exploración o del Panel de control.

© Copyright IBM Corp. 2018, 2020 85

Page 90: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Para borrar su historial de conversaciones y devolverlo a su estado inicial, pulse el icono Restablecer en la barra de herramientas. Si especifica restablecer o borrar el resultado es el mismo. El iconoRestablecer solo se muestra en el panel completo. No está disponible en el panel compacto.

Importante: Al renovar la pestaña de navegador de Cognos Analytics, también se restablece el historial.

Mandatos del asistenteEl asistente es una potente función que le permite hacer preguntas en lenguaje natural. En este tema semuestran algunos de los mandatos que puede utilizar con el asistente.

Formular preguntas utilizando el lenguaje natural. Por ejemplo, show Profit, (Mostrar beneficios), essinónimo de list Profit, (listar beneficios), what is Profit? (¿qué son los beneficios?), tell meabout Profit (informadme de los beneficios) y Profit (Beneficios).

Estas son algunas de las preguntas que se utilizan comúnmente en un principio:help

Muestra información de visión general y de uso general.show data

Lista todos los orígenes de datos soportados a los que tiene acceso en Mi contenido y Contenido delequipo. Los orígenes de datos soportados son:

• Archivos cargados (csv, tsv, xls, xlsx y zip)• Módulos de datos• Conjunto de datos• Paquetes de Framework Manager

Nota: Consulte Enriquecer paquetes en el documento Gestión.

86 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 91: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Cuando los resultados superen el número de elementos visualizados, pulse Más para ver hasta 100orígenes de datos. Para contraer la lista, desplácese hasta el final de la misma y pulse Menos.

show source <source-name>

Muestra una lista de campos y detalles relevantes para el origen de datos especificado. La barra deherramientas muestra el <source-name> que está en contexto. De forma predeterminada, CognosAnalytics utiliza el origen activo de su panel de control o panel de exploración. En los resultados,puede pulsar los nombres de campos para obtener más información sobre estos campos concretos.Pulsar los nombres de campos es equivalente a preguntar show column <column-name>.

Cuando los resultados superen el número de elementos visualizados, pulse Más para ver hasta 100orígenes de datos. Para contraer la lista, desplácese hasta el final de la misma y pulse Menos.

show column <column-name>Se muestra información y los campos relacionados para la columna especificada. Pulsar los camposrelacionados es equivalente a preguntar show column <column1> y <column2>. Si se determina quela columna especificada tiene influenciadores, puede escribir what influences <column-name> paraver su lista de influenciadores.

what influences column <column-name>Visualiza una lista de los campos que influyen en los resultados en la columna especificada.

show chart <column1> and <column2>Muestra visualizaciones que muestran la relación entre <column1> y <column2>. Puede desplazarsepor las visualizaciones pulsando las flechas izquierda y derecha. Cada visualización incluye un iconode información en el ángulo superior derecho. Pase el cursor por encima del icono para verdescripciones de los datos subyacentes. Opcionalmente, puede especificar más columnas, pero unexceso de columnas puede dar como resultado unas visualizaciones menos eficaces.

Si pulsa Mostrar visualizaciones relacionadas se devuelven visualizaciones basadas encampos influyentes y relacionados.

Si pulsa Crear panel de control desde los gráficos se crea un nuevo panel de controlbasado en los gráficos generados más recientemente. Si escribe Crear panel de controlrelacionado se genera el mismo panel de control. Si los gráficos contienen agregaciones superiorese inferiores, se aplican estos modificadores al panel de control generado.

Aplicar agregaciones y filtros puede ayudar a crear visualizaciones más centradas y atractivas. Lasagregaciones incluyen total, promedio, recuento, máximo/mínimo, superior/inferior, mejor/peor, etc.Los siguientes son algunos ejemplos de agregación:show top <num> <column1> by <column2>

Muestra los valores superiores de <column1> basados en el contexto de <column2>. Porejemplo, show top 5 Sales by Region. Si no se especifica <num>, se utiliza el valorpredeterminado de 10.

<column1> es una medida agregada o no agregada, mientras que <column2> es una columnacategórica.

show average <column-name>Muestra el promedio de todos los valores encontrados en <column-name>.

how many <column-name>Si <column-name> es una categoría, se devuelve el número de elementos diferentes. Si<column-name> es una medida, se devuelve el total de la suma.

show maximum <column-name>Muestra el valor más alto encontrado en <column-name>.

show minimum <column-name>Muestra el valor más bajo encontrado en <column-name>.

show total <column-name>Muestra el total de la suma de todos los valores encontrados en <column-name>.

Capítulo 6. Assistant 87

Page 92: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

Puede añadir filtros para series geográficas, (tales como País o Estado), o para series temporales,(tales como Mes o Año). No está soportado filtrar por fecha en este momento. Las agregaciones yfiltros se pueden combinar para generar resultados más granulares. Los siguientes son algunosejemplos basados en datos de muestra:

• show Education by Income where Income is less than 1000• show Education by Income where Income > 100K

Opcionalmente utilice K (para millares) o M (para millones).• show Revenue in 2017 and 2018• show Income by Month for New York City• ¿Cuáles son los 5 primeros Estados por inventario promedio, excluyendo California?

Las visualizaciones filtradas incluyen un icono de filtro ( ), que se encuentra en el ángulo superiorderecho del gráfico. Pase el cursor por el icono para ver el filtro aplicado.

crear panel de controlGenera un nuevo panel de control basado en el origen de datos seleccionado actualmente. Puedemodificar las visualizaciones, pestañas, el orden, etc., y guardar su nuevo panel de control. De formapredeterminada, el panel de control incluirá análisis avanzados y gráficos predictivos.

La generación automática de paneles de control para orígenes de datos más grandes puede causarproblemas de rendimiento. Como solución alternativa, puede especificar create simpledashboard para generar un panel de control básico. A continuación, puede modificar el panel decontrol sustituyendo los gráficos por visualizaciones más sofisticadas, tales como un análisis decontroladores o gráficos en espiral.

88 IBM Cognos Analytics Versión 11.1.0 : Guía del usuario de exploraciones

Page 93: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel
Page 94: Guía del usuario de exploraciones - IBM · Visualización de tarjetas en el panel de navegación. Puede ver las miniaturas de sus visualizaciones, denominadas tarjetas, en el panel

IBM®