introducción - the digital mapcarlos/cursos/seminariocalidad... · 2019-02-18 · dq fue...

36
1 UAS Carlos López Vázquez Gestión de Calidad de Datos Carlos López [email protected] Universitario Autónomo del Universitario Autónomo del Sur Sur - 2005 2005 2 UAS Carlos López Vázquez Alguna terminología... Calidad Precisión ¿Correctitud? ¿Exactitud? Quality Precision Accuracy El idioma español tiene limitaciones en este aspecto... 3 UAS Carlos López Vázquez La literatura... Redman (1996) English (1999) Redman (2001) Artículos varios 4 UAS Carlos López Vázquez Plan del curso Introducción Estrategias para mejorar Política de Calidad de Datos Cómo arrancar Manejo de Cadenas de información Métodos de control estadístico Monitoreo, seguimiento y mejora del proceso 5 UAS Carlos López Vázquez Gestión de Calidad de Datos Carlos López [email protected] Universitario Autónomo del Universitario Autónomo del Sur Sur - 2005 2005 Introducción Continúa con: Estrategias para Mejorar 6 UAS Carlos López Vázquez ¿Le suena esto familiar? “...Yo sé que nuestro /sistema/base de datos/ warehouse/ tiene algunos problemas con calidad de datos, pero no sé cómo o dónde comenzar...” 7 UAS Carlos López Vázquez Frases célebres... No puedo usar esta aplicación. Fíjese: ella sabe que este valor es típicamente menor a 1500, pero no me deja ingresar este caso de 1830. ¡Este sistema es inútil! (1) El sistema trabaja perfectamente. Obviamente, si se le cargan datos erróneos ¿qué puede hacer la computadora? (1) (1) Fuente: Bobrowski, Marré y Yankelevich 8 UAS Carlos López Vázquez Frases célebres... No sé. Lo que puedo decirle es que a mi no me sirve. Me hace perder más tiempo buscando datos que antes (1) No es nuestro problema. El sistema funciona, nosotros detectamos los datos cuando se cargan - y siguiendo SUS especificaciones - . Es un problema de los usuarios: ud. debería indicarles que lo usen bien (1)` (1) Fuente: Bobrowski, Marré y Yankelevich 9 UAS Carlos López Vázquez Algunos problem(it)as... Embajada China en Yugoeslavia (U$S 28M+...) Fabricante de fibras ópticas (U$S 0.5M) (1) Corredor de bolsa (U$S 500M) (1) Préstamos federales (U$S 2.000M) (1) (1) Fuente: Bowen, Fuhrer and Guess.

Upload: others

Post on 06-Aug-2020

3 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 200520052

UA

S C

arlo

s L

ópez

Váz

quez

Alguna terminología...

▼Calidad

▼Precisión

▼¿Correctitud?

▼¿Exactitud?

▲Quality

▲Precision

▲Accuracy

■ El idioma español tiene limitaciones en este aspecto...

3

UA

S C

arlo

s L

ópez

Váz

quez

La literatura...

■ Redman (1996)

■ English (1999)

■ Redman (2001)

■ Artículos varios

4

UA

S C

arlo

s L

ópez

Váz

quez

Plan del curso

■ Introducción

■ Estrategias para mejorar

■ Política de Calidad de Datos

■ Cómo arrancar

■ Manejo de Cadenas de información

■ Métodos de control estadístico

■ Monitoreo, seguimiento y mejora del proceso

5

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

IntroducciónContinúa con:

Estrategias para Mejorar

6

UA

S C

arlo

s L

ópez

Váz

quez

¿Le suena esto familiar?

“...Yo sé que nuestro /sistema/base de datos/ warehouse/ tiene algunos problemas con calidad de datos, pero no sé cómo o dónde comenzar...”

7

UA

S C

arlo

s L

ópez

Váz

quez

Frases célebres...

■ No puedo usar esta aplicación. Fíjese: ella sabe que este valor es típicamente menor a 1500, pero no me deja ingresar este caso de 1830. ¡Este sistema es inútil!(1)

■ El sistema trabaja perfectamente. Obviamente, si se le cargan datos erróneos ¿qué puede hacer la computadora?(1)

(1) Fuente: Bobrowski, Marré y Yankelevich8

UA

S C

arlo

s L

ópez

Váz

quez

Frases célebres...

■ No sé. Lo que puedo decirle es que a mi no me sirve. Me hace perder más tiempo buscando datos que antes(1)

■ No es nuestro problema. El sistema funciona, nosotros detectamos los datos cuando se cargan - y siguiendo SUS especificaciones - . Es un problema de los usuarios: ud. debería indicarles que lo usen bien(1)`

(1) Fuente: Bobrowski, Marré y Yankelevich9

UA

S C

arlo

s L

ópez

Váz

quez

Algunos problem(it)as...

■ Embajada China en Yugoeslavia (U$S 28M+...)

■ Fabricante de fibras ópticas (U$S 0.5M)(1)

■ Corredor de bolsa (U$S 500M) (1)

■ Préstamos federales (U$S 2.000M) (1)

(1) Fuente: Bowen, Fuhrer and Guess.

Page 2: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

Algunos números...

■ E-commerce 1998: 17.000 millones U$S

■ E-commerce 2002: 350.000 millones U$S(1)

■ E-commerce 1999: 1.700 millones U$S

■ E-commerce 2000: 4.200 millones U$S

■ E-commerce 2003: 13.100 millones U$S(2)

(1) Fuente: Forrester Research (2) International Data Corp. 11

UA

S C

arlo

s L

ópez

Váz

quez

Y los colegas... ¿en que están?

12

UA

S C

arlo

s L

ópez

Váz

quez

Tasas de error típicas

■ Cambios en la nómina de pagos 1%

■ Facturación 2-7%

■ Registros de crédito ... ¡tanto como 30%!

Fuente: Pierce (1997)

13

UA

S C

arlo

s L

ópez

Váz

quez

Algunos números...

Fuente: InformationWeek/Innovative Systems' 1999 Delphi Industry Study

Mejor caso(USA)

Peor caso(USA)

Promedio(USA)

Mejor caso(Int)

Peor caso(Int)

Promedio(Int)

Admisible

Errores ennombres

0.19 14.60 4.13 0.69 24.21 8.82 1.5

Registrosduplicados

1.06 60.49 16.24 2.55 55.96 16.01 2.0

Errores endirecciones

0.12 15.48 2.26 0.60 82.00 14.58 1.0

Tipo decliente

0.82 7.75 2.13 0.12 0.12 0.11 -

Relacionesignoradas

0.04 19.00 2.65 0.33 3.90 1.42 -

14

UA

S C

arlo

s L

ópez

Váz

quez

Nuevas víctimas (para un viejo villano...)

■ Data Warehouse (DW)

■ Electronic Data Interchange (EDI)

■ Data Mining (DM)

15

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué es un DW?

■ ...una estrategia para integrar información heterogénea

■ ...un sistema que permite procesamiento analítico en línea

■ ...un sistema que apoya la toma de decisiones correctas presentando correctamente en el momento correcto a un costo correcto la información correcta...

16

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué opina la gente de DW?

Los desafíos en orden de prioridad son:Calidad de datos

Manejo de datos antiguos

Manejo de las expectativas de los usuarios finales

Modelado del negocio/datos

Manejo de las expectativas de los directivos

Análisis de reglas del negocio

Manejo de metadatos

Fuente: DCI/Meta Group 17

UA

S C

arlo

s L

ópez

Váz

quez

Algunos hechos ...

■ Al crear un DW, entre 10 y 20% de los datos o son corruptos o son incompletos

■ Prevenir un error cuesta 1/10 de corregirlo

■ El costo directo de la mala calidad está entre 10 y 25% del presupuesto de ventas

■ Al integrar datos, se eliminan hasta un 40% de registros duplicados

■ Se ha informado que entre el 60 y 70 % de los proyectos de DW han fracasado

¿Seré yo el próximo?

18

UA

S C

arlo

s L

ópez

Váz

quez

Pero... ¿porqué?

■ Hay muchas razones (políticas, económicas y técnicas)

■ Hay dos en común: – no se comprenden los problemas

– se subestima el esfuerzo para resolverlos

Page 3: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

¿Y en qué invierte esa gente?

■ 59% Intranet/Internet data warehouse access tools■ 54% Query/report writers■ 45% Data warehouse design (logical/physical) ■ 43% Data acquisition and mapping■ 43% Data warehouse administration tools/products■ 41% Multidimensional OLAP tools/clients■ 40% Relational OLAP ■ 38% Data delivery (e.g., connectivity tools) ■ 38% RDBMS ■ 37% Data quality and reconciliation tools■ 36% Data mining tools■ 31% Managed query environments

Fuente: Market Perspectives Inc. for Meta Group 20

UA

S C

arlo

s L

ópez

Váz

quez

Ud...¿tiene una buena excusa?

■ Es sabido que unir DB para formar un DW es complicado

■ Sin una re-ingeniería de los datos... ¡es aún más complicado!

■ Ello implica investigar, reacondicionar y consolidar datos antes de migrar

■ Algunos no lo hacen; en ellos son típicas cinco excusas diferentes

Fuente: Vality Technology Inc. 21

UA

S C

arlo

s L

ópez

Váz

quez

Primera de cinco excusas...

“...Los datos nuevos serán tan buenos como los viejos, y los viejos aparentemente funcionan bien...”

La paradoja es:(Datos buenos)+(Datos buenos)=¡(Datos malos)!

22

UA

S C

arlo

s L

ópez

Váz

quez

Algunos ejemplos

Una tabla de clientes con campos no estandarizados

¡Se requieren “fuzzy joins”! 23

UA

S C

arlo

s L

ópez

Váz

quez

Segunda de cinco excusas...

“...Siempre tenemos alguna clave para hacer el join en la mayor parte de los casos...”

24

UA

S C

arlo

s L

ópez

Váz

quez

Tercera de cinco excusas...

“...De ser necesario limpiaremos los datos luego de llevarlos al nuevo sistema, y después del prototipo...”

Usualmente, es demasiado tarde porque:

•se acabaron los fondos

•se acabó el respaldo (o la paciencia)

•quizá ya se quemaron los puentes...

25

UA

S C

arlo

s L

ópez

Váz

quez

Cuarta de cinco excusas...

“...Arreglaremos los datos en el punto de entrada con GUIs y mejores procesos de edición...”

Esto tiene cuatro problemas:

■ Nunca subestime la creatividad del digitador

■ Las prácticas y políticas de la empresa evolucionan más rápido que el software

■ Hay datos cuyo formato no puede controlar

■ Para el futuro todo OK, pero... ¿qué hace con los datos viejos?

26

UA

S C

arlo

s L

ópez

Váz

quez

Quinta de cinco excusas...

“...Los usuarios nunca admitirían cambiar sus datos...”

Quizá no se requiera:•claves externas•tablas de sinónimos•etc.

27

UA

S C

arlo

s L

ópez

Váz

quez

En resumen:

No permita que estas excusas inhiban el utilizar la información existente como una ventaja estratégica

La salud de su empresa depende de la salud de sus datos

Page 4: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Nuevas víctimas (para un viejo villano...)

✔ Data Warehouse (DW)

■ Electronic Data Interchange (EDI)

■ Data Mining (DM)

29

UA

S C

arlo

s L

ópez

Váz

quez

DQ en relación a EDI

■ Teoría: “EDI ayuda a mejorar DQ”

■ Práctica: “Aparecen impactos negativos”

¿Porqué?

■ DQ fue originalmente presentado en contabilidad

■ El concepto ha variado en el tiempo– Confiabilidad

– Relevancia (desde los ‘80)

Fuente: Vermeer (2000)30

UA

S C

arlo

s L

ópez

Váz

quez

Visión tradicional

■ Confiabilidad (Reliability)– Accuracy

– Completeness

– Timeliness

■ El usuario no aparece

Calidad <==>Grado de acuerdo con la realidad

31

UA

S C

arlo

s L

ópez

Váz

quez

Nuevas tendencias

■ Agrega otra dimensión– Relevancia (Relevance)

– Confiabilidad (Reliability)

Calidad <==>Grado de acuerdo con la realidad y las necesidades del usuario

■ Relevancia no es intrínseca a los datos; depende del uso y del usuario

32

UA

S C

arlo

s L

ópez

Váz

quez

Incluso así...

■ El modelo es aún insuficiente

■ No explica cómo ni porqué pueden empeorar las cosas al implementar EDI– Datos perfectos pueden ser insuficientes

■ Necesidad de un modelo alternativo

33

UA

S C

arlo

s L

ópez

Váz

quez

Nuevas tendencias

■ Aparece la interpretación del emisor y receptor

■ La comunicación exitosa requiere compartir un contexto

Calidad <==> datos + alineación entre el contexto del emisor y del receptor

34

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo interactúan?

■ En resumen:– Confiabilidad es positiva

– Relevancia es positiva

■ Pero...– Contexto es negativa porque genera dudas y

desconfianza en el sistema

■ Resultado neto:– ¡puede ser positivo o negativo!

35

UA

S C

arlo

s L

ópez

Váz

quez

Ejemplo de Contextos

■ Diferentes interpretaciones del mismo ítem (“data is good but interpretation is wrong”)

■ Diferentes traducciones del mismo ítem entre diferentes proveedores

36

UA

S C

arlo

s L

ópez

Váz

quez

Nuevas víctimas (para un viejo villano...)

✔ Data Warehouse (DW)

✔ Electronic Data Interchange (EDI)

■ Data Mining (DM)

Page 5: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

37

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué es Data Mining? Fuente: Zaima (2004)

38

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué es Data Mining?(2)

Fuente: Bounsaythip (2004)

■ Modelos Predictivos– Clasificación

– Regresión

– Descubrimiento de Patrones Secuenciales

■ Modelos Descriptivos– Análisis de Conglomerados

– Descubrimiento de Reglas

Mínimos Cuadrados Redes Neuronales

etc.

39

UA

S C

arlo

s L

ópez

Váz

quez

Efecto de errores en regresión(1)

75 76 77 78 79 80 81

1.2

1.3

1.4

1.5

1.6

1.7

x 104

Reclamos por incendio en Bélgica

40

UA

S C

arlo

s L

ópez

Váz

quez

Efecto de errores en regresión(2)

0 20 40 60 800

5

10

15

20

25

30

35

40

Caudal en un dos puntos de un mismo río 41

UA

S C

arlo

s L

ópez

Váz

quez

Detección de errores(1)

Fuente: López (1997)

0 N 100 -N 100

E ffo rt [% ]

Any

mea

sure

of t

he r

emai

ning

err

or

o B es t

W ors t o

P os s ib le o

42

UA

S C

arlo

s L

ópez

Váz

quez

0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6 1.8 2

0

10

20

30

40

50

60

70

80

90

100

Effort [% ]

# er

rors

foun

d [%

]

(A )

(B )

(Best)

(W orst)

o

o

o

o

o(Real)

Detección de errores(2)

Fuente: López (1997)

43

UA

S C

arlo

s L

ópez

Váz

quez

Aplicación al Censo 1985

Fuente: López (1997)

0 2 4 6 8 1 0 1 2 1 4 16 1 8 2 00

1 0

2 0

3 0

4 0

5 0

6 0

7 0

8 0

9 0

1 0 0O ve ra ll re s ul ts vs . e ffo rt le ve l

3 % o f t h e s u rve y s ini t ia lly c o n t a m in a t edw ith 2 e rrors e a c h ; M a rgin al 0 .1 0 %

% o f c on t ro l le d d a ta

% o

f err

ors

foun

d

Bes

t po

ssib

le o

pera

t ion

line

E x p ec te d du pl ic a te p erform an c e lo c us

44

UA

S C

arlo

s L

ópez

Váz

quez

Por si no lo sabía…

■ Muchos problemas con el software no se deben al sistema, sino a inconsistencias o errores en los datos

■ Cuanto antes los elimine…– Errores al presente

– Errores al futuro

45

UA

S C

arlo

s L

ópez

Váz

quez

Al incorporar DQ en el sistema...

■ mejores decisiones de mercado

■ incrementar ingresos y ganancias

■ mejorar participación en el mercado

■ detectar fraudes más rápidamente

■ mejorar servicio al cliente

■ viabilizar el uso de OLAP y DM

■ comprender a sus clientes

■ implementar cambios más rápidamente Fuente: i.d.CENTRIC/firstLOGIC

Page 6: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

46

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo justificar hacer DQ?

■ Muchos proyectos sufren de problemas

■ Los problemas inesperados provocan:– gastos extras

– atrasos

– baja de calidad del producto o servicio

– combinación de los anteriores

■ Los riesgos son problemas potenciales

■ Identificarlos permite prevenir47

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo justificar hacer DQ?

■ Enfóquelo en términos de riesgo para el “otro” proyecto

■ ¿Otro? ¿Cuál otro? Por ejemplo:– Business intelligence

– Data Warehousing

– Customer Relationship Management (CRM)

– Enterprise Resource Planning (ERP)

■ Éxitos relacionados:empresa <==> CEO <==> CIO <==> ¡Ud.! 48

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo justificar hacer DQ?(2)

■ Ej.: Las etapas C1, F4 y F5 requieren integrar datos del sistema actual en el nuevo

Preguntas:

■ ¿Tolerancia a datos erróneos?

■ ¿Tolerancia a datos incompletos?

■ ¿Tolerancia a especificaciones (metadatos) incompletas o erróneas?

Hay que mitigar el riesgo si afecta al proyecto

49

UA

S C

arlo

s L

ópez

Váz

quez

Sobre el riesgo...

■ Para eso se inventaron los seguros

■ Hay seguros de vida, granizo, helada, etc.

■ Desafortunadamente, no hay pólizas para calidad de datos

¡Houston, we have a problem!

■ Tres pasos:– Identificar riesgos potenciales

– Elaborar un plan B para cada caso

– Monitorear el plan mismo 50

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué puede hacerse?

Se distinguen Sistemas de Calidad de Datos de 1a, 2a y 3a Generación:1. Énfasis en detección + corrección

2. Énfasis en el control del proceso

3. Hacer imposibles los errores mediante diseño

51

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué puede hacerse? (2)

1. Detección + corrección– No toca los sistemas existentes

– No requiere “demasiadas” discusiones

– Tarea a realizar “una” vez (¡ja!)

52

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué puede hacerse? (3)

2. Control del proceso– Quizá altera los sistemas existentes

– Altera los nervios de muchos...

– Tarea permanente

53

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué puede hacerse? (4)

3. Errores imposibles por diseño– Sólo existen ejemplos en la industria manufacturera

– Pavada de desafío, ¿no?

54

UA

S C

arlo

s L

ópez

Váz

quez

Algunos números...

Fuente: InformationWeek/Innovative Systems' 1999 Delphi Industry Study

Mejor caso(USA)

Peor caso(USA)

Promedio(USA)

Mejor caso(Int)

Peor caso(Int)

Promedio(Int)

Admisible

Errores ennombres

0.19 14.60 4.13 0.69 24.21 8.82 1.5

Registrosduplicados

1.06 60.49 16.24 2.55 55.96 16.01 2.0

Errores endirecciones

0.12 15.48 2.26 0.60 82.00 14.58 1.0

Tipo decliente

0.82 7.75 2.13 0.12 0.12 0.11 -

Relacionesignoradas

0.04 19.00 2.65 0.33 3.90 1.42 -

Page 7: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

55

UA

S C

arlo

s L

ópez

Váz

quez

Dos situaciones

■ Existe una lista/BD confiable contra qué comparar– Ej.: direcciones válidas

– Ej.: clientes válidos

■ No existe tal lista– Ej.: compras pasadas

– Ej.: calificación del cliente

56

UA

S C

arlo

s L

ópez

Váz

quez

La analogía del lago

57

UA

S C

arlo

s L

ópez

Váz

quez

Conclusiones

Fuente: Stewart and Fenton (1999)

Para asegurar la calidad de los datos las organizaciones no deben

únicamente invertir en la tecnología que permite acceder a la

información; ellos deben además invertir en la gente con las

habilidades para manejarla.

58

UA

S C

arlo

s L

ópez

Váz

quez

Referencias

■ Stewart, M. M. and Fenton, S., 1999 Building Data Quality into Information Management Processes AHIMA's Data Quality Task Force

■ Bobrowski, M., Marré, M. and Yankelevich, D. XXXX. A Software Engineering View of Data Quality

■ Bowen, P. L.; Fuhrer, D. A. and Guess, F. M., 1998. ContinuouslyImproving Data Quality in Persistent Databases. Data Quality V 4, N 1, 1998

■ Vermeer, B. H.P.J., 2000. How Important is Data Quality for Evaluating the Impact of EDI on Global Supply Chains? Proceedings of the 33rd Hawaii International Conference on System Sciences -2000

■ Zaima, A. and Kashner, J., 2004. Data Mining Primer for the DataWarehouse Professional.

■ Bounsaythip, C. and Rinta-Runsala, E., 2001. Overview of Data Mining for Customer Behavior Modeling.

59

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Introducción

Continúa con:

Estrategias para Mejorar

Page 8: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Estrategias para Mejorar

Viene de:

Introducción

Continúa con:

Política de Calidad de Datos

2

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ Algunas definiciones

■ Estrategias

■ Qué datos mejorar

■ Caso de una única BD

■ Caso del DW

3

UA

S C

arlo

s L

ópez

Váz

quez

Una tarea siempre titánica...

■ Volumen de datos tamaño empresa

■ Tendencia es a manejar más datos» DW

» BDOO

» Herramientas de última generación

» Intranet/Internet

■ Se requieren planes...

4

UA

S C

arlo

s L

ópez

Váz

quez

===D

efin

e có

mo

===>

proc

eder

en

ese

caso

<==Solicita recursos==

<=Infor

ma sobre

problem

as obser

vados==Definen qué datos serán mejorados=>

Plan de Calidad de Datos (PCD)

Infraestructura administrativa

Administración del PCD

Planes operacionales

Objetivos claros para el negocio

Administración del PCD

Infraestructura administrativa

Planes operacionales

Objetivos claros para el negocio

5

UA

S C

arlo

s L

ópez

Váz

quez

Algunas definiciones...

▼Calidad

▼Precisión

▼¿Correctitud?

▼¿Exactitud?

▲Quality

▲Precision

▲Accuracy

■ El idioma español tiene limitaciones en este aspecto...

6

UA

S C

arlo

s L

ópez

Váz

quez

Una definición operativa...

Def.: “...Calidad(A) > Calidad(B) si...”– intrínsecamente subjetiva

– asociada a las necesidades

– dos clientes podrían disentir

– eso si el cliente “sabe lo que quiere”...

7

UA

S C

arlo

s L

ópez

Váz

quez

Ejemplo de las dificultades...

MINMAX: Cal(A)=5.0;Cal(B)=0.5 A<B

StdDev: Cal(A)=2.04;Cal(B)=0.0 A<B

RMSE: Cal(A)=5.0;Cal(B)=1.22 A<B 8

UA

S C

arlo

s L

ópez

Váz

quez

Una definición operativa (2) ...

– dos clientes podrían disentir

Hay cosas que todos quieren o esperan:

!relevancia

!correctitud

!poder “ver”

!acceso simple

!seguridad

!privacidad9

UA

S C

arlo

s L

ópez

Váz

quez

Son dimensiones diferentes...

En Calidad de Datos se distinguen cuatro:

■ Modelo de Datos (ej. relevancia)

■ Valores mismos (ej. correctitud)

■ Presentación (ej. poder “ver”)

■ Tecnológicos (ej. acceso simple)

El curso trata sobre la segunda dimensión

Page 9: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

Para los valores mismos...

...también se distinguen cuatro dimensiones:

■ Correctitud

■ Vigencia

■ Completitud

■ Consistencia

11

UA

S C

arlo

s L

ópez

Váz

quez

Correctitud (1)

<E,A,V1>

<E,A,V2>

<E,A,V3>

...

<E,A,V2>

<E,A,V>

Ej. <EMPLEADO,AÑO_NACIMIENTO,VALOR>

E=“1745”,E.AÑO_NACIMIENTO=”1960” 12

UA

S C

arlo

s L

ópez

Váz

quez

Correctitud (2)

Quizá lo mejor que pueda lograrse es...

<E,A,[VMAX,VMIN]>

Ej. < FECHA,TEMPERATURA_AMBIENTE, VALOR>

FECHA=“18071825.120000”,FECHA.TEMP=”19.60”

Un caso con dos problemas:

•No existe “verdadero”

•No existió nunca

13

UA

S C

arlo

s L

ópez

Váz

quez

Correctitud (3)

Las combinaciones formalmente posibles no necesariamente son válidas

Ej. EMPLEADO=“9999”

EMPLEADO.NOMBRE=“Jorge Batlle Ibáñez”

EMPLEADO.AÑO_NACIMIENTO=“1925”

EMPLEADO.CARGO=“Desconocido”

¡ Simplemente no es empleado!

14

UA

S C

arlo

s L

ópez

Váz

quez

Correctitud (4)

<E,A,”Juguetería/Bazar”>

<E,A,”JUGUETERIA/BAZAR”>

<E,A,”Jugueteria/Bazar”>

...

<E,A,”Jugueteria / Bazar”>

¡Hay varios valores “correctos”!

15

UA

S C

arlo

s L

ópez

Váz

quez

Correctitud (5)

En resumen:

• No siempre existe un “verdadero valor”

• Aún existiendo, puede ser inaccesible

• Métricas específicas al problema

• Métricas problemáticas

16

UA

S C

arlo

s L

ópez

Váz

quez

Para los valores mismos...

...también se distinguen cuatro dimensiones:

✔ Correctitud

■ Vigencia

■ Completitud

■ Consistencia

17

UA

S C

arlo

s L

ópez

Váz

quez

Vigencia (1)

ESTALLOVIENDO.NOW=TRUE

LUN MAR MIE JUE

Es algo que depende del tiempo...

18

UA

S C

arlo

s L

ópez

Váz

quez

Vigencia (2)

■ Datos permanentes– Fecha de nacimiento

– Tipo de sangre

– Lugar de nacimiento ≠ País de nacimiento!

■ Datos dinámicos|– Cambian ocasionalmente

» Nombre y/o apellido (ej.: USA)

» Dirección

– Cambian regularmente» Salario|

Page 10: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

Para los valores mismos...

...también se distinguen cuatro dimensiones:

✔ Correctitud

✔ Vigencia

■ Completitud

■ Consistencia

20

UA

S C

arlo

s L

ópez

Váz

quez

■ Cuatro posibilidades– El empleado no tiene teléfono ==>OK

– El empleado tiene teléfono, pero se ignora el número==>INC

– El empleado tiene un número que no figura en la guía ==>OK

– Se ignora si el empleado tiene teléfono ==>OK

Completitud (1)

■ EMPLEADO.HOMEPHONE=“Null”

■ Veamos un poco más de detalle21

UA

S C

arlo

s L

ópez

Váz

quez

Completitud (2)

■ El “Null” debería tener colores...» Valor desconocido de un atributo aplicable (el

registro es incompleto)

» Indicador de atributo no aplicable (el registro es completo)

» Atributo de aplicabilidad desconocida

» Valor especial de un atributo (el registro es completo)

■ Difícil de implementar...

22

UA

S C

arlo

s L

ópez

Váz

quez

Completitud (3)

■ Dos problemas:✔ Completitud de registros en la base

– Completitud de la base

■ Ej.: Lista de Empleados Activos

■ Ej.: Diccionario de neologismos

23

UA

S C

arlo

s L

ópez

Váz

quez

Para los valores mismos...

...también se distinguen cuatro dimensiones:

✔ Correctitud

✔ Vigencia

✔ Completitud

■ Consistencia

24

UA

S C

arlo

s L

ópez

Váz

quez

Consistencia (1)

■ Dos o más cosas no son incompatibles

■ Dos o más datos pueden ser correctos a la vez

■ Un par de casos típicos– Redundancia

– Consistencia interna

25

UA

S C

arlo

s L

ópez

Váz

quez

Consistencia (2)

■ Redundancia– Varias copias de lo mismo

– Actualización independiente

– Mantenimiento separado

Empleado.Dirección=“Aconcagua 1234”

Empleado.Dirección=“Rancagua 1234”

Empleado.Dirección=“Aconcagua 2134” 26

UA

S C

arlo

s L

ópez

Váz

quez

Consistencia (3)

■ Consistencia interna– Existen reglas a cumplir

» explícitas

» implícitas

Empleado.Dirección=“Aconcagua 1234”

Empleado.CP=“11600”

27

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Algunas definiciones

■ Estrategias

■ Qué datos mejorar

■ Caso de una única BD

■ Caso del DW

Page 11: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Tres niveles, tres generaciones

Detección + corrección

Diseño de procesos

Mejora de procesos

29

UA

S C

arlo

s L

ópez

Váz

quez

Detección + corrección

Tácticas corrientes:– Laissez fair

– Comparar: » datos vs. realidad

» con otra base

» con reglas del negocio

30

UA

S C

arlo

s L

ópez

Váz

quez

Comparar datos con realidad...

■ Viable para pocos datos

■ Caro y lento

■ Útil para evaluar niveles de calidad mediante muestreo

■ Inviable para datos muy dinámicos

31

UA

S C

arlo

s L

ópez

Váz

quez

Comparar datos con otra base...

■ Trabajo de laboratorio (la realidad no entra)

■ Hipótesis implícitas» Existe una base, independiente, y redundante

» No tiene demasiados errores

■ La comparación puede no ser simple

■ Es un método seductor...

32

UA

S C

arlo

s L

ópez

Váz

quez

...con reglas del negocio... (1)

Se expresan como Data Edits...

■ Un único campo:– “el valor debe ser uno de {0,1,2...9}”

■ Múltiples campos:– “Ciudad y País deben coordinarse”

■ Relaciones probabilísticas:– “Hijos=4 y Edad=15 es improbable”

■ Si fallan, se revisan los casos anómalos33

UA

S C

arlo

s L

ópez

Váz

quez

...con reglas del negocio... (2)

A Favor:

■ Revelan muchas inconsistencias

■ No requiere una segunda base

En contra:

■ Difíciles de hallar/explicitar

■ Requieren “expertos”

■ Pueden cambiar con el tiempo

■ Se aplican una vez, o son permanentes

34

UA

S C

arlo

s L

ópez

Váz

quez

...con reglas del negocio... (3)

Ej.: Caso del Censo (López, JISS 1997)

■ Escaneado+interpretación automática

■ Sólo datos categóricos

■ Digitar dos veces, o sólo lo erróneo

■ Reglas derivadas de los datos ==>¡No hay experto!

■ Resultado de la simulación:35

UA

S C

arlo

s L

ópez

Váz

quez

0 2 4 6 8 10 12 14 16 18 200

10

20

30

40

50

60

70

80

90

100Overall results vs. effort level

3% of the surveys initially contaminatedwith 2 errors each; Marginal 0.10%

% of controlled data

% o

f err

ors

foun

d

Bes

t po

ssib

le o

p era

t ion

line

Expected duplicate performance locus

...con reglas del negocio... (4)

36

UA

S C

arlo

s L

ópez

Váz

quez

Tres niveles, tres generaciones

Detección + corrección

Mejora de procesos

Diseño de procesos

Page 12: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

37

UA

S C

arlo

s L

ópez

Váz

quez

Mejora de procesos

■ ¿Y la prevención?

■ Ej.: 1000 datos/día, 20 campos, 2% errores ==>¡400 errores/día!

38

UA

S C

arlo

s L

ópez

Váz

quez

Un ejemplo...

VENTAS

ÓRDENES

DESPACHO

FACTURACIÓN

39

UA

S C

arlo

s L

ópez

Váz

quez

Prevención...

■ Uso extenso de reglas del negocio

■ Quizá pequeños cambios» Ej.: habilitar/inhibir edición

■ Corrección temprana

■ Seguimiento

■ Más barato que corrección

■ Única alternativa si “llueven datos”

40

UA

S C

arlo

s L

ópez

Váz

quez

Tres niveles, tres generaciones

Detección + corrección

Mejora de procesos

Diseño de procesos

41

UA

S C

arlo

s L

ópez

Váz

quez

Diseño del proceso

■ “a prueba de errores”

■ Exitosa en manufactura

Ideas:

■ Eliminar re-digitación

■ Incorporar reglas

■ Reasignar propiedades

■ No hay muchos ejemplos con datos42

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Algunas definiciones

✔ Estrategias

■ Qué datos mejorar

■ Caso de una única BD

■ Caso del DW

43

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué datos mejorar... primero?

■ Tan importante como la estrategia

■ Hay que lograr éxitos al principio

■ Buscar consensos

■ Considerar varios criterios:– estrategia global de la empresa

– relevancia para problemas ya conocidos

– distancia ser<==>deber ser

– impacto económico

44

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Algunas definiciones

✔ Estrategias

✔ Qué datos mejorar

■ Caso de una única BD

■ Caso del DW

45

UA

S C

arlo

s L

ópez

Váz

quez

Una única base

1) Definir estrategia

EstrategiaProblemas conocidosNivel de errorImpacto ($)

Datos prioritarios

Cambios lentos

Cambios rápidos

Caso intermedio

Page 13: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

46

UA

S C

arlo

s L

ópez

Váz

quez

Hay casos mezclados...

BD de Clientes:■ Cliente.FechaNacimiento

■ Cliente.Domicilio

■ Cliente.Saldo

¿Razones?– acotar el trabajo de limpieza

– asegurar un retorno 47

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Algunas definiciones

✔ Estrategias

✔ Qué datos mejorar

✔ Caso de una única BD

■ Caso del DW

48

UA

S C

arlo

s L

ópez

Váz

quez

Muchas bases...

A) Bases que no se solapan

49

UA

S C

arlo

s L

ópez

Váz

quez

Muchas bases...

B) Bases cliente-servidor

50

UA

S C

arlo

s L

ópez

Váz

quez

Muchas bases...

C) Bases solapadas pero independientes

51

UA

S C

arlo

s L

ópez

Váz

quez

Más de una base...

52

UA

S C

arlo

s L

ópez

Váz

quez

Vale la pena mencionar...

■ Problemas con datos, no con SGBD...

■ Duplicación por razones técnicas– Backup

– Redundancia quizá requerida

==> ¡Usar Master-Slave!

■ DW explícitamente crea redundancia

■ DW recibe datos de varias fuentes

53

UA

S C

arlo

s L

ópez

Váz

quez

El caso del DW

■ Identificar los datos requeridos

■ Identificar la(s) fuente(s)

■ Estimar niveles de error y caracterizar velocidad de cambios

Tres pasos:

54

UA

S C

arlo

s L

ópez

Váz

quez

Resumen

■ Plan operacional:– Detección+corrección

– Manejo de procesos

– Diseño de procesos

■ Pueden convivir

■ Datos críticos

■ Controlar redundancia

Page 14: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Política de Calidad de Datos

Viene de:

Estrategias para mejorar

Continúa con:

Cómo arrancar

2

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ ¿Qué debería contemplarse?

■ Los datos como bienes

■ La política de datos

■ Implementando la política

■ Resumen

3

UA

S C

arlo

s L

ópez

Váz

quez

Tres aspectos...

Razones para preocuparse

Cómo proceder

Contabilidad de resultados

4

UA

S C

arlo

s L

ópez

Váz

quez

Los bienes en la empresa...

■ Tangibles– Capital

– Equipos

– Materiales

– Edificios

■ Intangibles– Marcas y patentes

– Conocimiento

– Datos 5

UA

S C

arlo

s L

ópez

Váz

quez

¿Quién es responsable...?

■ Tangibles– Capital ! Contador

– Equipos ! Capataz

– Materiales ! Encargado de Depósito

– Edificio ! Conserje

■ Intangibles– Patentes ! Jurídica

– Conocimiento ! Gerencia General

– Datos ! ¿? 6

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

■ ¿Qué debería contemplarse?

■ Los datos como bienes

■ La política de datos

■ Implementando la política

■ Resumen

7

UA

S C

arlo

s L

ópez

Váz

quez

¿Una Política de datos?

■ Es más que Calidad de Datos

■ Asignar responsabilidades– a organizaciones

– a personas

■ Sobre aspectos de la Calidad» Correctitud, Completitud, etc...

■ Pero además...» Seguridad

» Privacidad

» Redundancia8

UA

S C

arlo

s L

ópez

Váz

quez

“La empresa ya tiene políticas...”

■ Aplicadas típicamente para bienes tangibles» Capital

» Recursos Humanos

» Etc.

■ Ampliamente conocidas y enseñadas

■ ¿Porqué no aplicarlas?

9

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ ¿Qué debería contemplarse?

■ Los datos como bienes

■ La política de datos

■ Implementando la política

■ Resumen

Page 15: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

Los datos como bienes... (1)

pero...– No hay inventario

– No se comparten

– No se sabe qué hay

– Es difícil accederlos

– No hay estándares

– Hay demasiados datos

– No se sabe cómo, cuándo y de dónde obtenerlos

“...los datos son uno de nuestros bienes más valiosos”...

11

UA

S C

arlo

s L

ópez

Váz

quez

Los datos como bienes... (2)

■ Además...– Corren riesgo de daño o robo

– No hay reglas de acceso y privacidad

– No tienen especificado un valor monetario

■ En resumen:

12

UA

S C

arlo

s L

ópez

Váz

quez

Más características...

Los datos son:

■ Intangibles

■ Copiables y transportables

■ No se gastan con el uso

■ Únicos o novedosos

■ No hay mercado para cotizarlos

■ Tremendamente dinámicos

13

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ ¿Qué debería contemplarse?

✔ Los datos como bienes

■ La política de datos

■ Implementando la política

■ Resumen

14

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (1/6)

Objetivos de Calidad en sentido amplio– Relevancia

– Completitud

– Correctitud

– Acceso

– Consistencia

15

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (2/6)

Obligación del Inventario de Datos– Qué datos tiene

– Dónde están

– Qué significan

– Quién puede accederlos

– Cómo pueden accederse

16

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (3/6)

Reglas de Acceso y Disponibilidad– Acceso: ¿excepción o regla?

– Compartibles vs. Restringidos» Privacidad

» Estratégicos

» Impresentables...

– Administración del acceso

17

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (4/6)

Considerar una Arquitectura de Datos– De interés práctico

– Fuerza una solución a muchos problemas

– Induce a una solución en otros» Redundancia

» Uso de estándares

» Privilegios de Acceso

» Seguridad y respaldos

– Consagra separación datos/aplicaciones18

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (5/6)

Incluir Seguridad, Privacidad y Uso apropiado– Reglas de Seguridad

» El DBMS implementa; no define

» Gran discrecionalidad al momento del uso

– Privacidad, Uso apropiado» Costumbre

» Prácticas comerciales

» Entorno legal

» Podría no ser prioritario... aún.

Page 16: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué podría contener? (6/6)

Considerar Planificación expresamente– Actividad regular

– Varios horizontes (incluso multianuales)» Nuevos datos

» Nuevos tipos

» Nuevas fuentes

» Tecnologías apropiadas

– Alineados con la estrategia del negocio

20

UA

S C

arlo

s L

ópez

Váz

quez

Un ejemplo de Política de Datos

...focalizado en Calidad de Datos

Debería contener:– Generalidades

– Funciones Centralizadas

– Funciones Distribuidas» En proveedores y productores de datos

» En los que guardan y procesan los datos

» En los que usan los datos

Fuente: Redman DQFTIA, Cap. 321

UA

S C

arlo

s L

ópez

Váz

quez

Generalidades

■ Sobre la “propiedad” de los datos

■ Sobre mecanismos y costos de acceso

■ Sobre las reglas aplicables a otros

22

UA

S C

arlo

s L

ópez

Váz

quez

Funciones Centralizadas

En el CIO– Sobre el mantenimiento del Inventario

– Sobre el acceso a datos y medios

– Sobre la redundancia

En el Consejo de Datos– Clasificar datos

– Adoptar o desarrollar estándares

En el CQO– Establecimiento de métricas 23

UA

S C

arlo

s L

ópez

Váz

quez

Funciones distribuidas(1)

En proveedores y productores de datos – Saber quién usa qué, y para qué

– Confirmar que se obtiene/produce lo requerido

– Mejorar, Medir, Modificar

24

UA

S C

arlo

s L

ópez

Váz

quez

Funciones distribuidas(2)

Los que guardan y procesan datos – Suministrar soluciones de mínima redundancia

– Prevenir daños y acceso no autorizado

– Facilitar acceso

– Actualizar la tecnología

25

UA

S C

arlo

s L

ópez

Váz

quez

Funciones distribuidas(3)

En los usuarios de datos – Interactuar activamente con proveedores

– Proveer retroalimentación hacia ellos

– Asegurarse sobre qué se usa

– Asegurarse sobre qué puede usarse

– Exigir y proteger el derecho a privacidad

26

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ ¿Qué debería contemplarse?

✔ Los datos como bienes

✔ La política de datos

■ Implementando la política

■ Resumen

27

UA

S C

arlo

s L

ópez

Váz

quez

Implementando... (1)

■ Trabaje a favor de la cultura, no en contra– ¿verticalismo o liderazgo?

– ¿líneas claras o todo digerido?

■ Cinco modelos– feudalismo

– anarquía

– utopía tecnocrática

– monarquía

– federalismo

Mejores resultados

Pero...

requiere más paciencia, energía

...y habilidades

Page 17: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Implementando... (2)

■ No proponga políticas ...

■ Políticas<==>Implementación

■ En etapas– Creadores y usuarios

– Funciones centrales

■ Priorice

■ Estandarice (¡si puede!)– ignorancia

– resistencia

Implementación

29

UA

S C

arlo

s L

ópez

Váz

quez

Implementando... (3)

■ ¡Abajo la AntiRedundancia!

■ Privacidad– poco tratado

– conflictivo

– sea prudente

■ ¿Quién es el dueño?

30

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ ¿Qué debería contemplarse?

✔ Los datos como bienes

✔ La política de datos

✔ Implementando la política

■ Resumen

31

UA

S C

arlo

s L

ópez

Váz

quez

Política de Calidad de Datos

■ Asignar responsabilidades aunque falten:– avances científicos en gestión

– definiciones legales

■ ¡Próximas a la fuente!

■ La política debe incluir varias cosas

■ Datos (como bienes) son especiales

■ Un paso por vez

Cruce cada puente cuando llegue a él32

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Política de Calidad de Datos

Viene de:

Estrategias para mejorar

Continúa con:

Cómo arrancar

Page 18: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Cómo arrancar

Viene de:

Política de Calidad de Datos

Continúa con:

Manejo de Cadenas de Información

2

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ Un modelo para cambios exitosos

■ Comenzando

■ Creciendo

■ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

3

UA

S C

arlo

s L

ópez

Váz

quez

El Administrador del PCD

■ Provee la visión...

■ Planifica...

■ Disciplina...

■ Ayuda a incorporar...

■ Y finalmente... ¡Lidera!

4

UA

S C

arlo

s L

ópez

Váz

quez

Si tenemos administrador...

■ Los problemas existen

■ Nadie se opone

■ Soy simpático

pero el programa no arranca...

¿Que puede fallar?

5

UA

S C

arlo

s L

ópez

Váz

quez

Toda empresa tiene un PCD

Con el fin de:

■ Corregir facturas

■ Rastrear pedidos no entregados

■ Atención de quejas

■ Realizar “limpieza” ocasional de una BD

■ Aplicar algún control de rango

6

UA

S C

arlo

s L

ópez

Váz

quez

PCD de 1ra. generación

■ Implícito

■ Esfuerzos descoordinados

■ Caros

■ Dudoso valor a largo plazo

■ Poco soporte técnico/recursos

Características principales:

7

UA

S C

arlo

s L

ópez

Váz

quez

PCD de 1ra. generación

■ Necesidades poco especificadas e insatisfechas

■ Nadie es responsable a nivel empresa

■ No hay cadenas definidas

■ Énfasis en detección y corrección

■ Tasas de error altas y desconocidas

■ Altos costos asociados a errores

■ Otros aspectos (redundancia, privacidad, etc.) fuera de control

8

UA

S C

arlo

s L

ópez

Váz

quez

El primer proyecto

■ Esfuerzo focalizado

■ Una única cadena

■ Oportunidad de negocio

9

UA

S C

arlo

s L

ópez

Váz

quez

PCD de 2da generación

■ Uso de datos como fuente de valor

■ Datos convertidos en activos...

■ Responsabilidades asignadas

■ Cadenas importantes reconocidas y administradas

■ Mejora continua, prevención de errores

■ Menores niveles de error, menor costo

■ Otros aspectos bajo control

Page 19: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

La transformación deseada

11

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

■ Un modelo para cambios exitosos

■ Comenzando

■ Creciendo

■ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

12

UA

S C

arlo

s L

ópez

Váz

quez

Un modelo para cambios exitosos

Algunos autores reconocen 4 aspectos:

■ Presión para el cambio

■ Visión clara y compartida

■ Capacidad de cambio

■ Éxitos iniciales

exitosoCambio

iniciales Éxitos

cambio de

Capacidad

compartiday

clara Visión

cambio el para Presión

=+++

13

UA

S C

arlo

s L

ópez

Váz

quez

Presión para el cambio (1)

■ Sin obligación, no hay cambio– Si hay éxito, no hay cambio

– Si estamos bien, por algo será

– “No cambiar de caballo en la mitad del río…”

– Cualquier cambio es riesgoso

– Hay barreras sicológicas, no explícitas

14

UA

S C

arlo

s L

ópez

Váz

quez

Presión para el cambio (2)

■ ¡Se necesita una crisis!– Normalmente de origen externo

» Clientes, inversores, competidores, y…. Empleados

– Puede ser una oportunidad para la empresa» “Cómo aprovechar el mercado chino…”

» “Cómo entrar en ese nicho…”

– O para uno mismo» Oportunidad de mostrar liderazgo

15

UA

S C

arlo

s L

ópez

Váz

quez

Presión para el cambio (3)

■ Debe buscarse apoyo■ Lo que no debe hacerse

– “La calidad es buena; ¡hagamos Calidad!”– “Quiero ser recordado como…”

■ No olvidar– La calidad es un medio, no un fin– Tiene fines específicos; no filosóficos ni genéricos– Evite fanatismos– Guíe la energía de la empresa

16

UA

S C

arlo

s L

ópez

Váz

quez

Visión clara y compartida

■ Tres palabras:– Visión

» Qué se quiere lograr

» El Porqué debe ser algo más que los problemas de hoy

– Clara» Lenguaje apropiado

– Compartida» Los cambios afectan a muchos

■ Parece fácil, pero es difícil

17

UA

S C

arlo

s L

ópez

Váz

quez

Capacidad de cambio

■ Hay prerrequisitos– Conocimiento– Capital– Tiempo– Habilidad emocional para el cambio

■ Resistencias emocionales son difíciles…– Rara vez explicitada– Corriente incluso entre científicos

■ En relación a Calidad ¡es peor!18

UA

S C

arlo

s L

ópez

Váz

quez

Las cuatro F

■ La motivación para el cambio puede venir– Fear (Miedo)

– Fame (Fama)

– Fun (Diversión)

– Fortune (Fortuna)

■ El Líder debe estar preparado– Sea convincente

– Al empezar, eluda a los contras

Page 20: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

Éxitos iniciales

Los primeros son los más importantes…– Un visión no siempre es práctica

– Sinergia: Motivación !" Resultados

– Desactivar mala onda

“…Un largo viaje siempre tiene un primer paso…” Proverbio chino

20

UA

S C

arlo

s L

ópez

Váz

quez

¿Y si falta alguno?

inacción prioridad,

Baja

iniciales Éxitos

cambio de

Capacidad

compartiday

clara Visión

cambio el para Presión

=+++

dirección sinrápidos,

Arranques

iniciales Éxitos

cambio de

Capacidad

compartiday

clara Visión

cambio el para Presión

=+++

nfrustracióy

Ansiedad

iniciales Éxitos

cambio de

Capacidad

compartiday

clara Visión

cambio el para Presión

=+++

falso en arranques

Riesgos,

iniciales Éxitos

cambio de

Capacidad

compartiday

clara Visión

cambio el para Presión

=+++

21

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Un modelo para cambios exitosos

■ Comenzando

■ Creciendo

■ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

22

UA

S C

arlo

s L

ópez

Váz

quez

Comenzando

■ Elija un problema pequeño– Una única cadena

– Una porción

■ Logre mejoras

■ Recoja beneficios

■ El consejo:– Poner foco

– comenzar pequeño

– moverse rápido

23

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo elegir el problema?

■ El problema debe balancear– grande

"mostrar utilidad

– pequeño

"facilitar éxito

"limitar controversias

¡No lo elija demasiado pequeño!

¡Busque la fácil!

24

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo elegir el equipo?

■ El equipo debe ser– pequeño

– individuos respetados

– capaces de ejecutar

■ Un ejecutivo involucrado a la cabeza– Más el CIO, CQO, CFO, FMI, ETC.,…

25

UA

S C

arlo

s L

ópez

Váz

quez

Un consejo final…

■ No discuta con los contras

■ Son muchos, y tienen argumentos creíbles

■ Esconden razones emocionales

■ No gaste tiempo ni energía con ellos

■ La mayoría son inofensivos

26

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Un modelo para cambios exitosos

✔ Comenzando

■ Creciendo

■ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

27

UA

S C

arlo

s L

ópez

Váz

quez

Creciendo

■ Las empresas no avanzan “en formación”

–Los que nunca cambiarán

–Almas intrépidas

–Early adopters

–La mayoría…

Page 21: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Las recomendaciones previas…

■ Ocultaban el primer proyecto

■ Hay que cambiar

■ ¿Cuál podría ser el próximo?– Ampliar el primer proyecto

– Apuntar más alto

– Otros criterios…

■ Para la mochila…

29

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Un modelo para cambios exitosos

✔ Comenzando

✔ Creciendo

■ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

30

UA

S C

arlo

s L

ópez

Váz

quez

Los 14 Puntos de Deming (1-7)

1. Reconocer importancia de datos…

2. Adoptar la nueva filosofía…

3. Terminar con la corrección de errores…

4. Dejar de hacer negocios por precio…

5. Mejorar continuamente…

6. Educar permanentemente…

7. No sólo volumen…

31

UA

S C

arlo

s L

ópez

Váz

quez

Los 14 Puntos de Deming (8-14)

8. Alejar el miedo…

9. Romper barreras entre organizaciones…

10. Plantear objetivos alcanzables …

11. Eliminar metas de producción…

12. Eliminar barreras al mérito…

13. Entrenar permanentemente…

14. Crear una estructura…

32

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Un modelo para cambios exitosos

✔ Comenzando

✔ Creciendo

✔ Incorporándose a la rutina

■ El rol de/los gerentes

■ Resumen

33

UA

S C

arlo

s L

ópez

Váz

quez

¿… a pesar del gerente?

■ Podría hacerse…– Con mandos medios– Con líderes fuertes– Con muchos fracasos…

■ El CEO es imprescindible– Para disminuir fracasos– Para institucionalizar cambios– Para pasar del prototipo

34

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Un modelo para cambios exitosos

✔ Comenzando

✔ Creciendo

✔ Incorporándose a la rutina

✔ El rol de/los gerentes

■ Resumen

35

UA

S C

arlo

s L

ópez

Váz

quez

Resumen

■ Si fuera fácil…

■ Pasos pequeños…

■ Reconocer resistencias…

■ Promover 14 Puntos…

■ Las ganancias…

■ DQ no puede ser delegada…

■ El CEO es fundamental…

36

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Cómo arrancar

Viene de:

Política de Calidad de Datos

Continúa con:

Manejo de Cadenas de Información

Page 22: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Manejo de Cadenas de Información

Viene de:

Cómo arrancar

Continúa con:

Métodos de Control Estadístico

2

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen3

UA

S C

arlo

s L

ópez

Váz

quez

Gestión jerárquica

Presidente

Marketing Investigación Producción Ventas

■ “Escala” bien

■ Es posible ubicar especialistas en cada área

■ Problemas: – ¿dónde está el cliente?

– Gestión es vertical, pero Servicio ¡es horizontal!

4

UA

S C

arlo

s L

ópez

Váz

quez

Gestión orientada a procesos

■ Ubicación Jerárquica no es relevante

■ Es compatible con la Estructura… ¡en principio!

■ Aporte sustancial: vincula actores con el cliente

¡Apareció el cliente!

5

UA

S C

arlo

s L

ópez

Váz

quez

¿Procesos vs. Jerarquías? ¡No!

■ Requieren habilidades similares– Jefe contento !"Éxito personal

– Cliente contento!"Éxito personal

– Problema: ¡Hay más clientes que jefes!

■ Se siguen necesitando especialistas

■ Reportes se siguen generando verticalmente

■ Gestión es simplemente más compleja

6

UA

S C

arlo

s L

ópez

Váz

quez

Otro ejemplo: Limpieza de BD

■ Ej.: Nombre y dirección de clientes■ Dos alternativas:

– Detección + corrección» Armar equipo de gente» Llamar telefónicamente a cada cliente» Corregir los errores

– Control y Mejora de Proceso» Identificar los procesos que pueden editar la BD» Ponerlos bajo Control Estadístico» Comparar Calidad de datos nuevos, y modificar

Procesos deficientes así identificados

7

UA

S C

arlo

s L

ópez

Váz

quez

Resultados esperables

T ie m po

Niv

eles

de

erro

r

De te ccio n + c or re cc io nCo ntro l y M e jo ra d e P roce so

8

UA

S C

arlo

s L

ópez

Váz

quez

¿Bombero vs. Procesos? ¡No!

■ Corto plazo puede justificarse■ Largo plazo es imprescindible

– Menor costo– Más foco en tareas que aportan valor– Clientes satisfechos

■ ¡El mejor bombero es el que no se precisa!

■ Manejar Procesos es simplemente más difícil

9

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

■ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen

Page 23: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Establecer Sistema de Medición

Instalar SQC; verificar Conformidad

Identificar Oportunidades de Mejora

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

Describir el Proceso Establecer Necesidades

del Cliente

11

UA

S C

arlo

s L

ópez

Váz

quez

Antes de entrar en tema…

■ Manejo de procesos es Todo o Nada– La Jerarquía debe jugarse– El resto debe percibirlo

■ No se logra de un día para el otro– Hay experiencia en manufactura– Mejor comenzar de a poco

» Problemas pequeños» Personas receptivas

■ Mayor peso en mandos medios– ¡Paciencia y persistencia!

12

UA

S C

arlo

s L

ópez

Váz

quez

Un Propietario y un Equipo

■ Propietario >> Administrador

■ + responsabilidad, +involucramiento

■ Propietario debería ser real, no declarado

■ Propietario debe tener poder y recursos para cambiar

■ Debe tener apoyo claro y explícito de arriba

13

UA

S C

arlo

s L

ópez

Váz

quez

El Equipo

■ Compuesto por miembros de áreas relevantes– Pasos siguientes se completan

– Un proceso no mejora en desmedro de otro

– Se derriban barreras

– Dan apoyo al Propietario

■ Los equipos suelen ser fundamentales– Cadenas largas y complejas

– Descentralización física y lógica

– Una persona puede verse superada

14

UA

S C

arlo

s L

ópez

Váz

quez

El Equipo

■ Una jerarquía militar– La mayor parte del tiempo no pasa nada

– Cuando hay que decidir, el jefe está solo

– Los demás acatan; estén de acuerdo o no

■ El Equipo es a veces el Propietario– Podría funcionar

– Típicamente se diluyen responsabilidades

– Difícil tomar decisiones difíciles

15

UA

S C

arlo

s L

ópez

Váz

quez

Otros aspectos

– Cambio amenaza gente– Cambio amenaza sus trabajos– Cambio amenaza su autoestima

■ Debe asegurarse que– se entienda quiénes son los clientes– se entienda qué es lo que quieren– se les escuche

■ Todos roles muy importantes

■ El Propietario debe lidiar con el miedo

16

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen17

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

18

UA

S C

arlo

s L

ópez

Váz

quez

La primer tarea…

■ Quienes son los clientes

■ Qué quieren

■ Qué debería producir la Cadena

■ Qué está produciendo

■ Producir cuatro entregables:

Requerimientos de los Clientes

para toda la Cadena

Descripción cualitativa de la Cadena, incluyendo procesos y subprocesos así como sus

relaciones

Una traducción entre Requerimientos y

Especificaciones técnicas para los procesos

Algún medio de comunicación para informar a la gente los

requerimientos, y su rol personal en el cumplimiento de los mismos

Page 24: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

Tres modelos posibles

■ Modelo Cliente-Servidor

■ Diagrama de Flujo

■ FIP (Functions of Information Processing)

■ Pueden coexistir; suelen producirse las tres

■ Propósitos levemente diferentes

20

UA

S C

arlo

s L

ópez

Váz

quez

Tres modelos…

Modelo Foco Propósito

Cliente-ServidorExterno a

los procesos

1. Identificar clientes2. Identificar requerimientos3. Identificar Servidores4. Identificar requerimientos

1. Mostrar entradas y salidas 2. Mostrar dónde se agrega

valor

1. Mostrar cómo se desarrolla la información/datos

Diagrama de Flujo

FIP

Procesos con Valor Agregado

Interno a los procesos

21

UA

S C

arlo

s L

ópez

Váz

quez

Un ejemplo pequeño

Cajero ClienteRegistros contables

Pedido

- Información actualizada

-Efectivo-Actualización de saldo correcta y rápida-Corta espera

Pedido

22

UA

S C

arlo

s L

ópez

Váz

quez

Un ejemplo pequeño(2): FIP

Cola ####Cliente espera por cajero libre

Pedido ####Cliente se coloca frente a la ventana del cajero

Comunica ####Cliente le da cheque al cajero y deposita el sobre

Revisa ####Cajero revisa y valida cheque y sobre

Asocia ####Cajero revisa estado de cuenta

Comunica####Cajero entrega dinero en efectivo

$ComunicaCajero ingresa transacción en la terminal

$ColaEspera respuesta del servidor

$FiltroCuenta corriente es actualizada

$ColaFinInformación actualizada es efectivamente guardada

23

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen24

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

25

UA

S C

arlo

s L

ópez

Váz

quez

El Sistema de Medición

■ Hay que saber objetivamente" Requiere medir■ Intuición+Anécdotas no es lo mismo■ Opinión del cliente es lo relevante■ El Sistema de Medición:

– Informa a los responsables de la Cadena– Informa a los responsables de Procesos– Da alarmas sobre problemas inesperados– Da base para el Control Estadístico

■ Querer no es poder; lograr esto es difícil■ Será abordado en detalle más adelante

26

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen27

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

Page 25: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Instalar SQC

■ Poder predecir desempeño futuro

■ Tres casos: – Proceso fuera de control

– Proceso bajo control, sin cumplir requerimientos

– Proceso bajo control, cumpliendo requerimientos

S

NMedir

S

NMejorar proceso

Mantener control

¿Adecuado?

Eliminar causas asignables¿Estable?

29

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen30

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

31

UA

S C

arlo

s L

ópez

Váz

quez

Identificar oportunidades…

■ Oportunidades surgen muchas…

■ Hay que priorizar– Recursos escasos

– Mejoras en una parte pueden afectar a otra

– Perspectiva de conjunto

■ Haga una primer lista (que será parcial)

32

UA

S C

arlo

s L

ópez

Váz

quez

La lista completa debe considerar:

■ Requerimientos del cliente

■ Valor agregado por proceso

■ Qué está bajo control, sin cumplir requerimientos

■ Localización de interfaces

■ Nuevos procedimientos

33

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen

34

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

35

UA

S C

arlo

s L

ópez

Váz

quez

Seleccionar Oportunidades…

■ Proyectos: pocos pero buenos…

■ Comenzar con chicos– Ganar experiencia

– Ganar confianza

– Crear éxitos■ No postergar mucho los grandes

– Los éxitos retroalimentan…– Involucrar más gente…

■ Plantearse objetivos cuantificables– Saltos o saltitos– ¡Negociar! 36

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ El Ciclo de Gestión de Procesos1. Fijando un Propietario

2. Descripción del Proceso y Necesidades

3. El Sistema de Medición

4. Control Estadístico

5. Oportunidades de Mejora

6. Seleccionando Oportunidades

7. Ejecutar y Sostener mejoras

■ Resumen

Page 26: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

37

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

38

UA

S C

arlo

s L

ópez

Váz

quez

Hacer…

■ Al Equipo a cargo de las mejoras hay que:– Organizarlo

– Proveerlo (gente, capital, entrenamiento)

– Asignarle misión

– Controlarlo y respaldarlo

– Felicitarlo … ¡y recompensarlo!

■ Hay algunas Reglas para dentro del Equipo:

■ Divertido,… pero ¡hay que tener orden!

39

UA

S C

arlo

s L

ópez

Váz

quez

Algunas Reglas

■ Organícense como Equipo

■ Definir las causas principales

■ Concebir e Intentar soluciones

■ Implementar soluciones

■ Mantener foco

■ Prever cómo preservar las mejoras

40

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Manejo de Cadenas de Información

Viene de:

Cómo Arrancar

Continúa con:

Métodos de Control Estadístico

Page 27: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del SurUniversitario Autónomo del Sur

Métodos de Control Estadístico

Viene de:

Manejo de Cadenas de Información

Continúa con:

Monitoreo y seguimiento

2

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ Variabilidad del proceso

■ Estabilidad del proceso

■ Límites de control: – Teoría y métodos

– Fórmulas

■ Resumen

3

UA

S C

arlo

s L

ópez

Váz

quez

Introducción

■ “…Si no puede medirse…”

■ Medir !"Controlar

■ SQC– Shewhart, 1920

– Producción en serie

– Ideas consolidadas en los ’30 y ’40

■ Corriente para manufacturas y tangibles

■ Aplicable para intangibles

4

UA

S C

arlo

s L

ópez

Váz

quez

Propósito del SQC

■ Definición:– Predecir el comportamiento futuro del proceso

■ Algunas características– Orientado al futuro– Usa datos pasados y actuales– No es lo mismo que auditoría

■ ¿Qué tipo de predicción?– “…si no pasa nada nuevo, todo seguirá igual…”– “…busque bien, porque algo ha pasado…”

5

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✓ Introducción

■ Variabilidad del proceso

■ Estabilidad del proceso

■ Límites de control: – Teoría y métodos

– Fórmulas

■ Resumen

6

UA

S C

arlo

s L

ópez

Váz

quez

Predicciones…

0 5 10 15 20 25 30 35 40 45 5015

20

25

30

35

Tie

mpo

en

min

utos

Casos

0 5 10 15 20 25 30 35 40 45 5015

20

25

30

35

40

45

Tiem

po e

n m

inut

os

Casos

■ Proceso Bajo Control

■ Se puede observar:– Una línea media

– Un rango estable

"Hay previsibilidad en el rango

7

UA

S C

arlo

s L

ópez

Váz

quez

Predicciones…

0 5 10 15 20 25 30 35 40 45 5015

20

25

30

35

40

45

Tie

mpo

en

min

utos

Casos

0 10 20 30 40 50 60 70 8015

20

25

30

35

40

45

Proceso Fuera de Control

■ Se puede observar:– Una accidente

– Anomalías

"Hay que buscar una Causa asignable

8

UA

S C

arlo

s L

ópez

Váz

quez

Predicciones…

Otro ejemplo:

■ La tendencia no cambió, pero sí el rango

0 10 20 30 40 50 60 70 8015

20

25

30

35

40

45

Tiem

po e

n m

inut

os

Casos

9

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✓ Introducción

✓ Variabilidad del proceso

■ Estabilidad del proceso

■ Límites de control: – Teoría y métodos

– Fórmulas

■ Resumen

Page 28: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo es un proceso estable?

■ Proceso estable!"parámetros “estables”

■ Parámetros estadísticos– Media

– Mediana

– Desviación estándar

– Rango

– Quintiles

– Otros…

11

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo es un proceso estable?

Dos casos estables, con la misma media pero diferente rango

0 10 20 30 40 50 60 70 80

20

25

30

Caso A

Tie

mpo

en

min

utos

0 10 20 30 40 50 60 70 80

15

20

25

30

35

Tie

mpo

en

min

utos

Caso B

12

UA

S C

arlo

s L

ópez

Váz

quez

¿Cómo es un proceso estable?

Tiene la misma media, pero…

0 10 20 30 40 50 60 70 80

10

15

20

25

30

35

Caso C

Tie

mpo

en

min

uto

s

0 10 20 30 40 50 60 70 800

5

10

15

20

25

30

35

40

45

Caso D

Tie

mpo

en

min

utos

13

UA

S C

arlo

s L

ópez

Váz

quez

En resumen…

■ Primer problema: medir■ Segundo problema: decidir si el proceso es

estable (está bajo control) o no■ Tercer problema: qué hacer en cada caso

– Corregir Causas Asignables– Mejorar el Proceso

Todo puede esquematizarse…

14

UA

S C

arlo

s L

ópez

Váz

quez

Un diagrama de flujo

Medir ¿Estable?Eliminar Causas

Asignables

¿Desempeño adecuado?

Mejorar el Proceso

Mantener Control

S

N

N

S

15

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✓ Introducción

✓ Variabilidad del proceso

✓ Estabilidad del proceso

■ Cartas de control: – Teoría y métodos

– Fórmulas

■ Resumen

16

UA

S C

arlo

s L

ópez

Váz

quez

-5 -4 -3 -2 -1 1 2 3 4 5

σ σ σ σ σσσσσσ media-5 -4 -3 -2 -1 1 2 3 4 5

68.26%

σ σ σ σ σσσσσσ media-5 -4 -3 -2 -1 1 2 3 4 5

68.26%

99.73%

σ σ σ σ σσσσσσ media

Cartas de Control

■ Se basa en trabajos de la década de 1920-1930

■ Sólo estadística básica… ¡o todo lo compleja que se quiera!

■ Recordemos algo de la distribución Normal…

17

UA

S C

arlo

s L

ópez

Váz

quez

Teoría

Dados γt , t=1,2,…,k-1

■ SI γt es aleatoria y SI γ ~N(µ,σ)

entonces γt , t=k+1,k+2,… será aleatoria

■ “Aleatorio” "difícil de probar

■ “No Aleatorio”" criterios– Tres sigmas

– Rachas

18

UA

S C

arlo

s L

ópez

Váz

quez

Tres sigmas: algunas fórmulas…

■ n>25

■ Fórmulas básicas

■ Hay casos especiales, con fórmulas idem

( )n

pppLCL

−−≈ 13( )

n

pppUCL

−+≈ 13

pCL ≈

∑=

=

=≈ni

iip

np

1µ ( )n

pp −≈ 1σ

Page 29: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

3σ: Casos corrientes y especiales

■ una magnitud directamente asociada a una observación (ej.: tiempo de viaje)

■ el promedio de una magnitud en un lote de N unidades (N>2).

■ el número total de fallas observado en un lote de N unidades

■ la proporción de defectuosos en un lote de N unidades. Sólo hay unidades buenas o malas.

pt (o γt) pueden ser:

20

UA

S C

arlo

s L

ópez

Váz

quez

Control de Rachas

CL

UCL

LCL

1σ8 consecutivos por debajo de CL

8 consecutivos por encima de CL

4 de 5 por debajo de CL-1σ

4 de 5 por encima de CL+1σ

2 de 3 por debajo de CL-2σ

2 de 3 por encima de CL+2σ

Alguno por debajo de CL-3σ

Alguno por encima de CL+3σ

21

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✓ Introducción

✓ Variabilidad del proceso

✓ Estabilidad del proceso

✓ Cartas de control: – Teoría y métodos

– Fórmulas

■ Resumen

22

UA

S C

arlo

s L

ópez

Váz

quez

En resumen:

■ Hay lógica detrás de SQC (¡y teoría!)

■ SQC define Estabilidad del proceso y da: – Condiciones

– Predicciones

■ SQC ayuda a detectar problemas

23

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del SurUniversitario Autónomo del Sur

Métodos de Control Estadístico

Viene de:

Manejo de Cadenas de Información

Continúa con:

Monitoreo y seguimiento

Page 30: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

1

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Monitoreo, seguimiento y mejora del proceso

Viene de:

Métodos de Control Estadístico

2

UA

S C

arlo

s L

ópez

Váz

quez

El Ciclo de Gestión de Procesos

Establecer un Propietario del Proceso

Describir el Proceso Establecer Necesidades

del Cliente

Establecer Sistema de Medición

Identificar Oportunidades de Mejora

Instalar SQC; verificar Conformidad

Seleccionar Oportunidades

Hacer y Sostener las Mejoras

3

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

■ Introducción

■ Sistemas de Medición

■ ¿Qué medir?

■ Data Tracking

■ Implementación

■ Resumen

4

UA

S C

arlo

s L

ópez

Váz

quez

Introducción

■ Hay varias maneras de medir desempeño– Conteo de datos erróneos

» Reglas de Negocio no cumplidas» Seguimiento de Datos (Data tracking)» Ingreso duplicado

– Tamaño de datos erróneos» Efecto Godzilla

– Efecto de datos erróneos» Número de Quejas de Clientes

5

UA

S C

arlo

s L

ópez

Váz

quez

Reglas del Negocio

■ Def: Relaciones que tienen que cumplir los datos válidos– Sustanciales: Fecha Nacimiento < Fecha

Casamiento

– Formales: Nro. Hijos ≥0

■ Surgen de:– Expertos en el tema– Análisis estadístico de datos

Son esencialmente especificaciones de

los datos6

UA

S C

arlo

s L

ópez

Váz

quez

Reglas de Expertos

■ Son personales

■ Son incompletas

■ Son de difícil actualización (¡Hay que matar al experto!)

■ ¡No requieren datos!

■ Suelen redundar

■ Hay software específico

7

UA

S C

arlo

s L

ópez

Váz

quez

Análisis Estadístico

■ Hoy conocido como “Minería de Datos”

■ Busca relaciones predictivas empíricas– No verificadas!"¿erróneos?

■ Busca describir clases– No clasificados!"¿erróneos?

■ Registros individuales "conclusiones globales

100100101001001100 8

UA

S C

arlo

s L

ópez

Váz

quez

Modelos predictivos

■ Modelos de regresión– Vol. Compra=f(ingreso, edad, nro. de hijos)

■ Típicamente vinculan datos cuantitativos■ Se analiza y=|Compra-f(x)|

– Si y<=y0 #ok– Si y>y0#¡sospechoso!

■ Para corregir se requiere acceso al “verdadero valor”

9

UA

S C

arlo

s L

ópez

Váz

quez

Clasificación

■ Buscan patrones en los datos– Cerveza+pañales+pizza– Perfume+bombones-leña

– Mañana de domingo+chorizos

■ Vinculan datos categóricos y cuantitativos

■ Si alguien compra Leña y Perfume …

■ Para corregir se requiere acceso al “verdadero valor”

Page 31: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

10

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

■ Sistemas de Medición

■ ¿Qué medir?

■ Data Tracking

■ Implementación

■ Resumen

11

UA

S C

arlo

s L

ópez

Váz

quez

Sistemas de Medición

■ Tema muy importante

■ Las Métricas definen el comportamiento

■ Peligros– Métricas inapropiadas

– Administrar Métricas y no el proceso

■ Ejemplos

12

UA

S C

arlo

s L

ópez

Váz

quez

El caso de la Industria siderúrgica

■ Produce chapas, perfiles, varillas, etc. en serie

■ Objetivo: producción bruta en Ton/mes

■ Cambios ~8 hs.

■ Grandes stocks

■ Demora en cumplir pedidos

Resultado:

Ton/mes cumplidas, y clientes insatisfechos

13

UA

S C

arlo

s L

ópez

Váz

quez

Administrar la métrica

■ VW nombra CEO español

■ Año 1: récord de ganancias

■ Año 2: récord de ganancias

■ Año 3: ¡CEO despedido!

■ Corto plazo vs. Largo plazo

14

UA

S C

arlo

s L

ópez

Váz

quez

Medir vs. no Medir

■ Lo esencial es invisible a los ojos

■ Medir mal es peligroso

15

UA

S C

arlo

s L

ópez

Váz

quez

Cadenas de información

Cuentan con cuatro componentes:

■ Requerimientos de Desempeño

■ Definición de “qué medir”

■ Dispositivo de medida y protocolos

■ Resúmenes de Desempeño

■ Serán los tópicos a tratar

16

UA

S C

arlo

s L

ópez

Váz

quez

En general…

■ Mejor poco y bueno, que mucho y malo…

■ +medidas"+complejidad"+difícil y caro

■ Sinergias

Medidas Ideas y oportunidades

Más tecnología

Más

17

UA

S C

arlo

s L

ópez

Váz

quez

En lo que sigue…

■ Se discutirán las cuatro componentes■ Se trabajará un ejemplo simple

– 5 procesos– 2 bases de datos

■ Objetivos a medir/mejorar/controlar:– Correctitud datos en DB A– Consistencia entre DB A y DB B– Tiempo para llegar a DB A

18

UA

S C

arlo

s L

ópez

Váz

quez

Esquema del ejemplo

Page 32: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

19

UA

S C

arlo

s L

ópez

Váz

quez

Descripción del Ejemplo

campo 1 2 3 4 5 DB A DB B

a c ✔ ✔ ✔ ✔ ✔ ✔

b c ✔ ✔ ✔ ✔ ✔ ✔

c c ✔ ✔ ✔ ✔ ✔

d c ✔ ✔ ✔ ✔ ✔

e c ✔ ✔ ✔ ✔

f c ✔

g c c ✔ ✔

h c ✔

Proceso

20

UA

S C

arlo

s L

ópez

Váz

quez

Cadenas de información

■ Requerimientos de Desempeño

■ Definición de “qué medir”

■ Dispositivo de medida y protocolos

■ Resúmenes de Desempeño

21

UA

S C

arlo

s L

ópez

Váz

quez

Requerimientos de Desempeño

Diseño del SM debe admitir cosas del tipo de “La cadena debe”. Por ejemplo:

■ estar y mantenerse bajo Control

■ producir no más de <x> defectos

■ ser susceptible de mejora continua

■ ser susceptible de cumplir requerimientos futuros

22

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Sistemas de Medición

■ ¿Qué medir?

■ Data Tracking

■ Implementación

■ Resumen

23

UA

S C

arlo

s L

ópez

Váz

quez

¿Qué medir?

■ Cadenas suelen ser complejas– Muchos campos

– Muchos cruces de cadenas

■ Desafíos– Qué procesos medir

– Qué campos incluir

– Qué números son relevantes

24

UA

S C

arlo

s L

ópez

Váz

quez

“Dispositivo” de medida

■ Contraste con “la realidad”

■ Data tracking– Más apropiado para datos

– Más barato

– Implementable en el sistema

– Muestreo

– Encuesta

■ Digitación duplicada– “Database Bashing”

$ Ejércitos de digitadores

$ Pérdida de tiempo

$ Imagen empresa

$ ¡Costo!

25

UA

S C

arlo

s L

ópez

Váz

quez

Método tradicional

Producto final

26

UA

S C

arlo

s L

ópez

Váz

quez

Para datos…

■ Métricas pueden ser:– Binarias: Correcto/incorrecto– Cuantitativas

■ Difícil declarar “Incorrecto” – Sólo si no cumple reglas– Sólo si hay errores de formato

■ Más difícil declarar “Correcto”■ Difícil acceso al “verdadero valor”

27

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Sistemas de Medición

✔ ¿Qué medir?

■ Data Tracking

■ Implementación

■ Resumen

Page 33: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

28

UA

S C

arlo

s L

ópez

Váz

quez

Data Tracking

■ Se marcan datos

■ Se analizan cambios

■ Se guarda fecha/hora29

UA

S C

arlo

s L

ópez

Váz

quez

Los pasos claves son…

■ Muestrear al azar a la entrada, y marcar

■ Seguir los registros marcados– Al entrar a un proceso

– Al salir del proceso

■ Identificar dónde ocurren defectos/errores

■ Identificar demoras

■ Generar resúmenes cada tanto

30

UA

S C

arlo

s L

ópez

Váz

quez

Muestrear al azar

■ Aplicable a cadenas “continuas” o por lotes

■ Eliminan sesgos:– Pedidos consecutivos correlacionados

– Preferencia del inspector por pedidos “grandes”

■ Procedimientos bien estudiados– Descritos en Manuales

– Especificados en Estándares (MIL Std.)

31

UA

S C

arlo

s L

ópez

Váz

quez

■ r=1#100% del total; r=0 #no muestrear

■ Otros requerimientos:– Tamaño del lote

– Frecuencia de muestreo

– Tasa de ingreso al sistema

Muestrear al azar(2)

– Generar al azar

– Si aceptar el registro; si no, rechazarlo

[ ]1,0∈ix

rxi ≤

1

1

Pasos:

■ Especificar r

■ Para cada registro:

32

UA

S C

arlo

s L

ópez

Váz

quez

Seguir los registros marcados

■ Usar un identificador único ya existente– No requiere cambio del modelo de datos

■ Agregar una etiqueta específica– Hay que modificar modelo

■ Invisibilidad…

■ Ejemplo:

33

UA

S C

arlo

s L

ópez

Váz

quez

Ejemplo

1 2 3 4 5 DB A DB Ba -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC-

b 408727 408727 408831 408831 408831 408831 408831

c SRBEX A A A A A

d DEC DEC DEC DEC DEC

e H23A F17B H23A F17B H23A

f $23.25 $23.25

g N Y N Y

h bf bf

Ingreso 2/24 10:00 2/24 12:15 3/1 12:00 3/5 08:00 3/10 08:00 3/6 0:13 3/12 0:30

Salida 2/24 10:45 2/24 17:00 3/2 12:00 3/5 10:15 3/10 17:00

Esperado 2/24 17:00 3/1 17:00 3/5 17:00 3/9 17:00 3/6 8:00 3/10 8:00

34

UA

S C

arlo

s L

ópez

Váz

quez

Tres tipos de cambios

■ Normalización

■ Traducción

■ Espúreos– Corrección de errores

– Creación de errores

35

UA

S C

arlo

s L

ópez

Váz

quez

Ejemplo

1 2 3 4 5 DB A DB Ba -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC-

b 408727 408727 408831 408831 408831 408831 408831

c SRBEX A A A A A

d DEC DEC DEC DEC DEC

e H23A F17B H23A F17B H23A

f $23.25 $23.25

g N Y N Y

h bf bf

Ingreso 2/24 10:00 2/24 12:15 3/1 12:00 3/5 08:00 3/10 08:00 3/6 0:13 3/12 0:30

Salida 2/24 10:45 2/24 17:00 3/2 12:00 3/5 10:15 3/10 17:00

Esperado 2/24 17:00 3/1 17:00 3/5 17:00 3/9 17:00 3/6 8:00 3/10 8:0036

UA

S C

arlo

s L

ópez

Váz

quez

Tiempos de ciclos

■ Tres tipos de análisis– Tiempo de proceso (Ci-Si)

– Puntualidad (Ci-Di)

– Tiempo en cola (Si-Ci-1)

Siendo:Si fecha/hora de comienzo del proceso i

Ci fecha/hora de culminación del proceso i

Di fecha/hora comprometida del proceso i

Page 34: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

37

UA

S C

arlo

s L

ópez

Váz

quez

Ejemplo

1 2 3 4 5 DB A DB Ba -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC- -DHBC-

b 408727 408727 408831 408831 408831 408831 408831

c SRBEX A A A A A

d DEC DEC DEC DEC DEC

e H23A F17B H23A F17B H23A

f $23.25 $23.25

g N Y N Y

h bf bf

Ingreso 2/24 10:00 2/24 12:15 3/1 12:00 3/5 08:00 3/10 08:00 3/6 0:13 3/12 0:30

Salida 2/24 10:45 2/24 17:00 3/2 12:00 3/5 10:15 3/10 17:00

Esperado 2/24 17:00 3/1 17:00 3/5 17:00 3/9 17:00 3/6 8:00 3/10 8:0038

UA

S C

arlo

s L

ópez

Váz

quez

0 2 4 6 8 10 12 14 16 18 20

Cam

bios

por

reg

istr

o

Nro. de muestra

EspúreosNormalizaciónTraducción

Resumir resultados

■ Para Correctitud y Consistencia

■ Tres niveles:– Métrica

– Dónde

– Control

Un ejemplo de Métrica

■ Situación conocida

■ Quizá poco preocupante

■ Quizá legada

■ ¡Seguro que no aporta valor! 39

UA

S C

arlo

s L

ópez

Váz

quez

b e d g a c0

5

10

15

20

25

30

35

40

45

50

Campo

Pro

porc

ión

de c

aso

s)

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

Los casos graves…

¿Qué es un gráfico de Pareto?

40

UA

S C

arlo

s L

ópez

Váz

quez

Otras gráficas útiles/posibles

■ Rastreando el campo “b”

3->4 4->DB A 2->3 1->2 In->1 0

5

10

15

20

25

30

35

40

45

50

0%

10%

20%

30%

40%

50%

60%

70%

80%

90%

100%

■ Puede usarse más de una representación

41

UA

S C

arlo

s L

ópez

Váz

quez

2 4 6 8 10 12 14 16 18 20 220

0.05

0.1

0.15

0.2

0.25

0.3

0.35

0.4

Pro

porc

ion

de d

efec

tos

Muestra

UCL

CL

LCL

Para el control…

■ Dado el campo “b”, y el proceso “3”…

■ Hay puntos fuera de rango

■ Deben buscarse las causas 42

UA

S C

arlo

s L

ópez

Váz

quez

Algunos detalles…

■ Las muestras pueden demorar más o menos– La secuencia de entrada difiere de la de salida

■ Sólo incluir muestras ya completas

43

UA

S C

arlo

s L

ópez

Váz

quez

Detectando inconsistencias

■ La métrica es binaria: “consistente/inconsistente”

■ En principio es similar a la correctitud

■ Aislemos los espúreos…

0 2 4 6 8 10 12 14 16 18 20

Cam

bios

por

reg

istr

o

Nro. de muestra

EspúreosNormalizaciónTraducción

44

UA

S C

arlo

s L

ópez

Váz

quez

e g a c d0

5

10

15

20

25

30

34

Cas

os

0%

15%

29%

44%

59%

74%

88%

100%

Pro

porc

ión

de in

cons

iste

ncia

s

Analizando el ejemplo

■ Focalizando en los espúreos

■ Casos más problemáticos: campos “e” y “g”

45

UA

S C

arlo

s L

ópez

Váz

quez

Rastreando el campo “e”

■ Mayoría entre 3 y 4

■ “e” tenía problemas de correctitud

■ No es por tanto problema de inconsistencia

Page 35: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

46

UA

S C

arlo

s L

ópez

Váz

quez

Rastreando el campo “g”

■ No está tan claro

■ Errores altos, pero bajo control

2 4 6 8 10 12 14 16 18 20 220

0.05

0.1

0.15

0.2

0.25

Muestra

Pro

porc

ión

UCL

CL

LCL

47

UA

S C

arlo

s L

ópez

Váz

quez

Rastreando el campo “g” (2)

■ Hay que mirar más de cerca

■ El campo “g” se genera ¡independientemente!

48

UA

S C

arlo

s L

ópez

Váz

quez

Un detalle…

■ Métodos y gráficos para Correctitud ≈Consistencia– ¿Dónde están las diferencias?

■ Correctitud– Controla <realidad> vs. <DB A>

■ Consistencia– <DB A> vs. <DB B>– ¡<realidad> no entra!

49

UA

S C

arlo

s L

ópez

Váz

quez

Tiempos…

■ Hay que ser especialmente cuidadoso

■ Ilustremos la nomenclatura

tiempo

P3 terminadoP3 prometido

Comienza P3P2 terminado

P3 está retrasado en este lapso

50

UA

S C

arlo

s L

ópez

Váz

quez

Otras hipótesis…

■ Entrar en DB A implica la entrega de algo– Def. DA=Instante prometido de entrega

– Def. CA=Instante efectivo de entrega

– Def. TA = CA – DA (TA > 0 implica retraso)

■ DA depende de D1, D2, D3 y D4

■ El cliente siempre puede cancelar o cambiar antes de DA

51

UA

S C

arlo

s L

ópez

Váz

quez

Primer análisis: TA

■ UCL debería ser negativo■ Se debe/puede analizar el gráfico X, u otro■ Bajo control, pero 37% se entregan tarde

2 4 6 8 10 12 14 16 18 20 22-250

-200

-150

-100

-50

0

50

UCL

CL

LCL

Min

utos

Muestra

X-chart: TA

-500 -400 -300 -200 -100 0 100 200 3000

0.2

0.4

0.6

0.8

1

1.2

1.4

1.6

1.8

2

Promedio=-100

Temprano Tarde

Área=37%

52

UA

S C

arlo

s L

ópez

Váz

quez

Si el servicio llega tarde…

Causas:

■ Uno o más procesos tienen problemas

■ El sistema (o algún proceso) no es capaz

■ Clientes cambian la orden demasiado frecuentemente

■ ¿Cómo detectarlo, identificarlo y corregirlo?– Repita análisis para T1, T2, T3 y T4 por separado

– Estime tiempo promedio <Ti>, y súmelo53

UA

S C

arlo

s L

ópez

Váz

quez

Tiempos acumulados de 4 procesos

0 0.5 1 1.5 2 2.5 30

1

2

3

4

5

Dias

0 0.5 1 1.5 2 2.5 3 3.5 4 4.5 5 5.50

0.5

1

1.5

2

Dias

L2 (µ= 1/2 dia ,

σ=2 horas)

L4 (µ=1 dia ,

σ=3 hor as)

L1 (µ= 1 dia ,

σ=4 horas)

Distribuc ion de la suma L 1+L2+ L3 +L 4

(µ=4.5 d ias, σ=√ 42+22+3 2+22 ho ras)

L3 (µ=2 dias,

σ=2 hor as)

Percentil 99%

Se asumen independientes

También llamada Capacidad del

Proceso

54

UA

S C

arlo

s L

ópez

Váz

quez

“Otra vez los clientes…”

■ Tienen derechos (¡!)

■ Podría pensarse:– “Avisan tarde, y el trabajo está casi hecho”

■ Típicamente es lo contrario

■ Tiempo en cola >> Tiempo en proceso

■ Ideas “Just In Time”

Page 36: Introducción - The Digital Mapcarlos/cursos/SeminarioCalidad... · 2019-02-18 · DQ fue originalmente presentado en contabilidad El concepto ha variado en el tiempo – Confiabilidad

55

UA

S C

arlo

s L

ópez

Váz

quez

Unos comentarios…

■ Podría prometerse un DA menor

■ No todo es espera– Tiempo de transmisión no considerado

– Buffers (para manejar picos de trabajo)

■ Buffers suelen ocultar defectos

56

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Sistemas de Medición

✔ ¿Qué medir?

✔ Data Tracking

■ Implementación

■ Resumen

57

UA

S C

arlo

s L

ópez

Váz

quez

Cómo implementar Data Tracking

■ Será necesario implementar varios módulos

■ Ilustraremos una arquitectura: DCI

■ Es aplicable cuando:– Pueden ponerse etiquetas

– Los procesos están computarizados

■ La tendencia es hacia esto

■ Veamos un esquema

58

UA

S C

arlo

s L

ópez

Váz

quez

Un posible esquema de DCI

Filtros

Muestreo/etiquetado

PostProcesamiento

Análisis/Reportes

Comunicaciones

59

UA

S C

arlo

s L

ópez

Váz

quez

Detalles…

■ Tan próximo como se pueda– Muestreo DENTRO del 1er. Proceso

– Filtros DENTRO de cada proceso

– BD secundaria CERCA del “dueño” del proceso

■ Fácil de implementar en una reingeniería

■ Más difícil como cambios a un sistema ya operativo

60

UA

S C

arlo

s L

ópez

Váz

quez

Tópicos a considerar

✔ Introducción

✔ Sistemas de Medición

✔ ¿Qué medir?

✔ Data Tracking

✔ Implementación

■ Resumen

61

UA

S C

arlo

s L

ópez

Váz

quez

En Resumen

■ Concepto de Sistema de Medida– Cuatro componentes:

» Requerimientos» Ítems o características a medir» Instrumento y reglas para medir» Resúmenes apropiados

■ Requerimientos: la voz del cliente■ Requerimientos # Qué medir■ Instrumento: Data Tracking■ Requerimientos # Resúmenes apropiados

62

UA

S C

arlo

s L

ópez

Váz

quez

Resumen de Data Tracking

■ Es UN posible instrumento; hay otros■ Explota redundancia entre procesos y datos■ Objetivo:

– Controlar operación y mejorar» Correctitud» Consistencia» Tiempos de procesamiento

■ Uso extensivo de SQC

63

UA

S C

arlo

s L

ópez

Váz

quez

Gestión de Calidad de Datos

Carlos Ló[email protected]

Universitario Autónomo del Universitario Autónomo del Sur Sur -- 20052005

Monitoreo, seguimiento y mejora del proceso

Viene de:

Métodos de Control Estadístico