kdd

6
PROCESOS DE KDD INSTITUTO TECNOLOGICO DE OAXACA DIEGO OLIVER A GARCIA

Upload: diego-olivera

Post on 21-Nov-2014

109 views

Category:

Documents


5 download

DESCRIPTION

 

TRANSCRIPT

Page 1: Kdd

PROCESOS DE

KDD

INSTITUTO TECNOLOGICO DE OAXACA

DIEGO OLIVERA GARCIA

Page 2: Kdd

Eta

pa 1

: Reco

lecc

ión

de D

ato

s

Las primeras fases del

KDD determinan que las

fases sucesivas sean

capaces de extraer conocimiento válido y útil

a partir de la información

original.En nuestro caso extraeremos los datos de

las bases de datos de

ventas de una agencia

automotriz.

Page 3: Kdd

Eta

pa 2

: Sele

cció

n,

Lim

pie

za y

Tr

ansf

orm

aci

ón d

e

Dato

s

Se deben eliminar el

mayor número posible

de datos erróneos o inconsistentes (limpieza)

e irrelevantes (criba).Solo se seleccionaran

datos que nos sean utilicen para nuestra

finalidad, y los datos que

no se ocupen no se contemplaran, para facilitar nuestra tarea.

Page 4: Kdd

Eta

pa 3

: La

M

inerí

a d

e D

ato

s

incluye la selección de la tarea de

descubrimiento a realizar, por

ejemplo, clasificación,

agrupamiento o clustering,

regresión, etc. La selección de él o

de los algoritmos a utilizar. La

transformación de los datos al

formato requerido por el algoritmo

específico de minería de datos.

Los patrones principales que se

ocuparan en nuestro caso son: los

diferentes automóviles y diferentes

agentes de ventas, para analizar

sus estadísticas y formas de pago

mas comunes estos se establecen

como los principales patrones a

encontrar.

Page 5: Kdd

Eta

pa 4

: Eva

luaci

ón

y va

lidaci

ón

La fase anterior produce

una o más hipótesis de

modelos.Para seleccionar y validar

estos modelos es necesario

el uso de criterios de

evaluación de hipótesis.

Aquí se deben evaluar si lo

elegido anteriormente

servirá para llegar a lo que

se requiere. O si es la forma

correcta como se debe

hacer.

Page 6: Kdd

Eta

pa 5

: In

terp

reta

ción y

D

ifusi

ón

El despliegue del modelo

a veces a veces es trivial

pero otras veces requiere

un proceso de implementación o interpretación.

Aquí se difunde la informacion obtenida en

las etapas anteriores

onteniendo los resultados

deseados.