laboratorio de datos, clase 3 preparación, estandarización y...

14

Prof. Enzo Tagliazucchi [email protected] www.cocuco.org Laboratorio de datos, clase 3 Preparación, estandarización y normalización de datos

Upload: others

Post on 02-Aug-2021

4 views

Category:

Documents

0 download

Report

Download

Embed Size (px):

TRANSCRIPT

Page 1: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Prof. Enzo Tagliazucchi [email protected] www.cocuco.org

Laboratorio de datos, clase 3 Preparación, estandarización y normalización de datos

mailto:[email protected]

mailto:[email protected]

mailto:[email protected]

http://www.cocuco.org/

Page 2: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Identificar el problema y entender cómo resolverlo con datos

Conseguir los datos (si existen) o planear un experimento (si no)

Explorar los datos, buscar evidencia, desarrollar modelos

Visualizar y comunicar los resultados

Page 3: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

¿Qué vamos a ver hoy?

• Por qué los datos no son lo que pensamos que son

• Cómo podemos mejorar la calidad de los datos

• Cómo podemos hacer que los datos numéricos de distintas fuentes sean más comparables entre sí

Page 4: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Datos faltantes

¿3.4 o 3,4?

100 cm vs 1 m

Page 5: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Labo de datos 2021

La mejor manera de evitar estos problemas es reducir la libertad de quien ingresa los datos

Page 6: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Descartar la observación

Reemplazar por la media o la moda

Reemplazar por la media o la moda computada sobre las observaciones más similares

Usar machine learning para estimar la probabilidad de que el dato faltante tome distintos valores

¿Qué hacer con los datos faltantes?

Page 7: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

A veces, los datos faltantes nos dan información en sí mismos

¿por qué nadie en el vuelo RL 239 completó la encuesta de satisfacción al cliente?

Page 8: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Datos faltantes ≠ np.NaN … , ‘nan’ , … .. , , … … , ‘falta’ , … … , -999 , … … , ‘cosme fulanito’, …

Page 9: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Rescaleo con a y b constantes

xi = a(xi + b)

Por ejemplo, pasar de un sistema de unidades a otro, o comparar los datos contra un valor de referencia (e.g. b = -promedio histórico)

Page 10: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Normalización

xi =xi −min(xi)

max xi −min(xi)

Normalización min-max (entre 0 y 1) Es útil aunque los datos no sigan una distribución normal, pero es muy sensible a outliers (porque aparecen max y min) 2, 1, 3, 5, 3, 6, 10932, 10 0.0001, 0, 0.0002, 0.0004, 0.0002, 0.0005, 1, 0.0008

Page 11: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Estandarización

xi =xi − 𝑥𝑖

𝜎

Es resistente ante la presencia de outliers, pero no es demasiado interpretable para datos con distribuciones que no sean gaussianas. 2, 1, 3, 5, 3, 6, 10932, 10 -0.3541 , -0.3544, -0.3539, -0.3534 , -0.3539, -0.3531 , 2.4749, -0.3521

Page 12: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Por qué puede ser vital para machine learning (intuición)

x

y

Datos de entrenamiento

Datos nuevos

La coordenada y de los datos nuevos viene de una distribución diferente a la usada para entrenar el modelo

Page 13: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Por qué puede ser vital para machine learning (intuición)

x

y

Datos de entrenamiento

Si la coordenada y tiene un rango de valores muchísimo más amplio que x, domina el entrenamiento y siempre tengo el mismo modelo

Page 14: Laboratorio de datos, clase 3 Preparación, estandarización y …materias.df.uba.ar/lda2021c1/files/2021/04/CLASE_3.pdf · 2021. 4. 7. · Laboratorio de datos, clase 3 Preparación,

Próxima clase:

¿Cómo podemos caracterizar numéricamente nuestros datos?

Estadística descriptiva

Tema 1: El laboratorio clínico. · PDF fileBioquímica clínica Tema 1 2º Medicina Edurne Ruiz Lázcoz. preparación escritas por el laboratorio para que la prueba salga bien. c

SENSORES REMOTOS 2013cursosihlla.bdh.org.ar/ET_Local_Regional_2014/Clase_3/1... · 2014-07-04 · Sensores remotos Para la mayoría de la gente los sensores remotos son una forma

Soluciones para el laboratorio - Herzog Maschinenfabrik · Soluciones para el laboratorio Preparación de muestras para los máximos requisitos analíticos. 2 . Contenido Introducción

ACTUALIZACION EN TOMA A DE MUESTRA Y ANALIS DE LABORATORIO … · 2020. 3. 5. · Instituto de Salud Pública de Chile A Requisitos del laboratorio La preparación de las muestras

Preparación y esterilización de materiales del laboratorio

Manual de prcticas de laboratorio - sgpwe.izt.uam.mxsgpwe.izt.uam.mx/pages/cbs/cuhp/QuimOrgIII/PracLabQO3.pdf · Manual de Prácticas de Laboratorio ... Etapa preparación de benzoina

Práctica de laboratorio n3 preparación y estandarización de una solución de hidróxido de na

CONSTRUCCIÓN DEL SISTEMA DOCUMENTAL PARA LOS PROCESOS DE LABORATORIO, PREPARACIÓN, TINTORERÍA Y ACABADOS EN LA EMPRESA TINCOL LTDA

EQUIPOS DE PREPARACIÓN DE MUESTRAS Y LABORATORIO _2011.pdf · HARNEROS DE LABORATORIO GILSON (USA) Equipos diseñados para trabajo en laboratorio. Se fabrican con sistema de fijación

Material de laboratorio - Drogallega · Material de laboratorio de uso general La preparación y almacenamiento de mues-tras exige aparatos de laboratorio que cum-plan con las más

MANUAL PRÁCTICAS DE LABORATORIO DE …liceocorregidora.mx/contenido/028660d60_recurso_didactico.pdf · PRÁCTICA N° 1 PREPARACIÓN DE NIEVE Problema. ¿Se conservan las masas de

Presentación de PowerPoint - …sistematicavegetal.weebly.com/uploads/8/0/5/2/8052174/clase_3... · V. División Euglenophyta · VI. División Pirrophyta · VII. División Crisophyta

Microeconomía I AEA214 Escuela de Negociosroberto.ucoz.com/_ld/1/155_6-Clase_3-2013-.pdf · Teorías del Consumidor : Efecto Sustitución y Efecto ingreso Clase 3 Microeconomía

Administracion Financiera de Inventarios Clase_3

Guía para la preparación y uso de medios de Cultivo en placa para el Laboratorio de Microbiología I

PREPARACIÓN DE DISOLUCIONES - depa.fquim.unam.mxdepa.fquim.unam.mx/vmus/Tools/manual QA1-Rev JCA.pdf · seguridad en el laboratorio 5 ... aplicaciÓn a la predicciÓn de reacciones

Programación didáctica de Muestreo y preparación de la · PDF fileProgramación didáctica de Muestreo y preparación de la muestra 1º de CFGS Laboratorio de Análisis y Control

Lectura guia clase_3

Preparación del material en el M A laboratorio ... · A los fines del laboratorio de microbiología, la esterilización se efectúa para poder estudiar, conservar y transportar cultivos

Reglamento del Laboratorio de Preparación y Servicios de ...saludnutricion.ibero.mx/recursos/Ev_ 2_2 3 Reglamento de Laboratorio L-105.pdf · DE ALIMENTOS. 1 Reglamento del Laboratorio

Tercer Laboratorio de Paz Identificación y preparación Anders Rudqvist Colegio de Estudios del Desarrollo Universidad de Uppsala La documentación cuantitativa

PREPARACIÓN DE UN PLAN DE NEGOCIO PARA LA ...repository.uamerica.edu.co/bitstream/20.500.11839/651/1/...PREPARACIÓN DE UN PLAN DE NEGOCIO PARA LA ESTRUCTURACIÓN DE UN LABORATORIO

Laboratorio 1 Preparación del entorno de laboratorio · Para la realización de los laboratorios se facilitarán diversos ficheros, concretamente la tabla 1 resume el contenido y

Presentación de PowerPoint - ucv.veucv.ve/.../Clase_3-4_Higiene_del_agua_y_saneamiento_ambiental.pdf · Higiene del agua y saneamiento ambiental 4 Higiene del agua y saneamiento

CURSO DE CULTIVOS CELULARES · •introducciÓn al cultivo celular • laboratorio necesario para trabajar con cultivos celulares • esterilizaciÓn, preparaciÓn del material •

Laboratorio: Limpieza y Desinfección G 7883–G 7836 CD · laboratorio clínico, farmacia, industria alimentaria, industria cosmética, ... Para la preparación de los utensilios

MANUAL DE TOMA, PREPARACIÓN, EMBALAJE, · PDF filemanual de toma, preparaciÓn, embalaje, transporte y remisiÓn de muestras en laboratorio clinico. ... remisiÓn de muestras en laboratorio

Preparación segura y eficiente del vidrio de laboratorio

Preparación de un plan de negocios. fuentes de financiación disponibles.maria gallego(laboratorio de prácticas)

Clase_3. Diseño Electrico

Laboratorios Química General y Orgánica · I. En el Laboratorio. La preparación de un informe de laboratorio comienza en el mismo laboratorio (realizando medidas, registrando datos,

SEMINARIO: De la Preparación de Muestra a la … · SEMINARIO: De la Preparación de Muestra a la Purificación: La mejor ruta para su laboratorio ... 3/25/2011 12:09:53 PM

MANUAL DE TOMA, PREPARACIÓN, EMBALAJE, … · FECHA TOMA T° LABORATORIO DE REMISION TOMA T° LABORATORIO DE REFERENCIA DÍA MES AÑO TEMPERATURA salida Lab. Clínico de Remisión

El dominio en la preparación de los medios de cultivo · Material Clínico y de LaboratorioMaterial Clínico y de Laboratorio El dominio en la preparación de los medios de cultivo

LABORATORIO: BIOLOGÍA - agropecuaria.uta.edu.ecagropecuaria.uta.edu.ec/infraesfcagp/labfcagp.pdf · Preparación de medios de cultivo. Ajuste de pH y esterilización de medios de