análisis de datos en física de partículast = x / (z/n)1/2 sigue t student con ν = n. esto surge...

24
J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 1 Análisis de Datos en Física de Partículas Sección de Posgrado Facultad de Ciencias Universidad Nacional de Ingeniería C. Javier Solano [email protected] http://compinformatidf.wordpress.com/ Página del curso: http://compinformatidf.wordpress.com/2013/04/13/ curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/

Upload: others

Post on 19-Feb-2020

0 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 1

Análisis de Datos en Física de Partículas

Sección de PosgradoFacultad de CienciasUniversidad Nacional de Ingeniería

C. Javier [email protected]://compinformatidf.wordpress.com/

Página del curso:http://compinformatidf.wordpress.com/2013/04/13/curso-analisis-estadistico-de-datos-en-fisica-de-particulas-mf708/

Page 2: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Análisis de Datos en Física de Partículas: Capítulo 3

1 Teorema de Probabilidad de Bayes, Variables aleatorias, y pdfs2 Funciones de r.v.s, Valores de expectación, propagación de errores3 Catálogo de pdfs4 El método de Monte Carlo5 Test estadísticos: conceptos generales6 Test statistics, métodos multivariantes7 Tests Bondad de ajuste (goodness-of-fit)8 Parámetros de estimación, maximum likelihood9 Mas de maximum likelihood10 Método de mínimos cuadrados (least squares)11 Intervalo de estimación, establecimiento de límites12 Parámetros molestos (nuisance), incertidumbres sistemáticas13 Ejemplos de aproximación Bayesiana

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 2

Page 3: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Algunas distribuciones

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 3

Distribución/pdf Ejemplo de uso en HEPBinomial Branching ratioMultinomial Histograma con N fijoPoisson Número de eventos halladosUniforme Método Monte CarloExponencial Tiempo de decaimientoGaussian Error (incertidumbre) en la medidaChi-square Goodness-of-fit (Bondad-de-ajuste)Cauchy Masa de una resonanciaLandau Pérdida de energía por ionizaciónBeta pdf a priori para eficienciaGamma Suma de variables exponencialesStudent’s t Función de resolución con colas ajustables

Page 4: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Binomial

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 4

Considerar N experimentos independientes (ensayos de Bernoulli):

El resultado de cada uno es ‘suceso’ o ‘fracaso’,

probabilidad de suceso en cualquier ensayo es p.

Definir la r.v. discreta n = número de sucesos (0 ≤ n ≤ N).

Probabilidad de un resultado específico (en orden), ej. ‘ssfsf’ es

Pero el orden no es importante; hay

formas (permutaciones) para obtener n sucesos en N tentativas,

la probabilidad total para n es la suma de las probabilidades de

cada permutación.

Page 5: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Binomial (2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 5

La distribución binomial es por lo tanto

randomvariable

parámetros

Para el valor de expectación y variancia encontramos:

Page 6: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Binomial (3)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 6

Distribución Binomial para varios valores de los parámetros:

Ejemplo: observe N decaimientos de W±, el número n en el que son W→µν es una binomial r.v., p = branching ratio.

Page 7: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Multinomial

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 7

Como la binomial pero con m “salidas” en vez de dos, probabilidades son

Para N tentativas queremos la probabilidad de obtener:

n1 de salida 1,n2 de salida 2,

…nm de salida m.

Esta es la distribución multinomial para

Page 8: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Multinomial (2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 8

Ahora considere salida i como ‘suceso’, el resto como ‘falla’.

→ todas las ni son individualmente binomiales con parámetros N, pi

para todo i

Se puede hallar también que la covariancia será

Ejemplo: representa un histograma

con m bins, N entradas totales, todas las entradas independientes

Page 9: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución de Poisson

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 9

Considerar la distribución binomial n en el límite

→ n sigue la distribución de Poisson:

Ejemplo: número de eventos de scattering ncon sección transversal σ hallados para unaluminosidad integrada fija, con

Page 10: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Exponencial

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 10

El pdf exponencial para la r.v. x continua es definido por:

Ejemplo: tiempo propio de decaimiento de una partícula inestable

(τ = tiempo propio de decaimiento (mean lifetime))

Falta de memoria (solo para exponencial):

Page 11: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Uniforme

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 11

Considerar una r.v. x continua con −∞ < x < ∞ . Su pdf uniforme es:

N.B. Para cualquier r.v. x con distribución acumulativa F(x),y = F(x) es uniform en [0,1].

Ejemplo: para π0 → γγ, Eγ es uniforme en [Emin, Emax], con:

Page 12: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Gaussiana

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 12

La pdf Gaussiana (normal) para r.v. x continua es definida por:

Caso especial: µ = 0, σ2 = 1 (‘Gaussiana estándar’):

(N.B. frecuentemente µ, σ2 denota media, varianciade cualquier r.v.,no solo Gaussiana.)

Si y ~ Gaussiana con µ, σ2, entonces x = (y − µ) /σ sigue ϕ (x).

Page 13: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

pdf Gaussiana y el Teorema Central del Límite (CLT)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 13

La pdf Gaussiana es muy útil porque casi cualquier variable aleatoriaque es suma de un gran número de pequeñas contribuciones la sigue.Esto se deduce del Teorema Central del Límite:

Para n r.v.s xi independientes con variancias finitas σi2, por

otro lado con pdfs arbitrarias, considerar la suma

Errores de Medida frecuentemente son la suma de muchas contribuciones, por lo que frecuentemente valores medidospueden ser tratados como r.v.s Gaussianas

En el límite n → ∞, y es una r.v. Gaussiana con

Page 14: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Teorema Central del Límite (2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 14

El CLT puede ser provado usando funciones características(transformadas de Fourier)

Buen ejemplo: componente de velocidad vx de moléculas del aire.

Ejemplo OK: deflección total debido a multiples scattering Coulomb(Raro: grandes ángulos de deflección dado colas no-Gaussianas.)

Mal ejemplo: perdida de energía de partículas cargadas atravesandocapas delgadas de gas. (colisiones raras con una fracción grande deperdida de energía, cf. pdf de Landau.)

Para n finito, el teorema es aproximadamente válido en lamedida en que la fluctuación de la suma no está dominada porun (o unos pocos) términos.

cuidado con errores de medición c/colas no gaussianas.

Page 15: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Gaussiana Multivariante

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 15

Pdf Gaussiana Multivariante para el vector

son vectores columna, son vectores transpuesta (filas),

Para n = 2 esto es

donde ρ = cov[x1, x2]/(σ1σ2) es el coeficiente de correlación

Page 16: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Chi-square (χ2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 16

La pdf chi-square para la r.v. continua z (z ≥ 0) es definida por

n = 1, 2, ... = número de ‘grados de libertad’ (dof)

Para r.v. Gaussiana independiente xi, i = 1, ..., n, media µi, variancia σi2,

sigue pdf χ2 con n dof.

Ejemplo: variable de prueba de bondad de ajuste (goodness-of-fit),especialmente en conjunción con el método de los mínimos cuadrados.

Page 17: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución de Cauchy (Breit-Wigner)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 17

La pdf Breit-Wigner para la r.v. continua x está definida por

(Γ = 2, x0 = 0 es la pdf de Cauchy)

E[x] no bien definido, V[x] →∞.

x0 = modo (valor mas probable)

Γ = ancho a la mitad del máximo

Ejemplo: masa de partículas de resonancias, ej. ρ, K*, φ0, ...

Γ = tasa de decaimiento (inversa del tiempo de vida media)

Page 18: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución de Landau

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 18

Para una partícula cargada, con β = v /c, atravesando una capa demateria de espesor d, la perdida de energía ∆ sigue la pdf de Landau:

L. Landau, J. Phys. USSR 8 (1944) 201; ver tambiénW. Allison and J. Cobb, Ann. Rev. Nucl. Part. Sci. 30 (1980) 253.

+ − + −

− + − + β

d

Page 19: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución de Landau (2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 19

‘Cola de Landau’ larga

→ todos los momentos ∞

Modo (valor masprobable) sensible a β , → i.d. partículas

Page 20: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Beta

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 20

Usado frecuentemente para representar pdfs de r.v. continuo diferente de cerosolo dentro de los límites finitos

Page 21: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución Gamma

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 21

Usado frecuentemente para representar pdfs de r.v. continuo diferente de cerosolo dentro de [0,∞].También, por ejemplo, suma de n rvs exponenciales, o tiempo hasta eventon, en procesos de Poisson ~ Gamma

Page 22: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución t Student

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 22

ν = número de grados de libertad (no necesariamente entero)

ν = 1 da Cauchy,

ν → ∞ da Gaussiana

Page 23: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Distribución t Student (2)

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 23

Si x ~ Gausiana con µ = 0, σ2 = 1, y

z ~ χ2 con n grados de libertad, entonces

t = x / (z/n)1/2 sigue t Student con ν = n.

Esto surge en problemas donde se forma la relación de unamedia muestral a la desviación estándar muestral de rvsGausianas.t Student proporciona una pdf en forma de campana con colasajustables, que van desde los de una gaussiana, que cae muyrapidamente, (ν → ∞, en la práctica ya es tipo Gaussiana para ν = dos docenas), a la cola larga de Cauchy (ν = 1).

Desarrollado en 1908 por William Gosset, que trabajó bajo elseudónimo de "Student" para la fábrica de cerveza Guinness

Page 24: Análisis de Datos en Física de Partículast = x / (z/n)1/2 sigue t Student con ν = n. Esto surge en problemas donde se forma la relación de una media muestral a la desviación

Terminando Capítulo 3

J. Solano Clases de Análisis de Datos en Física de Partículas Capítulo 3 página 24

Hemos visto un número importante de distribuciones:Binomial, Multinomial, Poisson, Uniform, ExponencialGaussiana, Chi-square, Cauchy, Landau, Beta,Gamma, t Student

y hemos visto el importante Teorema Central del Límite:explica porqué r.v.s Gaussianas se ven frecuentemente

Para un catálogo mas completo ver ej. el “handbook onstatistical distributions” por Christian Walck de

http://www.physto.se/~walck/