formulas

Upload: agusdaleoso

Post on 14-Jan-2016

5 views

Category:

Documents


0 download

DESCRIPTION

Elementos de estadística FVET UBA

TRANSCRIPT

  • Elementos de Estadstica Estadstica Analtica

    1

    PPRROOBBAABBIILLIIDDAADD

    1) TEOREMA DE LA SUMA DE PROBABILIDADES

    2) PROBABILIDAD CONDICIONAL

    3) TEOREMA DEL PRODUCTO DE PROBABILIDADES 4) ESPERANZA MATEMATICA

    Sea x una variable aleatoria con funcin de probabilidad p(x) o f(x):

    5) DISTRIBUCION DE PROBABILIDAD A) DISTRIBUCIONES DISCRETAS:

    A.1) DISTRIBUCION DE BERNOULLI

    x 1-x(1- p para x = 0 y x = 1 ; 0 p 1p )

    p(x)= 0 para otros valores de x

    donde: E(X) = p ; V(X) = p(1-p)

    A.2) DISTRIBUCION BINOMIAL

    x n-xn

    (1- p para x = 0,1,...,n ; 0 p 1p )p(x)= x

    0 para otros valores de x

    donde: 0

    rx n-xn

    P(X r)= Bi(r, p,n)= (1- pp )x

    E(X)= np ; V(X)= np(1- p)

    cantidad de casos favorablesP(A)=

    cantidad de casos posibles

    P(A B)= P(A)+ P(B)- P(A B)

    P(A B)P(A/B)=

    P(B)

    )P(B/A).P(A =)P(A/B).P(B =B) P(A

    .

    i i

    +

    -

    1)E(X)= p( ) si x es v. a. discretax x

    2)E(X)= x.f(x).dx si x es v. a. continua

  • Elementos de Estadstica Estadstica Analtica

    2

    z

    -

    F(Z z)= f(Z).dZ

    Nota : f(-z)= f(z) (-z)= 1- (z)

    A.3) DISTRIBUCION DE POISSON

    donde: La constante es considerada la tasa media de ocurrencia de los sucesos por unidad de tiempo o espacio. B) DISTRIBUCIONES CONTINUAS:

    B.1) DISTRIBUCION NORMAL

    Condiciones:

    La funcin de distribucin de probabilidad acumulada se define como: B.2) DISTRIBUCION NORMAL ESTANDARIZADA

    Sea la variable aleatoria: (X - )

    Z =

    con funcin de densidad:

    2

    2

    Z1f(z)= para - Z +e

    2

    recibe el nombre de Distribucin Normal Estandarizada o N(0;1), donde:

    E(Z) = 0 ; V(Z) = 1

    La funcin de distribucin de probabilidad acumulada est definida por:

    x- .e para x = 0,1,... ; > 0p(x)= x!

    0 para otros valores de x

    0

    r - x.eP(X r)= Po(r, ,n)=

    x!

    E(X)= ; V(X)=

    2

    212

    22

    , , - xx1

    f (x )= e2

    ; ;

    2

    x (- ;+ ) (- ;+ ) > 0

    E(X)= ; V(X)=

    x

    -

    F(X)= f(y).dy

  • Elementos de Estadstica Estadstica Analtica

    3

    B.3) DISTRIBUCION JI CUADRADO

    Sea la variable aleatoria: 2

    2n n

    i ii

    i ii

    xV z

    con funcin de densidad: 1

    2 2

    2

    1 para 0

    22

    0 para 0

    x

    x e x

    f x

    x

    recibe el nombre de funcin de densidad Ji cuadrado. Donde la letra representa el nmero

    de trminos independientes y recibe el nombre de grados de libertad y:

    E(V) = ; V(V) = 2

    B.4) DISTRIBUCION t DE STUDENT

    Sea la variable aleatoria: Z

    tV

    12 2

    12

    1

    2

    tf t

    recibe el nombre de funcin de densidad t de Student con grados de libertad, donde:

    ;1-t

    ;1- ;1-

    -

    E(t) = 0 para > 1 V(t)= para > 2- 2

    f(t).dt = 1- = F( )= P( )t t t

    B.5) DISTRIBUCION F DE SNEDECOR

    donde 1

    2~U y 22~V Sea la variable aleatoria:

    11

    1 2

    /2/2 1

    1 2 1

    /2

    1 2 21

    2

    ( ) / 2 para

    / 2 / 21

    +

    + Fg(F)= . . F > 0

    + F

    recibe el nombre de funcin de densidad F de Snedecor con 1 y 2 grados de libertad,

    donde:

    1 2 1 2 1 2

    1 22 22 2

    2 1 22

    1 2

    para para

    2

    2

    ( , );1- ( , ) ( , );1-

    0

    F( , );1-

    2 ( + - 2)E(F)= > 2 V(F)= > 4

    - 2 ( - 4)( - 2)

    g(F).dF = 1- = G( ) = P( < )F F F

    1

    2

    U

    F = V

  • Elementos de Estadstica Estadstica Analtica

    4

    EESSTTAADDIISSTTIICCAA DDEESSCCRRIIPPTTIIVVAA

    1) MEDIDAS DE POSICION

    A.- MEDIA ARITMETICA ( x )

    * Para n valores observados no agrupados: ixx =

    n

    * Cuando los n valores estn ordenados en una tabla de frecuencias:

    'i ii i

    fxx = x h

    n

    B.- MEDIANA (Me) Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:

    Si n es impar: Me es la observacin de la posicin (n+1)/2 (PosMe)

    Si n es par: Me es la media aritmtica de las observaciones que correspondan a los 2 valores centrales.

    Cuando la variable es cuantitativa continua y los datos estn agrupados en una tabla de frecuencias:

    Donde: Li: Lmite inferior del intervalo mediana. c: Amplitud del intervalo. F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana. fi: Frecuencia absoluta del intervalo mediana.

    C.- MODO (Md o Mo) Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia simple. Cuando la variable es cuantitativa continua y los datos estn agrupados en una tabla de frecuencias:

    Li: Lmite inferior del intervalo Modal. c: Amplitud del intervalo Modal. f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal. f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.

    f(Max): Frecuencia absoluta del intervalo Modal.

    2) MEDIDAS DE DISPERSION

    A.- VARIANZA (sx2)

    Para n valores observados no agrupados:

    2

    2

    2 iix

    ( x1 )s = - x

    n -1 n

    1

    1 2

    1

    2

    Donde:

    i

    (ant)(Max)

    (post)(Max)

    Mo = + c L+

    f f

    f f

    (i-1)

    ix

    i

    PosMe - FMe = + c L

    f

  • Elementos de Estadstica Estadstica Analtica

    5

    Cuando los n valores estn ordenados en una tabla de frecuencias:

    B.- DESVIO ESTANDAR (sx)

    C.- COEFICIENTE DE VARIACION (C.V.)

    2

    x xs = s

    % xxs

    C.V. = 100x

    2

    2

    i2 iix i

    ( f1 )xs = f - x

    n -1 n

  • Elementos de Estadstica Estadstica Analtica

    6

    EESSTTAADDIISSTTIICCOOSS MMAASS EEMMPPLLEEAADDOOSS A) NORMAL ESTANDAR

    1 2 1 2

    2 2

    1 2

    1 2

    0;1X X

    Z N

    n n

    1 2 1 2 1 2 1 21 21 2 1 2

    1 2

    0;1 ; ;

    1 1 1

    p p p p x x x xZ N p p p

    n n n np p

    n n

    1 2 1 2

    1 1 2 2

    1 2

    0;1

    1 1

    p p p pZ N

    p p p p

    n n

    B) t DE STUDENT

    1nX

    xt t

    s

    n

    1 2

    1 2 1 2

    2

    1 2

    1 1n n

    a

    x xt t

    sn n

    2 21 1 2 22

    1 2

    1 1

    2a

    n s n ss

    n n

    1 2 1 22 2

    1 2

    1 2

    x xt t

    s s

    n n

    22 2

    1 2

    1 2

    2 22 2

    1 2

    1 2

    1 21 1

    s s

    n n

    s s

    n n

    n n

    ~x -

    Z = N(0;1)/ n

    p - pZ = N (0;1)

    p(1 - p)/n

    p - pZ = N (0;1)

    p(1 - p)/n

  • Elementos de Estadstica Estadstica Analtica

    7

    1 2 1 ; D

    i i i nD

    dd x x t t

    s

    n

    2nn

    ini11 2

    d i1

    dd1

    d = = d -snn n -1

    ;

    C) JI CUADRADO

    22

    1~2 x

    n2

    (n -1)s=

    ; donde y 2k

    2 2i i

    i i(k-1)

    i=1 i

    ( - )o e= e = n.p k = N clases

    e

    ; donde y

    2f c2 2ij ij

    (f -1)(c-1)

    iji=1 j=1

    ( - )o e= f = N filas c = N columnas

    e

    D) F DE SNEDECOR

    1 2 1 2

    2 2

    1 1

    2 2

    1 2( 1),( 1) ( 1),( 1)2 2

    2 1

    2 2

    2 2

    ~ o ~n n n n

    s s

    sF F F F

    s

    E) CORRECCIN DE TAMAO DE MUESTRA PARA POBLACIONES FINITAS

    N = Tamao de la poblacin; n0= tamao de muestra hallado; nf = tamao de muestra corregido

    0

    01f

    nn

    n

    N

    F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS

    T+ = sumando los rangos correspondientes a las diferencias Positivas T- = sumando los rangos correspondientes a las diferencias Negativas

    Suma total de rangos: 1

    2

    n nT T T

    1. sup.= . inf .

    2

    n nV crtico V crtico

    Si n > 25:

    ( 1) ( 1)(2 1)T N (E(T), V(T)) ;

    4 24

    d n n n n nN

  • Elementos de Estadstica Estadstica Analtica

    8

    G) PRUEBA DE MANN WHITNEY

    1

    ; siendo los rangos de una de las muestrasn

    i i

    i

    T r r

    1 1

    1 2 1

    2 2'

    1 2 2

    '

    1 2

    1*

    2

    1*

    2

    *

    n nU n n T

    n nU n n T

    U U n n

    Si n1 > 20 y n2 > 40:

    1 1 2 2 1 2

    1 2

    1 1

    2 2

    n n n n n nE T E T

    1 2 1 2

    1 2

    * 1

    12

    n n n nV T V T

    ( )(0;1)

    ( )

    T E TZ N

    V T

  • Elementos de Estadstica Estadstica Analtica

    9

    ANALISIS DE REGRESION a) Estimacin de la ecuacin de la regresin

    a.1) Estimacin de y

    2 22

    i i

    i ii i i i i i

    2 2

    i i iii

    x yx y -x - x y - y n. x y -( x )( y )nb = = =

    ( x n. x -( x) )x - xx -

    n

    a = y - bx

    a.2) Estimacin de 2

    2 2

    2 2

    2 22

    2 22

    2

    i i2 2e i i

    e ebb

    i i i

    i

    y x1= y - - x -s b

    n - 2 n n

    n.s s= s = =V

    n x - x xx -

    n

    b) Estimacin por intervalo de confianza

    b.1) Para

    b.2) Para E(Yi)

    Dados n pares de valores (xi; yi), se estiman los parmetros del modelo: Yi = + xi + ei

    2 00

    2

    y

    2

    (n-2);(1- / 2) e 2

    ii

    (x - x1 )a + bx s +t

    n ( x )x -

    n

    a : Estimador de ( ) b : Estimador de ( )

    c) Docimasia de hiptesis

    Para

    2~

    0

    0(n-2)H

    b

    b -= t t

    s

    2~ (n-2)

    b

    b - t = t

    s

    i iy = a + bx ecuacin de regresin estimada

  • Elementos de Estadstica Estadstica Analtica

    10

    d) Coeficiente de determinacin (R)

    2

    2 2

    i2 2i22

    i2

    i 2 i

    i

    x -b x

    n(x - x )b = = R

    y y y-y

    n

    e) Intervalo de prediccin

    2

    12

    1 2;1 22

    1

    1 1 nn n n

    i

    i

    x xY t s

    nx x

    2 11

    2

    1

    2

    n(n-2);(1- / 2)n e 2

    ii

    (x - x1 )a + bx s +t

    n ( x )x -

    n

    f) Anlisis de varianza en Regresin Lineal Simple Fuentes de Variacin

    G.L.

    Suma de Cuadrados

    Cuadrados

    Medios

    F

    Debida a la Regresin

    1

    2

    2 2 i

    i

    xb x

    n

    1

    REG REG

    REG

    SC SC

    GL

    ;~ REG RESREG

    GL GL

    RES

    CMF

    CM

    Residual

    n-2

    2

    i iy a bx

    2

    RES RES

    RES

    SC SC

    GL n

    TOTAL

    n-1

    2

    2 i

    i

    yy

    n

    21

    2e TOTAL REGs SC SC

    n

  • Elementos de Estadstica Estadstica Analtica

    11

    AANNAALLIISSIISS DDEE VVAARRIIAANNZZAA DDIISSEEOO CCOOMMPPLLEETTAAMMEENNTTEE AALLEEAATTOORRIIZZAADDOO

    Fuentes de Variacin

    G.L.

    Suma de Cuadrados

    Cuadrados

    Medios

    F

    Modelo o Tratamiento

    k-1

    2

    ..

    1

    k

    i i

    i

    n y y

    1TRATSC

    k

    TRAT

    ERROR

    CM

    CM

    Error n-k 21

    1 *k

    i i

    i

    n s

    2 ERRORP

    SCs

    n k

    TOTAL

    n-1

    2 21 121

    1 * ... 1 *

    ...

    k k

    P

    k

    n s n ss

    n n k

    Prueba de Kruskal Wallis

    .

    1

    123( 1)

    ( 1)

    ki

    i i

    RH N

    N N n

    Donde: N es el total de observaciones

    Ri. es el rango total de la muestra i

    Bajo Ho 2

    1kH

  • Elementos de Estadstica Estadstica Analtica

    12

    AANNAALLIISSIISS DDEE CCOORRRREELLAACCIIOONN a) Estimacin del coeficiente de correlacin():

    1 2

    1 21 1 2 2

    2 2 2 2

    2 21 1 2 2 1 2

    1 2

    i i

    i ii i

    i i i i

    i i

    x xx x -x - x x - x n = r = =

    x - x x - x x xx - x -

    n n

    b) Docimasia de hiptesis

    Para 0= : ~0 (n-2)H 2

    r (n - 2)= t t

    (1- )r

    NOTA: Para los fines prcticos el valor del Coeficiente de Determinacin (R2) coincide numricamente con: c) Coeficiente de correlacin de Spearman

    26 1

    ( 1) ( 1)

    iS

    dr

    n n n

    n: nmero de diferencias

    2 2 = R r