formulas
DESCRIPTION
Elementos de estadística FVET UBATRANSCRIPT
-
Elementos de Estadstica Estadstica Analtica
1
PPRROOBBAABBIILLIIDDAADD
1) TEOREMA DE LA SUMA DE PROBABILIDADES
2) PROBABILIDAD CONDICIONAL
3) TEOREMA DEL PRODUCTO DE PROBABILIDADES 4) ESPERANZA MATEMATICA
Sea x una variable aleatoria con funcin de probabilidad p(x) o f(x):
5) DISTRIBUCION DE PROBABILIDAD A) DISTRIBUCIONES DISCRETAS:
A.1) DISTRIBUCION DE BERNOULLI
x 1-x(1- p para x = 0 y x = 1 ; 0 p 1p )
p(x)= 0 para otros valores de x
donde: E(X) = p ; V(X) = p(1-p)
A.2) DISTRIBUCION BINOMIAL
x n-xn
(1- p para x = 0,1,...,n ; 0 p 1p )p(x)= x
0 para otros valores de x
donde: 0
rx n-xn
P(X r)= Bi(r, p,n)= (1- pp )x
E(X)= np ; V(X)= np(1- p)
cantidad de casos favorablesP(A)=
cantidad de casos posibles
P(A B)= P(A)+ P(B)- P(A B)
P(A B)P(A/B)=
P(B)
)P(B/A).P(A =)P(A/B).P(B =B) P(A
.
i i
+
-
1)E(X)= p( ) si x es v. a. discretax x
2)E(X)= x.f(x).dx si x es v. a. continua
-
Elementos de Estadstica Estadstica Analtica
2
z
-
F(Z z)= f(Z).dZ
Nota : f(-z)= f(z) (-z)= 1- (z)
A.3) DISTRIBUCION DE POISSON
donde: La constante es considerada la tasa media de ocurrencia de los sucesos por unidad de tiempo o espacio. B) DISTRIBUCIONES CONTINUAS:
B.1) DISTRIBUCION NORMAL
Condiciones:
La funcin de distribucin de probabilidad acumulada se define como: B.2) DISTRIBUCION NORMAL ESTANDARIZADA
Sea la variable aleatoria: (X - )
Z =
con funcin de densidad:
2
2
Z1f(z)= para - Z +e
2
recibe el nombre de Distribucin Normal Estandarizada o N(0;1), donde:
E(Z) = 0 ; V(Z) = 1
La funcin de distribucin de probabilidad acumulada est definida por:
x- .e para x = 0,1,... ; > 0p(x)= x!
0 para otros valores de x
0
r - x.eP(X r)= Po(r, ,n)=
x!
E(X)= ; V(X)=
2
212
22
, , - xx1
f (x )= e2
; ;
2
x (- ;+ ) (- ;+ ) > 0
E(X)= ; V(X)=
x
-
F(X)= f(y).dy
-
Elementos de Estadstica Estadstica Analtica
3
B.3) DISTRIBUCION JI CUADRADO
Sea la variable aleatoria: 2
2n n
i ii
i ii
xV z
con funcin de densidad: 1
2 2
2
1 para 0
22
0 para 0
x
x e x
f x
x
recibe el nombre de funcin de densidad Ji cuadrado. Donde la letra representa el nmero
de trminos independientes y recibe el nombre de grados de libertad y:
E(V) = ; V(V) = 2
B.4) DISTRIBUCION t DE STUDENT
Sea la variable aleatoria: Z
tV
12 2
12
1
2
tf t
recibe el nombre de funcin de densidad t de Student con grados de libertad, donde:
;1-t
;1- ;1-
-
E(t) = 0 para > 1 V(t)= para > 2- 2
f(t).dt = 1- = F( )= P( )t t t
B.5) DISTRIBUCION F DE SNEDECOR
donde 1
2~U y 22~V Sea la variable aleatoria:
11
1 2
/2/2 1
1 2 1
/2
1 2 21
2
( ) / 2 para
/ 2 / 21
+
+ Fg(F)= . . F > 0
+ F
recibe el nombre de funcin de densidad F de Snedecor con 1 y 2 grados de libertad,
donde:
1 2 1 2 1 2
1 22 22 2
2 1 22
1 2
para para
2
2
( , );1- ( , ) ( , );1-
0
F( , );1-
2 ( + - 2)E(F)= > 2 V(F)= > 4
- 2 ( - 4)( - 2)
g(F).dF = 1- = G( ) = P( < )F F F
1
2
U
F = V
-
Elementos de Estadstica Estadstica Analtica
4
EESSTTAADDIISSTTIICCAA DDEESSCCRRIIPPTTIIVVAA
1) MEDIDAS DE POSICION
A.- MEDIA ARITMETICA ( x )
* Para n valores observados no agrupados: ixx =
n
* Cuando los n valores estn ordenados en una tabla de frecuencias:
'i ii i
fxx = x h
n
B.- MEDIANA (Me) Dados n valores ordenados de menor a mayor o de mayor a menor, se define como Me:
Si n es impar: Me es la observacin de la posicin (n+1)/2 (PosMe)
Si n es par: Me es la media aritmtica de las observaciones que correspondan a los 2 valores centrales.
Cuando la variable es cuantitativa continua y los datos estn agrupados en una tabla de frecuencias:
Donde: Li: Lmite inferior del intervalo mediana. c: Amplitud del intervalo. F(i-1): Frecuencia acumulada del intervalo anterior al intervalo mediana. fi: Frecuencia absoluta del intervalo mediana.
C.- MODO (Md o Mo) Para variables cuantitativas discretas, el modo es el valor de la variable de mayor frecuencia simple. Cuando la variable es cuantitativa continua y los datos estn agrupados en una tabla de frecuencias:
Li: Lmite inferior del intervalo Modal. c: Amplitud del intervalo Modal. f(post): Frecuencia absoluta del intervalo posterior al intervalo Modal. f(ant): Frecuencia absoluta del intervalo anterior al intervalo Modal.
f(Max): Frecuencia absoluta del intervalo Modal.
2) MEDIDAS DE DISPERSION
A.- VARIANZA (sx2)
Para n valores observados no agrupados:
2
2
2 iix
( x1 )s = - x
n -1 n
1
1 2
1
2
Donde:
i
(ant)(Max)
(post)(Max)
Mo = + c L+
f f
f f
(i-1)
ix
i
PosMe - FMe = + c L
f
-
Elementos de Estadstica Estadstica Analtica
5
Cuando los n valores estn ordenados en una tabla de frecuencias:
B.- DESVIO ESTANDAR (sx)
C.- COEFICIENTE DE VARIACION (C.V.)
2
x xs = s
% xxs
C.V. = 100x
2
2
i2 iix i
( f1 )xs = f - x
n -1 n
-
Elementos de Estadstica Estadstica Analtica
6
EESSTTAADDIISSTTIICCOOSS MMAASS EEMMPPLLEEAADDOOSS A) NORMAL ESTANDAR
1 2 1 2
2 2
1 2
1 2
0;1X X
Z N
n n
1 2 1 2 1 2 1 21 21 2 1 2
1 2
0;1 ; ;
1 1 1
p p p p x x x xZ N p p p
n n n np p
n n
1 2 1 2
1 1 2 2
1 2
0;1
1 1
p p p pZ N
p p p p
n n
B) t DE STUDENT
1nX
xt t
s
n
1 2
1 2 1 2
2
1 2
1 1n n
a
x xt t
sn n
2 21 1 2 22
1 2
1 1
2a
n s n ss
n n
1 2 1 22 2
1 2
1 2
x xt t
s s
n n
22 2
1 2
1 2
2 22 2
1 2
1 2
1 21 1
s s
n n
s s
n n
n n
~x -
Z = N(0;1)/ n
p - pZ = N (0;1)
p(1 - p)/n
p - pZ = N (0;1)
p(1 - p)/n
-
Elementos de Estadstica Estadstica Analtica
7
1 2 1 ; D
i i i nD
dd x x t t
s
n
2nn
ini11 2
d i1
dd1
d = = d -snn n -1
;
C) JI CUADRADO
22
1~2 x
n2
(n -1)s=
; donde y 2k
2 2i i
i i(k-1)
i=1 i
( - )o e= e = n.p k = N clases
e
; donde y
2f c2 2ij ij
(f -1)(c-1)
iji=1 j=1
( - )o e= f = N filas c = N columnas
e
D) F DE SNEDECOR
1 2 1 2
2 2
1 1
2 2
1 2( 1),( 1) ( 1),( 1)2 2
2 1
2 2
2 2
~ o ~n n n n
s s
sF F F F
s
E) CORRECCIN DE TAMAO DE MUESTRA PARA POBLACIONES FINITAS
N = Tamao de la poblacin; n0= tamao de muestra hallado; nf = tamao de muestra corregido
0
01f
nn
n
N
F) PRUEBA DE WILCOXON DE RANGOS SIGNADOS
T+ = sumando los rangos correspondientes a las diferencias Positivas T- = sumando los rangos correspondientes a las diferencias Negativas
Suma total de rangos: 1
2
n nT T T
1. sup.= . inf .
2
n nV crtico V crtico
Si n > 25:
( 1) ( 1)(2 1)T N (E(T), V(T)) ;
4 24
d n n n n nN
-
Elementos de Estadstica Estadstica Analtica
8
G) PRUEBA DE MANN WHITNEY
1
; siendo los rangos de una de las muestrasn
i i
i
T r r
1 1
1 2 1
2 2'
1 2 2
'
1 2
1*
2
1*
2
*
n nU n n T
n nU n n T
U U n n
Si n1 > 20 y n2 > 40:
1 1 2 2 1 2
1 2
1 1
2 2
n n n n n nE T E T
1 2 1 2
1 2
* 1
12
n n n nV T V T
( )(0;1)
( )
T E TZ N
V T
-
Elementos de Estadstica Estadstica Analtica
9
ANALISIS DE REGRESION a) Estimacin de la ecuacin de la regresin
a.1) Estimacin de y
2 22
i i
i ii i i i i i
2 2
i i iii
x yx y -x - x y - y n. x y -( x )( y )nb = = =
( x n. x -( x) )x - xx -
n
a = y - bx
a.2) Estimacin de 2
2 2
2 2
2 22
2 22
2
i i2 2e i i
e ebb
i i i
i
y x1= y - - x -s b
n - 2 n n
n.s s= s = =V
n x - x xx -
n
b) Estimacin por intervalo de confianza
b.1) Para
b.2) Para E(Yi)
Dados n pares de valores (xi; yi), se estiman los parmetros del modelo: Yi = + xi + ei
2 00
2
y
2
(n-2);(1- / 2) e 2
ii
(x - x1 )a + bx s +t
n ( x )x -
n
a : Estimador de ( ) b : Estimador de ( )
c) Docimasia de hiptesis
Para
2~
0
0(n-2)H
b
b -= t t
s
2~ (n-2)
b
b - t = t
s
i iy = a + bx ecuacin de regresin estimada
-
Elementos de Estadstica Estadstica Analtica
10
d) Coeficiente de determinacin (R)
2
2 2
i2 2i22
i2
i 2 i
i
x -b x
n(x - x )b = = R
y y y-y
n
e) Intervalo de prediccin
2
12
1 2;1 22
1
1 1 nn n n
i
i
x xY t s
nx x
2 11
2
1
2
n(n-2);(1- / 2)n e 2
ii
(x - x1 )a + bx s +t
n ( x )x -
n
f) Anlisis de varianza en Regresin Lineal Simple Fuentes de Variacin
G.L.
Suma de Cuadrados
Cuadrados
Medios
F
Debida a la Regresin
1
2
2 2 i
i
xb x
n
1
REG REG
REG
SC SC
GL
;~ REG RESREG
GL GL
RES
CMF
CM
Residual
n-2
2
i iy a bx
2
RES RES
RES
SC SC
GL n
TOTAL
n-1
2
2 i
i
yy
n
21
2e TOTAL REGs SC SC
n
-
Elementos de Estadstica Estadstica Analtica
11
AANNAALLIISSIISS DDEE VVAARRIIAANNZZAA DDIISSEEOO CCOOMMPPLLEETTAAMMEENNTTEE AALLEEAATTOORRIIZZAADDOO
Fuentes de Variacin
G.L.
Suma de Cuadrados
Cuadrados
Medios
F
Modelo o Tratamiento
k-1
2
..
1
k
i i
i
n y y
1TRATSC
k
TRAT
ERROR
CM
CM
Error n-k 21
1 *k
i i
i
n s
2 ERRORP
SCs
n k
TOTAL
n-1
2 21 121
1 * ... 1 *
...
k k
P
k
n s n ss
n n k
Prueba de Kruskal Wallis
.
1
123( 1)
( 1)
ki
i i
RH N
N N n
Donde: N es el total de observaciones
Ri. es el rango total de la muestra i
Bajo Ho 2
1kH
-
Elementos de Estadstica Estadstica Analtica
12
AANNAALLIISSIISS DDEE CCOORRRREELLAACCIIOONN a) Estimacin del coeficiente de correlacin():
1 2
1 21 1 2 2
2 2 2 2
2 21 1 2 2 1 2
1 2
i i
i ii i
i i i i
i i
x xx x -x - x x - x n = r = =
x - x x - x x xx - x -
n n
b) Docimasia de hiptesis
Para 0= : ~0 (n-2)H 2
r (n - 2)= t t
(1- )r
NOTA: Para los fines prcticos el valor del Coeficiente de Determinacin (R2) coincide numricamente con: c) Coeficiente de correlacin de Spearman
26 1
( 1) ( 1)
iS
dr
n n n
n: nmero de diferencias
2 2 = R r