regresion09.pdf
TRANSCRIPT
-
1Anlisis Estadstico de Datos Climticos
Aplicaciones regresin-composicin
Marcelo Barreiro - Mario Bidegain - Alvaro Diaz
Universidad de la Repblica, 2009
-
AnalisisExploratorio Distribuciones PruebasdeHipotesis Composites Regresionlineal
Juntemostodoesto!
-
Composites
El mtodo de composites consiste en clasificar los datos en categoras y comparar p. ej. los valores medios o anomalas de otras variables para las distintas categoras.
Puede servir para identificar seales no muy fuertes que estn ocultas debido a la existencia de ruido.
-
CompositeEventos calidos
[82; 86; 87; 91; 94; 97]
CompositeEventos frios
[84; 88; 95; 98; 99]
Linealidad en lasanomalias!
-
Como s cuales anomalias son estadsticamente significativas?
HayquehacerunStudentTtestparacompararladiferenciaentrelasdosmediasmuestrales. H0:mismamedia;H1:mediaesdiferente Seasumelasmuestrasprocedendelamismapoblacin,tienendistribucionnormal,sonindependientesytienenigualdesviacintpica.
Quemuestrascomparo? AosNio[82;86;87;91;94;97] AosNeutros,aquellosquenosonniNiosniNias.
Eltestes:
-
Anomalias significativas al 5%1 extremo 2 extremos
Como tenemos menosinformacionel test debeser masfuerte
-
%MatlabCode
[clim,anom]=climatology(pre,X,Y,0);
anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+...
anom(12:12:end,:,:))/3;
%AnosNino
nino=[82;86;87;91;94;97]78;
nina=[84;88;95;98;99]78;
%AnosNeutros
neutros=(79:106)78;neutros(nino)=NaN;neutros(nina)=NaN;
neutros=neutros(~isnan(neutros))';
-
%%%Ttest
anomONDnino=mean(anomOND(nino,:,:));
anomONDneut=mean(anomOND(neutros,:,:));
nino_neu=anomONDninoanomONDneut;
dof=length(nino)+length(neutros)2;
sp=sqrt((var(anomOND(nino,:,:))*(length(nino)1)+...
var(anomOND(neutros,:,:))*(length(neutros)1))/dof);
tt=nino_neu./(sp*sqrt(1/length(nino)+1/length(neutros)));
tt=squeeze(tt);tt2=tt;
-
%5%level1sided
jj10=find(abs(tt2)
-
Correlaciones
MapadecorrelacionentreanomaliasdePP_artigas5102yTSMenOND.
-
Como s qu correlaciones son significativas?
ParalacorrelaciondePearsonexisteelsiguientetest. H0:r=0 H1:rdifde0
neslalongituddelaserie(consideradosindependientes). secomparaTconvalorescriticosdeladistribuciontconn2gradosdelibertad.
T=r n21r 2
-
Regiones de TSM con correlacion significativa con pp_artigas5102 en OND.
-
%Codigo Matlab
anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)... +anom(12:12:end,:,:))/3;
anompOND=(anomp(:,10)+anomp(:,11)+anomp(:,12))/3;
%Calcula correlacionfor i=1:96
for j=1:48correl(j,i)=corr(anompOND,anomOND(:,j,i));
endend
%Que correlacion es significativa?%Test Ho: r=0 (compare to T distribution)% 2 extremos al 5% de significancia
tt=correl*sqrt(52-2)./sqrt((1-correl.^2));jj=find(abs(tt)
-
Regresion
SupongamosquequierosabercualeslarelacionentreelestadodelPacificoecuatorialylaprecipitacionenSudamericaenOND.TomoNino3.4comoindice.
Unaformadeverestoeshacercomposites,comoyahicimos. Otraformaescalcularunmapaderegresion:hacerunaregresionlinealentrecadapuntodegrilladeprecipitacionyNino3.4.
-
Observacion:Esmuytiltrabajarconanomalasestandarizadas:z=x/ .
Enlaregresion
y=a+bx
lasunidadesde
[b]=(Unidadesdey)/(Unidadesdex)
Enesteejemplo:[b]=mm/dia/C
Sixestestandarizada,notieneunidadesytienedesviacinestandard=1
As,bsepuedeinterpretarcomolaanomaladeyasociada(dependiendodelr)aunadesviacionestandarddelavariableindependientex.
-
Nino3.4
Azul: originalRojo:estandarizadoLos dos indices son tan parecidos pues ~1 C
Eventos calidos
[82; 86; 87; 91; 94; 97]
Eventos frios
[84; 88; 95; 98; 99]
-
Regr
esio
n de
pre
cipi
taci
ones
co
n N
ino3
.4 e
stan
dariz
ado
Una anomalia de 1mm/dia esta asociadacon 1 desviacion estandard de TSM en Nino3.4.O sea, si Nino3.4 se calienta ~1C, tiende a llover1 mm/dia mas de lo normal en el norte de Uruguay.
-
Pero cmo sabemos en qu regiones es la regresin
estadsticamente significativa? ElcoeficientedemultipledeterminacionR2
yrepresentalahabilidaddelarectaestimadaenrepresentarlasvariacionesenlosdatos.
Entoncesparasaberlasignificanciaestadsticacalculamoselmapadecorrelacionyaplicamoseltest
comparandoconladistribuciont.
T=r n21r 2
R= SSRSST =
SXYSXX
SXY
SYY=
SXY SXX SYY
= x ix y iy x ix y iy
=r
-
Regr
esio
n y
sign
ifica
ncia
est
adis
tica
al 5
%
-
%Anomalias de PrecipitacionanompOND=(anomp(10:12:end,:,:)+anomp(11:12:end,:,:)+anomp(12:12:end,:,:))/3;
%Anomalias de TSManomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+anom(12:12:end,:,:))/3;
%Nio3.4figureplot((1979:2006),nino34,'linewidth',2)holdnino34s=nino34/std(nino34); %Estandarizo el indice Nino34 plot((1979:2006),nino34s,'r','linewidth',2)grid; axis tight
%Calculo Correlacion y Regresionfor i=1:144
for j=1:72p=polyfit(nino34s',anompOND(:,j,i),1); b(j,i)=p(1);r(j,i)=corr(nino34s',anompOND(:,j,i));
endend
-
figure%Que correlacion es significativa?%Test Ho: r=0 (compare to T distribution)
tt=r*sqrt(28-2)./sqrt((1-r.^2));jj=find(abs(tt)
-
Diferencias entre composites y regresion
Enuncompositesetomanlosextremosysecomparanconlosaosneutros.Elcompositesepuedehacerparaextremospositivosynegativosyestosresultadosnotienenporqueseropuestos(respuestanolineal).
Enlaregresionsoloseconsideralarelacionlinealentreelpredictando(y)yelpredictor(x).
Elcompositede(maxmin)/2dalarespuestalinealydeberiasersimilaralmapaderegresion