regresion09.pdf

23
1 Análisis Estadístico de Datos Climáticos Aplicaciones regresión-composición Marcelo Barreiro - Mario Bidegain - Alvaro Diaz Universidad de la República, 2009

Upload: pablo-melo

Post on 25-Nov-2015

8 views

Category:

Documents


0 download

TRANSCRIPT

  • 1Anlisis Estadstico de Datos Climticos

    Aplicaciones regresin-composicin

    Marcelo Barreiro - Mario Bidegain - Alvaro Diaz

    Universidad de la Repblica, 2009

  • AnalisisExploratorio Distribuciones PruebasdeHipotesis Composites Regresionlineal

    Juntemostodoesto!

  • Composites

    El mtodo de composites consiste en clasificar los datos en categoras y comparar p. ej. los valores medios o anomalas de otras variables para las distintas categoras.

    Puede servir para identificar seales no muy fuertes que estn ocultas debido a la existencia de ruido.

  • CompositeEventos calidos

    [82; 86; 87; 91; 94; 97]

    CompositeEventos frios

    [84; 88; 95; 98; 99]

    Linealidad en lasanomalias!

  • Como s cuales anomalias son estadsticamente significativas?

    HayquehacerunStudentTtestparacompararladiferenciaentrelasdosmediasmuestrales. H0:mismamedia;H1:mediaesdiferente Seasumelasmuestrasprocedendelamismapoblacin,tienendistribucionnormal,sonindependientesytienenigualdesviacintpica.

    Quemuestrascomparo? AosNio[82;86;87;91;94;97] AosNeutros,aquellosquenosonniNiosniNias.

    Eltestes:

  • Anomalias significativas al 5%1 extremo 2 extremos

    Como tenemos menosinformacionel test debeser masfuerte

  • %MatlabCode

    [clim,anom]=climatology(pre,X,Y,0);

    anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+...

    anom(12:12:end,:,:))/3;

    %AnosNino

    nino=[82;86;87;91;94;97]78;

    nina=[84;88;95;98;99]78;

    %AnosNeutros

    neutros=(79:106)78;neutros(nino)=NaN;neutros(nina)=NaN;

    neutros=neutros(~isnan(neutros))';

  • %%%Ttest

    anomONDnino=mean(anomOND(nino,:,:));

    anomONDneut=mean(anomOND(neutros,:,:));

    nino_neu=anomONDninoanomONDneut;

    dof=length(nino)+length(neutros)2;

    sp=sqrt((var(anomOND(nino,:,:))*(length(nino)1)+...

    var(anomOND(neutros,:,:))*(length(neutros)1))/dof);

    tt=nino_neu./(sp*sqrt(1/length(nino)+1/length(neutros)));

    tt=squeeze(tt);tt2=tt;

  • %5%level1sided

    jj10=find(abs(tt2)

  • Correlaciones

    MapadecorrelacionentreanomaliasdePP_artigas5102yTSMenOND.

  • Como s qu correlaciones son significativas?

    ParalacorrelaciondePearsonexisteelsiguientetest. H0:r=0 H1:rdifde0

    neslalongituddelaserie(consideradosindependientes). secomparaTconvalorescriticosdeladistribuciontconn2gradosdelibertad.

    T=r n21r 2

  • Regiones de TSM con correlacion significativa con pp_artigas5102 en OND.

  • %Codigo Matlab

    anomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)... +anom(12:12:end,:,:))/3;

    anompOND=(anomp(:,10)+anomp(:,11)+anomp(:,12))/3;

    %Calcula correlacionfor i=1:96

    for j=1:48correl(j,i)=corr(anompOND,anomOND(:,j,i));

    endend

    %Que correlacion es significativa?%Test Ho: r=0 (compare to T distribution)% 2 extremos al 5% de significancia

    tt=correl*sqrt(52-2)./sqrt((1-correl.^2));jj=find(abs(tt)

  • Regresion

    SupongamosquequierosabercualeslarelacionentreelestadodelPacificoecuatorialylaprecipitacionenSudamericaenOND.TomoNino3.4comoindice.

    Unaformadeverestoeshacercomposites,comoyahicimos. Otraformaescalcularunmapaderegresion:hacerunaregresionlinealentrecadapuntodegrilladeprecipitacionyNino3.4.

  • Observacion:Esmuytiltrabajarconanomalasestandarizadas:z=x/ .

    Enlaregresion

    y=a+bx

    lasunidadesde

    [b]=(Unidadesdey)/(Unidadesdex)

    Enesteejemplo:[b]=mm/dia/C

    Sixestestandarizada,notieneunidadesytienedesviacinestandard=1

    As,bsepuedeinterpretarcomolaanomaladeyasociada(dependiendodelr)aunadesviacionestandarddelavariableindependientex.

  • Nino3.4

    Azul: originalRojo:estandarizadoLos dos indices son tan parecidos pues ~1 C

    Eventos calidos

    [82; 86; 87; 91; 94; 97]

    Eventos frios

    [84; 88; 95; 98; 99]

  • Regr

    esio

    n de

    pre

    cipi

    taci

    ones

    co

    n N

    ino3

    .4 e

    stan

    dariz

    ado

    Una anomalia de 1mm/dia esta asociadacon 1 desviacion estandard de TSM en Nino3.4.O sea, si Nino3.4 se calienta ~1C, tiende a llover1 mm/dia mas de lo normal en el norte de Uruguay.

  • Pero cmo sabemos en qu regiones es la regresin

    estadsticamente significativa? ElcoeficientedemultipledeterminacionR2

    yrepresentalahabilidaddelarectaestimadaenrepresentarlasvariacionesenlosdatos.

    Entoncesparasaberlasignificanciaestadsticacalculamoselmapadecorrelacionyaplicamoseltest

    comparandoconladistribuciont.

    T=r n21r 2

    R= SSRSST =

    SXYSXX

    SXY

    SYY=

    SXY SXX SYY

    = x ix y iy x ix y iy

    =r

  • Regr

    esio

    n y

    sign

    ifica

    ncia

    est

    adis

    tica

    al 5

    %

  • %Anomalias de PrecipitacionanompOND=(anomp(10:12:end,:,:)+anomp(11:12:end,:,:)+anomp(12:12:end,:,:))/3;

    %Anomalias de TSManomOND=(anom(10:12:end,:,:)+anom(11:12:end,:,:)+anom(12:12:end,:,:))/3;

    %Nio3.4figureplot((1979:2006),nino34,'linewidth',2)holdnino34s=nino34/std(nino34); %Estandarizo el indice Nino34 plot((1979:2006),nino34s,'r','linewidth',2)grid; axis tight

    %Calculo Correlacion y Regresionfor i=1:144

    for j=1:72p=polyfit(nino34s',anompOND(:,j,i),1); b(j,i)=p(1);r(j,i)=corr(nino34s',anompOND(:,j,i));

    endend

  • figure%Que correlacion es significativa?%Test Ho: r=0 (compare to T distribution)

    tt=r*sqrt(28-2)./sqrt((1-r.^2));jj=find(abs(tt)

  • Diferencias entre composites y regresion

    Enuncompositesetomanlosextremosysecomparanconlosaosneutros.Elcompositesepuedehacerparaextremospositivosynegativosyestosresultadosnotienenporqueseropuestos(respuestanolineal).

    Enlaregresionsoloseconsideralarelacionlinealentreelpredictando(y)yelpredictor(x).

    Elcompositede(maxmin)/2dalarespuestalinealydeberiasersimilaralmapaderegresion