pt2 a2 e1_pelm

Post on 07-Feb-2017

74 Views

Category:

Data & Analytics

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

“Análisis Estadístico y Probabilístico de la Deserción Escolar del IEMSDF mediante el

Método de Regresión por Mínimos Cuadrados.”Elaboró: C. Pedro Lara Maldonado

SEGUNDO AVANCE DEL PROYECTO TERMINAL

INTEGRACIÓN DE LOS RESULTADOS PARA EL AJUSTE CUADRÁTICO

• Se procede a realizar manualmente la tabla de este ajuste, para poder aplicar la relación de variables en el método de mínimos cuadrados:

Suma por columna

LAS SUMATORIAS DE LA TABLA DEL AJUSTE DETERMINA LOS COEFICIENTES DE LA FUNCIÓN

CUADRÁTICA PARA LA DEPENDENCIA

• Se procede a encontrar los coeficientes: a través del siguiente sistema matricial para este ajuste cuadrático:

EL SISTEMA MATRICIAL SE PUEDE EXPRESAR COMO UN SISTEMA DE ECUACIONES.

• Realizando operaciones elementales en el sistema matricial, se obtiene el siguiente sistema de ecuaciones:

EMPLEANDO SOFTWARE MATEMÁTICO COMO ALTERNATIVA DE RESOLVER UN SISTEMA DE ECUACIONES DE TRES

INCÓGNITAS O COEFICIENTES A ENCONTRAR.

• Por lo que aquí se emplea el software matemático de Matrixcalc que este se localiza en la siguiente página electrónica: https://matrixcalc.org/es/slu.html cuya indicación a ejecutar es resolver el sistema de ecuaciones a través del Método de la Matriz Inversa que se define en este caso como:

DETERMINACIÓN DE LOS COEFICIENTES DEL AJUSTE POLINOMIAL CUADRÁTICO

• Por lo tanto los valores de los coeficientes, para este ajuste polinomial cuadrático, son:

• Estos coeficientes encontrados se sustituyen en la función de ajuste polinomial cuadrático:

INTEGRACIÓN DE RESULTADOS PARA LOS INTERVALOS DE PREDICCIÓN

• Considerando el ajuste polinomial cuadrático, conduce a estimar los probables intervalos de predicción al 95% de la deserción estudiantil, dada por la siguiente fórmula:

• Esto implica, sustituir los valores respectivos del percentil de una t Student y del error estándar de estimación para esta fórmula que define el ajuste polinomial cuadrático:

DETERMINANDO EL VALOR DEL PERCENTIL DE LA T STUDENT MEDIANTE SOFTWARE DE WOLFRAM ALPHA

• Para encontrar el percentil de la distribución t Student de se utiliza el software de wólfram alpha: http://www.wolframalpha.com/ de la siguiente manera:97.5 Percentile Student´s t distribution degrees of freedom 9

• Esta sintaxis a ejecutar, da el valor correspondiente de:

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de parámetros, se consideran los valores de los coeficientes de la función polinomial cuadrática:

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de diseño del ajuste polinomial:

DEFINIR LOS ELEMENTOS MATRICIALES PARA REALIZAR OPERACIONES EN EL INTERVALO DE PREDICCIÓN.

• Para la matriz de respuesta del modelo ajustado a los datos:

PARA CALCULAR EL ERROR DE LA ESTIMACIÓN

• Se procede a sustituir los elementos matriciales mencionados, para poder efectuar la operación matricial de la formula definida del numerador con el software de Matrixcalc https://matrixcalc.org/es/slu.html de la siguiente manera:

UN INTERVALO DE PREDICCIÓN GENERALIZADO QUE PUEDE ESTIMAR EL PDG ESTUDIANTIL.

• Por lo tanto, se sustituye los valores del percentil de la distribución t Student y del error de estimación en la fórmula generalizada del intervalo de predicción:

Para estimar la generación 2013:

Para estimar la generación 2014:

DEFINIENDO EL VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE PARÁMETROS

EN LOS RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Luego se ocupa el software de wólfram alpha: http://www.wolframalpha.com/ para efectuar la operación matricial del lado izquierdo de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*{{91.42409},{-5.69021},{0.37881}} Por lo tanto, el valor del lado izquierdo de la bivalencia es:

DEFINIENDO EL VALOR IZQUIERDO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE PARÁMETROS

EN LOS RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2014, se sustituyen las matrices correspondientes al lado izquierdo de la bivalencia, para efectuar su operación:

Luego se ocupa el software de wólfram alpha: http://www.wolframalpha.com/ para efectuar la operación matricial del lado izquierdo de la bivalencia, considerando la siguiente instrucción:

{{1,14,196}}*{{91.42409},{-5.69021},{0.37881}} Por lo tanto, el valor del lado izquierdo de la bivalencia es:

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2013, se sustituyen las matrices correspondientes al lado derecho de la bivalencia, para efectuar su operación:

Luego se ocupa el software de matrixcalc: https://matrixcalc.org/es/slu.html para encontrar la operación matricial del lado derecho de la bivalencia, por lo tanto, resulta:

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN Luego se ocupa el software de wólfram alpha:

http://www.wolframalpha.com/ para efectuar la operación matricial del lado derecho de la bivalencia, considerando la siguiente instrucción:

{{1,13,169}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{13},{169}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Realizando operaciones elementales del lado derecho de la bivalencia , implica encontrar su valor respectivo, es decir:

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN

En la generación 2014, se sustituyen las matrices correspondientes al lado derecho de la bivalencia, para efectuar su operación:

Luego se ocupa el software de matrixcalc: https://matrixcalc.org/es/slu.html para encontrar la operación matricial del lado derecho de la bivalencia, por lo tanto, resulta:

DEFINIENDO EL VALOR DERECHO DE LA BIVALENCIA MEDIANTE LAS MATRICES DE PRONOSTICO Y DE DISEÑO EN LOS

RESPECTIVOS INTERVALOS DE PREDICCIÓN Luego se ocupa el software de wólfram alpha:

http://www.wolframalpha.com/ para efectuar la operación matricial del lado derecho de la bivalencia, considerando la siguiente instrucción:

{{1,14,196}}*inverse({{12,78,650},{78,650,6084},{650,6084,60710}})*{{1},{14},{196}}

Esta sintaxis da el resultado de la operación matricial y por lo tanto este valor resultante se sustituye en la fórmula de intervalo de predicción:

Realizando operaciones elementales del lado derecho de la bivalencia , implica encontrar su valor respectivo, es decir:

CORROBORANDO LOS LÍMITES DEL INTERVALO DE PREDICCIÓN MEDIANTE EL SOFTWARE DE OCTAVE-MATLAB

Estos límites encontrados de cada intervalo predictivo, se corrobora mediante el software de Octave-MATLAB: http://octave-online.net/ donde se consideran las siguientes instrucciones a ejecutar:

• [p,S] = polyfit(x,y,n): Da los coeficientes del polinomio p de grado n que se encontró manualmente en la ecuación de la mejor función polinomial que ajusta los puntos (x,y) por mínimos cuadrados, con errores estimados S

• [Y,D] = polyconf(p,X,S,alpha): Predicción polinómica con intervalos de confianza Y±D de la salida S dada por polyfit con nivel de confianza alpha (considerando la ecuación del intervalo de predicción, se menciona que es del 95%, es decir 0.05)

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Estas instrucciones definidas, implica introducir las variables de los puntos del ajuste considerado, es decir (x,y)=(Generacion,Desercion) con el siguiente orden fundamental:

octave:1>Desercion=[88.60,82.68,73.51,75.39, 70.57,68.13,69.89,73.59,73.78,74.13,74.34,74.87];

octave:2>Generacion=[1,2,3,4,5,6,7,8,9,10,11, 12];

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Luego, se agrega la instrucción polyfit definida en este caso, como:

octave:3>[p,S]=polyfit(Generacion,Desercion,2)p =

0.37881 -5.69021 91.42409

S =scalar structure containing the fields: yf =

Columns 1 through 8:86.113 81.559 77.763 74.724 72.443 70.92070.154 70.146

Columns 9 through 12:70.896 72.403 74.668 77.690

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

X = 1 1 1 4 2 1 9 3 1 16 4 1 25 5 1 36 6 1 49 7 1 64 8 1 81 9 1 100 10 1 121 11 1 144 12 1

• En efecto, estos resultados concuerdan con los que se obtuvieron manualmente.

LA EJECUCIÓN DEL SOFTWARE OCTAVE PARA ENCONTRAR LOS LIMITES DE CADA INTERVALO DE PREDICCIÓN

• Por lo tanto, se corroboran los predichos intervalos estudiantiles de la generación 2013 y 2014 de desertores, esto implica considerar lo que se obtuvo de la implementación polyfit para que se encuentra la última instrucción definida:

octave:4> [Y,D] = polyconf(p,13,S,0.05)

Y = 81.470D = 8.978 octave:5> [Y,D] = polyconf(p,14,S,0.05)

Y = 86.008D = 10.722

• Esta sintaxis ejecutada da certeza de nuestros resultados obtenidos.

ANÁLISIS DE RESULTADOS • Estos límites predictivos de cada intervalo corroborado, se

puede expresar de la siguiente manera:

Para la generación 2013:

Para la generación 2014:

INTERPRETACIÓN DE RESULTADOS • En estos dos avances se ha partido de la premisa de que un modelo estadístico

paramétrico se encuentra por medio del grado que determina el óptimo ajuste funcional polinomial, que dependen principalmente del nivel de confianza al 95% y de su vía asociada al percentil de la distribución de Student cuyos límites involucra qué para tamaños de muestras grandes, varía los resultados de la siguiente manera:

Para la generación 2013 su intervalo predictivo porcentual de su ecuación, se compara con el último valor obtenido en los datos del ajuste, es decir con el porcentaje de la generación 2012; por lo tanto, se menciona que para su límite inferior el valor se considera optimista a razón de que es proporcional y en su límite superior el valor es fatalista por que incrementa significativamente

Para la generación 2014 su intervalo predictivo porcentual de su ecuación se compara en los respectivos límites del intervalo obtenido en la ecuación de la generación 2013 por lo tanto, se menciona que para su límite inferior el valor aumenta sustancialmente y en su límite superior el valor es catastrófico porque sigue incrementando la deserción estudiantil.

• Esto refleja el error de muestreo de deserción estudiantil inherente al cálculo del error estándar de su dispersión generacional.

VIDEO DE EXPOSICIÓN DE SU SERVIDOR. • El link correspondiente se localiza en:https://www.youtube.com/watch?v=w0Xnhd9Etp4https://www.youtube.com/watch?v=w0Xnhd9Etp4

Gracias por su atención

top related