costos en ingenieríavicamswitch.mx/wp-content/uploads/2020/09/tema-3...por otro lado, pueden ser...
TRANSCRIPT
.
Costos en Ingeniería
Tema 3. Elementos del costo de producción
Universidad de Sonora
Departamento de Ingeniería Industrial
Profesor Alejandro Valenzuela
Las empresas tienen tres categorías o tipos de costos:
1) El costo de los materiales usados en la producción
2) El costo de la mano de obra que transforma los materiales y
3) Los costos indirectos de fabricación.
La tercera categoría, el de los costos indirectos, agrupan a todos aquellos costos que no entran
directamente en la producción y que provienen de las dos primeras categorías: es decir, de los
materiales y la mano de obra indirectos.
La verdadera dificultad de esta parte está en la asignación de los costos indirectos a los costos
totales.
1. Costeo de materiales
Los materiales constituyen un elemento esencial del costo de producción. Son los principales
recursos que se usan en la producción y que se transforman en bienes terminados, con la adición
de la mano de obra y los costos indirectos de fabricación.
Los materiales usados en la producción se pueden separar en directos e indirectos. Los materiales
directos son todos los que pueden identificarse en la fabricación de un producto terminado o
pueden ser fácilmente relacionados con el producto.
El costo de estos materiales directos es lo que se contabiliza en “costo de materiales”. Por
ejemplo, la madera que se utiliza en la fabricación de una mesa.
Hay materiales indirectos, que son aquellos que participan en la fabricación de un producto,
pero que no entran directamente. El costo de esos materiales se incluye en los costos indirectos
de fabricación. Por ejemplo, la madera que se usa para el embalaje de una la mesa para su envío,
es un costo indirecto.
Algunos materiales pueden ser utilizados en el proceso de producción, pero incluso así pueden
considerarse elementos indirectos porque no son suficientemente significativos desde el punto de
vista monetario, o porque no se les puede hacer un conveniente seguimiento.
Por otro lado, pueden ser utilizados en cantidades tan insustanciales para la fabricación de un
producto que no vale la pena hacerles seguimiento como materiales directos, lo cual implicaría
incluirlos en la lista de materiales. Material indirecto es aquel que se consume de forma indirecta
o suplementaria.
Por lo tanto, son consumidos como parte del proceso de producción, pero no están integrados en
cantidades sustanciales a un producto o trabajo. Se puede pensar en los materiales indirectos como
los recursos utilizados en el ensamblaje de los materiales directos para la fabricación de productos
terminados.
Este tipo de materiales:
– Suelen ser pequeños, económicos y se compran en grandes cantidades.
– No le agregan mucho valor al producto que se produce, aunque sí en el monto acumulado
– A diferencia de los materiales directos, los materiales indirectos son aquellos materiales que no
pueden ser identificados y asignados convenientemente al centro o unidad de costo.
– Generalmente, a los materiales indirectos no se les hace seguimiento a través de un sistema
formal de mantenimiento de registros de inventario.
La compra de materiales sigue un complicado proceso que debe seguirse para poder llevar un
control de lo que pasa en la planta. Ese proceso se presenta de manera resumida en la siguiente
imagen:
2. Costeo de mano de obra
La mano de obra, fuerza de trabajo o simplemente trabajo es el esfuerzo físico y mental
empleado en la fabricación de un producto. Recuérdese del curso de Economía, que los
trabajadores venden (ofrecen) a la empresa su fuerza de trabajo, y la empresa compra
(demanda) fuerza de trabajo a los trabajadores.
En consecuencia, si la oferta de trabajo es más grande que la demanda (si a los trabajadores se
les dificulta conseguir trabajo, si se les dificulta vender su fuerza de trabajo), el salario tenderá
a bajar. Desde luego, que ese mercado (el de trabajo) está regulado fuertemente por leyes
laborales que las empresas deben respetar.
La compensación que se paga a los trabajadores, o salario, representa el costo de la mano de
obra de fabricación. Los costos de la mano de obra pueden dividirse en directos e indirectos.
La mano de obra directa es la involucrada en, y puede ser asociada con facilidad con, la
fabricación de un producto terminado. Representa la parte más importante de los costos de la
mano de obra. El costo de la mano de obra directa y el costo de materiales directos, sumados
se conocen como costos primos o costos de conversión.
La mano de obra indirecta es el costo de aquella fuerza de trabajo que no se asocia
directamente a un producto. Para la producción, la mano de obra indirecta no representa un
costo relevante. En esta categoría entran, por ejemplo, los diseñadores, los supervisores, los
inspectores. El costo de la mano de obra indirecta se incluye en los costos indirectos de
fabricación.
El registro de la mano de obra debe realizarse a través de tarjetas o cualquier otro sistema
donde se consigne el número de horas trabajadas y la tasa salarial. En cálculo de la nómina se
debe tener presente que existen problemas fiscales y prestaciones que se deben considerar.
Además, se debe considerar que existen circunstancias de pagos excepcionales como las horas
extras.
3. Costos indirectos de fabricación
Para lograr un producto terminado, se deben hacer otros gastos que entran en los costos
indirectos de fabricación, como pagar salarios a las personas que no participan directamente
en la producción y muchos otros gastos relacionados.
Los costos indirectos se clasifican de acuerdo con sus componentes y de acuerdo con su
participación en el producto.
De acuerdo con sus componentes, se clasifican en materiales indirectos y mano de obra
indirecta. De acuerdo con su participación en el producto, se clasifican en variables, fijos,
semivariables y escalonados.
Costos indirectos de acuerdo con sus componentes:
a) Materiales indirectos:
Son aquellos que no se pueden identificar en el producto o no forma parte de él. Su costo es
difícil de cuantificar como, por ejemplo, pegamentos, lijas, combustibles, lubricantes, etc.
b) Mano de obra indirecta
Son los salarios de todo el personal que no participa direcamente en la transformación del
material en producto. También se incluyen aquí los pagos al personal directo cuando se les
paga sin que estén participando en la producción. Por ejemplo, cuando se descompone una
máquina o se escasea el material para seguir trabajando, y los operacios tienen que esperar a
que sea resuelto el problema.
c) Otros costos indirectos
En este renglón se incluyen costos relacionados directamente con la fábrica, como la
depreciación de activos fijos, seguros, pago de impuestos inmoviliarios, alquileres,
contabilidad, administración, comerdor, médico, vigilancia, pérdidas por materiales
defectuosos, reparaciones, etc.
Costos indiretos con respecto a su comportamiento en la producción:
Considrando un periodo de tiempo y un nivel de actidad, los costos indirectos se clasifican
en variables, fijos y mixtos.
a) Rango relevante
El rango relevante (o periodo relevante) es el intervalo de actividad dentro del cual los costos
fijos totales y los costos variables por unidad permanecen constantes.
En el mismo sentido, en el rango relevante, los CIF fijos por unidad y variables totales varían
con el nive de producto.
Las relaciones anteriores se pueden visualizar en el siguiente esquema:
b) CIF variables
De acuerdo con la definición de rango relevante, los CIF variables totales varían en
proporción directa al nivel de producto, aunque CIF variables unitarios permanecen
constantes.
Son ejemplo de CIF variables los materiales indirectos, algunas partidas de mano de obra
indirecta, reparaciones, pérdidas de inventarios, etc.
EN EL
RANGO RELEVANTE
CIF Variables
TOTAL:
cambia con el producto
UNITARIO: permanece
constante con el producto
CIF Fijos
TOTAL:
permanece constante
UNITARIOS:
Varían con el producto
c) CIF Fijos
El monto total de estos costos fijos no cambia con el nivel de producción, pero, de acuerdo
con la definición del rango relevante, los costos fijos medios (o unitarios) varian de menera
inversamente proporcional al cambio del producto.
Son ejemplo de estos los impuestos a la propiedad inmoviliaria (el impuesto predial), la
depreciación en línea recta, la renta, algunos seguros y algunos salarios.
Estos costos indirectos fijos se clasifican en discrecionales y comprometidos.
Discrecionales: pueden ser modificados durante el periodo. No son variables porque no
dependen del nivel de producción sino de la voluntad de quen toma las decisiones.
Comprometidos: Son los que no pueden ser modificados durante el periodo. El ejemplo más
claro de ellos es la depreciación.
A diferencia de los CIF variables (que pueden ser controlados a nivel de departamento), los
CIF fijos en su mayoría no se pueden cambiar, aunque la parte variable sólo puede hacerse en
el todo de la empresa, es deci, en los niveles de gerencia general.
d) CIF Mixtos
Tienen características tanto de los fijos como variables. Por razones de planeación y control,
estos costos deben ser separados en sus componentes.
En este renglón, los hay semivariables y escalonados.
Costos semivariables. En este costo hay una parte fija, que podría ser el derecho de usar un
equipo, y una parte variable que puede ser resultado de la intensidad de uso. Ejemplos de ellos
son el servicio telefónico (hasta cierto número de llamadas hay un costo, y este aumenta con
el uso) y el arrendamiento de camones (para un determinado kilometraje hay un costo y sube
si se sobrepasa ese límite).
Costos escalonados. La parte fija cambia abruptamente en los diferentes niveles. Un
ejemplo es el siguiente. Suponga que se pagan salarios por un grupo de personas ontratadas,
pero se tiene que contratar a un supervisor por cada 10 trabajadores. El costo del agua
entubada podría también ser este caso si los metros cúbicos de agua sucesivos tuvieran
precios diferentes.
4. Cálculo de CIF
Asignar los costos indirectos puede ser una tarea difícil y nunca precisa.
Los CIF:
No son uniformes
Se deben calcular
Su cálculo se basa en diversos métodos
Son imprescindibles para obtener el CMe por unidad de producto.Los métodos para calcular
los CIF se refieren tanto a la estimación de esos costos (el numerador), como a los cálculos
de la base de aplicación, es decir, la cantidad de referencia contra la que se va a comparar el
monto total de CIF.
Una vez estimada la base de aplicación para la tasa de asignacion de los CIF, entonces se
deben estimar los CIF (es decir el numerador). Para ello se deben realizar las siguientes
actividades.
1) Cuando se tengan CIF mixtos, separar los costos fijos de los variables.
2) Preparar el presupuesto de CIF Fijos
3) Preparar el presupuesto de CIF Variables
4) Obtener los CIF Totales sumando los fijos y los variables.
NO SIEMPRE ES TAN SENSILLO SEPARAR LOS COSTOS INDIRECTOS DE LOS
DEMÁS. La empresa siempre debe hacer un cálculo de los CIF y luego separar los CIF
variables de los fijos. Esta es una dificultad que se puede afrontar con los siguientes
métodos:
Debido a que los CIF no se asocian fácilmente al producto, se diseño una variante del costeo
histórico (o real) que se llama costeo normal, y que consiste en la aplicación de los costos
indirectos con base en producciones reales multiplicando por es produción por una tasa
predeterminada de costos indirectos.
Esa tasa es pertinente porque los CIF no se aplican uniformemente al producto, pero al final
es necesario determinar un costo unitario al producto para que sea comparado con los precios
que determina el mercado.
Una manera de hacer esa asignación es determinando una tasa de asignación de CIF. Las
razones para establecer esa tasa son los siguientes: 1) Los CIF no son uniformes; 2) Al final
se requiere de un costo unitario para determinar el costo medio total y porder compararlo con
el precio.
Hay muchos maneras de construir esa tasa, pero en general sigue la siguiente fórmula:
𝑇𝐶𝐼𝐹 =𝐶𝐼𝐹 𝑃𝑟𝑒𝑠𝑢𝑝𝑢𝑒𝑠𝑡𝑎𝑑𝑜𝑠
𝐵𝑎𝑠𝑒 𝑑𝑒 𝐴𝑝𝑙𝑖𝑐𝑎𝑐𝑖ó𝑛
Para determinar las cantidades se suele usar la clasificación referente al momento en que se
contabilizan. Así, se tienen los costos históricos (o reales) y los predeterminados.
Los costos históricos se registran paralelamente a la fabricación del producto, y una vez
concluido se contabiliza la parte alícuota o unitaria.
Los costos predeterminados se calculan en forma unitaria antes de que empiece la
fabricación del producto. En este caso se realiza una estimación de los costos indirectos para
ser asignados al producto.
La base de aplicación puede ser la producción total o cualquier otro elemento del que se
tenga pleno control. El siguiente ejemplo se basa en la Mano de Obra Directa (MOD). El
procedimiento es:
Se hace un presupuesto de costos indirectos con base en la experiencia.. Como bien
se sabe, un presupuesto es una actividad ex ante de la producción.
Se toma el registro de mano de obra, que ceteris paribus es más o menos estable.
Se obtiene la tasa de aplicación
Véase el siguiente ejemplo:
PRESUPUESTO DE CIF
Materiales indirectos 300,000
Mano de obra indirecta 450,000
Renta 600,000
Depreciación 225,000
Luz y agua 150,000
Reparaciones 75,000
TOTAL $1,800,000
La empresa produce 300,000 unidades de producto y cada una de ellas requiere de 4 horas de
mano de obra directa. Por tanto, la empresa utiliza 1,200,000 horas de MOD.
Aplicando la fórmula:
𝑇𝐶𝐼𝐹 =1,800,000
1,200,000= $1.5 𝑝𝑜𝑟 ℎ𝑜𝑟𝑎
Por tanto, cada unidad de producto contene $6.00 de CIF
Esta es una estimación, y por tanto de debe de ajustar periódicamente ya que se aplica una
tasa que se refiere a los resultados de un periodo anterior y en una estimación de los CIF.
La producción también puede ser usada como base de plicación (en el denominador). Sin
embargo, es necesario tener en cuenta que se trata del nivel de producción estimado de la
empresa. Esa estimación tiene como límite la capacidad de producción de la empresa, lo cual
requiere de algunas consderaciones.
Capacidad productiva teórica o ideal. Es el máximo rendimiento de la empresa, sin
considerar factores contingentes que puedan suceder, los que (sisndo que sí ocurren)
la hacen inalcansable.
Capacidad productiva práctica o realista. Es la máxima producción alcanzable
teniendo en cuenta esos factores contingentes. No tiene en cuenta, sin embargo, la
falta de ventas de los productos. Esta oscila alrededor de la producción potencial.
Capacidad productiva normal o de largo plazo. Considera la capacidad de la
demanda a largo plazo de los clientes. Suele oscilar alrededor de la capacidad realista.
Capacidad productiva esperada o de corto plazo. Se basa en la estimación del
producto para el siguiente periodo. Oscila en torno a la normal (LP) y a la larga
coinciden ambas.
Dos consideraciones se debe tener en cuenta en relación a la capacidad productiva.
Capacidad en exceso. Es la capacidad productiva no utilizada porque excede la
demanda de largo plazo de la empresa. Su existencia genera costos y debe
buscársele un uso alternativo.
Capacidad ociosa. Es la capacidad normal no usada en un determinado periodo
por fluctuaciones en la demanda.Genera un stock no esperado de inventarios, pero
son costos inevitables.
5. Métodos de separación de CIF fijos y variables
En esta sección se verán tres métodos para hacer tal asignación. El primero es llamado punto
alto-punto bajo; el segundo, el del diagrama de dispersión y, tercero, el método de regresión.
El procedimiento es el siguiente. La empresa hace un cálculo, un pronóstico de los CIF
totales y por uno de los métidos anteriores, se dividen los fijos de los variables. El
procedimieto se realiza por medio de la extrapolación de los costos totales.
a) Diagrama de dispersión
El diagrama de dispersión es una herramienta visual que sugiere la distribución de los costos
indirectos de fabricación de acuerdo a un patrón o la ausencia de él.
El diagrama es la graficación de los costo indirectos (eje vertiocal) y el nivel de producción
(eje horizontal). Cada par ordenado (Q, Y), genera un punto sobre el plano. Una vez que se
tiene la nube de punrtos, se traza una recta que ofrezca el mejor ajuste. Esa recta cruzará en
algún punto en el eje de las Y, lo que determinará la cantidad de CIF Fijos. La pendiente de la
línea proporcionará la proporción de costos variables por unidad de Q.
Suponga los siguientes datos en los que hay un solo costo indirecto (los de supervisión) y se
relaciona con el número de horas de mano de obra directa.
Los resultados son los siguientes:
Una de las principales desventajas del método de gráficas de dispersión es que depende de la
capacidad de quien la utilice para trazar la línea recta que representa la relación costo-volumen.
Esta desventaja se puede obviar ajustando matemáticamente la línea recta a través de cada par
de observaciones de costo y volumen, lo que se presenta en la siguiente sección sobre regresión
lineal.
b) Punto alto-punto bajo
Para saber los componentes fijos y variables de los CIF, se puede usar este método para
separarlos en los costos totales. Se trata de estimar una línea recta seleccionando dos puntos.
El intercepto en el eje vertical de la recta es la parte fija de los CT, y la pendiente es la tasa
variable del costo. Se procede así:
Seleccionar un nivel de actividad alto y otro bajo y obtener su diferencia (alto-bajo).
∆𝑄 = 𝑄2 − 𝑄1
Obtener el costo para cada nivel de actividad y calcular su diferencia (costo nivel
alto-costo nivel bajo).
∆𝐶𝑇 = 𝐶𝑇2 − 𝐶𝑇1
Dividir la diferencia de costos entre la diferencia de productos y obtener la tasa de
costo variable (la pendiente)
𝑇𝐶𝑉 =∆𝐶𝑇
∆𝑄
Calcular con esa tasa, el costo variable y restarlo al costo total para obtener el costo
fijo.
𝐶𝐹 = 𝐶𝑇 − 𝑇𝐶𝑉 ∗ 𝑄2
EJEMPLO. Suponga que una empresa tiene registro de producción y costos por seis meses.
MesProducción
(Q)
Costos
totales
1 4900 21030
2 4700 20330
3 4850 20840
4 5000 21350
5 4950 21180
6 5200 22030
Con el sombreado se han detectado los meses con menor y mayor producción
∆𝑄 = 5200 − 4700 = 500
∆𝐶𝑇 = 22030 − 21330 = 1700
𝑇𝐶𝑉 =1700
500= 3.4 pesos por unidad de producto
𝐶𝐹 = 22030 − 3.4 ∗ 5200 = 4350
CT CV
4350 CF
Q
Eso significa que del total de costos ($22,030), $17680 son variables y $4,350 son fijos. Es
decir, una proporción de 0.8025 son variables y de 0.1975 son fijos.
Una vez que se tienen las proporciones fijo-variable, se aplica al presupusto de CIF y se
calcula (extrapolando) la parte fija de la variable.
Suponga que el el sexto mes el presupuesto de CIF es de $5,000. Entonces, se estima que
$4012 son CIF Variables y el resto, $987.50 son CIF Fijos.
c) Método de regresión
Suponga que una variable Y depende de otra variable X [y=f(X)] y que se tienen los
siguientes datos de cada variable:
Y X
25 10
35 15
31 13
37 16
29 12
31.4 13.2
La relación estrucutral (lineal) entre esas variables es: Y=5+2X
Supongamos ahora que los datos son:
Y X
27 10
33 15
33 13
35 16
27 12
31.00 13.2
La relación estructural sigue siendo la misma, pero hay un término de error porque el
pronóstico no es exacto (no es determinístico, sino probabilístico): Y=5+2X+ei.
El modelo de regresión es probabilístico porque a la parte deterministica se le añade un elemnto
de error que capta la diferencia entre la parte real y la parte pronosticada. La idea es que el
modelo debe ajutarse a los datos lo mejor que se pueda, lo que implica diminuir el peso de los
errores. Hacer que el error sea cero es imposible, pero sí es posible minimizarlo.
El modelo calcula un conjunto de parámetros que hacen que la ecuación de regresión exprese
de la mejor manera posible el comportanmiento de la variable dependiente dados los datos de
las variables independientes.
Supongamos que Y depende de un conjunto de X de forma lineal tal como se muestra
enseguida:
𝑌𝑖 = 𝛽0 + 𝛽1𝑋1 + 𝛽2𝑋2 + 𝛽3𝑋3+ ⋯ + 𝛽𝑛𝑋𝑛 + 𝑢𝑖
Aquí, βi son los verdaderos parámetros y u es el error verdadero (un error que proviene
del hecho de que es imposible meter todas las variables que explican algo o porque las elegidas
no son las pertinentes). Como en cuerpos grandes de información (o cuando es imposible
medir a toda la población) es muy difícil o imposible saber los valores verdaderos, lo que se
suele hacer es tomar una muestra y hacer una estimación:
𝑌𝑖 = 𝑏0 + 𝑏1𝑋1 + 𝑏2𝑋2 + 𝑏3𝑋3+ ⋯ + 𝑏𝑛𝑋𝑛 + 𝑒𝑖
En esta última, los parámetros b y e son estimadores de los verdaderos (y desconocidos)
parámetros β y u. Si alguno de los parámetros (β o b) resulta que en realidad es cero, entonces
la variable asociada no aporta ninguna explicación sobre Y.
Para simplifiar, supongamos una línea recta que muestre la relación lineal entre dos variables
(por ejemplo, costo y producción). La ecuación “verdadera” (la poblacional) sería:
𝒀𝒊 = 𝜶 + 𝜷𝑿𝒊 + 𝒖𝒊
Al tomar una muestra se tiene la estimación proporcionada por la ecuación muestral:
𝒀𝒊 = 𝒂 + 𝒃𝑿𝒊 + 𝒆𝒊
Como el cálculo de a y b tiene como objetivo la minimización de e, entonces nos centraremos
en esta parte. Para hacer eso:
Primero, separemos la parte determinística de la ecuación anterior, que está dada por la parte
𝑎 + 𝑏𝑋𝑖 a la que se le llama la Y estimada o �̂�. Así, la última ecuación se puede reescribir
como:
𝒀𝒊 = �̂�𝒊 + 𝒆𝒊
De aquí queda claro que los errors son la diferencia entre los datos reales y los estimados:
𝒆𝒊 = 𝒀𝒊 − �̂�𝒊
Pero lo que realmente interesa no es cada error en particular, sino todos los errores
simultáneamente. Para ello, se deben agregar, es decir, sumar:
∑ 𝑒𝑖 = ∑ 𝑌𝑖 − ∑ 𝑌�̂�
Esta expresión tiene un problema: que la suma de errores bajo distribución normal
siempre da cero. Entonces, si siempre da cero, entonces es irrelevante obener los
estimadores a y b (conlo que se calcula �̂�) que minimicen los errores.
Esto insunua que independientemente de que los errores fueran muy grandes o muy chicos,
siempre son cero. Para evitar ese problema, la expresión anterior se eleva al cuadrado. Es
decir, se toman las sumas al cuadrado:
∑ 𝑒𝑖2 = ∑ 𝑌𝑖
2 − ∑ 𝑌�̂�2
Cada una de estas expresiones tiene un nombre específico:
∑ 𝑌𝑖2 = Suma de Cuadrados Totales (SCT)
∑ �̂�𝑖2 = Suma de Cuadrados Explicados (SCE)
∑ 𝑒𝑖2 = Suma de Cuadrados de los Errores o Residuales (SCR)
La versión extensa de la ecuación anterior es:
∑ 𝑒𝑖2 = ∑(𝑌𝑖 − 𝑎 − 𝑏𝑋𝑖)
2
Esta es la ecuación objetivo. Para obtener los parámetros a y b que minimicen los errores,
se debe derivar la expresión con respecto a los parámetros e igualar a cero esas derivadas.
Si se tiene una función con dos parámetros, la ecuación que proporciona a, la constante, es
(derivando la ecuación objetivo respecto al parámetro a):
𝒂 = �̅� − 𝒃�̅�
ANEXO 1. Obtención de a PROCEDIMIENTO
Se deriva la función objetivo
respecto al parámetro a y se iguala a
cero.
𝝏 ∑ 𝒆𝒊𝟐
𝝏𝒃𝟎= 𝟐 ∑(𝒀𝒊 − 𝒂 − 𝒃𝑿𝒊 )(−𝟏) = 𝟎
Se organiza por partes −𝟐 ∑ 𝒀𝒊 + 𝟐 ∑ 𝒂 + 𝟐𝒃 ∑ 𝑿𝒊 = 𝟎
Se eliman el 2 porque está en toda la
expresión y se supone que ∑a = na. − ∑ 𝒀𝒊 + 𝒏𝒂 + 𝒃 ∑ 𝑿𝒊 = 𝟎
Se divide todo entre n y se despeja a 𝒂 =
∑ 𝒀𝒊
𝒏− 𝒃
∑ 𝑿𝒊
𝒏
La expresión final es: 𝒂 = �̅� − 𝒃�̅�
La ecuación del parámetro de la pendiente (derivando la ecuación objetivo respecto al
parámetro b) es:
𝒃 =∑ 𝒚𝒊𝒙𝒊
∑ 𝒙𝒊𝟐
ANEXO 2. Obtención de b PROCEDIMIENTO
Se deriva la función objetivo
respecto al parámetro b y se iguala a
cero.
𝝏 ∑ 𝒆𝒊𝟐
𝝏𝒃= 𝟐 ∑(𝒀𝒊 − 𝒂 − 𝒃𝑿𝒊 )(−𝑿𝒊) = 𝟎
Se organiza por partes − ∑ 𝒀𝒊𝑿𝒊 + 𝒂 ∑ 𝑿𝒊 + 𝒃 ∑ 𝑿𝒊𝟐 = 𝟎
Se sustituye la expresión obtenida
del parámetro a − ∑ 𝒀𝒊𝑿𝒊 + (�̅� − 𝒃�̅�) ∑ 𝑿𝒊 + 𝒃 ∑ 𝑿𝒊
𝟐 = 𝟎
Se reorganiza de nuevo − ∑ 𝒀𝒊𝑿𝒊 + �̅� ∑ 𝑿𝒊 − 𝒃𝑿𝒊̅̅ ̅ ∑ 𝑿𝒊 + 𝒃 ∑ 𝑿𝒊
𝟐 = 𝟎
Se separan los elementos que tienen
b de los que no lo tienen. ∑ 𝒀𝒊𝑿𝒊 − �̅� ∑ 𝑿𝒊 = 𝒃 (∑ 𝑿𝒊
𝟐 − 𝑿𝒊̅̅ ̅ ∑ 𝑿𝒊)
Se toman elementos equivalentes de
Y �̅� =
∑ 𝒀𝒊
𝒏 ∑ 𝒀𝒊 = 𝒏�̅�
Se toman elementos equivalentes de
X �̅� =
∑ 𝑿𝒊
𝒏 ∑ 𝑿𝒊 = 𝒏�̅�
Se sustituyen los elementos
equivalentes ∑ 𝒀𝒊𝑿𝒊 − 𝒏�̅��̅� = 𝒃 (∑ 𝑿𝒊
𝟐 − 𝒏�̅�𝟐)
Se simplificausando el hecho de que
n asociada a los parámetros puede
ser sustituida por ∑.
𝒃 =∑(𝒀𝒊𝑿𝒊 − �̅��̅�)
∑(𝑿𝒊𝟐 − �̅�𝟐)
Se simplifica de nuevo tomando los
elementos comunes 𝒃 =∑(𝒀𝒊 − �̅�)(𝑿𝒊 − �̅�)
∑(𝑿𝒊 − �̅�)𝟐
Se toma el hecho de que los
elementos entre paréntesis son
desviaciones de la medio.
𝒃 =∑ 𝒚𝒊𝒙𝒊
∑ 𝒙𝒊𝟐
EJEMPLO
Suponga que C= a+bQ; que se tienen datos de C y Q y se deben obtener los estimadores de
los parámetros a y b.
C Q c q cq q2
28 10 -5.70 -1.70 9.69 2.89
31 9 -2.70 -2.70 7.29 7.29
35 13 1.30 1.30 1.69 1.69
31 9 -2.70 -2.70 7.29 7.29
31 11 -2.70 -0.70 1.89 0.49
39 14 5.30 2.30 12.19 5.29
39 16 5.30 4.30 22.79 18.49
28 8 -5.70 -3.70 21.09 13.69
33 12 -0.70 0.30 -0.21 0.09
42 15 8.30 3.30 27.39 10.89
33.7 11.7 111.1 68.1
Siguiendo las fórmulas:
𝒃 =∑ 𝒚𝒊𝒙𝒊
∑ 𝒙𝒊𝟐 =
𝟏𝟏𝟏.𝟏
𝟔𝟖.𝟏
b= 1.63
𝒂 = �̅� − 𝒃�̅� = 𝟑𝟑. 𝟕 − (𝟏. 𝟔𝟑)(𝟏𝟏. 𝟕)
a= 14.61
Por tanto, la función de regresiónes:
𝑪 = 𝟏𝟒. 𝟔𝟏 + 𝟏. 𝟔𝟑(𝑸) + 𝒆𝒊
En esta ecuación, la parte estimada o C estimada (Ĉ)está dada por:
�̂� = 𝟏𝟒. 𝟔𝟏 + 𝟏. 𝟔𝟑(𝑸)
Como las pruebas de hipótesis de los parámetros estimados requiere de la desviación
estándar, es necesario estimar primero las varianzas, cuyas fórmulas son:
Varianza de a Varianza de b Varianza del modelo
𝑉𝑎𝑟(𝑎) =∑ 𝑋𝑖
2
𝑛 ∑ 𝑥𝑖2 𝜎2 𝑉𝑎𝑟(𝑏) =
𝜎2
∑ 𝑥𝑖2 𝜎2 =
∑ 𝑒𝑖2
𝑛 − 𝑘
La raíz cuadrada de ellas proporciona la desviación estándar.
Para estimar las varianzas, se obtienen los dartos necesarios, los que se muestran en el
siguiente cuadro:
C Q e2 Q2
28 10 31 8.56 100
31 9 29 2.91 81
35 13 36 0.67 169
31 9 29 2.91 81
31 11 33 2.43 121
39 14 37 2.40 196
39 16 41 2.94 256
28 8 28 0.11 64
33 12 34 1.41 144
42 15 39 8.50 225
33.7 11.7 32.85 1437
Se obtiene primero la varianza del modelo:
𝜎2 =∑ 𝑒𝑖
2
𝑛−𝑘=
32.85
8
𝝈𝟐 = 𝟒. 𝟏𝟎𝟔
Con esto, se obtienen las varianzas de los parámetros:
𝑉𝑎𝑟(𝑎) =∑ 𝑄𝑖
2
𝑛 ∑ 𝑞𝑖2 =
1437
(10)(68.1)
𝑽𝒂𝒓(𝒂) = 𝟐. 𝟏𝟏
𝑉𝑎𝑟(𝑏) =𝜎2
∑ 𝑞𝑖2 =
4.106
68.1
𝑽𝒂𝒓(𝒃) = 𝟎. 𝟎𝟔
Interpretación de los resultados
Para interpretar un modelo, uno se tiene que hacer tres prefuntas: Una, ¿qué tanto explica el
modelo?; dos, ¿qué tan bien explica lo que explica? Y tres, ¿todos las variables introdicidas
son pertintes, es decir, si todos los parámetros son estadísticamente significativos?
PRIMERA PREGUNTA: ¿Qué tanto explica el modelo?
La parte explocada está dada por un coeficiente que va de cero a uno llamado coeficiente de
determinación R2 dado por las sumas de cuadrados expresadas en desviaciones de la media.
𝑹𝟐 =𝑺𝑪𝑬
𝑺𝑪𝑻 𝑹𝟐 =
∑ �̂�𝒊𝟐
∑ 𝒚𝒊𝟐 𝑹𝟐 = 𝟏 −
∑ 𝒆𝒊𝟐
∑ 𝒚𝒊𝟐
Es decir, R2 es la proporción que la parte explicada ocupa en el total que queremos explicar.
Para modelos de series de tiempo se espera que el R2 sea muy alto, cercano a uno porque
entonces el modelo explica más el problema. En cambio, para modelos de corte transversal,
no importa el tamaño porque lo que se busca es calcular qué tanta explicación al problema
aporta el modelo propuesto.
Siguiendo con el ejemplo:
C Q c2 ĉ2 e2
28 10 32.49 7.69186648 8.56
31 9 7.29 19.4026667 2.91
35 13 1.69 4.49801189 0.67
31 9 7.29 19.4026667 2.91
31 11 7.29 1.30415729 2.43
39 14 28.09 14.0795757 2.40
39 16 28.09 49.2119762 2.94
28 8 32.49 36.4365578 0.11
33 12 0.49 0.23953909 1.41
42 15 68.89 28.9842304 8.50
33.7 11.7 214.1 181.251248 32.85
𝑹𝟐 =∑ �̂�𝒊
𝟐
∑ 𝒄𝒊𝟐 =
𝟏𝟖𝟏.𝟐𝟓
𝟐𝟏𝟒.𝟏 o también 𝑹𝟐 = 𝟏 −
∑ 𝒆𝒊𝟐
∑ 𝒄𝒊𝟐 = 𝟏 −
𝟑𝟐.𝟖𝟓
𝟐𝟏𝟒.𝟏
En ambos casos, el resultado es: 𝑹𝟐 = 𝟎. 𝟖𝟒𝟔𝟔
Es decir, que como es una serie de tiempo, el modelo esplica bastante bien el problema
(aporta un 84.66% a la explicación del comportamiento de C).
SEGUNDA PREGUNTA: ¿Todos los parámetros son estadísticamente significativos?
Si el coeficiente de una variable es cero, entonces esa variable no aporta ninguna explicación
a Y. Por ejemplo, si en la ecuación 𝒀 = 𝒂 + 𝒃𝑿, resultara que b=0, entonces X no aporta
ninguna explicación delcomportamiento de Y. Si resulta que a=0, entonces la línea de parte
del origen.
Como a y b son estimadores obtenidos a partir de una muestra, su validación debe ser
probabilística, es decir, probar que su valor es significativo, es decir, que es estadísticamente
diferente de cero.
Como un estimador muestral que proviene de una poblacion que se distribuye de manera
normal, se distribuye como t de student, entonces se puede construir un intervalo de confianza
que con un cierto nivel de significancia descarte que el cero esté contenido en el intervalo. Si
no puede descartarlo, entonces el parámetro no es estadísticamente diferente de cero.
ANEXO 3. Intervalo de confianza PROCEDIMIENTO
Validación de b en la recta Y=a+bX. H0: β=0 o H1: β≠0
Encontrar los valores A y B de un
intervalo para β (el verdadero
parámentro) que no contenga a cero
para un determinado nivel de
P(A≤ β ≤ B)=1-α
significanciza estadística, α, pero que sí
contenga a b (el estimador)
Los límites del intervalo los
proporciona el estadístico de la
distribución t de student (β es el
verdadero parámetro, desconocido,
estimado por b)
𝒕 =𝒃 − 𝜷
𝑺𝒃
En realidad, la distribución t de student
es una prueba bilateral: el “error” se
distribuye en las dos colas. Si el error
es α, a cada lado le corresponde α/2
−𝒕𝜶/𝟐 ≤𝒃 − 𝜷
𝑺𝒃≤ 𝒕𝜶/𝟐
Se despeja el verdadero parámetro: β −𝒃𝒊 − 𝒕𝜶 𝟐⁄ (𝑺𝒃) ≤ −𝜷 ≤ −𝒃+𝒕𝜶 𝟐⁄ (𝑺𝒃)
Voltenado los signos e intercambiando
los límites 𝑏 − 𝑡𝛼 2⁄ (𝑆𝑏) ≤ 𝛽 ≤ 𝑏+𝑡𝛼 2⁄ (𝑆𝑏)
El límite inferior del intervalo, A, es: 𝑏 − 𝑡𝛼 2⁄ (𝑆𝑏)
El límite superior del intervalo, B, es: 𝑏+𝑡𝛼 2⁄ (𝑆𝑏)
La probailidad de que un parámetro
caiga en un cierto intervalo que no
incluya al cero es
P[𝒃 − 𝒕𝜶 𝟐⁄ (𝑺𝒃) ≤ 𝜷 ≤ 𝒃+𝒕𝜶 𝟐⁄ (𝑺𝒃)] = 𝟏 − 𝜶
Siguiendo con el ejemplo:
Se obtienen las desviaciones estár de los parámetros a partir de la raíz cuadrada de las varianza:
Sa= 1.4525
Sb= 0.245
Para 10 observaciones, 2 parámetros y un nivel de significancia de 0.05 (es decir, de 0.025
para cada lado de la distribución):
Valor de t crítica (de tablas)= 2.306
El intervalo de confianza es de β es:
P[1.63 –2.06(0.245) ≤ β ≤ 1.63+2.06(0.245)]=0.95
Es decir:
P[1.035 ≤ β ≤ 2.195]=0.95
Primera conclusión, como el intervalo no incluye al cero, se puede rechazar la hipótesis nula
(el parámetro es estadísticamente diferente de cero) con un 95% de probabilidad.
Segunda conclusión, como el parámetro estimado (1.63) cae dentro del intervalo, se puede
decir que con un 95% de probabilidad b es un buen estimador de β.
Para evitar el procedimiento del intervalo de confianza, se puede usar una regla de dedo: si el
tamaño de muestra es mayor que 7 y el nivel de significancia de 0.05 (véase las tablas de t de
student), y bajo la hipótesis nula de que el verdadero parámetro es cero (H0: β=0), se puede
rechazar la hipótesis nula si el valor de la t de student es igual o mayor que 2, lo que significa
que el el valor del parámetro es por lo menos 2 veces la desviación estándar.
El estadístico t está dado por:
𝑡 =𝑎−𝛼
𝑆𝑎
(Desde luego que esta ecuación vale para obtener la t calculada de cualquier parámetro).
Como la hipótesis nula es H0:α=0, entonces la expresión se transforma así:
𝑡 =𝑎
𝑆𝑎
Sustituyendo:
𝑡 =14.61
1.4525= 10.058
Como el estadístico t del parámetro a es mayor que 2 (en particular, es de 10.058), se asume
que se rechaza la hipótesis nula, es decir, que a es estadísticamente diferente de cero.
TERCERA PREGUNTA: ¿Qué tan bien explica el modelo el problema planteado?
Lo que se busca saber es si el modelo no es simultáneamente cero, es decir, si las variables
independientes no son una combinación lineal, lo que se prueba a través de los parámetros
porque son éstos los que indican si una variable independiente influye o no en la variable
dependiente.
Se busca probar las siguientes hipótesis:
H0: ß1 = ß2 =... = ßk = 0
H1: ß1 = ß2 =... = ßk 0
La valoración se hace utilizando la tabla de análisis de varianza (o ANOVA). Las sumas de
cuadrados se dividen entre sus respectivos grados de libertad para obtener las medias
cuadradas (MCE y MCR). El parámetro resultante es la distribución F de Fischer.
MODELO SC GL MC F SIGN
VARIACIÓN
DEBIDA A LA
REGRESIÓNSCE k-1
1-a
VARIACIÓN
DEBIDA A
RESIDUALES SCR n-k
TOTAL SCT n-1
1-
k
SCEMCE
kn
SCRMCR
-
MCR
MCEF
La regla de decición se puede separar es dos versiones:
Versión 1 de la regla. Con los grados de libertad del numerador y los del denominador, se
calcula el valor de la F (Fc) y se obtiene el valor de la F crítica (en tablas yendo sobre el primer
renglónpara los grados de libertad del numerador y sobre la primera columna para los grados
de libertad del denominador) para α=0.05 (Fk, k-1). Si Fc>Fk-1, n-k se puede rechazar la H0 (las
variables introducidas no son una combinación lineal y la explicación aportada por el modelo
es estadísticamente buena.
Versión 2 de la regla. Como una regla de dedo de la anterior, si F calculada es igual o mayor
a 4, puede rechazar la hipótesis nula. Esto querría decir que la las medias explicadas por el
modelo son al menos 4 veces más que las medias de los errores.
De acuerdo con el ejemplo:
MODELO SC gl MC F Sign
Regresión 181.3 1 181.3 44.1 95%
Residuos 32.8 8 4.1
Total 214.1 9.0
Como Fc= 44.1 > 4, se rechaza la hipótsis nula y las variables introducidas en el modelo
aportan en conjunto una buena explicación del problema.
Tres supuestos son cruciales
PRIMERO, el modelo debe ser homocedástico, varianza constante. Si no, es
heteroscedástico.
𝑉𝑎𝑟(𝑢𝑖|𝑋𝑖) = 𝜎2
SEGUNDO, la covarianza de los errores debe ser cero, es decir, los errores deben ser
independientes entre observaciones. Si no, tiene autocorrelación.
E(ei, ej) = 0
TERCERO, la covarianza entre variables independientes debe ser cero, es decir, deben ser
independientes una de otra. Si no, tiene multicolinealidad.
Cov(Xi, Xj) =0
La consecuencia de la violación de los supuestos anteriores es que las varianzas resultantes
son muy grandes. Eso ocasiona que los intervalos de confianza sean muy amplios y que
siempre se esté rechazando la hipótesis nula. Esto significa tomar como bueno un parámetro
que en realidad no lo es.
EJEMPLO CON CIF
Supongamos que en una empresa se tiene la ecuación de costos que hemos calculado y que
se producen 100 unidades de producto. Suponga, además, que los CIF = $80. ¿Cuánto de
ellos es fijo y cuánto es variable?
C=14.1+1.63(100)
C=177.1
De ellos, CF = 14.1 y CV = 163.1
Las proporciones respectivas
𝑃𝐶𝑉 =163.1
177.1= 0.9209
𝑃𝐶𝐹 = 1 − 𝑃𝐶𝑉 = 1 − 0.9209 = 0.0791
Como CIF= 80
CIF-V= (80)(0.9209)=73.672
CIF-F= (80)(0.0791) = 6.328