xlix congreso nacional del valuacion veracruz 2013 · ... tales como el software ... que los bienes...

54
PONENCIA XLIX CONGRESO NACIONAL DEL VALUACION VERACRUZ 2013 PRESENTADA POR: MTRO. EN VAL. ING. JAVIER FURLONG SALGADO COLEGIO DE VALUADORES DEL ESTADO DE PUEBLA, A.C. TEMA APLICACIÓN DE METODOS ESTADISTICOS EN LA VALUACION DE MAQUINARIA Y EQUIPO

Upload: nguyenthien

Post on 20-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

PONENCIA

XLIX CONGRESO NACIONAL DEL VALUACION VERACRUZ 2013

PRESENTADA POR:

MTRO. EN VAL. ING. JAVIER FURLONG SALGADO

COLEGIO DE VALUADORES DEL ESTADO DE PUEBLA, A.C.

TEMA

APLICACIÓN DE METODOS ESTADISTICOS EN LA VALUACION DE

MAQUINARIA Y EQUIPO

INDICE

Resumen------------------------------------------------------------- 3

Introducción----------------------------- ---------------------------- 5

1. Aspectos generales ------------------------------------------- 6

1.1 Definición de conceptos------------------------------- 6

1.2 Enfoques de valuación inmobiliaria ------------------ 10

1.3 Enfoque de mercado------------------------------------ 10

2. Principios de Estadística------------------------------------- 13

2.1 Conceptos básicos------------------------ -------------- 14

2.2 Recolección de datos ----------------------------------- 16

2.3 Organización de datos----------------------------------- 20

2.4 Análisis de datos …..----------------------------------- 23

2.5 Tamaño de la muestra ----------------------------------- 29

2.6 Regresión y Correlación -------------------------------- 36

3. Aplicación del método ----------------------------------------- 49

CONCLUSIONES

BIBLIOGRAFIA

RESUMEN

La estadística está presente en casi todos los aspectos de la vida moderna, la

utilizan los políticos para conocer las preferencias del electorado, los ingenieros para llevar

el control de calidad en una línea de producción, los economistas para ver el rumbo de la

economía de un país, los científicos para estimar resultados de un experimento. En

cualquiera de los ejemplos anteriores, alguien quiere conocer una característica de algo. En

la mayoría de los casos éstas características que queremos conocer no se pueden

examinar en su totalidad porque su número es muy grande y verificarlas una por una, sería

muy tardado y costoso; lo que se hace es tomar una parte de ese total, examinarla, sacar

conclusiones de la parte examinada y extender esas conclusiones hacia el total no

examinado. Esto nos lleva a dos áreas distinta: una de recabar, clasificar y ordenar los

datos, y otra de hacer un análisis y establecer conclusiones a partir de los datos ordenados,

o sea, a la Estadística Descriptiva y la Estadística Inferencial.

En el campo de la valuación, se ha dado mucha importancia a la Estadística Inferencial

para determinar valores de bienes, a través de modelos de regresión, pero alimentar con

los datos adecuados estos modelos, para generar resultados confiables, se deja a un lado

en la mayoría de los casos y este es un tema en el que se puede encontrar ayuda en la

Estadística Descriptiva.

Uno de los temas más importantes en la recolección de datos para alimentar un

modelo estadístico es el tamaño de la muestra analizada. La determinación del tamaño de

la muestra no es algo sencillo, ya que en la mayoría de los casos se requiere información

poblacional con la que no se cuenta. La estadística nos proporciona algunas herramientas y

una estructura para auxiliarnos en este proceso.

Para determinar el tamaño de la muestra mencionado, se necesita determinar el

nivel de confianza, el error máximo y la desviación estándar de la población de acuerdo a la

siguiente fórmula:

n

2

E

z

Una vez obtenido este número de muestras que sustenta el análisis, se

procede a aplicar un modelo de Análisis Multivariante de acuerdo al siguiente

modelo de regresión lineal:

y = + x1 + 2x2 + ... + kxk +

Cualquier t ipo de bien podría ser valuado con esta metodología, pero

se necesita cumplir con el tamaño de muestra sustentado que, en la mayoría

de los casos no es reducido. En la práct ica, se encuentran algunos bienes

que cumplen con la cantidad de comparables suficientes para aplicar el

modelo multivariante. Regularmente, dentro de la valuación de maquinaria y

equipo, el equipo de trasporte y la maquinaria de la construcción presentan

gran cantidad de información de mercado, por lo que se pueden plantear

ejemplos de la aplicación de la metodología mencianada con estos bienes.

Todos los métodos estadíst icos multivariantes requieren del desarrollo

de modelos matemáticos complicados, pero en época reciente, la aparición

de programas computacionales especial izados en estos temas, permiten la

aplicación de los modelos de manera rápida y ef iciente, tales como el

software SPSS.

INTRODUCCION

El planteamiento del tema a desarrollar es una respuesta a una situación problemática

detectada en el campo de la valuación.

El determinar un valor de mercado de un bien depende en gran medida de la forma de

recopilar y analizar la información disponible para tal fin. En la práctica no es fácil esta

tarea, ya que es común que la información no esté disponible o sea poco confiable y en

muchos casos se trabajan técnicas de selección de comparables o de homologación de

información que están basadas en datos que no se pueden sustentar. Adicionalmente, en el

enfoque de mercado se aplican herramientas estadísticas para inferir resultados en base a

la información obtenida, pero estos modelos, que de inicio ofrecen resultados muy

confiables, no deberían de ser aplicados si no se cuenta con datos analizados de manera

correcta. Un problema recurrente es el que surge al aplicar un análisis multivariante a una

muestra sin calcular el tamaño óptimo.

OBJETIVO

La propuesta que se hace en este trabajo es la de calcular un valor de mercado

sustentado estadísticamente, utilizando un análisis multivariante y haciendo uso de una

base de datos obtenida con una investigación de mercado. Como el campo de la valuación

es muy amplio, donde podemos valuar desde una casa, hasta una obra de arte, el análisis

se centrará en el avalúo de maquinaria y equipo y dentro de este campo, se seleccionará

un ejemplo donde se aplique la metodología de manera adecuada.

Este trabajo se iniciará estableciendo lo que se entiende por las

palabras: “valor”, “prec io”, “valor de mercado”, “costo” y “valuación” ya que

son la base del estudio. Se sabe que estos conceptos tienen diversos

signif icados, como escenarios desde los cuales se pueden definir, pero

únicamente se tomará la acepción económica de cada uno de estos vocablos

ya que son los que realmente interesan a las personas que se dedican a

estimar el valor, en términos monetarios, de los bienes tangibles e

intangibles de los cuales se les ha solicitado su inspección y correspondiente

dictamen ya sea referido a un tiempo actual, pasado o futuro.

DEFICNICION DE CONCEPTOS

Concepto de valor

El valor ha existido como un concepto desde que la humanidad ha

creado capital y r iqueza; ha sido una medida consistentemente usada por

quienes tienen la l ibertad de poseer diversos bienes y preservar e

incrementar su patrimonio.

El dueño de un bien le asigna valor a su posesión; también lo otorga

quien presta o recibe un servicio. El valor en sí, se manif iesta a través de los

dist intos conceptos que de él se tienen en los diferentes sistemas

económicos, sociales o religiosos. Se puede decir que es el grado de

deseabil idad que se tiene de algo.

Desde el punto de vista económico, valor es el grado de satisfacción

que los bienes y servicios de naturaleza tangible o intangible proporcionan a

los grupos o individuos. Pero existen dos factores que afectan este concepto:

el t iempo y el r iesgo. El paso del t iempo afecta al valor porque las

condiciones cambian y esto puede afectar la posición de un bien en la escala

de valor económico y la deseabilidad que se tiene de él. También el ri esgo lo

afecta, ya que las esperanzas sobre las condiciones futuras determinan la

confianza de que estará disponible o de que tendrá mayor o menor valor; el

riesgo será dist into para bienes o servicios de distinta naturaleza.

A continuación se recordarán a lgunas definiciones de valores:

VALOR DE USO: Es el valor que tiene un bien de acuerdo con su función, implica un

sentido de mérito o de posesión; por ejemplo valor sentimental, valor histórico, valor

potencial, valor de inversión, etc.

VALOR DE CAMBIO: Es el que representa el valor comercial de un bien.

VALOR COMERCIAL: La máxima suma de dinero a cambio de la cual podría

razonablemente esperarse que se celebraría una operación de compraventa entre un

vendedor interesado en vender, pero sin ninguna necesidad imperiosa o urgente de llevar a

cabo dicha operación, ni obligado a vender, y un comprador prudente y deseoso de

comprar pero sin ninguna necesidad urgente o imperiosa de hacerlo. Ambos con pleno

conocimiento de todos los usos, ventajas y desventajas que tiene el bien valuado.

VALOR DE REPRODUCCIÓN NUEVO: Es el valor a precios actuales de la reproducción

de una nueva réplica de un bien, utilizando materiales idénticos.

VALOR DE REPOSICIÓN NUEVO: Es el valor a precios actuales de un bien nuevo similar

o igual, con la utilidad casi equivalente más próxima al bien que se está valuando.

VALOR JUSTO DE MERCADO O VALOR COMERCIAL: Es la suma de dinero a cambio de

la cual podría esperarse, de manera razonable, que un comprador y un vendedor bien

informados estuvieran dispuestos a efectuar la transacción de un bien, bajo condiciones

equitativas y sin que ninguno tuviera la compulsión de comprar o vender, y que ambos

conocen toda la información pertinente al bien.

VALOR JUSTO DE MERCADO EN USO CONTINUO: Es la suma de dinero estimada a

cambio de la cual podría esperarse, de manera razonable, que un comprador y un

vendedor bien informados estarían dispuestos a efectuar la transacción de un bien, bajo

condiciones equitativas y sin que ninguno tuviera la necesidad imperiosa de comprar o

vender, donde ambos conocen toda la información pertinente al bien, considerando que

éste está instalado, por lo que se contemplan los gastos de instalación y se presupone que

el bien está generando ingresos y/o utilidades que corroboran el valor considerado en el

informe valuatorio.

VALOR JUSTO DE MERCADO INSTALADO: La suma de dinero estimada a cambio de la

cual podría esperarse, razonablemente, que un comprador y un vendedor bien informados

estarían dispuestos a efectuar la transacción de un bien instalado, bajo condiciones

equitativas, sin que ninguno tuviera la necesidad imperiosa de comprar o vender, donde

ambos conocen de toda la información pertinente. El bien está instalado, más no está

operando y no generará ingresos y/o utilidades.

VALOR JUSTO DE MERCADO DESMONTADO: La suma de dinero estimado a cambio de

la cual podría esperarse, razonablemente, que un comprador y un vendedor informados

estarían dispuestos a efectuar la transacción de un bien, bajo condiciones equitativas y sin

que ninguno tuviera la necesidad imperiosa de comprar o vender, donde ambos conocen

toda la información pertinente y en el entendido de que el equipo se trasladará a otro sitio y

está desmontado.

VALOR DE LIQUIDACIÓN EN OBRA: El importe total de dinero que se espera obtener por

una planta o instalación industrial en quiebra, normalmente fuera de operación, suponiendo

que toda la planta se venderá completa, en cierto tiempo limitado para llevar a término la

transacción.

VALOR DE LIQUIDACIÓN ORDENADA: La suma bruta estimada en dinero que se espera

obtener por concepto de una venta, contando con un plazo razonable para encontrar un

comprador, donde el vendedor se ve en la necesidad de vender “tal como está y donde se

ubica” el bien, en parte o en forma completa. Que la planta puede o no estar en quiebra.

VALOR DE LIQUIDACIÓN FORZOSA: La suma bruta estimada en dinero que podría

percibirse, razonablemente, por concepto de una venta pública debidamente anunciada y

llevada a cabo, en la que el vendedor se ve en la necesidad de vender de inmediato “tal

como está y donde se ubica el bien”.

VALOR DE RESCATE: La suma de dinero que se espera obtener por concepto de la venta

total de un bien, o de un componente del mismo, que se haya retirado de servicio para

utilizarse en otra parte.

VALOR DE CHATARRA: La suma de dinero que podría obtenerse por un bien si éste fuera

vendido sólo con base al tipo de material del que está compuesto y no para destinarse a un

uso productivo.

Concepto de precio

El precio se puede asociar a una operación de compraventa, ya que representa la

cantidad monetaria en que un comerciante o un vendedor oferta un producto o un servicio;

si un comprador está dispuesto a pagarla, el precio tiende a constituirse en valor.

Concepto de costo

Monto de la erogación realizada para reproducir o reemplazar un bien. El costo no

incluye la utilidad ni los impuestos derivados de la venta.

Concepto de bien o bienes

A medida que la vocación del valuador de bienes, con el paso del tiempo, ha

evolucionado de una ocupación mercantil a una profesión, han surgido y debido ser

aclarados ciertos conceptos.

Hoy el término “bienes” se aplica a las cosas físicas y también a los derechos reales

como la servidumbre y la habitación que recaen sobre bienes inmuebles (que son

considerados como bienes inmuebles por su objeto, según clasificación establecida en el

Código Civil del Estado Libre y Soberano de Puebla arts. 750 fracción XII y, 751).

Como ya se estableció en algún inciso anterior, el valor es el grado de satisfacción

que dan los bienes; para que un bien pueda tener ese grado de deseabilidad y satisfacción,

debe contar con tres características:

a) Utilidad.- Debe de servir para algo, inclusive para satisfacer necesidades

psicológicas.

b) Valor de intercambio.- Debe de existir alguien que desee tener el bien y alguien

que se quiera deshacer a cambio de otra cosa, que puede ser dinero.

c) Escasez.- Siguiendo los principios de economía, un bien que tuviera

disponibilidad ilimitada para cualquier persona, no se le podría asignar un valor

específico.

Definición de valuación

En la actualidad se entiende que “la valuación”: es la estimación del valor de un bien

a una fecha determinada, para un propósito y objeto específico

ENFOQUES DE VALUACION INMOBILIARIA

Se establecen tres enfoques o métodos para la elaboración de los avalúos de bienes

que son: el físico, el de ingresos y el de mercado, y comprende tres clases de operaciones,

a saber:

1. - La estimación del costo de producir y reponer un bien físico (valor físico)

2. - La predicción de la capacidad de compra de determinados tipo de bienes (valor

de capitalización)

3. - La valuación o determinación del valor de mercado de un bien.

En virtud de que el presente trabajo se centra exclusivamente en el estudio del valor

de mercado de los bienes inmuebles, no abordaremos el estudio de los métodos físico y de

capitalización, entrando únicamente al estudio y análisis de cómo se llega a integrar en la

actualidad el valor de mercado para el caso de maquinaria y equipo.

ENFOQUE DE MERCADO

Como ya vió, el valor se puede expresar como una medida en la escala de

deseabilidad de individuos, grupos y organizaciones; así, la escasez relativa de un bien o

servicio habrá de influir sobre su atractividad y, por lo tanto, sobre su precio. Tenderá a

descender el valor de un bien, tal como su precio lo expresa, cuando éste pueda obtenerse

con facilidad, o ascender cuando las fuentes de abastecimiento no alcancen a cubrir la

demanda, por lo tanto tenemos que reconocer la teoría económica básica de equilibrio

entre oferta y demanda como un factor fundamental a tomarse en cuenta en el

establecimiento de un valor de mercado.

La naturaleza de la oferta y la demanda existentes para cualquier bien influirá sobre el

valor y esta influencia persistirá aún ante la ausencia de un mercado bien desarrollado y

definido para los bienes analizados. Se facilitará la tarea para precisar el valor, cuando la

oferta y la demanda se manifiestan, a través de una historia de transacciones abundantes y

estables que delinee claramente la naturaleza de estas fuerzas. Cuando los bienes se

intercambian con frecuencia y bajo condiciones de libertad, la interacción de la oferta y la

demanda generará algo aproximado o quizá igual al valor de mercado.

oferta demanda

equilibrio

Precio

(valor)

Precio de

mercado

Cantidad

En el caso de la valuación de bienes en general, no es común tener esta información

disponible, por lo que se hace uso de ofertas que se tienen en el mercado, pero tomando

en cuenta que existe una diferencia entre el precio ofertado y el precio en el que se cierra la

operación de compraventa; a esta diferencia se le llama factor de comercialización.

Adentrándose en el mercado de maquinaria y equipo, el enfoque de mercado lleva a

calcular el valor del bien estudiado, al cual un comprador estaría dispuesto a cerrar una

transacción con un vendedor, en condiciones de conocimiento del bien y del mercado, y sin

presiones de ningún tipo, o lo que es lo mismo, se estaría conociendo el valor que

determina la oferta y la demanda.

Para establecer dicho valor es necesario un conocimiento del mercado a través de

una investigación. Es común que se haga una recolección de datos, de maquinaria y equipo

que el valuador considere similares al que es objeto de estudio, ya sea por comunicación

directa con los participantes de una operación de compraventa, o por información publicada

en diarios, revistas especializadas, comunicación telefónica o por anuncios en internet. Si

no se encuentran máquinas o equipo con las mismas características, se hace uso de las

técnicas de homologación, que tratan de igualar las características de los comparables que

se investigaron con las de la máquina o equipo valuado, aplicando factores numéricos de

premio o castigo; posteriormente de hace una estimación del valor buscado aplicando la

estadística, ya sea por el cálculo de la media o por una regresión. El problema que se

puede encontrar en esta metodología es que las muestras analizadas por lo general son

muy pequeñas, como es común que se aplique de tres a seis en la práctica.

La propuesta que se hace en este estudio es tener un valor de mercado sustentado

estadísticamente, utilizando un análisis multivariante, haciendo uso de una base de datos

obtenida con una investigación de mercado.

CAPITULO 2

PRINCIPIOS DE ESTADÍSTICA

CONCEPTOS BASICOS

La estadística está presente en casi todos los aspectos de la vida moderna, la utilizan

los políticos para conocer las preferencias del electorado, los ingenieros para llevar el

control de calidad en una línea de producción, los economistas para ver el rumbo de la

economía de un país, los científicos para estimar resultados de un experimento, pero antes

de aplicarla en nuestro estudio, necesitamos definirla y conocer los conceptos básicos que

la fundamentan.

Definición de estadística

En cualquiera de los ejemplos anteriores, alguien quiere conocer una característica

de algo. En la mayoría de los casos éstas características que se quieren conocer no se

pueden examinar en su totalidad porque su número es muy grande y verificarlas una por

una, sería muy tardado y costoso; lo que se hace es tomar una parte de ese total,

examinarla, sacar conclusiones de la parte examinada y extender esas conclusiones hacia

el total no examinado. Esto lleva a dos áreas distinta: una de recabar, clasificar y ordenar

los datos, y otra de hacer un análisis y establecer conclusiones a partir de los datos

ordenados.

Lo anterior hace que existan dos ramas de la estadística: la estadística descriptiva y

la estadística inferencial.

La estadística descriptiva es aquella que se encarga de la recolección, presentación

y descripción de datos muestrales.

La estadística inferencial es la que se encarga de la interpretación de los valores

resultantes de la estadística descriptiva y de la toma de decisiones y la obtención de

conclusiones de una población.

De manera general y simple se puede decir que la estadística trata de la

recopilación, presentación, análisis y uso de la información para resolver

problemas, , tomar decisiones, y diseñar y desarrollar productos y

procedimientos1.

Términos fundamentales

Antes de abordar los temas de estadística, se necesita definir algunas términos

importantes.

POBLACION. Es un conjunto de elementos, individuos u objetos que poseen una

característica común y cuyas propiedades serán analizadas. Existen dos tipos de

poblaciones: finitas e infinitas. La población finita es aquella en la cual podemos enumerar

cada uno de sus elementos, como por ejemplo, el total de libros de una biblioteca o el total

de casas habitación unifamiliares que tiene un municipio; por otro lado la población infinita

es la que tiene un número indefinido de elementos, por ejemplo el número de piezas

defectuosas en una línea de producción.

MUESTRA. Es un subconjunto de la población que tiene las mismas características

de ésta. Debe ser representativa de la población en cantidad y calidad, es decir, debe de

tener los mismos elementos en las mismas proporciones.

VARIABLE. Característica de interés sobre cada elemento individual

de una población o muestra1. Puede ser el estado de conservación de una casa

habitación o los metros cuadrados de construcción que tiene. Existen dos tipos de

variables: cualitativas y cuantitativas.

La variables cualitativas son aquellas que describen atributos de los elementos de la

población o muestra y no son numéricas. A su vez, se clasifican en nominales, las cuales

describen elementos que no tiene sentido ordenar, como el color de una casa, y por otro

lado las ordinales,

1 Hin es Wi l l i am y o t r os , P r ob ab i l i d ad y E s t ad í s t i ca p a ra In g en i er í a . T rad . Gab r i e l Nag or e . 4 t a . ed i c ión ,

Méxic o : Comp añ ía Ed i tor i a l Con t in en t a l , 2 0 0 5 .

que describen una posición o clasificación ordenada, como por puede ser el estado de

conservación de una máquina: excelente, bueno, regular, malo y ruinoso.

DATO. Valor que puede tomar una variable dentro una población o muestra, por

ejemplo 3 años de edad de un vehículo.

EXPERIMENTO. Es una actividad realizada bajo un plan determinado, la cual

produce resultados que se consideran datos. El ejemplo más común es el de los

experimentos de laboratorio en los cuales se manipula una serie de elementos tendientes a

obtener resultados, los cuales son utilizados para sacar conclusiones de situaciones

específicas.

PARAMETRO. Medida que representa a todos los datos de una población. Puede

ser el promedio de metros cuadrados de construcción de las casas habitación de una

población.

Estadístico. Medida que representa a todos los datos de una muestra. Igual que

sucede en el parámetro, puede ser ejemplificada con el promedio de los metros cuadrados

de construcción de una muestra de casas habitación de la población analizada.

RECOLECCION DE DATOS

Aspectos generales

Uno de los aspectos más importantes de la estadística es la obtención de los datos

ya que los resultados finales de las inferencias que se realicen, dependen de la buena

recolección de estos.

La recolección de datos puede presentarse como el siguiente proceso:

1. Definir los objetivos de la investigación o del experimento. 2. Definir la variable y la población de interés. 3. Definir los esquemas para recolectar y medir los datos. Esto incluye el

procedimiento de muestreo, el tamaño de la muestra y el instrumento de medición (cuestionario, por teléfono, etc.) de los datos.

4. Determinar las técnicas idóneas para realizar el análisis de datos: descriptivas o inferenciales.2

2 Johnson Robert y Patricia Kuby, Estadística Elemental. Lo Esencial. Trad. Hugo Villagomez. México: Thomson Learning, 2004.

Existen dos métodos para la recolección de datos: el estudio experimental y el

estudio observacional.

En el primero, se manipula o controla el entorno y se observa los efectos que se

producen en la variable estudiada. Es importante mencionar que el experimento se

diseña para obtener los datos necesarios para conocer el efecto sobre la variable. Un

ejemplo de este proceso, es la medición que se hace de los efectos que producen los

medicamentos en ratas de laboratorio, cuando se les inyectan diferentes dosis.

En el estudio observacional sucede lo contrario, es decir, no se manipula o controla

el proceso de observación, simplemente se muestrea la población para obtener los datos,

observando sin intervenir. Además, dentro de éste método de recolección de datos,

tenemos cuatro formas principales de hacerlo: entrevista personal, entrevista por teléfono,

cuestionarios autoaplicados y observación directa.

Cuando se puede enlistar cada elemento de una población, estamos hablando de un

censo, pero las observaciones implican tiempo y dinero; con poca información el

investigador no puede obtener buenas estimaciones, mientras que mucha información,

como la que nos da el censo, implica un costo muy elevado, por eso es común efectuar una

encuesta muestral. Al elegir una muestra para realizar una encuesta, donde recolectaremos

los datos de la población estudiada, es necesario elaborar un marco muestral. Un marco es

una lista de unidades de muestreo 3 la cual debe ser igual a la población y sus elementos

solo pueden aparecer una vez.

Una vez que tenemos el marco muestral, debemos determinar el método de

muestreo que se utilizará. Existen muchos métodos para tal fin pero los podemos agrupar

en dos: muestreo de juicio y muestreo probabilístico. En el muestreo de juicio la persona

que lo elabora toma las muestras que considera representativas de la población según su

juicio. En el muestreo probabilístico se seleccionan los elementos en base a la probabilidad

de que tienen de ser elegidos como parte de la muestra, y puede ser con reemplazo o sin

reemplazo; en el primero se toma un elemento para que forme parte de la muestra y antes

de tomar el siguiente, se regresa a la población para que siga formando parte de ella y

pueda, incluso, volver a ser seleccionado. En el muestreo sin reemplazo los elementos se

van separando formando parte de la muestra sin ser devueltos en ningún momento,

haciendo que la probabilidad de que los elementos restantes sean escogidos se

incremente, ya que los elementos en la población van disminuyendo.

3 Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo

Editorial Iberoamérica, 1987.

Dentro de la clasificación de los muestreos probabilísticos, los mas comúnmente

utilizados se describen a continuación.

Muestreo irrestricto aleatorio

Los dos factores que más afectan la representatividad que tiene una muestra en una

población son el tamaño de la muestra y la magnitud de la variación de los datos; entre

más grande es la muestra, mayor será la información que se espera obtener de la

población, mientras que la variación de los datos puede ser controlada por medio del

método por el cual se obtienen las observaciones.

El método que se utiliza con mayor frecuencia para obtener una muestra de una

población es el muestreo aleatorio irrestricto y es aquel en el cual cada elemento de la

población tiene la misma probabilidad de ser seleccionado, así como todas las muestras de

tamaño n tienen la misma probabilidad de ser elegidas.

El que se trate de un muestreo aleatorio significa que al seleccionar un elemento, el

siguiente resultado o elemento seleccionado no sea predecible, y pueda ser cualquiera de

la población. La manera de extraer las muestras, para asegurarse que todos los elementos

tengan la misma probabilidad de ser elegidos, es numerarlos y utilizar un generador de

números aleatorios, o tablas igualmente de números aleatorios para elegir los que sean

necesarios.

Muestreo aleatorio estratificado

Una muestra aleatoria estratificada es la obtenida mediante la separación de los

elementos de la población en grupos que no presenten traslapes, llamados estratos, y la

selección posterior de una muestra irrestricta aleatoria simple de cada estrato.1

Para seleccionar este tipo de muestra, primero hay que especificar los estratos o

subdivisiones en los que se va a dividir el marco muestral, usualmente se puede usar una

subdivisión

1 Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo Editorial

Iberoamérica, 1987.

que ya ocurrió de manera natural, por ejemplo, si suponemos que la población a estudiar

es el total de casas habitación unifamiliares del municipio de Puebla, los estratos que

podrían existir de manera natural son las casas de lujo, de semi-lujo, las de nivel medio, las

de interés social y las populares; una vez seleccionados los estratos, se resumen por

separado y luego se combinan para obtener conclusiones acerca de toda la población.

Este tipo de muestreo presenta tres ventajas fundamentales: primero, que la

variación de los datos de la muestra proporcional es menor a la que obtenemos por el

muestreo irrestricto aleatorio, porque la variación de los datos dentro de cada estrato es

usualmente menor que la de toda la población. En segundo lugar, el costo de recolectar y

analizar datos se hace mas pequeño en muestras separadas que en una población grande,

y por último, se pueden hacer estimaciones separadas por estrato sin tener que hacer otra

muestra.

Muestreo sistemático

En el muestreo sistemático se ordenan en forma de lista los elementos de la

población a estudiar, después se elige un intervalo k entre dichos elementos,

posteriormente se elige aleatoriamente un elementos y a partir de éste se selecciona todo

k-ésimo elemento del marco muestral. Este método es fácil de describir y ejecutar, y en

general se extiende más uniformemente sobre toda la población y puede proporcionar más

información acerca de la población que una cantidad equivalente de datos contenida en

una muestra irrestricta aleatoria, pero tiene el inconveniente de no dar resultados aleatorios

cuando el marco muestral sea repetitivo o de naturaleza cíclica.

Muestreo por conglomerados

Una muestra por conglomerados es una muestra aleatoria en la cual cada unidad de

muestreo es una colección, o conglomerado, de elementos1. Para entender mejor, vamos a

suponer que necesitamos conocer el ingreso por hogar en una ciudad. Si usamos un

muestreo irrestricto aleatorio, sería muy costosa la investigación ya que el costo traslado y

el tiempo utilizado por los encuestadores sería elevado. Si usamos un muestreo

estratificado necesitaríamos un marco para cada estrato y resultaría igualmente costoso.

Por otro lado, si dividimos la ciudad en regiones tales como manzanas (o conglomerados),

y seleccionamos una muestra irrestricta aleatoria de

1 Scheaffer Richard y otros, Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo Editorial

Iberoamérica, 1987.

ellas simplificaría el proceso; se establecería un marco que liste las manzanas de la unidad

y se podría medir el ingreso de las familias dentro de las manzanas.

Es conveniente utilizar el muestreo por conglomerados cuando no se encuentra

disponible o sea muy costoso obtener un marco muestral que liste todos los elementos de

una población. También lo podemos utilizar cuando el costo de las observaciones

realizadas es directamente proporcional a la distancia que separa los elementos. Otro

factor importante a tomarse en cuenta es que si los elementos del conglomerado son muy

diferentes entre sí, una muestra que contenga pocos conglomerados grandes pueden

producir una estimación muy buena de un parámetro poblacional. De aquí podemos sacar

la principal diferencia entre la construcción de estratos y la de conglomerados: Los estratos

pueden ser tan homogéneos entre ellos como sea posible, pero un estrato debe diferir tanto

como sea posible de otro respecto a la característica que está siendo medida. En cambio,

los conglomerados, deben ser tan heterogéneos entre ellos como sea posible y similar a

otro para poder aprovechar las ventajas de los costos de muestreo.

Una variante del muestreo por conglomerados es el muestro por conglomerados en

dos etapas, el cual se obtiene seleccionando una muestra aleatoria de conglomerados y

cuando se tiene ésta, se selecciona una muestra aleatoria de los elementos de cada

conglomerado muestreado.

ORGANIZACIÓN DE DATOS

Una vez que recolectamos datos de una población mediante una muestra,

necesitamos organizarlos para poder obtener conclusiones válidas de ellos. La manera

más común para hacerlo es mediante distribución de frecuencias y mediante gráficas.

Presentación gráfica de los datos

Una de las formas más conocidas para empezar a familiarizarse con los datos es

mediante un formato visual, o gráfico, que nos presente el patrón de comportamiento de la

variable estudiada. Existen varios tipos de gráficas las cuales es conveniente utilizar de

acuerdo al tipo de datos y al concepto a representar.

Gráficas de pastel

Las gráficas de pastel (diagramas de pay) son aquellas que muestran la cantidad de

datos que pertenecen a una categoría como una parte proporcional de un círculo y suelen

utilizarse para describir datos cualitativos. Por ejemplo:

Gráficas de barras

Las gráficas de barras son aquellas que muestran la cantidad de datos que

pertenecen a una categoría como áreas de rectángulos de tamaños proporcionales y, al

igual que las de pastel, suelen utilizarse para describir datos cualitativos. Por ejemplo:

Gráficas de puntos

4%

7%

65%

22%

2%

Tipo de casas

Popular

Interés social

Media

Semi-lujo

Lujo

0

5

10

15

20

25

30

35

40

Popular Interés social

Media Semi-lujo Lujo

mero

de

casas

Tipo de casa

Tipo de casas del fraccionamiento "x"

Presenta los datos de una muestra mediante la representación de cada porción de

datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u

horizontal. La frecuencia de los valores está representada a lo largo de la otra escala1.

Estas gráficas suelen utilizarse en datos cuantitativos. Por Ejemplo:

Distribución de frecuencias

Acabamos de ver cómo los datos se pueden representar de una manera gráfica para

facilitarnos su interpretación, pero la manera más efectiva de manejarlos es a través de

tablas de distribución de frecuencias.

La frecuencia es el número de veces que un valor numérico aparece en la muestra.

La distribución de frecuencias es un listado que asocia cada valor de una variable

con su frecuencia.

Para obtener la distribución de frecuencias de una muestra primero es necesario

listar el total de los datos en orden ascendente; después determinamos el rango de los

datos, es decir, la diferencia entre el mayor y el menor de ellos. Luego hay que establecer

el número de intervalos de clase, que son los intervalos contenidos en el rango en los

cuales lo queremos dividir. Dicho número de intervalos nos da el ancho de clase, el cual lo

podemos definir como la diferencia entre el límite superior y el límite inferior de clase. Estos

límites no son mas que los valores numéricos máximo y mínimo en que deben estar

contenidos los datos para pertenecer a esa clase.

Si expresamos de manera gráfica una distribución de frecuencias, obtendremos un

histograma, el cual es una gráfica de barras que representa una distribución de frecuencias

de una variable cuantitativa. Un histograma está integrado por los siguientes componentes:

Superficie de Costrucción

0

50

100

150

200

250

300

350

0 5 10 15 20 25

Número de dato

tro

s c

ua

dra

do

s

1. Un título, que identifica la población o la muestra de interés.

2. Una escala vertical, que identifica las frecuencias que hay en las diversas

clases.

3. Una escala horizontal, que identifica la variable x. Los valores de los límites

de clase o de las marcas de clase deben identificarse a lo largo del eje x.

Debe utilizarse el método de identificación con que se presente la variable.

ANALSIS DE DATOS

Como vimos anteriormente, la estadística estudia las características de una muestra

para hacer inferencias de las características de una población. Dichas características de las

poblaciones se estudian mediante indicadores de aspectos particulares. Estos indicadores

son llamados parámetros cuando se refieren a poblaciones y estadísticos cuando hacen

referencia a muestras. Una vez que tenemos ordenados nuestros datos en distribuciones

de frecuencias, existen dos tipos de indicadores para empezar a estudiar nuestros dados:

los de tendencia central y los de dispersión.

Medidas de tendencia central

La medidas de tendencia central son valores numéricos que localizan el centro de un

conjunto de datos. En este tipo de medidas, existen tres que son comúnmente usadas

como parámetros o como estadísticos:

Media

La medida de tendencia central más utilizada es la media aritmética. Debido a que,

por lo general consideramos datos que se obtienen de una muestra, nos referimos a la

media aritmética como la media muestral; es común escuchar que representa el promedio

de los valores numéricos de los datos y se calcula dividiendo la suma de todos los valores

entre el número de datos. Sin embargo, la media difiere del promedio al involucrar

conceptos de probabilidad. De una manera simple, diremos que la media puede ser

definida como la suma de todos los valores de una población o muestra, multiplicando cada

uno de éstos valores con su probabilidad de ocurrencia, pero para efectos prácticos la

manejaremos como un promedio. Cuando hablamos de la media de una población, la

representamos por la letra griega (miu minúscula) y cuando hablamos de la media de una

muestra la representamos con x . Si las observaciones en una muestra tamaño n son

x1,x2,...,xn, la media muestral es:

x1+x2+...+xn

n____________x

-

o lo que es lo mismo:

n

xi=1

n

-

xi

la media de estos datos sigue siendo una medida de tendencia central, pero no implica

necesariamente que la mayoría de las observaciones estarán alrededor de ella. Si

consideramos que las observaciones tienen una unidad de masa y peso, la media muestral

es solo el centro de masa de los datos y esto implica que el histograma se equilibrará, en

forma de balanza, si se apoya en la media muestral.

Cuando calculamos el valor promedio de las observaciones de una población finita,

lo llamamos media de la población y lo calculamos de la misma manera:

N

x

donde x es el total de la población finita:

i=1

N

x xi

La estadística inferencial utiliza métodos para hacer inferencias sobre la media de la

población tomando como base la media de la muestra, por lo que la media de la muestra se

usa como un estimador de .

Mediana

La mediana es el valor que ocupa la posición central de un conjunto de datos

ordenados según su tamaño. También se puede definir como el punto en el que la muestra

se divide en dos partes iguales. Cuando se trata de la mediana de una población se

representa con la letra griega M (miu mayúscula) y cuando se trata de una muestra usamos

(x tilde). Se calcula de la siguiente manera:

~x

x((n+1)/2)

x(n/2)+x((n/2)+1)

2n par

n impar

La mediana tiene la ventaja de no estar muy influenciada por los valores extremo.

Moda

La moda es el valor numérico que más se repite dentro de un conjunto de datos.

Cuando ningún valor se repite, o más de un valor se repite con mayor frecuencia, se dice

que no hay moda.

Medidas de dispersión

No siempre las medidas de tendencia central proporcionan suficiente información

para describir los datos de una población o de una muestra. Supongamos que tenemos dos

muestras con los siguientes datos:

1: 137 157 152 165 172 147

2: 97 135 212 147 172 167

La media de las dos muestras es 155, pero la dispersión de los datos de la segunda

muestra es mayor que la de la primera, es decir, en la primera muestra los datos están

concentrados alrededor de la media y en la segunda se encuentran mas alejados o

dispersos, como lo podemos apreciar en la siguiente gráfica:

140130 150 160 170 180 190 200 210 22012011010090

muestra 1

muestra 2

media

Las medidas de dispersión son aquellas que miden cómo se agrupan los datos en

una población o en una muestra. Asimismo, podemos ver el agrupamiento de todo el

conjunto de datos calculando el rango, o el agrupamiento de los datos alrededor de la

media calculando la desviación estándar y la varianza.

Rango

Como lo vimos anteriormente, el rango es la diferencia entre el mayor y el menor

valor de los datos analizados. El rango nos da una idea de lo dispersos que pueden estar

los datos entre sí. En el ejemplo anterior el rango para la primera muestra es de 35,

mientras que la segunda muestra tiene un rango de 75, lo que nos hace ver que estos

últimos están distribuidos en un mayor rango.

Varianza

La medida de dispersión más importante es la varianza. La podemos definir como el

promedio del cuadrado de las diferencias de los valores con respecto a la media. Cuando

hablamos de la varianza de una población, la representamos con la letra griega (sigma

minúsc

hacemos con la letra s (ese minúscula) también elevada al cuadrado (s2).

Matemáticamente la expresamos en la siguiente manera: Si x1,x2,...,xn es una muestra de n

observaciones, la varianza de la muestra es

s2 ____________

n-1

n

i=1(xi-x)

2-

Una desviación con respecto a la media es la diferencia entre un valor de x y la

media x . Cada valor de la muestra se desvía de la media en una cantidad igual a (x- x ), y

esta desviación se hace cero cuando el valor se encuentra en la media. Por otro lado, si la

media es mayor que x, el valor resultante de la desviación es negativo, y en el caso

contrario, es positivo. Si calculamos el promedio de las desviaciones mediante la fórmula

i=1 -

promedio de las desviaciones

n

(xi -x)

n

Se puede caer en el problema de que los valores positivos de las desviaciones se

neutralicen con los valores negativos y pudiera haber un promedio de desviaciones igual a

cero, lo cual indicaría que todos los valores están en la media sin que esto sea real.

Volviendo al mismo ejemplo de las dos muestras de datos anteriores, calculamos sus

desviaciones:

muestra 1 137 157 152 165 172 147

desviaciones -18 2 -3 10 17 -8

muestra 2 97 135 212 147 172 167

desviaciones -58 -20 57 -8 17 12

si aplicamos la fórmula anterior, en ambos casos el promedio de las desviaciones es cero.

Una manera de eliminar este efecto es elevando al cuadrado cada una de las desviaciones,

para asegurar que todas sean positivas. De esta manera obtenemos la varianza:

desviaciones muestra 1 -18 2 -3 10 17 -8

desviaciones al cuadrado 324 4 9 100 289 64

muestra 1

s2

n -1

n

i =1 (xi -x)

2-

i =1(xi -155)

2

6 - 1

6

158

desviaciones muestra 2 -58 -20 57 -8 17 12

desviaciones al cuadrado 3364 400 3249 64 289 144

muestra 2

s2

n -1

n

i =1 (xi -x)

2-

i =1(xi -155)

2

6 - 1

6

1502

Cuando tenemos una población finita con N valores el cálculo de la varianza se

expresa de la siguiente manera:

i=1N

(xi-)2

N

Desviación estándar

Es la raíz cuadrada de la varianza de un grupo de datos:

s2

s

La desviación estándar nos da una idea más clara de la dispersión de los valores

alrededor de la media, ya que está expresada en las mismas unidades de medida que los

datos, es decir, si tenemos una muestra que expresa los precios de venta de un grupo de

automóviles en pesos, la varianza estará dada en pesos cuadrados, lo cual no tiene mucho

sentido al hacer un análisis; por otro lado, la desviación estándar, estará dada un pesos y

nos será de más utilidad al visualizar los datos.

Una aplicación muy útil de la desviación estándar está dada en el Teorema de

Chebyshev:

La probabilidad de que cualquier variable aleatoria x caiga dentro de k desviaciones

estándar de la media es al menos (1-(1/k2)).1

Esto quiere decir que a menos de dos desviaciones estándar de la media (k=2)

siempre se encontrarán por lo menos el 75% de los datos. Si se considera el intervalo de

tres desviaciones estándar a cada lado de la media, se encontrarán al menos el 89% de los

datos.

TAMAÑO DE LA MUESTRA

La determinación del tamaño de la muestra no es algo sencillo, ya que en la mayoría

de los casos se requiere información poblacional con la que no se cuenta. La estadística

nos proporciona algunas herramientas y una estructura para auxiliarnos en este proceso.

1 Walpole E. Ronald y Raymond H. Myers, Probabilidad y Estadística para Ingenieros. Trad. Luis Fernando Romero Sánchez. 2ª. Edición,

México: nueva editorial interamericana, 1983.

Variabilidad de la muestra.

Para hacer inferencias sobre una población debemos analizar con detenimiento los

resultados muestrales. De una muestra se obtiene una media muestral x , pero no es de

ro debe ser próximo para

que el resultado sea aceptable. De la misma manera, si tomamos una segunda muestra de

la población, tampoco debemos esperar que su media muestral sea idéntica a la primera

media muestral tomada, pero también debe aproximarse al primer valor tomado y a la

media poblacional. De aquí nos surge la duda de cómo saber cuál es un valor próximo;

para esto necesitamos una distribución muestral: Una distribución muestral de un

estadístico muestral, es la distribución de valores de un estadístico muestral obtenido de muestras

repetidas, todas del mismo tamaño y extraídas de la misma población1. Esto quiere decir, que si

tenemos una población cualquiera, y obtenemos varias muestras iguales (de manera

aleatoria) podemos establecer una distribución muestral, ya sea representada por una

distribución de frecuencias o en forma de histograma, de algún estadístico muestral, por

ejemplo, podemos establecer la distribución muestral de las medias x de todas las

muestras tomadas.

Si de cualquier población con media y desviación estándar , se toman todas las

posibles muestras aleatorias, cada una de tamaño n, la distribución muestral de las medias

muestrales tiene una media x igual a y una desviación estándar x igual a /(n)1/2; esta

desviación estándar de la media muesteral se llama error estándar y representa la

desviación o dispersión que presentan todas las medias muestrales respecto a la media de

la distribución de éstas. Además, si la población muestreada tiene una distribución normal2,

entonces la distribución muestral de x también es normal para muestras de todos

tamaños. Por otro lado, el Teorema del Límite Central nos dice: La distribución muestral de

medias muestrales se vuelve normal a medida que aumenta el tamaño de la muestra3. No

existe una regla firme que defina a las muestras suficientemente grandes, pero en la

práctica hablamos de muestras de más de 30 elementos.

Podemos resumir lo anterior afirmando que para describir la distribución muestral

necesitamos lo siguiente:

1 Johnson Robert y Patricia Kuby, Estadística Elemental. Lo Esencial. Trad. Hugo Villagomez. México: Thomson Learning, 2004.

2 Distribución de probabilidad continua en forma de montículo o campana, simétrica, donde el área total bajo la curva es igual a 1.

3 Johnson Robert y ...

- La ubicación del centro (la media): x =

- La medida de dispersión que indica cuan esparcidos están los datos

(desviación estándar): /(n)1/2

- Una indicación de cómo está distribuida: Si la población es normal, la

distribución de las medias muestrales es normal; el teorema del límite

central establece que, aunque la población no sea normal, la distribución

de las medias muesteales será aproximadamente normal, cuando la

muestra es suficientemente grande.

Cuando la distribución de las medias muestrales está distribuida normalmente, o es

aproximadamente normal, es posible hacer estimaciones de probabilidad con la ayuda

de la distribución normal estándar.

Confiabilidad de la muestra

Todas las muestras que tomemos no generan el mismo valor de x ( ó s). El punto

importante es que x variará de muestra a muestra. Es razonable pensar que la variación

en x será más grande a medida que la varianza de la población, sea más grande.

También, a medida que aumenta el tamaño de la muestra, la variación en x disminuirá.

Cuando la muestra es pequeña, se necesitan solo uno o dos valores extremos para afectar

sustancialmente la media muestral generando así una x relativamente grande o pequeña.

A medida que aumenta el tamaño de la muestra, estos valores extremos tendrán un menor

impacto cuando aparezcan, porque serán promediados con más valores. La variación en x

es medida por su error estándar x .

Si tenemos una variable x, con una distribución de probabilidad desconocida; la

media de la muestra, x , también tiene una distribución de probabilidad, la cual diremos que

es normal, por el teorema del límite central. Esto indica que x , normalmente se acerca a y

que tiene iguales probabilidades de ser más grande o más pequeña. El área bajo la curva

queda dividida así:

El área corresponde a la probabilidad, es decir, el área bajo la curva entre dos

puntos es la probabilidad de que x esté entre esos dos puntos. Por ejemplo, en la siguiente

figura aparece el 95% del área; esto quiere decir que la probabilidad de que x se

encuentre dentro de 2 x de la media de la población , es 0.95.

Para visualizar el concepto de error estándar, vemos en la figura que existe un 95%

de probabilidad de que x caiga dentro de +/- dos errores estándar de la media de la

población. Esta figura se denomina distribución muestral, puesto que indica la probabilidad

de obtener una media muestral particular. El error estándar de x disminuye a medida que

el tamaño de la muestra aumenta; por consiguiente, con una muestra grande, x tenderá a

estar más cerca de , y la distribución de x cambiará con ello.

Estimación de intervalo

La media de la muestra, x , es usada para estimar la media de la población

desconocida (). Debido a que x varía de muestra a muestra, no es igual a la media de la

población. Existe un error de la muestra. Es útil proporcionar una estimación de intervalo en

torno a x el cual refleje nuestro juicio acerca del alcance de este error muestral:

x E error de la muestra = estimación del intervalo de

El tamaño del intervalo dependerá de qué tan confiados queremos estar de que el

intervalo contenga a la media de la población verdadera, la estimación de este intervalo

sería:

x E 2 x = x E 2 /n1/2 = estimación de intervalo del 95.33% de

El tamaño del intervalo se basa en 2 x porque la probabilidad de que x esté entre 2

x de la media poblacional es 0.9544. Aproximadamente el 95% de las muestras generarán

una estimación de intervalo que incluirá a la media de la población verdadera. Si se desea

tener una confianza del 90% de que la estimación de intervalo incluirá a la media

poblacional verdadera, entonces la estimación de intervalo sería:

x E 5/3( x )= x E 5/3 /n1/2 = estimación de intervalo del 90% de

En este caso, el intervalo es más pequeño, pero tenemos menos confianza de que

incluya a la media poblacional verdadera.

Si la desviación estándar de la población ( x = ) no es conocida, es necesario

estimarla con la desviación estándar de la muestra, s. Por consiguiente, la estimación del

intervalo, por ejemplo, del 95.44% sería:

x 2s/n1/2 = estimación de intervalo del 95.44% con desconocida

En resumen, la estimación del intervalo de la media de la población, , puede

escribirse así:

x E error nuestral, o x =E z(/2)/n1/2

donde

- z(/2) = Coeficiente de confianza. Es el número de múltiplos de error

necesarios para formular una estimación por intervalo del ancho correcto

para tener un nivel de confianza de 1-parte central de la curva normal).

El término /2 se refiere al área a cada lado de la curva normal fuera del

intervalo de confianza (el valor de z(/2) se obtiene de las tablas de la

distribución normal estándar).

desviación estándar de la población (se usa s si es desconocida).

n = tamaño de la muestra.

Por lo tanto, el tamaño de la estimación del intervalo dependerá de tres factores:

- Nivel de confianza. Si estamos dispuestos a tener menos nivel de

confianza de que la estimación de intervalo incluya a la media de la

población verdadera y desconocida, entonces el intervalo será más

pequeño.

- Desviación estándar de la población. Si hay poca variación de la

población, entonces la estimación del intervalo de la media poblacional

será más pequeña

- Tamaño de la muestra. Conforme el tamaño de la muestra aumenta, el

error de la muestra se ve reducido y el intervalo se volverá más pequeño.

El tamaño de la muestra

El intervalo de confianza tiene dos características básicas que determinan su

calidad: su nivel de confianza y su ancho. Es preferible que el intervalo tenga un alto nivel

de confianza y que sea preciso (estrecho) a la vez. Mientras más alto sea el nivel de

confianza, más probable es que el intervalo contenga al parámetro, y mientras más

estrecho es el intervalo, más precisa es la estimación. Estas dos propiedades parecen

contraponerse, ya que parecería que un intervalo más estrecho tiende a tener menos

probabilidad y que un intervalo más ancho es menos preciso. La parte del error máximo, de

la fórmula del intervalo de confianza especifica la relación implicada.

Si intervalo de confianza es

x E z(/2)/n1/2

se sabe que el error es

E = z(/2)/n1/2

El análisis de la formula indica que al aumentar el nivel de confianza, se hace más

grande el coeficiente de confianza y por lo tanto se requiere incrementar el error máximo o

el tamaño de la muestra; aminorar el error máximo requiere de la reducción del nivel de

confianza o bien, aumentar el tamaño de la muestra; disminuir el tamaño de la muestra

obliga a que el error se vuelva más grande o que el nivel de confianza disminuya. El trabajo

del experto en estadística, es encontrar el equilibrio entre el nivel de confianza, el tamaño

de la muestra y el error máximo, de modo que se obtenga un intervalo aceptable. También

podemos expresar la fórmula de la siguiente manera:

n

2

E

z

Si el error se expresa como múltiplo de la desviación estándar , para calcular el tamaño de

la muestra no es necesario el valor real de .

REGRESION Y CORRELACION

Datos de dos variables

Hasta ahora solo hemos visto problemas donde se involucra una variable, pero

existen muchas situaciones donde es necesario analizar de una manera combinada dos

variables, es decir un análisis de datos bivariados. Cada una de estas dos variables puede

ser cuantitativa o cualitativa, lo que resulta en tres posibles combinaciones:

Dos variables cualitativas. En esta categoría los datos se agrupan en tablas de

contingencia o cruzadas, donde se presenta la frecuencia para cada categoría cruzada de

las dos variables junto con los totales por renglón y por columna, denominados totales

marginales; el total de los totales marginales es igual al tamaño de la muestra.

Una variable cualitativa y una cuantitativa. En este caso los valores cuantitativos se

consideran muestras ajenas, cada una identificada por niveles de la variable cuantitativa y

los resultados se presentan uno junto al otro para efectos de comparación. Se pueden

aplicar histogramas para visualizar los datos.

Dos variables cuantitativas. Cuando esto sucede, los datos se expresan como pares

ordenados (x,y), donde x es la variables de entrada o variable independiente, y y es la

variable de salida o variable dependiente; a cada valor de x le corresponde un valor de y

que proviene de la misma fuente de datos. En este caso los datos se pueden representar

gráficamente mediante un diagrama de dispersión, en el cual la variable independiente x se

grafica en el eje coordenado horizontal, y la variable dependiente y en el eje vertical. Por

ejemplo:

Máquina 1 2 3 4 5 6 7

Característica 1 150 250 180 160 220 280 300

Característica 2 180 280 220 200 320 350 380

TERRENO

320300280260240220200180160140

CO

NS

TR

UC

400

300

200

100

Correlación lineal

El objetivo de un análisis de correlación es el de medir la intensidad de una

relación lineal entre dos variables. Si a medida que crece la variable independiente, no hay

un cambio definido en los valores de la variable dependiente, se dice que no hay

correlación entre las dos variables. En el caso contrario, si a medida que crece la variable

independiente hay un cambio en la variable dependiente, hay una correlación. La

correlación es positiva cuando la variable dependiente crece y negativa cuando decrece. Si

los valores de x y y presentan un patrón de línea recta, se dice que tienen una correlación

lineal. Se pueden dar casos que los valores tengan patrones que tiendan a curvas y

representen correlaciones de funciones cuadráticas, cúbicas, exponenciales, logarítmicas,

etc. La correlación lineal perfecta se da cuando todos los puntos están sobre una línea

recta y puede ser positiva o negativa según su pendiente, pero si la línea es horizontal o

vertical, no hay correlación, porque una variable no afecta a la otra.

El coeficiente de correlación lineal r mide la intensidad de la relación lineal

entre dos variables y su valor está entre –1 y +1. Un valor de 1 significa correlación lineal

perfecta, ya sea positiva o negativa, y un valor de cero significa que no hay correlación. El

matemático Karl Pearson (1857- 1936) fue quien desarrolló la fórmula para el cálculo del

coeficiente de correlación, también llamado coeficiente de Pearson; se puede expresar

como rxy para indicar la correlación entre las variables x y y:

rxySxy

(Sxx Syy)1/2

donde Sxy representa la suma de los cuadrados de las diferencias entre (x- x ) y (y- y ); Sxx es la

suma de los cuadrados de las diferencias de (x- x ) y Syy es la suma de los cuadrados de las

diferencias de (x- x ).

Sxy n

i=1

(xi-x)-(yi-y)

-

Sxx i =1

n

xi2-

n

n

i =1

2

xi

i =1

n

-n

n

i =1

2

Syy yi2

yi

Calculando el coeficiente de correlación de Pearson para el ejemplo del apartado

anterior, tenemos r = 0.955, lo cual nos indica que hay una alta correlación lineal positiva

entre las dos variables, ya que su valor es cercano a 1, lo cual se puede apreciar en su

diagrama de dispersión, ya que los puntos se agrupan en torno a una línea recta.

Regresión con mínimos cuadrados

El análisis de regresión es una técnica estadística para modelar e investigar la relación

entre dos o más variables1.

Si tenemos una variable dependiente (o de respuesta), relacionada con k variables

independientes (o regresivas), las cuales normalmente son controlados por el investigador,

el análisis de regresión puede utilizarse en el caso de que los datos se recaban como

mediciones diferentes en una unidad experimental común. La relación de estas variables se

establece como un modelo matemático llamado ecuación de regresión, el cual se ajusta a

un conjunto de datos. Una aplicación de esta ecuación es la de hacer predicciones.

El análisis de regresión encuentra la ecuación de la curva que mejor describe la

relación de dos variables. Cuando tenemos más de dos variables estaremos hablando de

una análisis multivariante, o regresión múltiple.

La relación una variable dependiente y y una variable independiente x describe una

relación matemática que puede ajustarse a distintos modelos establecidos, que entre otros,

pueden estar definidos por las siguientes ecuaciones:

Lineal: yest. = a + bx

Cuadrática: yest. = a + bx + cx2

Cúbica: yest. = a + bx + cx2 + dx3

Exponencial: yest. = a ( bx )

Logarítmica: yest. = a logbx

donde yest. reprensenta el valor estimado de la variable dependiente y.

1 Hines Willian W. y otros, Probabilidad y Estadística para Ingeniería. Trad. Gabriel Nagore. 4ta. edición, México: Compañía Edtorial

Continenta, 2005.

El ejemplo más simple de una aproximación por mínimos cuadrados es el ajuste de

una línea recta a un conjunto de pares de datos observados: (x1,y1), (x2,y2),...,(xn,yn). La

ecuación de la línea recta está dada por

yest. = a + bx

El criterio de mínimos cuadrados busca encontrar los valores de a y b, para poder

estimar el valor de y, dado un valor de x. En la siguiente gráfica, representamos los valores

del mismo ejemplo utilizado anteriormente, junto con la recta a la cual se aproximan estos

valores

TERRENO

320300280260240220200180160140

CO

NS

TR

UC

400

300

200

100

También se muestra la distancia de un valor observado y y un valor estimado yest. La

longitud de esta distancia se representa por (y – yest.). La recta que mejor se ajusta a todo el

conjunto de datos es aquella que minimice estas distancias, pero al igual que cuando

estudiamos la varianza, el hecho de que algunos puntos estén por encima de la recta y

otros por abajo, hace que las diferencias puedan ser positivas y negativas, por lo que la

suma de todas ellas podría neutralizarse e indicarnos una diferencia mínima o cero, lo cual

no sería verdadero. La manera de obtener valores absolutos de estas desviaciones es

elevándolas al cuadrado, por lo que el objetivo es encontrar la recta en la que el menor

valor de:

(y-yest.)

n

i=1

(yi - yest.)2

sabiendo que yest=a+bx, sustituimos en el término anterior y llamamos Q a la suma del

cuadrado de los residuos (diferencias entre el valor observado y el estimado), para

obtener la siguiente expresión:

n

i=1

(yi - a - bxi.)2

Q

Para minimizar este valor obtenemos su derivada y la igualamos a cero, pero como

Q está en función de a y de b, calculamos la derivada parcial con respecto a cada una de

las variables:

cQ

n

i =1

(yi - a - bxi. )2

can

i =1(yi - a - bxi. )(-1) = 02

cQ

n

i =1

(yi - a - bxi. )2

cbn

i =1

2 (yi - a - bxi. )(-xi) = 0

sustituyendo y simplificando, obtenemos un sistema de dos ecuaciones con dos variables,

que al resolverlo por cualquier método apropiado, como la regla de Cramer o el método de

matrices de Gauss-Jordan o algebraicamente, obtenemos el valor de a y b:

n

xi

i=1

ban+ yin

i=1

a n

xi

i =1

+ xi2

n

i =1

b ( xi yi )n

i =1

n

Volviendo al ejemplo de la muestra de valores de metros cuadrados de terreno y

construcción de un grupo de casas, calculamos los valores para sustituir en las ecuaciones

anteriores:

Máquina (n=7) 1 2 3 4 5 6 7

Característica 1 (x) 150 250 180 160 220 280 300 1540

Característica 2 (y ) 180 280 220 200 320 350 380 1930

(x2) 22500 62500 32400 25600 48400 78400 90000 359800

(xy) 27000 70000 39600 32000 70400 98000 114000 451000

sustituyendo,

7a + 1540b = 1930

1540a + 359800b = 451000

resolviendo tenemos:

a = -0.857 b = 1.257

por lo tanto

yest. = -0.857 + 1.257x

esto quiere decir que la recta a la cual se ajustan los datos corta al eje de las ordenadas en

el valor –0.857 y tiene una pendiente positiva de 1.257.

Uno de los objetivos más importantes por los que se obtiene una ecuación de regresión es

para hacer predicciones. Volviendo a nuestro ejemplo, supongamos que deseamos

conocer el valor de la característica 2 una máquina que tiene valor de característica 1 de

175. Sustituyendo este valor en x, obtenemos:

yest. = -0.857 + 1.257(175) = 219.12

Es importante tener en cuenta que existen restricciones para la aplicación de este

método. En primer lugar, la ecuación de ajuste debe de usarse para hacer predicciones

solo de la población de la cual se extrajo la muestra. En segundo lugar, la ecuación se

debe usar dentro del dominio muestral de la variable de entrada ya que los datos

analizados presentaron tendencia lineal, pero no sabemos qué puede pasar fuera de este

intervalo, y por último, debemos de tomar en cuenta que es esencial que la muestra haya

sido tomada de manera adecuada y los datos estén vigentes.

El método de mínimos cuadrados utiliza el criterio llamado mínimax en el ajuste de

una línea óptima, ya que ésta se escoge, de tal manera que minimice la distancia máxima a

la que se encuentra un punto de la línea recta.

El mismo procedimiento se puede aplicar para el cálculo de ajustes no lineales como son

los mencionados anteriormente: cuadrático, exponencial, etc. Supongamos que el

diagrama de dispersión muestra una tendencia parabólica, entonces la curva de ajuste

estaría dada por la siguiente ecuación:

yest=a+bx+cx2

por lo tanto

(yi - a - bxi.- cxi2)2

n

i=1

Q

y para encontrar el mínimo derivamos parcialmente con respecto a las tres variables

resultantes a, b y c, resolviendo y simplificando obtendremos un sistema de tres

ecuaciones con tres variables cuya solución nos dará los valores de los coeficientes para

obtener yest. en la ecuación de ajuste inicial.

n

xi

i =1

ban + yin

i =1

yi

n

c+ n

i =1

xi2

an

xi

i =1

+ xi2

n

i =1

b n

i =1

n

cn

i =1

+ xi3

( xi yi )

an

i =1

+ n

i =1

b n

i =1

n

cn

i =1

+xi3

xi2 xi

4 (xi2yi)

Análisis Multivariante

Las investigaciones que se hacen de fenómenos reales necesitan considerar gran

cantidad de aspectos, lo cual nos lleva a un número elevado de variables. Dichos

fenómenos no pueden ser analizados con las técnicas univariantes o bivariantes vistas

anteriormente. Por ello es necesario utilizar técnicas multivariantes, las cuales realizan un

análisis conjunto de muchas variables haciendo un estudio multidemensional de los datos.

Podemos definir al análisis multivariante como la parte de la estadística que se ocupa

del análisis conjunto de más de dos variables, constituyendo así una extensión del análisis

univariante y bivariante1.

Las primeras técnicas de análisis multivariante aparecieron a principios del siglo XX,

pero no tuvieron mucha utilización debido a lo complejo de sus cálculos. Su difusión

empezó hace unos 25 años junto con el auge y desarrollo de la computación, ya que el

surgimiento de herramientas de software estadístico facilitó su aplicación.

Existen varias clasificaciones de las técnicas multivariantes que involucran diversos

criterios; una de las más utilizadas es la que toma en cuenta los aspectos técnicos y las

divide en dos típos.

Técnicas predictivas. Realizan una explicación de un fenómeno, determinando las

relaciones de dependencia entre variables dependientes e independientes. A esta

clasificación pertenecen la regresión múltiple, el path análisis, el análisis de la varianza, el

análisis de la covarianza y el análisis discriminante.

Técnicas reductivas. Tratan de describir un fenómeno real reduciendo su complejidad,

haciendo un estudio de la independencia de todas las variables para reducir su número y

contar con las necesarias para describir el fenómeno observado. A estas técnicas

pertenecen el análisis factorial, el análisis de correspondencias, la correlación canónica y el

análisis de conglomerados.

La técnica del análisis de regresión analiza la naturaleza de las relaciones entre un

conjunto de variables con el objetivo de hacer predicciones, tratando de conocer la

influencia que una serie de variables independientes ejercen sobre una variable

dependiente. De todas las técnicas de regresión múltiple, la más sencilla y utilizada es la

regresión lineal múltiple.

Supongamos que el precio de venta de una casa depende de la cantidad de metros

cuadrados de terreno que tiene, y de los metros cuadrados de construcción. Un modelo de

1 Díaz de Rada Vidal, Técnicas de Análisis Multivariante para Investigación Social y Comercial. España: RA-MA Editorial, 2002.

regresión lineal que podría describir esta relación sería:

y = + x1 + 2x2 +

donde y representa el precio de venta de la casa, x1 la superficie de terreno, x2 la

superficie de construcción y es el error de la estimación. Este es un modelo de regresión lineal múltiple con dos regresores y es la función lineal de los parámetros desconocidos y 2; es un modelo que describe un plano bidimensional x1, x2.

representa la ordenada al origen del plano y mide el cambio esperado en y por cada cambio unitario en x1, cuando x2 es constante. De igual manera, 2 mide el cambio

en y por cambio unitario en x2, cuando x1 permanece constante. A estos dos parámetros se les llama coeficiente de regresión parciales.

Para generalizar el modelo, vemos que y se puede relacionar con k variables

independientes, por lo que el modelo de regresión lineal múltiple para k variables

independientes queda de la siguiente manera:

y = + x1 + 2x2 + ... + kxk +

Este modelo describe un hiperplano en el espacio k-dimensional de las variables

independientes {xi}.

El método de mínimos cuadrados puede utilizarse para estimar los coeficientes de

regresión . Si se tienen n > k observaciones y xij representa la i-ésima observación y el nivel

de la variable xj, y el error en el modelo tiene E()=0, V()=2 y que las {i} son variables

aleatorias no correlacionadas, entonces tenemos

yi = + xi1 + 2xi2 + ... + kxik + i

i=1n

+ jxij i+

i = 1,2,...,n

La función de mínimos cuadrados es:

jxijn

i =1

Q yi - -j= 1

k2

La función Q se minimizará respecto de ,..., k

^^ ^

^ ^

^cj

cQ

k^ ^

jxijn

i =1

yi - -j= 1

k

- 2 xij 0^ ^

donde j=1,2,...,k.

Al resolver y simplificar obtenemos las ecuaciones normales de mínimos cuadrados, las

cuales anotaremos en forma matricial para visualizarlas más fácil:

^

^

^

n

i =1

n

i =1

n

n

i =1

n

i =1

n

i =1n

i =1

n

cn

i =1

n

i =1n

i =1n

i =1

n

n

i =1

n

xi 1

. . .

. . .

. . .

. . .

. . .

xik

xi 1

x2i 1

xik xi 1

xi 2 . . .

. . .

. . .

xi 1xi2

xik xi 2

. . .

yin

i =1

yi

n

n

i =1

n

n

i =1

n

. . .

xik

xi 1xik

x2ik

k

^

^

^

xi 1yi

xik yi

Supongamos que tenemos los siguientes datos de un conjunto de casas:

Máquina Precio venta Característica 1 Característica 2

1 $1’037,000.00 150 180

2 $1’600,000.00 250 280

3 $1’280,000.00 180 220

4 $1’325,000.00 160 200

5 $1’850,000.00 220 320

6 $1’993,000.00 280 350

7 $2’250,000.00 300 380

La ecuaciones planteadas serían las siguientes:

^

^

^

i =1

i =1

i =1 i =1

i =1

i =1

i =1

i =1

xi 1

xi 1

x2i 1

xi 2

xi 1xi2

yii =1

yi

i =1

i =1

k

^

^

^

xi 1yi

7

7

7 7

7 7

7 7 7

7

7

7

xi 2 xi 1xi2 x2i 2

xi 2yi

Sustituyendo valores y resolviendo el sistema de ecuaciones, tenemos:

= 112845.5

= -710.725

2 = 6030.88

Por consiguiente, la ecuación de regresión para el valor de y estimada es:

yest. = 112845.5 – 710.725 x1 + 6039.88 x2

Ahora supongamos que queremos conocer el precio de una máquina que tiene un valor de

200 de la característica 1 y con 250 de la característica 2. Si sustituimos estos dos valores

en x1 y en x2 de la ecuación anterior tendremos un valor estimado del precio de venta:

yest. = 112845.5 – 710.725(200) + 6039.88 (250)

yest. = 112845.5 – 142145 + 1509970 = 1480670.5

Es posible utilizar algunas técnicas para medir la eficiencia del modelo. El coeficiente

de determinación múltiple r2 se expresa como:

r2

Syy

SCR SCE

Syy-1

donde SCR es la suma de los cuadrados de la regresión, SCE es la suma de los cuadrados del

error y Syy está definido por:

i =1

n

-n

n

i =1

2

Syy yi2

yi

r2 es la medida del grado de reducción de la variabilidad de y obtenida mediante el

empleo de las variables independientes x1, x2, ..., xk. Igual que en la regresión lineal simple,

debemos tener 0r21. La raíz cuadrada de r2 es el coeficiente de correlación múltiple entre

y y las variables independientes, esto es, la medida de asociación lineal entre y y x1, x2, ..., xk.

Cuando k=1 estamos hablando de una correlación lineal simple entre y y x.

Es posible que r2 no de un valor bueno dado que al añadir una variable al modelo

siempre aumentará su valor, independientemente que la variable sea estadísticamente

significativa o no. Es por eso que algunos analistas prefieren el coeficiente ajustado de

regresión múltiple (donde p = número de términos de la ecuación):

r2aju

SCE

Syy-1

/ (n- p)

/ (n- 1)

El valor de r2aju aumentará solo si la adición de un nuevo término reduce

significativamente la media cuadrática del error, es decir, penalizará la adición de términos

que no tengan significado en el modelado de la respuesta. Su interpretación es igual a la de

r2.

En casi todos los problemas de regresión múltiple, las variables independientes

están intercorrelacionadas. En situaciones en las que la intercorrelación es grande,

decimos que hay multicolinealidad. Los valores característicos de la matriz de correlación

brindan una medida de la multicolinealidad. Uno o más valores característicos iguales a

cero implica que hay multicolinealidad.

CAPITULO 3

A P L I C A C I O N D E L M E T O D O

Se tomará como ejemplo el la estimación del valor de un vehículo ya que en este tipo

de bienes se puede encontrar suficiente información de mercado.

Como se vio en las secciones anteriores, para determinar el tamaño de la muestra,

para obtener el valor de mercado de bien, se necesita determinar el nivel de confianza, el

error máximo y la desviación estándar de la población.

El punto más importante que debemos analizar es el referente a la desviación

estándar de la población, puesto que la desconocemos. Ya mencionamos que podemos

utilizar la desviación muestral, pero tampoco tenemos una muestra previa para poderla

utilizar, ya que podríamos ocupar algún estudio anterior o un muestro piloto para

determinar la desviación deseada. En este caso la única alternativa con la que contamos es

con un muestreo piloto que nos diga el comportamiento del precio de los inmuebles

estudiados. Para esto hay que tomar en cuenta que, si queremos que la distribución

muestral sea normal, necesitamos una muestra de al menos 30 datos. Por otro lado, al

ocupar s (de la muestra) en lugar de (de la población) en nuestros cálculos, tendríamos

que sustituir la variable z de la distribución normal, por la variable t de la distribución t student1,

la cual toma en cuenta un error estándar estimado.

Una de las características de la distribución t stundet, es que tiende a la distribución

normal estándar a medida que aumenta el número de grados de libertad; si analizamos sus

valores, nos daremos cuenta que con más de 100 grados de libertad, la distribución t student

se comporta como la normal. Esto quiere decir que si nuestras muestras no bajan de 100

datos seguiremos teniendo el comportamiento de la distribución normal estándar.

Se tomará para este muestreo piloto los datos recabados en sitios web nacionales,

recordando que esto solo es para estimar la desviación estándar que se utilizará en el

calculo del tamaño de la muestra final que servirá como base de datos el estudio. Se

analizaron 30 muestras de vehículos tipo Pick Up, marca Chevrolet tomando como variable

dependiente el precio de venta y como variables independientes el kilometraje recorrido y el

año de fabricación, convirtiendo este a edad en años.

Para determinar el tamaño definitivo de la muestra, se tomará un nivel de confianza

del 95%, la desviación obtenida de la variable precio de $ 65,954.44 y un error máximo

permitido de 25,248.33 esto quiere decir, que en el promedio de las camionetas (la media),

su error permitido no va a ser más del 10% de su precio, lo cual podría ser un número

aceptable. Aplicando la fórmula, se tiene:

n

2

E

z

lo que da como resultado una muestra a analizar de 26.24 comparables. Se tomarán para

la regresión los 30 que se tenían porque cumplen con la muestra mínima y se realizará un

análisis multuvariante con la variable precio con variable dependiente y las variables edad (

a partir de año) y kilómetros como variables independientes:

PRECIO AÑO KILOMETROS

$ 119,900.00 2009 52954

$ 205,000.00 2008 60000

$ 249,000.00 2011 48000

$ 180,000.00 2007 87000

$ 139,900.00 1991 48900

$ 269,000.00 2009 57000

$ 276,000.00 2009 78000

$ 360,000.00 2003 68000

$ 195,000.00 2010 63000

$ 119,000.00 2006 88000

$ 280,000.00 2009 58000

$ 295,000.00 2011 65000

$ 290,000.00 2009 56000

$ 252,400.00 2010 27101

$ 269,000.00 2010 28000

$ 309,000.00 2012 15000

$ 287,500.00 2009 59000

$ 168,000.00 2008 65000

$ 220,000.00 2009 128000

$ 289,000.00 2011 19000

$ 295,000.00 2010 45000

$ 242,000.00 2008 68000

$ 300,000.00 2009 52000

$ 239,000.00 2010 67884

$ 200,000.00 2009 100040

$ 330,000.00 2011 44000

$ 375,000.00 2012 30000

$ 205,800.00 2009 85000

$ 320,000.00 2010 90000

$ 295,000.00 2011 55000

El resultado del análisis es el siguiente:

Coeficientesa

Modelo Coeficientes no estandarizados Coeficientes

tipificados

t Sig.

B Error típ. Beta

1 (Constante) 311871.167 30672.735 10.168 .000

kilómetros -.985 .473 -.367 -2.086 .046

a. Variable dependiente: precio

Los resultado indican que la variable edad no tuvo influencia sobre el precio por lo que

se retiró del modelo y la variable kilometraje muestra una relación inversa con precio, por lo

que el modelo queda de la siguiente manera:

Precio = 311,871.167 - (.985) ( kilometraje)

Si se quisiera calcular el precio de una camioneta con 105,000 km, se tendría lo

siguiente:

Precio = 311,871.167 - (.985) ( 105,000) = 208,446.17

C O N C L U S I O N E S

Observando los resultados del modelo de regresión l ineal múltiple,

planteado para calcular el valor de mercado de una un vehículo , se ve que

estadísticamente se llegó a un buen modelo, ya que se uti l izan las

herramientas adecuadas para que la información que se maneja tenga

rangos de confianza adecuados.

Los modelos estadísticos presentan la ventaja de ser confiables y no

tener el inconveniente de estar sujetos al criterio del analista, ya que al

procesar los datos de manera adecuada, el mismo modelo informa si los

resultados sin confiables.

La desventaja de estos métodos radica en que se necesita una gran

cantidad de información para que pueda ser analizada y en la mayoría de

los casos dentro del campo de la valuación no se cuenta con ella, pero hay

ciertos bienes que si dan la oportunidad de aplicarlos como es el caso de

los vehículos, la maquinaria de la construcción, algunas máquinas de

confección entre otras.

B I B L I O G R A F I A

Camacho, Juan. Estadíst ica con SPSS para Windows. México: Alfa y

Omega, 2003Aaker, David y George Day. Investigación de Mercados. Trad. Jaime Gómez Mont. 3ra. Edición, México: 1989

Aaker, David y George Day. Investigación de mercados. Trad. Jaime Gomez

Mont. 3ra. Edición, México: McGraw Hills, 1989. Capra, Steven y Raymons P. Canale. Métodos Numéricos para Ingenieros .

México: McGrawHil l, 1988.

Díaz de Rada, Vidal. Técnicas de análisis mult ivariante para investigación

social y comercial . España: Ra-Ma Editorial, 2002.

Herfert Erich, Valuación: Conceptos y Aplicaciones Prácticas . Trad. Alfredo Pérez Grovas. 1ra. Edición. México: Ed iciones Contables y Administrativas, 1973.

Hines Willian W. y otros. Probabilidad y Estadística para Ingeniería. Trad. Gabriel Nagore. 4ta. edición, México: Compañía Edtorial Continenta, 2005.

Johson, Robert y Patricia Kuby. Etadística Elemental. Lo Esencial. Trad. Hugo Villagomez. México: Thomson Learning, 2004.

Mercado, Salvador. Investigación de mercados. México: Editorial Pac, 2000.

Scheaffer Richard y otros.Elementos de Muestreo. Gilberto Rendón Sánchez y José Roberto Gómez Aguilar. México: Grupo Editorial Iberoamérica, 1987.

Trápaga Maza Tirso Miguel, Taller de Valuación de Maquinaria y Equipo . Apuntes del curso impartido en la Universidad Autónoma de Zacatecas, 2011.

Visauta, Bienvenido y Joan C. Martori. Análisis estadístico con SPSS para

Windows, Volumen II: Estadística multivariante . España: McGraw-Hill, 2003.

Visauta, Bienvenido. Análisis estadíst ico con SPSS para Windows, Volumen

I: Estadíst ica básica. España: McGraw-Hill , 2002.

Walpole, Ronald E. Y Raymond H. Myers. Probabilidad y estadística para ingenieros. Trad.

Luis Fernando Romero Sánchez. México: Interamericana, 1983.

Zanotto, Hector. Aplicaciones de Valuación en SPSS. Apuntes del curso

impartido en la Benemérita Universidad Autónoma de Puebla, 2005.