proceso de la investigación (1)

346
CURSO-TALLER PROCESO DE LA INVESTIGACIÓN: METODOLOGÍA, DISEÑO Y ESTADÍSTICA.

Upload: gabriel-gamas-padilla

Post on 12-Dec-2015

264 views

Category:

Documents


0 download

DESCRIPTION

investigacion

TRANSCRIPT

CURSO -TALLER

PROCESO DE LA INVESTIGACIÓN: METODOLOGÍA, DISEÑO Y

ESTADÍSTICA.

CONTENIDO 13/JUL

• Día 1

• Aspectos generales y presentación de programas.

• Presentación del curso, del instructor y de los integrantes del taller.

• 1. EL CONOCIMIENTO CIENTÍFICO• 2. CONOCIMIENTO Y MÉTODO• 3. LA INVESTIGACION CIENTIFICA• 4. PLANTEAMIENTO DE LA INVESTIGACION

OBJETIVO

• El curso tiene como objetivo el contribuir al conocimiento de los principios básicos de la metodología, los diseños experimentales y la investigación con fundamentos estadísticos. Por otro lado, con el curso se pretende favorecer el planeamiento y desarrollo de un diseño, recolectar, organizar, analizar e interpretar datos experimentales obtenidos en la investigación de campo y laboratorio, así como interpretar los resultados del análisis.

EVALUACIÓN

• Asistencia mínima del 90% y calificación final mínima de 80%.

• Solución y entrega de problemas asignados y aplicados.

• Un trabajo final de investigación documental y experimentación.

• Prácticas en software especializado.• Entregar portafolio de evidencias.• Cuestionarios de actividades programadas.

EL CONOCIMIENTO CIENTIFICO

CONOCIMIENTO COMÚN

CONOCIMIENTO CIENTÍFICO

- SIMPLE

- ADQUIRIDO Y ACEPTADO SIN > DISCUSIÓN

- COMPLEJO

- SE ADQUIERE A TRAVÉS DEL MÉTODO CIENTÍFICO

-BUSCA RESPONDER INTERROGANTES

-INTERPRETAR LA REALIDAD

-MODIFICAR LA REALIDAD

Distintas formasDistintas formas

Conocimiento vulgar

•Adquirido en el proceso de socialización.

•Superficial

•Sensitivo y subjetivo

Conocimiento mítico-religioso

•Supone la adhesión a una creencia de verdad.

•Dogmática

•No requiere contrastación empírica de sus verdades.CONOCIMIENTO CIENTÍFICOCONOCIMIENTO CIENTÍFICO

Racional: se obtiene a través del uso de la razón.

Metódico: supone procedimientos logico-metodológicos basados en el método científico

Sistemático: sus componentes teóricos y sus observaciones empíricas se articulan en un todo.

Verificable: los postulados teóricos se contrastan con la realidad

Falible: tiene un carácter provisorio.

Busca las regularidades: intenta describir la realidad para comprenderla en sus relaciones invariantes.

Usa como instrumentos: la reflexión, la observación y la experimentación de los fenómenos

Es un producto socio-cultural: se genera en contextos sociales específicos y en procesos históricos determinados.

CONOCIMIENTO CIENTÍFICO

OBSERVA

DESCUBRE

EXPLICA

PREDICE

CONOCIMIENTO SISTEMÁTICO DE LA REALIDAD

REALIDAD

CONOCIMIENTO CIENTÍFICO

CIENCIA

Cuerpo de ideas

NIVEL TEÓRICO

Plantea problemas teóricos. Explica la

realidad independientemente de la

aplicación del conocimiento.

Investigación básica

CIENCIA PURA

NIVEL PRÁCTICO

Estudia problemas prácticos

Investigación aplicada Investigación tecnológica

CIENCIA APLICADA

Genera una actividad teórica

TECNOLOGÍA

Toma teorías científicas y las adapta

para determinados fines.

Producto de la investigación científica es elProducto de la investigación científica es el

Genera nuevos problemas teóricos APLICACIÓN

DEL CONOCIMIENTO

CIENTÍFICO

INFLUYE SOBRE LA SOCIEDAD

El significado etimológico: in (en)

vestigar (hallar, seguir vestigios).

Es un procedimiento reflexivo, sistemático, controlado y crítico que tiene por finalidad descubrir o interpretar los hechos y fenómenos, relaciones y leyes de un determinado ámbito de la realidad.

Investigación constituye una búsqueda de hechos, un camino para conocer la realidad.

¿QUÉ ES UNA INVESTIGACIÓN?

La investigación es un conjunto de fases en la búsqueda de una respuesta a una situación problemática.

El método es el camino a seguir en esa búsqueda, es decir, los procedimientos a utilizar a través de normas y reglas genéricas de actuación científica.

Investigación

Actividades de búsqueda.

Método

Procedimientos para seguir el camino de esa búsqueda.

DIFERENCIA ENTRE INVESTIGACIÓN CIENTÍFICA Y MÉTODO CIENTÍFICO

MÉTODO CIENTÍFICO

CONOCIMIENTO CIENTÍFICO

INVESTIGACIÓN CIENTÍFICA

El método científico es un procedimiento para descubrir las condiciones en que se presentan sucesos específicos, caracterizado generalmente por ser:

•tentativo•verificable•de razonamiento

riguroso y •observación empírica

EL MÉTODO CIENTÍFICO

PERMITE

MEDIANTE

OBTENER

EL PROCESO INVESTIGATIVO

EXPLICACIONES LÓGICAS Y

COHERENTES

analizar y sistematizar información

ESQUEMA

MÉTODO CIENTÍFICO

Característico de la ciencia

PURA

APLICADA

- No infalible ni autosuficiente

- Puede perfeccionarse

- Se sustenta en conocimientos previos

Puede reajustarse y elaborarse

EL MÉTODO CIENTÍFICO

Independencia y objetividad• Al respecto, Barragán dice: «Lo que importa de método

científico es su independencia respecto de aquello (materia) que se estudia. Cada ciencia tendrá sus propios problemas y para ello debe utilizar prácticas o técnicas que se acomoden al objeto de estudio».

(Barragán, H. Epistemología, pág. 101)

METODO CIENTÍFICO

OBJETO DE ESTUDIOINDEPENDENCIA

METODO CIENTÍFICO

• MANIPULACIONES

• PREJUICIOS

• REALIDAD

• OBJETO DE ESTUDIO

RECHAZA

• Paso 1Concebir la idea a investigar

• Paso 2Plantear el problema de investigación- Establecer objetivos de investigación- Desarrollar las preguntas de investigación- Justificar la investigación y su viabilidad

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

• Paso 3Elaborar el marco teórico

Revisión de la literatura*Detección de la literatura*Obtención de la literatura*Consulta de la literatura*Extracción y recopilación de la información de

interés

Construcción del marco teórico

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

•Paso 4

Definir si la investigación se indica como exploratoria, descriptiva, correlacional o explicativa y hasta qué nivel llegará.

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

Paso 5

• Establecer la hipótesis o hipótesis• Detectar las variables• Definir conceptualmente las variables• Definir operacionalmente las variables

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

Paso 6Seleccionar el diseño apropiado de

investigación:• Experimental• Cuasiexperimental• No experimental

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

• Paso 7Seleccionar la muestra

- Determinar el universo- Extraer la muestra

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

• Paso 8Recolección de los datos:

- Elaborar el instrumento de medición y aplicarlo

- Calcular validez y confiabilidad del instrumento de medición

- Codificar los datos- Crear un archivo que contenga los datos

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

• Paso 9Analizar los datos:

- Seleccionar las pruebas estadísticas- Elaborar el problema de análisis- Realizar los análisis

EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

Paso 10Presentar los resultados:

Elaborar reporte de investigaciónPresentar el reporte de investigación

ESQUEMA: EL PROCESO DE LA INVESTIGACIÓN CIENTÍFICA

ELECCIÓN DEL TEMA

DELIMITACIÓN DEL TEMA

PROBLEMA

OBJETIVOS

MARCO TEÓRICO

METODOLOGÍA

PLANTEAMIENTO

IDENTIFICACIÓN

ALCANCE Y LÍMITES

RECURSOS

REVISIÓN DEL CONOCIMIENT

O

GENERALES

FORMULACIÓN

DESCRIPCIÓN

ANTECEDENTES

ESPECÍFICOS

DEFINICIÓN CONCEPTUAL

HIPÓTESIS

VARIABLES CODIFICACIÓNTABULACIÓN

POBLACIÓN Y MUESTRA

RECOLECCIÓN DE DATOS

PROC. DE DATOS

ENTREGA DE INFORME

OPERACIONES O MOMENTOS DEL PENSAR DE UN INVESTIGADOR

EnumerarDescribirCompararDistinguirClasificar

Definir

Situar Tiempo Espacio

Implicarse

(meterse en el problema)

Hechos

Fenómenos

Formulación del problema.

Complicarse (Hacer suya la

complejidad de la realidad)

Aspectos o facetas del problema.

Puntos de vistas

Contradicciones.

Preocuparse (Abordar la realidad)

Métodos y técnicas de abordaje de la

realidad

Recopilar datos información relativos

al problema

Explicarse (Apropiarse del

saber)

Tratar la información.

Analizar los hechos. Causas.Leyes.Teorías .Consecuencias

Aplicarse (ir a la acción)

Programar

Corto

Mediano Plazo

Largo

Teniendo en cuenta lo posible, lo probable y

lo deseable.

EJECUTAR la decisión tomada.

EVALUAR Y VERIFICAR

resultados.

COMO ESTUDIARLO

EN QUE CONSISTEN

PROCESO ETNOGRÁFICO

CUALES SON TUS ASPECTOS

QUE HACE

R

DE QUE SE TRATASituación problemática

PROCESO DE INVESTIGACIÓN-

ACCIÓN

Paso N° 1

• Concebir la idea a

investigar.

Paso N° 2

• Plantear el problema de

investigación:

• Establecer objetivos de

investigación.

• Desarrollar las preguntas de investigación.

• Justificar la investigación y su viabilidad.

Paso N° 3

• Elaborar el marco teórico:

• Revisión de la literatura:

• Detección de la literatura.

• Obtención de la literatura.

• Consulta de la literatura.

• Extracción y recopilación de la

información de interés.

• Construcción del marco teórico.

ETAPAS DE LA INVESTIGACIÓN

Paso N° 4

•Definir si la investigación se inicia como exploratoria, descriptiva correlacional o explicativa y hasta qué nivel llegará.

Paso N° 5

•Establecer las hipótesis

•Detectar las variables.

•Definir conceptual mente las variables.

•Definir operacional mente las variables.

Paso N°6

•Seleccionar el diseño apropiado de investigación:

•Diseño experimental, preexperi mental o cuasiexperi mental

ETAPAS DE LA INVESTIGACIÓN

Paso N° 9

• Analizar los datos:

• Seleccionar las pruebas

estadísticas.

• Elaborar el problema de

análisis.

• Realizar los análisis.

Paso N° 10

• Presentar los resultados:

• Elaborar el reporte de

investigación.

• Presentar el reporte de

investigación.

Paso N° 8

• Recolección de los datos:

• Elaborar el instrumento de

medición y aplicarlo.

•Calcular validez y confiabilidad del instrumento de

medición

• Codificar los datos

• Crear un archivo que contenga los

datos..

Paso N° 7

• Selección de la

muestra:

•Determinar el universo.

• Extraer la muestra

ETAPAS DE LA INVESTIGACIÓN

Ideas Información

TécnicaEsfuerzo

Motivación

¿QUÉ NECESITO PARA HACER INVESTIGACIÓN?

Las buenas ideas intrigan, alientan y excitan al investigador de manera personal.

Las buenas ideas de investigación ¨no son necesariamente nuevas pero sí novedosas¨.

Las buenas ideas de investigación pueden servir para elaborar teorías y la solución de problemas.

CRITERIOS PARA GENERAR IDEAS

PREGUNTA INICIAL

FASE EXPLORATORIA

Las lecturas Las entrevistas exploratorias

PLANTEAMIENTO DEL PROBLEMA

ACLARAR PROBLEMÁTICA

MARCO TEÓRICO

ESTRUCTURACIÓN DEL MODELO DE ANÁLISIS

INTERACCIÓN ENTRE LA PREGUNTA INICIAL, LA EXPLORACIÓN Y LA PROBLEMATICA

CARACTERÍSTICAS DE LA PREGUNTA DE INVESTIGACIÓN

Actualidad: La interrogante básica debe ser novedosa y actual. La pregunta de investigación debe ser original.Viabilidad: Antes de proponer un proyecto debemos estar seguros de que disponemos de los recursos materiales, humanos y de tiempo para concretarlo.Pertinencia: La pregunta de investigación tiene que tener importancia para resolver situaciones o problemas de las personas o de la comunidad.Precisión: La pregunta de investigación debe ser precisa, es decir, tiene que estar adecuadamente ubicada en tiempo, espacio y persona.Ética: Toda propuesta de investigación que no sea científicamente sólida, es por tanto, éticamente incorrecta.

ETAPAS DE LA FORMULACIÓN DE LA PREGUNTA

Una vez elegido el tema de investigación y enunciada la cuestión preliminar, el investigador deberá seguir precisando el problema, pensando y escribiendo acerca de las siguientes preguntas:• ¿Qué necesitamos para comprender mejor nuestro tema de investigación?• ¿Qué conocemos acerca del problema? Rescatar conocimiento previo.• ¿Cuál es la situación deseable y cuáles son las sugerencias propuestas para alcanzar dicha situación?• ¿Qué han hecho otros para resolver este problema?• ¿Cuáles son los escenarios y las personas involucradas en el problema?• ¿Qué metodología resultaría más útil para dar respuesta a nuestros interrogantes?• ¿Qué aspectos éticos deben considerarse en el abordaje del problema?

CRITERIOS PARA PLANTEAR UN PROBLEMA DE INVESTIGACIÓN

Según Kerlinger (2002) son:

• El problema debe expresar una relación entre dos o mas variables ( exceptuando que se describa el problema).

• Debe estar formulado claramente y sin ambigüedad como pregunta.

• El planteamiento implica la posibilidad de realizar una prueba empírica..

• Se debe expresar en una dimensión temporal y espacial.

• Debe especificar la población a la cual se inferirán los resultados.

• Se debe especificar la viabilidad del estudio.

ERRORES QUE SUELEN COMETERSE AL PLANTEAR UN PROBLEMA

• Muy amplio, no está delimitado.• Muy específico, intrascendente.• No se puede medir en la práctica.• Ya está resuelto, no hay novedad.• El estudiante no posee los recursos para investigarlo.

• Es un tema filosófico y está expresado con términos valorativos.

FORMULACIÓN O PLANTEAMIENTO DEL PROBLEMA DE INVESTIGACIÓN

• Plantear el problema no es si no afinar y estructurar más formalmente la idea de investigación, en términos concretos y explícitos.

• La génesis de estos problemas se dará por la reflexión surgida con ocasión de las lecturas, de los debates, de las experiencias de aprendizaje; en fin, de la vivencia intelectual dentro del medio de educación superior y en el ambiente científico y cultural.

¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?

A) PLANTEAMIENTO INICIAL: en esta etapa se intenta responder a la pregunta ¿qué investigar?

Defino y describo el objeto de estudio, a través del planteamiento de interrogantes entorno al tema escogido.

B) ANTECEDENTES DEL PROBLEMA: es importante definir el contexto de la investigación, es decir, recabar toda la información sobre el tema.

ANTECEDENTES TEÓRICOS: revisión bibliográfica sobre otros estudios con respecto al tema consulta a expertos en la temática evolución histórica de la temática.

ANTECEDENTES EMPÍRICOS: experiencia práctica que se posee sobre el tema experiencia directa del investigador motivaciones personales.

¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?

C) PLANTEAMIENTO DEFINITIVO: luego de realizar una descripción de la temática exponiendo los antecedentes teóricos y empíricos, se precisa cual es la finalidad de la investigación.

¿CÓMO CONSTRUIR UN PROBLEMA DE INVESTIGACIÓN?

REDACTAR LA PREGUNTAS DE INVESTIGACIÓN

Se requiere especificidad.

En lugar de decir• ¿Cuál es el impacto de la tecnología en la

educación?

Sería mejor decir• ¿Qué porcentaje de profesores utilizan ejercicios

en los que sus estudiantes utilicen una base de datos electrónica?

REDACTAR LA PREGUNTAS DE INVESTIGACIÓN

Debe evitarse la simplicidad excesiva o un nivel de complejidad que haga poco factible su realización.

¿Existe una norma que regule el desecho de la basura en la industria del estado de SLP?

¿En cuántos municipios del estado de SLP existen normas ambientales que regulen la actividad industrial?.

¿En cuántos municipios de América Latina existen normas ambientales que regulen la actividad industrial?

REDACTAR LA PREGUNTAS DE INVESTIGACIÓN

Se debe apreciar con claridad la variable que se está estudiando.

• En la pregunta planteada anteriormente ¿Cuáles son las condiciones de seguridad e higiene en los restaurantes de SLP?

• La variable en estudio sería: Condiciones de seguridad e higiene

TIPOS DE PREGUNTAS DE INVESTIGACIÓN

Descriptivas: • Se pueden expresar como ¿Qué característica (s) tiene una

determinada unidad o categorías de unidades de observación? o ¿Cuales son las unidades de observación que tienen una característica dada?.

Analíticas:• Se pueden formular como ¿ Qué característica X está

relacionada con la característica Y en cada unidad de observación?.

Diagnostico:• Se pueden enunciar como ¿Qué característica (s) tiene una

determinada unidad de observación (o categorías de unidades) y cuales son los factores de un estado determinado para clasificarlo como bueno, regular o malo (u otra clasificación)?.

REDACTAR LA PREGUNTAS DE INVESTIGACIÓN

Debe permitir visualizar la metodología que probablemente será utilizada.

• ¿Cuáles son las normas ambientales que deben ser cumplidas por las empresas que producen jugos?

• Tipo documental en la que el investigador busca averiguar.• ¿Cuál es la calidad del servicio al cliente que se otorga en las

cafeterías de la ciudad de SLP?• Estudio descriptivo que se podría realizar a través de una

observación, mediante una encuesta o una auditoría de la calidad del servicio.

• ¿Cuáles son los factores que contribuyen a elevar los índices de titulación en la carrera de Ingeniería Agroindustrila?

• Diseño experimental Estamos hablando de un estudio manipulativo en el que seguramente se evaluaran las variables del estudio.

REDACTAR LA PREGUNTAS DE INVESTIGACIÓN

• Al formular una pregunta de investigación se trata de formular el problema con claridad no la solución.

• Una pregunta de investigación apropiadamente redactada debe poder visualizar también el escenario, los sujetos o límites del estudio.

• Finalmente al estructurar la pregunta de investigación debe evaluarse la relevancia de la misma, de manera general es necesario cuestionarse si la respuesta a la pregunta enriquece el conocimiento.

PLANTEO DEL PROBLEMA

OBJETIVOS

¿Qué?

• Claridad.

• Alcanzables.

• PREGUNTAS

• Una o varias.

• Resume lo que será la

investigación.

• Clara.

• Precisa

• Límites temporales y espaciales.

• Manipulable

JUSTIFICACIÓN

¿Para qué?

Finalidad de la investigación

OBJETIVOS DE INVESTIGACIÓN

El o los objetivos establece el sentido, dirección, curso que seguirá la Investigación, constituye la identificación de los elementos de análisis de una investigación.Plantean los propósitos a estudiar y no la metodología.

Objetivo general o principal: es el enunciado claro y preciso del propósito central que se persiguen con la investigación.

Objetivos específicos o secundarios: indica lo que se pretende llevar a cabo en cada etapa, descomposición del objetivo general.

CRITERIOS PARA LA FORMULACIÓN DE OBJETIVOS

• Deben especificar con claridad los resultados prácticos que debe llegar el estudio.

• Deben ser explícitos, claros y precisos.• Deben ser observables y susceptibles de

medir.• Deben ser ordenados según prioridades.• Deben invocar la pregunta de investigación.• Deben estar expresados en el infinitivo de

un verbo.

ASPECTOS FUNDAMENTALES DE LOS OBJETIVOS:

• Claridad: se basa en un lenguaje comprensible y preciso, un lenguaje fácil de identificar.

• Factibilidad: se refiere a la posibilidad de lograr los objetivos con los recursos disponibles, con la metodología adoptada y dentro de los plazos previstos.

• Pertinencia: se conforma de la relación lógica con el tipo de problema que se pretende solucionar.

SEGÚN SU COMPLEJIDAD LOS OBJETIVOS

Perceptual: implica conocimiento externo y superficial del evento, para precisar aquellos elementos que resultan evidentes, por ejemplo describir, explorar. Aprehensivo: implica la búsqueda de aspectos no tan evidentes en el evento de estudio, de aquello que parece oculto y subyace a la organización interna del evento, por ejemplo analizar, comparar.Comprensivo: alude a la explicación de las situaciones que generan el evento, por ejemplo explicar.Integrativo: implica la modificación del evento por parte del investigador, por ejemplo evaluar.

VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN

Nivel Finalidad – Verbos

Percept

ual

Explorar: indagar, conocer, detectar,

estudiar, reconocer, descubrir.

Describir: caracterizar, tipificar, clasificar,

identificar, diagnosticar.

VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN

Nivel Finalidad – Verbos

Aprehensi

vo 

Analizar: interpretar, criticar.

Comparar: contrastar, asemejar,

diferenciar.

VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN

Nivel Finalidad – Verbos

Comprensi

vo  

Explicar: entender, comprender.

Predecir: proveer, pronosticar.

Proponer: plantear, formular, configurar,

diseñar, crear, proyectar, invertir,

programar.

VERBOS SEGÚN CORRESPONDAN CON LA FINALIDAD DE TU INVESTIGACIÓN

Nivel Finalidad – Verbos

Integrati

vo  

Modificar: cambiar, ejecutar, reemplazar,

propiciar, organizar, realizar, aplicar, mejorar,

promover.

Confirmar: verificar, comprobar, demostrar,

probar.

Evaluar: valorar.

HACIÉNDONOS LAS PREGUNTAS CORRECTAS

¿Qué quiero saber? ¿Qué objetivo voy a plantear?

¿Cómo es? ¿Cuáles son sus

características?

¿Cómo varía en el tiempo?

Describir: caracterizar, tipificar,

clasificar, identificar, diagnosticar.

¿En qué medida este evento se

corresponde con ciertos

criterios? ¿Cuáles son los

aspectos ocultos de este evento?

Analizar: interpretar, criticar.

HACIÉNDONOS LAS PREGUNTAS CORRECTAS

¿Qué quiero saber? ¿Qué objetivo voy a plantear?

¿Por qué ocurre este fenómeno?, ¿Cuáles

son sus causas?, ¿Cómo varía este evento

en presencia de otros eventos?, ¿Cómo se

puede explicar?

Explicar: entender, comprender.

¿Cómo se presentará este evento en un

futuro que reúna tales condiciones?,

Dadas tales circunstancias.. ¿Cuáles serán

las situaciones futuras?

Predecir: prever, pronosticar

¿Cuáles serán las actividades de un

aparato, diseño, propuesta, etc., que

permita lograr los objetivos tales,

relacionado con este fenómeno?

Proponer: plantear, formular, configurar,

diseñar, crear, proyectar, invertir, programar.

HACIÉNDONOS LAS PREGUNTAS CORRECTAS

¿Qué quiero saber? ¿Qué objetivo voy a plantear?

¿Cuáles cambios se pueden producir

en este fenómeno, al aplicar este

diseño, programa, plan de acción…?

Modificar: cambiar, ejecutar, propiciar,

motivar, organizar, realizar, aplicar,

mejorar, promover.

¿Existe realmente relación entre

estos dos eventos?

Confirmar: verificar, comprobar,

demostrar, probar.

¿Hasta qué punto el programa,

diseño o propuesta está alcanzando

los objetivos que se propuso?

Evaluar: valorar, estimar.

CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO

• Conveniencia:¿ Que tan conveniente es la investigación?

¿ para que sirve?

• Relevancia Social:¿ Cual es la Trascendencia para la sociedad?

¿ quienes serán los beneficiarios con la investigación? ….. ¿Cuál es el alcance social?

CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO

• Implicaciones Practicas:

¿ Contribuirá a solucionar un problema práctico?

• Valor Teórico: Con la investigación ¿ se podrán generalizar los

resultados a principios mas amplios?¿ servirá para desarrollar, comentar o apoyar una

teoría?.. ¿ que se espera saber con los resultados que no se conociera antes?

CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO

• Utilidad Metodologíca: Investigación ayudara a la definición de un nuevo

concepto, variable o relación entre ellas? ¿ sugiere como estudiar mejor a un tipo de población? ¿ puede ayudar a crear nuevos instrumentos de recolección o análisis de datos?

• Factibilidad:Debemos tener encuenta si contamos realmente con los recursos para poder realizar el estudio o investigación …¿ es factible llevar a cabo esta investigación? ¿ Cuanto tiempo tomara realizarla? ¿ Es competente el equipo de investigación para efectuar el estudio?

CRITERIOS DE JUSTIFICACIÓN DEL ESTUDIO

• Implicancias Éticas:¿Existen implicancias de orden moral? ¿ se cuenta con la autorización de los sujetos mediante el Consentimiento Informado?

ELABORACIÓN DEL MARCO TEÓRICO

Marco Teórico

Implica analizar teorías, investigaciones; Y antecedentes que se consideren válidos Para el encuadre del estudio.

Tenemos ya

El problema de estudio

preguntas

objetivos

relevancia

factibilidad

FUNCIONES PRINCIPALES DEL MARCO TEÓRICO

• Ayuda a prevenir errores

• Orienta sobre cómo analizar el estudio

• Guía al investigador para centrarse en el problema, evitando desviaciones del planteamiento original.

• Conduce al establecimiento de hipótesis o afirmaciones

• Inspira nuevas líneas y áreas de investigación

• Posee un marco de referencia para interpretar los resultados del estudio.

FUENTES DE INFORMACIÓN

PRIMARIAS: (datos de primera mano) libros, antologías, artículos, monografías, tesis, disertaciones documentos oficiales, testimonios de expertos, Internet, “artículos científicos”.

SECUNDARIAS: (listado de fuentes primarias) (reprocesar información) compilaciones, resúmenes y listado de referencias, publicaciones en un área de conocimiento.

TERCIARIAS: compendios de fuentes secundarios, listados de publicaciones boletines, conferencias, simposios, sitios WEB, títulos de reportes, etc.

¿CÓMO SE CONSTITUYE EL MARCO TEÓRICO?

(Kerlinger) TEORÍA: conjunto de conceptos, definiciones y proposiciones relacionados entre sí, que presentan una visión sistemática de fenómenos especificando relaciones entre variables con el objetivo de explicar y predecir fenómenos.

¿Cuáles son las funciones de una Teoría?

- Explicar, decir porqué, cómo, cuando, ocurre un fenómeno.- Sistematizar, ordenar el conocimiento sobre un fenómeno o

una realidad.- Hacer inferencias a futuro, predecir, sobre el comportamiento

de un futuro.

ESTRATEGIAS PARA CONSTRUIR EL MARCO TEÓRICO

1. Existencia de una teoría completamente desarrollada.

2. Existencia de varias teorías aplicables.

3. Existencia de “piezas y trozos” de teorías.

4. Descubrimientos interesantes, pero parciales, que no se ajustan a una teoría.

5. Existencia de guías no investigadas, ideas largamente relacionadas con la investigación.

PARTES O ELEMENTOS QUE CONFORMAN EL MARCO TEÓRICO

• Antecedentes de la Investigación.• Reseña Institucional (si aplica).• Bases Teóricas.• Bases Legales (si aplica).• Sistema de Variables.• Definición de Términos Básicos.

HIPOTESIS

Son explicaciones tentativas del fenómeno investigado y que se formulan como proposiciones. (No siempre son verdaderos; o siempre pueden comprobarse con hechos o experimentalmente).

Sus funciones son:• Guiar el estudio• Proporcionar explicaciones• Apoyar la prueba de teorías

CARACTERÍSTICAS DE UNA HIPÓTESIS

• Deben referirse a una situación real, contexto y universo bien definidos.

• Las variables de la hipótesis deben ser comprensibles, precisas y lo mas concretas posible.

• Relación entre variables debe ser clara y verosímil (lógica).

• Las variables y la relación entre ellas deben ser observables y medibles, tener referentes en la realidad.

• Deben estar relacionadas con técnicas disponibles para probarlas

CLASIFICACIÓN DE LAS HIPOTESIS

INVESTIGACIÓN:

Proposiciones tentativas acerca de las posibles relaciones entre dos o más variables y que cumplen con los requisitos mencionados

Hi H1, H2, H3

NULAS:

Reverso de las anteriores

Refutan o niegan lo que afirma la hipótesis de investigación (la relación entre variables)

Ho

ALTERNATIVAS:

Posibilidades diferentes o alternas entre las hipótesis de investigación y nula.

ESTADISTICAS: (enfoque cuantitativo)

Representan la transformación de las hipótesis de investigación, nulas y alternativas en símbolos estadísticos

VARIABLES

Cualidad o característica de un objeto (o evento) que contenga, al menos, dos atributos en los que pueda clasificarse un objeto o evento

Requisitos básicos:

Exhaustividad: debe comprender el mayor número de atributos posible. Toda observación debe ser clasificada

Exclusividad: los distintos atributos de la variable deben ser mutuamente excluyentes. Una observación solo puede clasificarse en términos de un solo atributo

Precisión: realizar el mayor número de distinciones posibles. Las categorías pueden agruparse más tarde, el camino inverso no es posible...

NIVEL DE MEDICIÓN

Variables Nominales:

Ejemplos: sexo, nacionalidad, estado ocupacional, grupo sanguíneo, partido político, estado civil, religión, plan social al que pertenece, localidad donde reside, etc.

No se puede establecer ningún tipo de relación

Análisis estadístico limitado

NIVEL DE MEDICIÓN

Variables Ordinales:

Ejemplos: estrato social, orden de mérito, nivel educativo, opinión acerca de un hecho/situación/gobierno

Los atributos, además de poseer las características mencionadas, tienen la propiedad de poder establecer un orden

No puede conocerse la magnitud de la diferencia entre un atributo y otro

Son variables no métricas o cualitativas

Análisis estadístico limitado

NIVEL DE MEDICIÓN

Variables Cuantitativas o métricas:

Variables de intervalo:

Además de establecer un orden, la diferencia entre dos atributos puede cuantificarse

La distancia que separa a personas de 15 y 16 años, es la misma que la existente entre personas de 72 y 73 años

Permite realizar la mayoría de las operaciones aritméticas

Ejemplos: temperatura en ºC

No tiene cero absoluto. El cero no implica la ausencia de atributo

NIVEL DE MEDICIÓN

Variables Cuantitativas o métricas:

Variables de razón:

Además de las características de las variables de intervalo, se suma la posibilidad de contar con un cero absoluto

El cero absoluto indica ausencia de la característica

Permite cálculo de proporciones

Permite realizar cualquier operación aritmética

Ejemplos: ingreso, altura, peso, número de habitantes, todas las variables que consideren tiempo y distancia

NIVEL DE MEDICIÓN

Variables Cuantitativas o métricas:

Variables discretas:

Entre dos valores dados, no existen valores intermedios

Ejemplos: número de hijos, número de elementos vendidos, número de beneficiarios de un plan

Variables continuas:

Entre dos valores dados, existen valores intermedios

Ejemplos: edad, peso, altura, ingreso

Variable Dicotómica:

Sólo puede tomar dos valores (sí – no, 0 – 1, hombre – mujer, bueno – malo, encendido – apagado).

VARIABLES DEL DISEÑO EXPERIMENTAL

Tipo Acción

V. Independient

e Manipulación

V. Dependiente Medición

V. Extraña Control Variable Papel

V. Independient

e Causa

V. Dependiente Efecto

V. Extraña Confusión

DISEÑOS EXPERIMENTALES

• El diseño experimental es una estructura de investigación donde al menos se manipula una variable y las unidades son asignadas aleatoriamente a los distintos niveles o categorías de la variable o variables manipuladas.

• Se trata de un diseño estadístico, el mismo debe tener en cuenta la estructura del estudio, y todos los aspectos concernientes a la recolección de datos, incluido el tipo de mediciones a realizar y la frecuencia de las mismas.

DISEÑOS EXPERIMENTALES

• Es el proceso de planear un experimento para obtener datos apropiados, que pueden ser analizados mediante métodos estadísticos, con objeto de producir conclusiones válidas y objetivas.

X’sFactores

De control

Y´s respuestas

Z’s factores no controlables

ELEMENTOS DEL DISEÑO DE EXPERIMENTOS

El diseño de experimentos se refiere a la estructura del experimento considerando:

i) El conjunto de tratamientos incluidos en el estudio.

ii) El conjunto de unidades experimentales utilizadas en el estudio.

iii) Las reglas y procedimientos por los cuales los tratamientos son asignados a las unidades experimentales (o viceversa).

iv) Las medidas o evaluaciones que se hacen a las unidades experimentales luego de aplicar los tratamientos

¿QUÉ ES UN EXPERIMENTO DISEÑADO?

Proceso

Entradas Salidas (Y)

Diseño deProducto

Entradas Salidas (Y)

Cambios deliberados y sistemáticos de las variables de entrada (factores) para observar los cambios correspondientes en la salida (respuesta).

REQUISITOS DE UN EXPERIMENTO

• El primer requisito es la manipulación intencional de una o más variables independientes. Es decir la variable independiente es la que se considera como supuesta causa en una relación entre variables. Al efecto provocado por dicha causa se le denomina variable dependiente.

• Medir el efecto que la variable independiente tiene en la variable dependiente.• Maneras de medir:• Cuestionarios• Escalas• Observación• Entrevistas• Mediciones fisiológicas• Análisis de contenido

• Hay dos requisitos importantes que debemos manejar a la hora de llevar a cabo un experimento.• Control • Validez interna

¿CÓMO SE LOGRAN EL CONTROL Y LA VALIDEZ INTERNA?

• Se logra cuando en un experimento tenemos grupos equivalentes en todo.

• Manipulación de la variable independiente.

• En un experimento se debe de tener por lo menos dos grupos a comparar.

• Esto debe de ser así para poder verificar si existen cambios significativos durante el experimento.

OBJETIVOS CONSECUCIÓN

Maximizar la variancia sistemática primaria

Mediante la adecuada elección de los valores de la variable independiente

Mediante la selección de un diseño adecuadoControl de las fuentes de variación secundarias

Aumentando la precisión en la medida de los registros y selección de sujetos homogéneosMinimizar la variancia del error

OBJETIVOS DE UN EXPERIMENTO

CLASIFICACIÓN POR VALIDEZ

• Pseudo-experimentales:• un grupo con una sola medida

X O• pretest-postest de un solo grupo

O1 X O2• dos grupos NO equivalentes

G1 X O1G2 O2

CLASIFICACIÓN POR VALIDEZ

• Cuasi-experimentales:• Dos grupos no equivalentes con pre-

postest G1 O1 X O2G2 O3 O4

• Dos muestras separadas con pretest-postest

G1 O1 XG2 X O2

CLASIFICACIÓN POR VALIDEZ

• Experimentales:• Dos grupos equivalentes con pretest -

postest G1 X O1G2 O2

CLASIFICACIÓN POR NÚMERO FACTORES

• Simples: una Variable Independiente• Factoriales: más de una V.I.

Estudio de la interacción

V 1

V 2V 2

V 1

EXPERIMENTOS FACTORIALES

• Totalmente aleatorizado: (A x B)• Ejemplo: Conocimiento x Coherencia (2 x 2)

• Efecto Conocimiento (A)• Efecto Coherencia (B)• Efecto Interacción (A*B)

• Medidas Repetidas: • Mismo grupo, medido varias veces

• Mixto: Entre-sujetos e Intra-sujetos

EXPERIMENTOS FACTORIALES

• Bloques al azar:• Variables que influye validez interna• Bloque como factor

• Jerárquicos o anidados• Evitar todas las combinaciones de un factor

A B C D

Procedimiento 1 Procedimiento 2

Centro

DISEÑOS EVOLUTIVOS

-Foco: cambios en el tiempo

-Tipos:

- Longitudinal: cambios de un grupo de participantes

- Transversal: distintos grupos (de diferentes edades)

- Secuencial: combinación longitudinal + transversal

Técnicas de control

Experimental o directo: Diseño

Estadístico o indirecto: Ajuste

Técnicas de control asociadas al diseño

Aleatorización Diseños de grupos completamente al azar

Constancia Diseños de dos grupos apareados y de bloques

El sujeto como control propio

Diseños intra-sujetos o de medidas repetidas

Técnica de control Diseño

CLASIFICACIÓN DEL DISEÑO EXPERIMENTAL CLÁSICO

Diseños experimentales

Diseños entre-grupos

Diseños intra-sujetos o de medidas repetidas

Simple

Factorial

Diseños mixtos

Simple

Factorial

ESTRATEGIA DE COMPARACIÓN

CANTIDAD DE VARIABLES

INDEPENDIENTES

EL DISEÑO DE EXPERIMENTOS TIENE COMO OBJETIVOS DETERMINAR:

• Las X’s con mayor influencia en las Y’s

• El mejor valor de X’s para lograr Y’s nominales

• El mejor valor de X’s de manera que la variabilidad de Y sea pequeña

• El mejor valor de las X’s de manera que se minimizen los efectos de las Z’s – Proceso robusto

DISEÑO DE DOS GRUPOS

• Una de las situaciones más simples de investigación experimental, es la formada por dos grupos, uno de control y otro experimental.

Técnica de control Diseño

Aleatorización Diseño de dos grupos completamente al azar

ConstanciaDiseño de dos grupos apareados Diseño de bloques de dos tratamientos

El sujeto como control propio

Diseños de medidas repetidas (Sujetos x Tratamientos)

FORMATO DEL DISEÑO DE DOS GRUPOS COMPLETAMENTE AL AZAR

SUJETOS

SUJETOS

A2

(Grupo control)

A1

(Grupo experimental)

SUJETOS

SUJETOS

A2

(Grupo control)

A1

(Grupo experimental)

Muestra experimental Asignación al azar

FORMATO DEL DISEÑO DE DOS GRUPOS EMPAREJADOS

SUJETOS

SUJETOS

A2

(Grupo control)

A1

(Grupo experimental)

SUJETOS

SUJETOS

A2

(Grupo control)

A1

(Grupo experimental)

Muestra experimental Asignación al azar

S1, S2

S3, S4

S5, S6

DISEÑOS MULTIGRUPO

• Los diseños multigrupo, son estructuras de una sola variable independiente a tres o más valores o niveles. Al seleccionar más de dos valores de la variable independiente o causal, es posible extraer la relación funcional entre la variable independiente y dependiente del experimento.

Técnicas de control Diseño

Aleatorización Diseño multigrupo (de tres o más grupos completamente al azar)

ConstanciaDiseño de bloques de grupos al azar

El sujeto como control propio

Diseño de medidas repetidas con tres o más tratamientos (Sujetos x Tratamientos)

DISEÑO MULTIGRUPO AL AZAR

• El diseño multigrupo completamente al azar requiere la asignación aleatoria de los sujetos de la muestra a los distintos grupos, sin restricción alguna. Se trata de una extensión del diseño de dos grupos, ya que en esta situación se eligen de la variable de tratamiento más de dos valores o condiciones.

DISEÑO MULTIGRUPO AL AZAR

Muestra experimental

Asignación aleatoria

Tratamientos

.…………

A1 A2 … Aj … Aa

Sujetos

Sujetos

Sujetos

Prueba de significación general

Si la V. Independiente es categórica

Si la V. Independiente es cuantitativa

ANOVA unidireccional

Comparaciones múltiples

Análisis de tendencias

DISEÑO MULTIGRUPO AL AZAR

DISEÑO DE BLOQUES DE GRUPOS AL AZAR

• El principal objetivo de la experimentación es el control de las fuentes de variación extrañas. La neutralización o control de las variables extrañas incide directamente en la reducción de la variación del error. Es decir, las unidades varían con respecto a cualquier variable a excepción de la controlada. Siendo esto así, el margen de variación es menor que con la presencia de la variable extraña (o variable no controlada).

TÉCNICA DE BLOQUES

• Mediante la técnica de bloques se pretende conseguir una mayor homogeneidad entre los sujetos o unidades experimentales intra bloque y una reducción del tamaño del error experimental. La formación de bloques homogéneos se realiza a partir de los valores de una variable de carácter industrial, biológico o social, altamente relacionada con la variable dependiente.

Bloques TratamientosA1 A2 ··· Aj ··· Aa

………………………………………..…………………………….………….

n1 n2 nj na··· ···

B1

B2

Bk

n1 n2 nj na··· ···

n1 n2 nj na··· ···

FORMATO DEL DISEÑO DE BLOQUES

VENTAJAS DE LA TÉCNICA DE BLOQUES

• Se neutraliza una potencial fuente de variación extraña que, en caso contrario, incrementaría la variación del error.

• Mediante la técnica de bloques se consigue un material experimental mucho más homogéneo, se reduce la magnitud del error experimental y se incrementa el grado de precisión del experimento.

DISEÑO FACTORIAL

• El diseño factorial, como estructura de investigación, es la combinación de dos o más diseños simples (o unifactoriales); es decir, el diseño factorial requiere la manipulación simultánea de dos o más variables independientes (llamados factores), en un mismo experimento.

Cantidad de niveles por factor 2x2, 2x2x2, 2x3, 2x3x4, etc.

Grado de control

Diseño factorial completamente al azarDiseño factorial de bloques

EFECTOS FACTORIALES ESTIMABLES

1. Efectos simplesEl efecto puntual de una variable independiente o factor para cada valor de la otra.2. Efectos principalesSon el impacto global de cada factor considerado de forma independiente, es decir, el efecto global de un factor se deriva del promedio de los dos efectos simples. 3. Efectos secundariosEl efecto secundario o de interacción se define por la relación entre los factores o variables independientes, es decir, el efecto cruzado.

FORMADO DEL DISEÑO FACTORIAL 2 X 2 COMPLETAMENTE AL AZAR

SUJETOS

A1B1

SUJETOS

A1B2

SUJETOS

SUJETOS

A2B2A2B1

SUJETOS

A1B1

SUJETOS

A1B2

SUJETOS

SUJETOS

A2B2A2B1

Muestra experimental

Asignación al azar

REPRESENTACIÓN GRÁFICA DE LA INTERACCIÓN

A1 A2

B1

B2

Interacción nula

A1 A2

B2

B1

Interacción positiva

A1 A2

B2

B1

Interacción negativa

A1 A2

B1

B2

Interacción inversa

A1 A2

B1

B2

Interacción inversa

A1 A2

B1

B2

Interacción inversa

VENTAJAS DEL DISEÑO FACTORIAL

• La disposición bifactorial aporta información no sólo de cada factor (efectos principales), sino de su acción combinada (efecto de interacción o efecto secundario). De esta forma, con la misma cantidad de sujetos requerida para experimentos de una sola variable independiente o factor, el investigador puede estudiar, simultáneamente, la acción de dos o más variables manipuladas.

• Ello supone un enorme ahorro de tiempo y esfuerzo. Si se tiene en cuenta la posibilidad de analizar la acción conjunto o cruzada de las variables, se concluye que el diseño factorial es una de las mejores herramientas de trabajo.

DISEÑO DE MEDIDAS REPETIDAS

• El diseño de medidas repetidas es una extensión del diseño de bloques, en que el sujeto sustituye al bloque y actúa de control propio. Con este formato, los sujetos de la muestra reciben todos los tratamientos y repiten medidas o registros de respuesta; asimismo, la comparación de los tratamientos es intra-sujeto.

• De este modo, el uso del procedimiento de medidas repetidas proporciona un control más efectivo de las fuentes de variación extrañas asociadas, por lo general, a las características individuales; es decir, se consigue una reducción de la variancia del error.

EFECTOS DE ORDEN

Los efectos de orden se derivan de la propia estructura del diseño de medidas repetidas, y deben ser neutralizados para que no confundan los efectos de los tratamientos.

A) Efecto residualB) Efecto de período

EFECTO RESIDUAL

• El efecto residual, conocido por error progresivo, se caracteriza por la persistencia de la acción de un tratamiento más allá del período o tiempo de aplicación. Representa la progresiva acumulación tanto de los efectos facilitadores de la respuesta (efecto de la práctica, aprendizaje, etc.) como de los efectos obstaculizadores (como la fatiga mental, cansancio físico, etc.)

Solución: ampliar los intervalos entre tratamientos.

EFECTO DE PERÍODO

• Los efectos de período ocurren cuando, independientemente del tratamiento aplicado, el sujeto responde al período o posición que, en la secuencia, ocupa el tratamiento (período de administración). Cabe, por lo tanto, la posibilidad de que el sujeto responda mejor al período que al tratamiento en sí mismo. Cuando esto ocurre, el efecto de período confunde la acción del tratamiento.

Solución: contrabalanceo

DISEÑO DE MEDIDAS REPETIDAS SIMPLE DE UN GRUPO

• El diseño simple de medidas incorpora la estrategia de comparación intra-sujeto. Los sujetos se cruzan o combinan con los tratamientos (Sujetos x Tratamientos). Así mismo, es un diseño simple o unifactorial porque sólo se evalúa la acción de una variable independiente o de tratamientos.

• La principal ventaja del diseño, dada su especial disposición, es la posibilidad de extraer del error una de sus fuentes de variación más importante: la variación atribuida a las diferencias individuales.

ESTRUCTURA DEL DISEÑO

• A diferencia del diseño factorial, la variable de sujetos no es manipulada, ya que se trata de un pseudo-factor. La variable de tratamientos está manipulada por el experimentador y es considerada como un auténtico factor.

DISEÑO DE MEDIDAS REPETIDAS SIMPLE (S X A)

A1 A2 ........ Aa

Sujeto 1 Sujeto 1 ........ Sujeto 1

Sujeto 2 Sujeto 2 ........ Sujeto 2

..........................................................

Sujeto N Sujeto N ........ Sujeto N

DISEÑO DE MEDIDAS REPETIDAS FACTORIAL (S X A X B)

A1B1 A1 B2 A2B1 A2B2

Sujeto 1 Sujeto 1 Sujeto 1 Sujeto 1

Sujeto 2 Sujeto 2 Sujeto 2 Sujeto 2

....................................................................

Sujeto N Sujeto N Sujeto N Sujeto N

DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO

• El diseño de medidas repetidas multigrupo, conocido también por diseño factorial mixto, incorpora dos estrategias de inferencia de hipótesis: estrategia de comparación entre grupos y estrategia de comparación intra sujetos. La estructura mixta combina, en un mismo experimento, el procedimiento de grupos independientes y el procedimiento con sujetos de control propio.

DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO

• Puesto que el diseño mixto integra, en un mismo estudio, dos enfoques de investigación se aplica a aquellas situaciones donde están presentes, por lo menos, dos variables independientes. Así, los valores o niveles de la primera variable independiente genera grupos separados y su efecto se infiere por la comparación entre grupos o entre sujetos.

DISEÑO DE MEDIDAS REPETIDAS MULTIGRUPO O FACTORIAL MIXTO

• Esta variable independiente es conocida como variable entre. Los valores de la segunda variable se administran a todos los sujetos, en cuyo caso los sujetos repiten medidas. Dado el carácter de repetición, esa segunda variable recibe el nombre de variable intra. De esto se concluye que el diseño mixto requiere siempre una estructura factorial. Por lo tanto, son experimentos donde intervienen como mínimo dos variables.

FORMATO DEL DISEÑO DE MEDIDAS REPETIDAS DE DOS GRUPOS

Muestra experimental

B1 B2 B3

Sujeto 1 Sujeto 1 Sujeto 1

Sujeto 2 Sujeto 2 Sujeto 2

...................................................

Sujeto N Sujeto N Sujeto N

Asi

gnac

ión

al a

zar

Sujeto 1 Sujeto 1 Sujeto 1

Sujeto 2 Sujeto 2 Sujeto 2

...................................................

Sujeto N Sujeto N Sujeto N

A1

A2

FACTOR INTRA

FA

CT

OR

EN

TR

E

MUESTREO

• Población: Conjunto de unidades de las que se desea obtener cierta información.

• Muestra: Selección de unas unidades concretas de la población que representen la característica que se quiere medir.

• Procedimiento por el cual se extrae, de un conjunto de unidades que constituyen el objeto de estudio (población), un número de casos reducido (muestra) elegidos con criterios tales que permitan la generalización a toda la población de los resultados obtenidos al estudiar la muestra.

RAZONES DE MUESTREO

• Disminución de costos ( tiempo, personal, material)

• Al disminuir el número de casos disminuyen también los errores asociados a la manipulación de los datos.

• Puede confiarse en la generalización de los resultados si se ha tenido cuidado al seleccionar la muestra.

CRITERIOS IMPORTANTES PARA LA SELECCIÓN DE LA MUESTRA

• Salvo en poblaciones muy pequeñas y accesibles nunca se observan a todas las unidades de la población.

• Se debe diseñar una muestra que constituya una representación a pequeña escala de la población a la que pertenece.

• Cualquier diseño muestral comienza con la búsqueda de la información que ayude a la identificación de las características de la población bajo estudio

TAMAÑO DE LA MUESTRA

• Es el número de unidades a incluir en la muestra. • Existen varios factores que influyen en el:

• Tiempo y recursos disponibles• Modalidad de Muestreo • Tipo de Análisis Previsto• Varianza o heterogeneidad de la población• Margen de Error máximo admisible• Nivel de confianza de la estimación muestral

TIPOS DE MUESTREOS

PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral

•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos

USOS DE CADA TIPO DE MUESTREO

Muestreo Probabilísticos

• Estimación de Parámetros

• Comprobación de Hipótesis

Muestreos No Probabilísticos

• Estudios Pilotos• Estudios Cualitativos• Investigaciones en

poblaciones de difícil registro o localización ( Ej. Marginales, prostitutas, enfermos de VIH, etc…)

RECORDANDO: TIPOS DE MUESTREOS

PROBABILÍSTICOS NO PROBABILISTICOS

•Todas las unidades tienen igualprobabilidad de participar enla muestra.•La elección de cada unidad muestral es independiente de lasdemás•Se puede calcular el error muestral

•Cada unidad NO tiene igualprobabilidad de participar enla muestra.•No se puede calcular el error muestral•Alto riesgo de invalidez producido por la introducción de sesgos

EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

• Se realiza un muestreo entre los alumnos que van a clases de la Materia Metodología, eligiéndolos al azar a la entrada del salón.

Este diseño es NO probabilístico porque aquellos que no van a clases NO PUEDEN ser elegidos

EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

• Se utiliza la lista de propietarios de líneas telefónicas para elegir a aquellos que serán encuestados.

Este diseño es NO Probabilístico porque aquellos que no tienen teléfono NO PUEDEN ser elegidos

EJEMPLO: ¿MUESTREO PROBABILÍSTICO?

• Un investigador toma muestras del carbón extraído de una mina, tomando al azar trozos de carbón de la parte superior de cada carro.

Este diseño es NO probabilístico porque solo se toma carbón

de la parte superior

FACTORES QUE INFLUYEN EN EL TAMAÑO DE LA MUESTRA

La técnica de análisis influye en el tamaño de la muestra:

• Comparación de Medias• Estimación de Proporciones

( parámetros) • Análisis Univariables• Análisis Multivariables

HETEROGENEIDAD POBLACIONAL

• Cuanto mas heterogénea sea la población mayor será su varianza poblacional lo que implicará mayores tamaños muestrales.

• Cuando se desconoce el valor de la varianza poblacional se recurre al supuesto mas desfavorable, asumiendo una varianza poblacional igual a 0,5.

• 0,5 significa que una unidad seleccionada tiene 50 % de posibilidades de pertenecer o no a un grupo específico dentro de la población.

ALGUNOS TIPOS DE MUESTREO PROBABILÍSTICO

SimpleSistemáti

coEstratific

ado

Por Conglome

rados

MUESTREOS PROBABILÍSTICOS: SIMPLE

• Se realiza utilizando alguna fuente de elección aleatoria.

• Supone que cada miembro de la población tiene elemento que lo identifica ( ej. Un número identificador) y mediante el cual puede ser elegido si “sale” sorteado.

• La afirmación anterior implica que hay que tener un listado completo de TODOS los miembros de la población.

MUESTREOS PROBABILÍSTICOS: SIMPLE

• Ventajas• Facilidad en los cálculos

estadísticos

• Elevada probabilidad de lograr “equivalencia” entre las características de la muestra y las correspondientes a la población

• Desventajas• Cada que cada miembro

de la población tiene que ser identificado

• Complicado en poblaciones grandes

• Alto costo

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO SISTEMÁTICO

Similar al muestro simple salvo que:• Solo la primera unidad de la muestra se elige

al azar siempre que el número seleccionado sea mayor que el coeficiente de elevación.

• Coeficiente de Elevación = N/ n • Donde

• N: Tamaño de la población• n : Tamaño de la muestra

• Los restantes elementos de la muestra se hayan sumando, sucesivamente el coeficiente de elevación.

MUESTREOS PROBABILÍSTICOS: MUESTREO ALEATORIO ESTRATIFICADO

• Presupone el conocimiento de las características de las unidades que forman la población para poder dividirla en grupos ( estratos)

• Se eligen los miembros de la muestra en cada estrato creado siguiendo algún tipo de muestreo de los vistos anteriormente.

EJ. MUESTREO PROBABILÍSTICO POR ESTRATOS

Universidad

Facultad de Ingeniería

Carrera 1

Profesores

Carrera 2

Profesores

Facultad de ciencias

Carrera 1

Profesores

Carrera 2

Profesores

Estrato Primario

MUESTREO ALEATORIO ESTRATIFICADO

El objetivo de este tipo de muestreo es garantizar la representatividad equitativa de los estratos ( que implica representación equitativa de las características de la población).Se logra si:

• Son máximas las diferencias entre los estratos.• Son mínimas las diferencias entre los miembros

de un mismo estrato. • Los criterios de división de la población en

estratos se hallen relacionadas con los objetivos de la investigación.

MUESTREO ALEATORIO ESTRATIFICADO

Los tamaños de cada estrato pueden ser:• Los mismos ( Afiliación simple).• Proporcional al peso relativo ( tamaño)

del estrato dentro de la población (Proporcional).

• En función de la heterogeneidad de cada estrato ( Óptima).

VENTAJAS Y DESVENTAJAS

1. No es necesario disponer de la lista de toda la población sino de las subpoblaciones de orden superior extraídas ( por ej. las escuelas primarias y secundarias)

2. Existe una considerable reducción de costos

• Puede ocurrir que los miembros de una unidad superior se parezcan, reduciendo la representatividad de otros en la muestra final.

Ventajas Desventajas

MUESTREO ALEATORIO POR CONGLOMERADOS

• La unidad muestral es un grupo de elementos de la población que forman una unidad, a la que llamamos conglomerado.

• A diferencia de un estrato, un conglomerado es una unidad de elementos que contienen representantes de toda la población.

Zona Geográfica

Edificio

Una institución

EJEMPLO: MUESTREO POR CONGLOMERADOS

Universidad

Facultad de Ingeniería

Carrera 1 Carrera 2

Facultad de Ciencias

Carrera 1 Carrera 2

Todos los profesores de las Carrera 2 (F. Ingeniería) y Carrera 1 (F. Ciencias) son parte de la muestra

VENTAJAS DEL MUESTREO POR CONGLOMERADOS

• Es ventajoso, desde el punto de vista de costos, si se pueden agrupar los miembros de la población por conglomerados, en los cuales el criterio de agrupación no sea la variable que se estudia.

• No es preciso tener un listado de toda la

población, sino de las unidades ( conglomerados) por los que se agruparán.

DESVENTAJAS

• El error es mayor que cuando se utilizan otras técnicas de muestreo.

TIPOS DE MUESTREOS NO PROBABILÍSTICOS POR CUOTAS

• La población debe ser dividida en estratos definidos por variables cuya distribución dentro de la población sea conocida.

• Se procede a calcular el tamaño de cada estrato siguiendo el mismo procedimiento que si fuese un muestreo probabilístico estratificado. ( proporcional).

• A diferencia del M. Probabilístico Estratificado el entrevistador es libre para escoger a quienes forman parte de cada estrato. (CUOTA)

MUESTREO POR CUOTAS

• Resulta más económico que los muestreos probabilísticos .

• Fácil de ejecutar el trabajo de campo

• No precisa el listado de la población

• Supone mayor error muestral que los diseños probabilísticos.

• No existe un método válido para calcular el error.

• Dificultas para el control del trabajo de campo.

• Limitaciones en la representatividad de la muestra para las características no especificadas en los controles de cuotas.

Ventajas Desventajas

MUESTREO DE BOLA DE NIEVE

• Este modelo es particularmente útil cuando se muestrean poblaciones cuyos componentes, por motivos morales, ideológicos, legales o políticos tienen a ocultar su identidad.

• A partir de unos pocos individuos el entrevistador, con ayuda de los primeros, va “ conociendo” a nuevos miembros de la muestra.

• El riesgo fundamental está asociado a la selección inadecuada de los primeros miembros de la muestra y de quienes dependerá el resto.

• También es posible que ocurran distorsiones si no se tiene en cuenta criterios muy específicos para la selección de la muestra.

TAMAÑO DE LA MUESTRA

• Estimando qué proporción de sujetos poseen una característica al nivel de confianza del 99% (Z=2.56) y un error de admitido del 2%, será: R=4096

• El número óptimo para un estudio de 60.000 personas estableciendo un nivel de confianza de 95%(z=1.96), y el margen de error en el 3%, sería:R=1049

• Es necesario estimar entre 10.000 establos, el número de vacas lecheras por establo con un error de estimación de 4 y un nivel de confianza del 95%. Sabemos que la varianza es 1.000. ¿Cuántos establos deben visitarse para satisfacer estos requerimientos? R=235

TAMAÑO DE LA MUESTRA

TAMAÑO DE LA MUESTRA

• Para analizar el crecimiento de ratas de laboratorio se elige una muestra piloto de 13 ratas y se miden obteniendo una talla promedio de la muestra de 5.3 centímetros y una varianza muestral de 19.2 Pregunta: Un investigador desea determinar el tamaño de muestra mínimo usando un diseño MAS para estimar la talla promedio de las ratas en la población con una confianza de 95% y un error de estimación no mayor a 2 centímetros si en la población hay 200 ratas. ¿Cuántas ratas se debe elegir en la muestra? R=19

TAMAÑO DE LA MUESTRA

• En una fábrica de artículos electrónicos generalmente el 10% de los artículos presenta algún defecto de fabricación. Para analizar la calidad del producto se desea estimar la proporción de artículos electrónicos defectuosos de un lote de 2000 artículos listo para ser embarcado. ¿Cuántos artículos deben ser elegidos del lote si se desea una confianza de 95% y un error de estimación no mayor a 0.05?

TAMAÑO DE LA MUESTRA

• Para estudiar la imagen de diferentes empresas, se pide a los encuestados que los evalúen en una escala (continua) de 0 a 10 puntos. Si se acepta que la varianza de esta variable es de 1.5 puntos, ¿cuántos casos se necesitan para que la semi-amplitud del intervalo de confianza al 95% de la media poblacional sea de 0.05 puntos?

TAMAÑO DE LA MUESTRA

• Una máquina llena cajas con cierto cereal. El supervisor desea conocer con un error de estimación de máximo 0.1 y un nivel de confianza del 90%, una media estimada del peso. Como la varianza era desconocida se procedió a escoger una muestra piloto. Los resultados fueron los siguientes: 11.02, 11.14, 10.78, 11.59, 11.58, 11.19, 11.71, 11.27, 10.93, 10.94. ¿Cuántas cajas debe escoger para que se cumplan los requisitos propuestos?

TAMAÑO DE LA MUESTRA

• Se desea hacer una encuesta para determinar la proporción de familias que carecen de medios económicos para atender los problemas de salud. Existe la impresión de que esta proporción está próxima a 0.35. Se desea determinar un intervalo de confianza del 95% con un error de estimación de 0.05.

TAMAÑO DE LA MUESTRA

• Un productor de semillas desea saber con un error de estimación del 1% el porcentaje de semillas que germinan en la granja de su competidor. ¿Qué tamaño de muestra debe tomarse para obtener un nivel de confianza del 95%?

TAMAÑO DE LA MUESTRA

• Se desea realizar una encuesta entre la población juvenil de una determinada localidad para determinar la proporción de jóvenes que estaría a favor de una nueva zona de ocio. El número de jóvenes de dicha población es N=2,000. Determinar el tamaño de muestra necesario para estimar la proporción de estudiantes que están a favor, con un error de estimación de 0.05 y un nivel de confianza del 95%.

TAMAÑO DE LA MUESTRA

• Determinar el número de profesionales a encuestar en una región donde se estima en 4500 el número de ellos. El objetivo del estudio es determinar entre otras cosas, la intencionalidad de seguir estudios de maestría, con una prueba piloto de 20 profesionales, se determinó que la proporción de profesionales con afán de continuar sus estudios era del 25%. La confiabilidad del estudio, dado que sus resultados serán validados con otras fuentes se definió en el 90%, el error puede estar entre el 4 y el 6%, dependiendo de los costos se definirá cual tamaño seleccionar.

TAMAÑO DE LA MUESTRA

• De una población de 1 176 adolescentes, de la ciudad de SLP, se pretende conocer la aceptación de una barra energetica. Se desea tomar una muestra para saber la cantidad de adolescentes a entrevistar y con ello tener una información adecuada, con un error standard de 1.5% al 90% de confiabilidad.

TAMAÑO DE LA MUESTRA

• Suponga que decide llevar a cabo un estudio comparativo del costo de una comida en un restaurante de una gran ciudad con el de una comida similar en un restaurante fuera de la ciudad. La siguiente tabla muestra los datos de 50 restaurantes citadinos y 50 fuera de la ciudad. Con un intervalo de confianza de 90% y un error de 5 pesos, ¿Cuántos restaurantes debo seleccionar para estimar el costo de los platillos?.

• Para la elección y desarrollo del instrumento de medición se debe tomar en cuenta el objetivo de la investigación.

• La metodología utilizada en la recolección de datos debe estar acorde con el enfoque conceptual que se ha desarrollado en el estudio.

MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION

• Al momento de definir como se va a abordar la recolección de los datos, se debe definir el tipo de información requerida (cuantitativa, cualitativa o ambas).

• Método: Representa la estrategia concreta e integral de trabajo para el análisis de un problema coherente con la definición teórica del mismo y con los objetivos de la investigación.

• Tipo de Método: observación, entrevista y la encuesta.

MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION

• Técnica: conjunto de reglas y procedimientos que permiten al investigador establecer la relación con el objeto o sujeto de la investigación.

• Instrumento: mecanismo que usa el investigador para recolectar y registrar la información; formularios,pruebas, test, escalas de opinión, listas de chequeo.

MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION

• El método orienta la técnica, pueden existir distintas técnicas de recolección de información, pero no varios métodos, sin ser validados como tales.

• En investigación cuantitativa el investigador puede usar varias técnicas; entrevistas y cuestionarios, ayudados por entrevistas grupales, historias de vida y observación etnográfica. (cualitativas)

MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION

1- Fuentes Primarias: Se obtiene información por contacto directo con el sujeto de estudio; por medio de observación, cuestionarios, entrevistas, etc.

2- Fuentes Secundarias: Información obtenida desde documentos; historia clínica, ficha académica, estadísticas, datos epidemiológicos, Censo, encuestas nacionales, etc.

MÉTODOS, TÉCNICAS DE RECOLECCION DE DATOS E INSTRUMENTOS DE MEDICION

1- LA OBSERVACIÓN: Es el registro visual de lo que ocurre en una situación real, clasificado y consignando los datos de acuerdo con algún esquema previsto y de acuerdo al problema que se estudia.

• Ventajas:• Permite registrar datos cualitativos y cuantitativos.• Se observan características y condiciones de los individuos.• Puede ser utilizada en cualquier tipo de investigación y en

cualquier área del saber.• Es un método que no depende de terceros o de registros.

FUENTES DE INFORMACÌÓN

• Desventajas:• Se requiere de mucha habilidad y agudeza para “ver” los

fenómenos estudiados.• Demanda gran cantidad de tiempo.• Tiene sesgos; el humano ve lo que quiere ver.• Al momento de la interpretación pueden distorsionarse los

hechos e ir más allá de lo que vimos en realidad.

• Para reducir los problemas se utiliza:• Definir claramente los objetivos perseguidos.• Determinar claramente la unidad de observación.• Las condiciones en que se asumirá la observación y las

conductas que deberán registrarse.

LA OBSERVACIÓN

1- La Observación Participante: El investigador se involucra total o parcialmente con la actividad objeto de investigación.• La observación se hace desde el interior del grupo.• Pueden intervenir las emociones del investigador.

2- La Observación NO Participante:El investigador no se involucra en la actividad objeto de estudio.• Los datos pueden ser más objetivos.• Al no integrarse al grupo los datos pueden no ser exactos.

• “Todos los errores de la observación se pueden minimizar por medio de una buena definición operacional de las variables.”

LA OBSERVACIÓN

1-La Observación Simple, No estructurada, No regulada, No controlada: El investigador utiliza lineamientos generales para observar y luego escoge lo que estima relevante a los efectos de la investigación propuesta.Fundamentalmente usada para estudios exploratorios.

2- La Observación Sistemática, estructurada, regulada o controlada: El investigador dispone de un instrumento estructurado y estandarizado para medir las variables en estudio de una manera uniforme.Se utiliza para probar hipótesis en que se especifica claramente que se estudia.Se usan listas de cotejo, grabadoras, filmadoras, etc.

FORMAS DE OBSERVACIÓN

• Cuando los fenómenos a observar no se dan de la misma manera en todos los sujetos de observación.

• Cuando el observador tiene ideas prejuiciadas.

• Cuando el instrumento no es válido, es inexacto o está mal definido.

ERRORES RELACIONADOS CON LA OBSERVACIÓN

• Consiste en obtener información de los sujetos en estudio, proporcionados por ellos mismos, sobre opiniones, conocimientos, actitudes o sugerencias.

• Existen dos maneras de obtener información: 1- La Entrevista: Las respuestas son formuladas

verbalmente y se necesita de la presencia del entrevistador. y

2- El Cuestionario: Las respuestas son formuladas por escrito y no se requiere de la presencia del investigador.

LA ENCUESTA

• Comunicación interpersonal entre el investigador y el sujeto de estudio a fin de obtener respuestas verbales a las interrogantes planteadas sobre el problema propuesto.

• Ventajas:• Es aplicable a toda persona (muy útil con analfabetos, niños o

en aquellos con alguna limitación física o psicológica).• Permite estudiar aspectos psicológicos o de otra índole donde

se desee profundizar en el tema.• Permite obtener información más completa.• A través de ella el investigador puede: Aclarar el propósito del

estudio, especificar claramente la información que necesita, aclarar preguntas y permite usar triangulación.

• Permite captar mejor el fenómeno estudiado ya que permite observar lenguaje no verbal.

LA ENTREVISTA

1- ENTREVISTA ESTRUCTURADA.• Se elabora un formulario estandarizado.• Idénticas preguntas y en el mismo orden a todos los sujetos.• Los sujetos eligen la respuesta de 2, 3 o pocas más alternativas.• Los comentarios y explicaciones son los mismos para todos.

• Ventajas:• Respuestas cortas y precisas.• Información fácil de procesar.• El entrevistador no requiere de gran entrenamiento.• Información uniforme.

• Desventajas:• La información puede ser muy superficial.• Limitada la posibilidad de profundizar en un aspecto

determinado.• Difícil obtener información confidencial.

TIPO DE ENTREVISTA

2- ENTREVISTA NO ESTRUCTURADA.• Es flexible y abierta, pero regida por los objetivos de la

investigación.• Las preguntas, su contenido, orden y formulación es

controlado por el investigador, el que puede adaptarlas dependiendo de las situaciones y características de los sujetos en estudio.

• El entrevistado también cuenta con libertad para dar sus respuestas.

• Se utiliza un instrumento guía que contiene las orientaciones de los temas a tratar.

• Muy útil para estudios exploratorios, descriptivos y cualitativos.

• Ventajas:• Adaptable y aplicable a toda clase de sujetos en diversas

situaciones.• Permite profundizar en los temas de interés.• Orienta posibles hipótesis y variables cuando se exploran

áreas nuevas.

TIPO DE ENTREVISTA

• Desventajas:• Requieren mucho tiempo.• Muy costosos por el tiempo de las entrevistas.• Limitado para personas con problemas de comunicación.• Dificultad para tabular datos que han sido recopilados de

distinta forma.• Se requiere crear confianza y comodidad entre el

entrevistado y el entrevistador.• Se requiere habilidad técnica para obtener la información y

mayor conocimiento respecto del tema.• Debido a que son entrevistas en profundidad habitualmente

se utilizan muestras pequeñas.

TIPO DE ENTREVISTA

• Para evitar el rechazo o atrasos al aplicar entrevistas:• Establecer los contactos necesarios para el buen fin de las

entrevistas.• Entrevistador debe estar bien capacitado. El entrevistador

debe establecer una buena comunicación con el entrevistado, uso de vestuario adecuado, lenguaje adecuado, escuchar adecuadamente, no apresurar al entrevistado, etc.

• Buen registro de la información a fin de poder interpretarla adecuadamente.

• El entrevistador debe:• Dejarle un mensaje positivo al entrevistado.• Jamás dar consejos,• Jamás hacer juicios morales,• Jamás rebatir al entrevistado.

CONSIDERACIONES PARA LAS ENTREVISTAS

• Método que utiliza un instrumento o formulario impreso, destinado a obtener respuestas sobre el problema en estudio y que el sujeto investigado llena por sí mismo.

• El cuestionario puede aplicarse a grupos o individuos estando presente el investigador.

• Incluso puede enviarse por correo a los destinatarios.• Ventajas:

• Costo relativamente bajo.• Proporciona información sobre un mayor número de personas en

un período breve.• Fácil para obtener, cuantificar, analizar e interpretar datos.• Menores requerimientos de personal capacitado.• Mayor posibilidad de mantener anonimato de los encuestados.• Eliminación de los sesgos que introduce el encuestador.

CUESTIONARIO

• Desventajas:• Es poco flexible, la información no puede variar ni profundizarse.• Si el cuestionario se envía por correo, es posible que no sean

devueltos o que no se obtengan respuestas.• No utilizable en personas que no saben leer ni escribir.• No permite aclarar dudas.• Resulta difícil obtener cuestionarios completamente contestados.• Se deben obtener grandes muestras.

En general, el proceso de recolección de información para una investigación, métodos, técnicas e instrumentos y las fuentes de las mismas suelen combinarse, cada uno de ellos con sus ventajas y desventajas.

CUESTIONARIO

Se requiere verificar la calidad de la información con la finalidad que tengamos información real y sin errores (o con el mínimo error posible)

Esto se puede realizar mediante:

Revisión manual: se revisa la información de forma independiente.A pesar que este proceso no ofrece garantías, es mejor que sólo ingresar la información

Revisión de valores inconsistentes: La intención es no contar con valores inverosímiles, es decir, que los datos estén registrados dentro de los rangos reales que esa variable puede asumir

VALIDACIÓN DE LA BASE DE DATOS

Cotejo cruzado de bases independientes: Un capturista ingresa la información y otro ingresa la misma también de forma independiente. Luego de ello se realiza el contraste a través de un software. Se puede observar: inconsistencia entre las bases. Es el más usado.

Imputación de datos: Los procesos de limpieza de base de datos implican el tratamiento para los valores perdidos (el dato no se pudo recolectar pese a todos los esfuerzos)

Imputar es introducir un dato probable a partir de la información que se recolectó. Se necesitan que se cumplan:-Una serie de supuestos-Modelos matemáticos para su estimación-Proporción de datos a imputar muy pequeña.

VALIDACIÓN DE LA BASE DE DATOS

ELEMENTOS DE ESTADÍSTICA

• La Estadística es una ciencia que facilita la solución de problemas en los cuales necesitamos conocer características sobre el comportamiento de algún suceso o evento.

• Nos permite inferir el comportamiento de sucesos iguales o similares sin necesidad de que estos ocurran.

ETAPAS DE UN ESTUDIO ESTADÍSTICO

• Planteamiento del problema: consiste en definir el objetivo de la investigación y precisar el universo o población.

• Recogida de la información: consiste en recolectar los datos necesarios relacionados al problema de investigación.

• Análisis descriptivo: consiste en resumir los datos disponibles para extraer la información relevante en el estudio.

• Inferencia estadística: consiste en suponer un modelo para toda la población partiendo de los datos analizados para obtener conclusiones generales.

• Diagnóstico: consiste en verificar la validez de los supuestos del modelo que nos han permitido interpretar los datos y llegar a conclusiones sobre la población

ETAPAS DE UN ESTUDIO ESTADÍSTICO

Esquema de las etapas de un estudio estadístico

AREA DE INTERES DATOS

Tema de Investigación-Antecedentes Previos -Objetivos-Preguntas de Investigación-Posibles Hipótesis-Unidad de Análisis-Población-Variables

ORGANIZAR Y RESUMIR

ESTADÍSTICA DESCRIPTIVA (Tablas, Gráficos, Medidas Descriptivas, etc.)

INTERPRETACIÓN

INFERENCIA ESTADÍSTICA

¿Población o Muestra?

CONCLUSIONES

Población

Muestra

ProbabilidadINFORMACIÓN

ETAPAS DE UN ESTUDIO ESTADÍSTICO

La Estadística es la Ciencia de la

• Sistematización, recogida, ordenación y presentación de los datos referentes a un fenómeno que presenta variabilidad o incertidumbre para su estudio metódico, con objeto de

• deducir las leyes que rigen esos fenómenos,

• y poder de esa forma hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Descrip

tiv

a

Probabili

da

d

Infe

rencia

ESTADÍSTICA DESCRIPTIVA

• Centralización o Tendencia central o promedios• Indican valores con respecto a los que los datos

parecen agruparse.• Media, mediana y moda

• Posición• Dividen un conjunto ordenado de datos en grupos con

la misma cantidad de individuos.• Cuantiles, percentiles, cuartiles, deciles, quintiles...

• Forma• Asimetría• Apuntamiento o curtosis

• Dispersión o Variabilidad• Indican la mayor o menor concentración de los datos

con respecto a las medidas de centralización.• Desviación típica, coeficiente de variación, rango, varianza

LA MEDIA ARITMÉTICA[=PROMEDIO(RANGO)]

La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias relativas y lo denotaremos por

y se calcula mediante las expresiones, según el caso:

x

n

i

iin

i

iin

i

i

n

nc

n

nx

n

xx

111

xi representa el valor de la variable; ci representa la marca de clase.

Para TDNA TF TI

LA MEDIANA[=MEDIANA(RANGO)]

Tendremos en cuenta el tamaño de la muestra. Si N es Impar, hay un término central, el término

Cálculo de la mediana en el caso de variables discretas

que será el valor de la mediana.2

1nX

Ejemplo: El conjunto de números 3,4,4,5,6,8,8,8 y 10 tiene mediana 6.

La mediana de un conjunto de números ordenados en magnitud es o el valor central o la media de los dos valores centrales.

LA MEDIANA

Si N es Par, hay dos términos centrales,

la mediana será la media de esos dos valores

Cálculo de la mediana en el caso de variables discretas

122

nXy

nX

2

122 n

Xn

X

Ejemplo: El conjunto de números 5,5,7,9,11,12,15 y18 tiene mediana 10

LA MODA[=MODA(RANGO)]

• La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.

• Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

LA MODA

ESTADÍGRAFOS DE POSICIÓN

• Se define el cuantil de orden a como un valor de la variable por debajo del cual se encuentra una frecuencia acumulada .a

• Casos particulares son los percentiles, cuartiles, deciles, quintiles,...

CUANTIL DE ORDEN Α[=PERCENTIL(RANGO;K)]

Los cuantiles son generalizaciones de la mediana. Los cuartiles dividen a los datos en cuatro partes iguales, los deciles

en diez, los quintiles en cinco, los percentiles en cien.

k

rnC

X

kr

5,314

342

43

X

Q

CUANTIL DE ORDEN

• Cuartiles (Q): Dividen a la muestra en 4 grupos con frecuencias similares.

• Primer cuartil = Percentil 25 = Cuantil 0,25• Segundo cuartil = Percentil 50 = Cuantil 0,50 = mediana• Tercer cuartil = Percentil 75 = Cuantil 0,75

• Quintiles (K): Dividen a la muestra en 5 grupos con frecuencias similares.• Primer quintil = Percentil 20 = Cuantil 0,20• Segundo quintil = Percentil 40 = Cuantil 0,40• Tercer quintil = Percentil 60 = Cuantil 0,60• Cuarto quintil = Percentil 80 = Cuantil 0,80

• Deciles (D): Dividen a la muestra en 10 grupos con frecuencias similares.• Tercer decil = Percentil 30 = Cuantil 0,30• Quinto decil = Percentil 50 = Cuantil 0,50 = mediana• Séptimo decil = Percentil 70 = Cuantil 0,70

• Percentiles (P) : Dividen a la muestra en 100 grupos con frecuencias similares.

• La mediana es el percentil 50• El percentil de orden 15 deja por debajo al 15% de las observaciones. Por

encima queda el 85%

Miden el grado de dispersión (variabilidad) de losdatos, independientemente de su causa.

• Amplitud o Rango [=max(rango)-min(rango)]

• La diferencia entre las observaciones extremas.• 2,1,4,3,8,4. El rango es 8-1=7• Es muy sensible a los valores extremos.

• Rango intercuartílico• [=CUARTIL(rango;3)-CUARTIL(rango;1)]

• Es la distancia entre el primer y tercer cuartil.• Rango intercuartílico = Q3 – Q1 = P75 - P25 = C0.75 – C0,25

• Parecida al rango, pero eliminando las observaciones más extremas inferiores y superiores.

• No es tan sensible a valores extremos.

MEDIDAS DE DISPERSIÓN

25% 25%25%25%

MUESTRA DE EDADES DE CINCO NIÑOS

• En una muestra de cinco niños se observa que éstos tienen las siguientes edades:

• 1, 1, 4, 8 y 9 .• En promedio tienen 4.6 años.• ¿Cuánta variabilidad hay en las edades de los

niños?• ¿A qué distancia quedan las edades observadas

de la media muestral 4.6 años?

DIFERENCIAS DE VALORES OBSERVADOS A LA MEDIA MUESTRAL

Distribucion de cinco observaciones

0

1

2

3

1 2 3 4 5 6 7 8 9 More

Edades observadas

Fre

cu

en

cia

Media muestral-3.6

-3.6

4.4

3.4-.6

DESVIACIÓN ABSOLUTA MEDIA[=DESVPROM(RANGO)]

• -3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0• |-3.6| + |-3.6| + |-.6| + |3.4| + |4.4| = 15.6• Distancia promedio = 15.6 / 5 = 3.12• En general:

n

ii xx

nDAM

1

||1

n

i

i

n

xxDAM

1

||

En estadística la desviación absoluta promedio o, sencillamente desviación media o promedio de un conjunto de datos es la media de las desviaciones absolutas y es un resumen de la dispersión estadística.

VARIANZA

0

1

2

3

1 2 3 4 5 6 7 8 9 More

Area observada

Fre

cu

en

cia

4.4x4.4

3.6x3.6

3.6x3.6

3.4x3.4

.6x.6

Media Muestral

VARIANZA [=VAR(RANGO)]

• -3.6 + -3.6 + -.6 + 3.4 + 4.4 = 0• 3.6(3.6) + 3.6(3.6) + .6(.6) + 3.4(3.4) +

4.4(4.4) = 57.2• área promedio = 57.2 / 4 = 14.3• En general:

n

ii xx

ns

1

22 )(1

1

n

i

i

n

xxs

1

22

1

)(

GRADOS DE LIBERTAD

• ¿Por qué calculamos la varianza dividiendo por n - 1, en lugar de dividir por n?

• Como la suma de las desviaciones es 0, la última desviación es una combinación lineal de las n - 1 desviaciones restantes.

• Por lo tanto, no estamos calculando el promedio de n números independientes (los desvíos). Solo n -1 de las desviaciones al cuadrado pueden variar libremente y por ello, promediamos la suma de los desvíos al cuadrado dividiendo por n -1.

• Al numero n -1 se lo denomina grados de libertad de la varianza o de la desviación típica.

DESVIACIÓN ESTÁNDAR [=DESVEST(RANGO)]

2ss Así s = 3.78

DESVIACIÓN ESTÁNDAR

S2=14.3 años2

SS=3.78 años

MEDIDAS DE FORMA

Asimetría

• Si bien es fácil tener una idea de si la distribución es simétrica o no tras ver la representación gráfica, es importante cuantificar la posible asimetría de una distribución.

• Recordemos que cuando la distribución de los datos es simétrica, la media, la mediana y la moda coinciden. (Y la distribución tiene la misma forma a la izquierda y la derecha del centro)

ÍNDICES DE ASIMETRÍA

1. Índice de asimetría de PearsonMuy sencillo de calcular. Está basado en la relación entre la media y la moda en distribuciones simétricas y asimétricas:

• Si la distribución es simétrica As será 0

• Si la distribución es asimétrica positiva, As será mayor que 0

• Si la distribución es asimétrica negativa, As será menor que 0

xS S

MoXA

__

ÍNDICES DE ASIMETRÍA

2. Índice de asimetría de Fisher• Está basado en la diferencia de los datos sobre la media, como

la varianza, si bien esta vez se elevan los coeficientes al cubo

• Si la distribución es simétrica As será 0

• Si la distribución es asimétrica positiva, As será mayor que 0

• Si la distribución es asimétrica negativa, As será menor que 0

• Desventaja: Muy influida por puntuaciones atípicas

sA

x

n

i

i

S

nXx

31

3__

)(

ÍNDICES DE ASIMETRÍA

3. Expresión en Excel• En el software Excel, la función

=COEFICIENTE.ASIMETRIA(A3:A14) se basa en la siguiente expresión:

• Si la distribución es simétrica As será 0

• Si la distribución es asimétrica positiva, As será mayor que 0

• Si la distribución es asimétrica negativa, As será menor que 0

• Desventaja: Muy influida por puntuaciones atípicas

sA

x

i

s

Xx

nn

n3

3__

)(

)2()1(

AsimetríaAsimetría hacia la derecha

(asimetría positiva)Asimetría hacia la izquierda

(asimetría negativa)

Al ser positiva significa que la gráfica es asimétrica por la derecha de la media y por tanto los valores mayores que ella están más dispersos que los menores.

Al ser negativa significa que la gráfica es asimétrica por la izquierda de la media y por tanto los valores menores que ella están más dispersos que los mayores.

CURTOSIS O APUNTAMIENTO

• La curtosis representa la elevación o achatamiento de una distribución, comparada con la distribución normal. Una curtosis positiva indica una distribución relativamente elevada, mientras que una curtosis negativa indica una distribución relativamente plana.

• El estándar es la distribución normal: distribución mesocúrtica.

• Si la distribución es más apuntada que la distribución normal tenemos una distribución leptocúrtica.

• Si la distribución es más achatada que la distribución normal tenemos una distribución platicúrtica.

ÍNDICE DE CURTOSIS

• Para una distribución normal (mesocúrtica) sabemos que

• Y esta va a ser la referencia para el índice de curtosis que vamos a emplear

• Si la distribución es normal (mesocúrtica), el índice vale 0

• Si la distribución es leptocúrtica, el índice es superior a 0

• Si la distribución es platicúrtica, el índice es inferior a 0

3)(

41

4__

sx

n

i

i nXx

3)(

41

4__

sC

x

n

i

i

r

nXx

ÍNDICE DE CURTOSIS

• En el software Excel, la función =CURTOSIS(A3:A14) se basa en la siguiente expresión:

• Si la distribución es normal (mesocúrtica), el índice vale 0

• Si la distribución es leptocúrtica, el índice es superior a 0

• Si la distribución es platicúrtica, el índice es inferior a 0

)3)(2(

)1(3)(

)3)(2)(1(

)1( 2

4

4__

nn

nXx

nnn

nn

sC

x

i

r

CurtosisLeptocúrtica Platicúrtica

Al ser negativa significa que la gráfica es menos apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están menosconcentrados que en la Distribución Normal.

Al ser positiva significa que la gráfica es más apuntada que la gráfica de la distribución normal y por tanto los valores alrededor de la media están masconcentrados que en la Distribución Normal.

MEDIDAS DE FORMA

Son aquellos números, que indican la morfología de la distribución de los datos, es decir de la simetría y apuntamiento que tiene el histograma de la variable en estudio. Sólo se pueden calcular en variables medidas en escala intervalar y de razón.

Son el:• SESGO (COEFICIENTE DE ASIMETRIA)• CURTOSIS

TIPOS DE DISTRIBUCIONES DE FRECUENCIA MÁS COMUNES

Distribución Simétrica

DISTRIBUCIÓN SIMÉTRICA

DISTRIBUCIÓN ASIMÉTRICA

DISTRIBUCIÓN ASIMÉTRICA

Medidas de Forma Page 221

RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA

X = Me = Mo

Cuando una distribución de frecuencia es simétrica, la media, mediana y moda coinciden en su valor ( X = Me = Mo). En el caso de una distribución binomial simétrica, es necesario calcular el promedio de las modas.

Mo < Me < X

En una distribución sesgada a la izquierda, la moda es menor a la mediana, y esta a su vez menor que la media.

RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA

• En una distribución sesgada a la derecha la relación se invierte, la moda es mayor a la mediana, y esta a su vez mayor que la media.

Mo > Me > X

EJEMPLO: RELACIÓN ENTRE LA MEDIA, MEDIANA Y MODA

Calcular la media, mediana y moda de los siguientes datos e interpretar surelación.

COEFICIENTE DE ASIMETRÍA

Mide el grado de asimetría de la distribución con respecto a la media. Un valor positivo de este indicador significa que la distribución se encuentra sesgada hacia la izquierda (orientación positiva). Un resultado negativo significa que la distribución se sesga a la derecha.

EJEMPLO: CÁLCULO DEL COEFICIENTE DE ASIMETRÍA

Calcular el coeficiente de asimetría a partir de los siguientes datos obtenidos de una muestra. Realizando el Polígono de Frecuencias.

CURTOSIS

Si los datos están muy concentrado hacia la media, la distribución es leptocúrtica (curtosis mayor a 0).

Si los datos están muy dispersos, la distribución es platicúrtica (curtosis menor a 0).

El comportamiento normal exige que la curtosis sea igual a 0 (distribución mesocúrtica).

Indica que tan apuntada o achatada se encuentra una distribución respecto a un comportamiento normal (distribución normal).

CÁLCULO DE LA CURTOSIS

La fórmula empleada para calcular la Curtosis se muestra a continuación (reemplace el valor de n por N en caso de tratar con datos poblacionales):

EJEMPLO: CÁLCULO DE LA CURTOSIS

• Calcular el coeficiente de asimetría a partir de los siguientes datos obtenidos de una muestra. Realizar el polígono de frecuencias.

IDENTIFICACIÓN DE HIPÓTESIS

• Una hipótesis estadística es una suposición acerca que una característica de la población, que debe ser probada con base en la información porporcionada por una muestra aleatoria.

Hipótesis nula: H0 : Es la que se pretende probar, generalmente se establece con el fin de rechazarla.

Hipótesis alternativa: H1 : Es la negación de la hipótesis nula, establece además la región en la que se tomará la decisión de rechazar o no H0.

DEFINICIONES

Nivel de significación: La probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera.

Error tipo I: Rechazar la nula cuando en realidad es verdadera.

Error tipo II: Aceptar la hipótesis nula cuando en realidad es falsa.

Estadístico de prueba: Es un valor, determinado a partir de la información de la muestra, usado para decidir si rechazar o no la hipótesis nula.

Valor crítico: El punto que divide la región entre el lugar en el que la hipótesis nula es rechazada y y la región donde la hipótesis nula es no rechazada.

¿QUÉ ES UNA PRUEBA DE HIPÓTESIS?

Prueba de hipótesis: es un procedimiento, basado en la evidencia de la muestra y en la teoría de las probabilidades, usado para determinar si la hipótesis es una afirmación razonable y debería no ser rechazada o si no es razonable debería ser rechazada.• Principalmente sus parámetros:

MediaVarianzaProporción/Tasa

• OJO: Si queremos contrastarla, debe establecerse antes del análisis.

PRUEBA DE HIPÓTESIS

N o rech zar la h ip ó tes is n u la R ech azar la n u la y acep ta r la a lte rn a tiva

P aso 5 : Tom ar u n a m u es tra , lleg ar a u n a d ec is ió n

P aso 4 : F o rm u la r u n a reg la d e d ec is ió n

P aso 3 : Id en tifica r e l es tad ís tico d e p ru eb a

P aso 2 : S e lecc ion ar e l n ive l d e s ig n ificac ió n

P aso 1 : E s tab lecer la h ip ó tes is n u la y la a lte rn a tiva

REGIÓN CRÍTICA Y NIVEL DE SIGNIFICACIÓN

Región crítica• Valores ‘improbables’ si...• Es conocida antes de realizar el

experimento: resultados experimentales que refutarían H0

Nivel de significación: a• Número pequeño: 1% , 5%• Fijado de antemano por el

investigador• Es la probabilidad de rechazar

H0 cuando es cierta

No rechazo H0

Reg. Crit.Reg. Crit.

a=0.05

H0: m=40

CONTRASTES: UNILATERAL Y BILATERAL

La posición de la región crítica depende de la hipótesis alternativa

Unilateral Unilateral

Bilateral

H1: m < 40 H1: m>40

H1: m ¹40

SIGNIFICACIÓN: P

43X

No se rechazaH0: m =40

Es la probabilidad que tendría una región crítica que comenzase exactamente en el valor del estadístico obtenido de la muestra. Es la probabilidad de tener una muestra que discrepe aún más que la nuestra de H0. Es la probabilidad de que por puro azar obtengamos una muestra “más extraña” que la obtenida.p es conocido después de realizar el experimento aleatorioEl contraste es no significativo cuando p>a

P

P

a

a

SIGNIFICACIÓN : P

Pa

Pa

50X

Se rechaza H0: m=40

Se acepta H1: m>40

El contraste es estadísticamente significativo cuando p < aEs decir, si el resultado experimental discrepa más de “lo tolerado” a priori.

RESUMEN: α, P Y CRITERIO DE RECHAZO

• Sobre a• Es número pequeño,

preelegido al diseñar el experimento

• Conocido a sabemos todo sobre la región crítica

• Sobre p• Es conocido tras realizar

el experimento

• Conocido p sabemos todo sobre el resultado del experimento

Sobre el criterio de rechazo El contraste es significativo si p menor que a

ESTADÍSTICOS PARA DISEÑOS DE DOS GRUPOS

Grupos Datos

Independientes

Relacionados

Paraméticos t Student muestras no relacionadas

t Student muestras

relacionadas

Ordinales U Mann-Whitney T Wilcoxon

Nominales Probabilidad exacta de Fisher

McNemar

PRUEBAS NO-PARAMÉTRICAS

Pruebas estadísticas que no requieren muchas asunciones acerca de la naturaleza de la población de donde proceden las muestras. Son referidos como pruebas de distribución libre.

Pueden usarse con datos de escala nominal y

ordinal. Muestreo independiente o aleatorio.

PRUEBAS PARAMÉTRICAS

Pruebas estadísticas que asumen una serie de propiedades sobre los parámetros de la población de donde proceden la muestras: datos de distribución normal y de igual variancia en la población.

Datos de escala de intervalo y razón. Muestreo independiente o aleatorio.

• Coeficientes de correlación• Regresión lineal• Prueba t• Prueba de diferencia de proporciones• Análisis de varianza• Análisis de covarianza

ANÁLISIS PARAMÉTRICOS

Coeficiente de correlación de Pearson Analiza la relación entre dos variables medidas

en un nivel por intervalos o de razón. Se simboliza con:r Ejemplos: A mayor X, mayor Y. A mayor X,menor Y. La hipótesis de investigación señala que la

correlación es significativa.(No identifica causalidad)

Puede variar de -1.00 a +1.00

ANÁLISIS PARAMÉTRICOS

Regresión lineal• Es un modelo estadístico para estimar el efecto

de una variable sobre otra.• Está asociado con el coeficiente de correlación de

Pearson.• Brinda la oportunidad de predecir las

puntuaciones de una variable tomando las puntuaciones de la otra variable.

ANÁLISIS PARAMÉTRICOS

Prueba t• Es una prueba estadística para evaluar si dos

grupos difieren entre si de manera significativa respecto a sus medias en una variable.

• Se simboliza con :t.• La hipótesis de inv.propone que los dos grupos

difieren de manera significativa,y la hipótesis nula que los dos grupos no difieren.

ANÁLISIS PARAMÉTRICOS

Prueba de diferencia de proporciones• Es una prueba estadística para analizar si dos

proporciones o porcentajes difieren significativamente entre sí, en dos grupos.

• La comparación se realiza con una variable.• Si hay varias variables hay que realizar una

prueba por cada variable.

ANÁLISIS PARAMÉTRICOS

Análisis de varianza(ANOVA- one-way)• Es una prueba estadística para analizar si más de

dos grupos difieren significativamente (son diferentes)entre sí en cuanto a sus medias y varianzas.

• Hay otras a estadísticas relacionadas con anova.

ANÁLISIS PARAMÉTRICOS

Supuestos:1. Aceptan distribuciones no normales.2. Pueden analizar datos medidos con escalas de

intervalos,razón,nominales u ordinales.

ANÁLISIS NO PARAMÉTRICOS

Las pruebas no paramétricas más comunes son:• Chi cuadrada • Coeficientes de correlación e independencia para

tabulaciones cruzadas• Coeficientes de correlación por rangos ordenados

de Spearman y Kendall.

ANÁLISIS NO PARAMÉTRICOS

Chi cuadrada• Es una prueba estadística para evaluar hipótesis

acerca de la relación entre dos variables categóricas.

• Se simboliza :X2• No considera relaciones causales.

ANÁLISIS NO PARAMÉTRICOS

La prueba de t Student para muestras dependientes se utiliza para comparar las medias de un mismo grupo en diferentes etapas. Se utiliza, por ejemplo, para las comparaciones de los resultados de una prueba antes y después para un grupo determinado.

A continuación se explicará la operación de esta prueba a través de un caso para contraste unilateral y otro bilateral.

PRUEBA T DE STUDENTPARA MUESTRAS RELACIONADAS

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)ejemplo: Se desea saber si el cambio de alimento ha variado

positivamente en el peso de animales. Los datos son los siguientes :

A1 A2

92 94

85 97

74 93

70 99

36 92

85 98

55 77

66 93

88 96

75 100

89 95

66 93

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

En este caso se utiliza la prueba t para muestras relacionadas

nDS

t

d

M d

muestra la de sujetos de Número

sdiferencia las deEstándar Desviación

sdiferencia las de aritmética Media

nd

DSd

M

n

ii

ndxxDS

1

21

1

1

2___

1

n

d

n

d

XdDS

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

En nuestro caso, se obtienen los siguientes valores:

A1 A2 d

92 94 -2

85 97 -12

74 93 -18

70 99 -29

36 92 -56

85 98 -14

55 77 -23

66 93 -27

88 96 -8

75 100 -25

89 95 -6

66 93 -27

50,20___

dX

39,14sd

12n

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

CÁLCULO DEL VALOR T OBSERVADO

50,20dM 39,14DS d12n

SUSTITUYENDO

93,4

1239,14

50,20

Ot

nDS

t

d

M d

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

valor critico

a = 0.05 unilateral

Se Rechaza Ho

796,111;05.0 t

Valor calculado

93,4ot

93,4ot

796,111;95.0 t

Al comparar los valores, podemos rechazar la hipótesis nula con un margen de error de 5%, por lo cual podemos afirmar que el peso de los animales ha variado positivamente después del cambio de alimento.

grados de libertad n-1

grados de libertad n-1

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

Ejemplo Contraste Bilateral:

Un granjero intentaba encontrar un modo eficaz de extraer leche de su ganado. Con el fin de elegir la técnica más apropiada, probó dos opciones manuales. Los resultados fueron medidos a través de los litros obtenidos.

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

En nuestro caso, se obtienen los siguientes valores:

83,4dM

61,5DS d

12n

TÉC. 1 TÉC. 2 d

15 27 -12

12 25 -13

22 17 5

20 30 -10

18 22 -4

16 19 -3

14 15 -1

19 22 -3

17 25 -8

10 19 -9

25 23 2

20 22 -2

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

CÁLCULO DEL VALOR T OBSERVADO

83,4dM 61,5DS d12n

SUSTITUYENDO

99,2

1261,5

83,4

Ot

nDS

t

d

M d

DIFERENCIA DE MEDIAS GRUPOS RELACIONADOS (T)

valor critico

a = 0.05 bilateral

201,211;025.0 t

Valor calculado

99,2ot

99,2ot

201,211;975.0 t grados de libertad n-1

Se Rechaza Ho

Al comparar los valores, podemos rechazar la hipótesis nula de la igualdad de las técnicas de ordeña, con un margen de error de 5%, por lo cual podemos afirmar que la existen diferencias entre ellas, a favor de la técnica 2.

EJERCICIO T STUDENT

• Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y (rendimiento académico):

• X: 105 116 103 124 137 126 112 129 118 105• Y: 4 8 2 7 9 9 3 10 7 6

EJERCICIO T STUDENT

EJERCICIO T STUDENT

• Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en pesos (Y ) en la década de los 80 fueron:

• Producción de trigo 30 28 32 25 25 25 22 24 35 40

• Precio de la harina 25 30 27 40 42 40 50 45 30 25

El contraste de Wilcoxon es la técnica no paramétrica paralela a la T de Student para muestras relacionadas. Al Igual que en esa prueba, disponemos de n parejas de valores que podemos considerar como una variable medida en cada sujeto en dos momentos diferentes.

Se presentará a continuación el proceso de contraste para muestras por aproximación normal.

PRUEBA DE WILCOXON

Caso

Los datos siguientes se refieren a los niveles de tolerancia a la frustración manifestada por un grupo de niños en la casa y en el colegio. Se trabajó con una muestra de 8 niños.

Se midió a través de una escala de manifestaciones de frustración a los niños, tanto en la casa como en el colegio. Se intenta establecer si existen diferencias en los niveles de tolerancia a la frustración manifestada .

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

Paso 1) Se recogen y tabulan los datos.

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

TF-CASA TF-COLEGIO

82 63

69 42

73 74

43 37

58 51

56 43

76 80

65 82

Paso 2) Se determinan las diferencias Di entre los pares de observaciones realizadas.

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

TF-CASA TF-COLEGIO Di

82 63 19

69 42 27

73 74 -1

43 37 6

58 51 7

56 43 13

76 80 -4

65 82 -17

Paso 3) Sin tomar en cuenta el signo, se ordenan en forma creciente las Di y se les asigna el rango de 1 a n. En el caso de haber dos o más diferencias iguales, se considera para cada uno el promedio de los rangos. Las diferencias iguales a 0 se descartan los cálculos y de

n , pues en este modelo no se toman en cuenta los empates.

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

TF-CASA TF-COLEGIO Di RANGO (T)

73 74 -1 1

76 80 -4 2

43 37 6 3

58 51 7 4

56 43 13 5

65 82 -17 6

82 63 19 7

69 42 27 8

Paso 4) Se coloca el signo a cada uno de los rangos Ri hallados. Se suman entre sí los rangos de las diferencias positivas calculando su total T1-, y el de las negativas obteniendo T2+, siendo T1 la suma de los rangos en que Y>X (diferencias negativas); y T2 la suma de los rangos en que X>Y (diferencias positivas).

Paso 5) Se elige la menor de ambas sumas y se la define como el estadígrafo W.

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

TF-CASA TF-COLEGIO Di RANGO RANGO (T1-) RANGO (T2+)

73 74 -1 1 1  

76 80 -4 2 2  

43 37 6 3   3

58 51 7 4   4

56 43 13 5   5

65 82 -17 6 6  

82 63 19 7   7

69 42 27 8   8

9 27Valor W calculado 9

Paso 5) Está demostrado que cuando n aumenta de tamaño, la distribución W se acerca rápidamente a la distribución normal, con los siguientes parámetros:

4

)1( nnW 24

)12)(1( nnnW

por lo que podemos determinar la significación de un valor observado de W por medio de:

24

)12)(1(4

)1(

nnn

nnW

WZ

W

WWWZ

o

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

En nuestro ejemplo, si sustituimos en

4

989

24

17989

Tenemos, entonces, los siguientes valores:

189 141,79

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

4

)1( nnW 24

)12)(1( nnnW

Si hay diferencias igual a 0, se excluyen eso pares de n

Una vez establecidos los parámetros, calculamos el valor Z observado para W=9

26,11899 141,7

Z

Alternativas de contraste

Bilateral oHrechazarZW

Z 2/

Unilateral oHrechazarZW

Z

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

Los valores críticos para Z se indican a continuación:

Valores Críticos de ± ZNivel de Significación para

Contraste Unilateral

.05 .025 .01 .005 .0005

Contraste Bilateral

.10 .05 .02 .01 .001

z crítico   1.645 

    1.960 

    2.326 

    2.576 

    3.291 

 

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

Paso 6) Comparar el valor crítico con el valor observado para W.

96,126,1

26,1WZ 96,12/05.0 Z

Por lo tanto, no podemos rechazar la hipótesis nula, y debemos aceptar que no existe evidencia empírica suficiente para afirmar que existen diferencias significativas entre los niveles de tolerancia a la frustración manifestada en la casa y en el colegio

Considerando que el contraste para nuestro caso es bilateral, el valor

crítico asociado a una probabilidad a bilateral de 0.05, es de Z = 1.96.

Comparamos :

Paso 7) Se concluye sobre la Hipótesis nula.

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

EJERCICIO RANGO DE SIGNOS DE WILCOXON

Paso 5) Está demostrado que cuando n aumenta de tamaño, la distribución W se acerca rápidamente a la distribución normal, con los siguientes parámetros:

4

)1( nnW 24

)12)(1( nnnW

por lo que podemos determinar la significación de un valor observado de W por medio de:

24

)12)(1(4

)1(

nnn

nnW

WZ

W

WWWZ

o

DIFERENCIA ENTRE GRUPOS RELACIONADOS (W)

m8= = 394

s8= 24+1) = 12.73 24√

Z8 = 8- 39 = - 2.44 12.73

Valores Críticos de ± Z

Nivel de Significación para

Contraste Unilateral

.05 .025 .01 .005 .0005

Contraste Bilateral

.10 .05 .02 .01 .001

z crítico

  1.645  

  1.960  

  2.326  

  2.576  

  3.291  

LOS ANÁLISIS DE REGRESIÓN Y CORRELACIÓN MOSTRARÁ

• La naturaleza de la relación entre las variables• La fuerza de la relación entre variables

Análisis de regresión• Formula matemática que relaciona las variables

conocidas con la varibable desconocidaAnálisis de correlación• Determinar el grado de relación entre las

variables

INDEPENDENCIA - DEPENDENCIA

Cuando se estudian dos características simultáneamente sobre una muestra, se puede considerar que una de ellas influye sobre la otra de alguna manera. Por ejemplo la altura y el peso o las horas de estudio y la calificación en un examen.

El objetivo principal de la regresión es descubrir el modo en que se relacionan.

Dos variables pueden considerarse:

• Variables independientes No tienen relación (una de ellas no sirve para explicar los movimientos de la otra)

• Dependencia funcional Y=f(x)• Dependencia estadística

Independencia estadística Dependencia funcionalDependencia estadística

Grado de asociación entre dos variables- +

GRÁFICOS DE DISPERSIÓN: PERMITE VER SI HAY ASOCIACIÓN

• Dadas dos variables X y Y tomadas sobre el mismo elemento de la población, el diagrama de dispersión es simplemente un gráfico de dos dimensiones, donde en un eje (la abscisa) se sitúa una variable, y en el otro eje (la ordenada) se sitúa la otra variable. Si las variables están correlacionadas, el gráfico mostraría algún nivel de correlación (tendencia) entre las dos variables. Si no hay ninguna correlación, el gráfico presentaría una figura sin forma, una nube de puntos dispersos en el gráfico.

GRÁFICOS DE DISPERSIÓN: PERMITE VER SI HAY ASOCIACIÓN

Estadística Económica 2007-2008. Sara Mateo.

Asociación positiva. Si aumenta X aumenta Y

GRÁFICO DE DISPERSIÓN

Es un gráfico que muestra la intensidad y el sentido de la relación entre dos variables de interés.• Variable dependiente

Respuesta, predicha, endógenaEs la variable que se desea predecir o estimar

• Variables independientesPredictoras, explicativas exógenasSon las variables que proveen las bases para estimar.

• Si X es la variable independiente e Y es la variable dependiente, una relación funcional tiene la forma:

Y=f(X)

La relación entre dos variables métricas puede ser representada mediante la línea de mejor ajuste a los datos. Esta recta se le denomina recta de regresión, que puede ser negativa o positiva, la primera con tendencia decreciente y la segunda creciente.

GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN

GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN

• Para el cálculo de la recta de regresión se aplica el método de mínimos cuadrados entre dos variables. Esta línea es la que hace mínima la suma de los cuadrados de los residuos, es decir, es aquella recta en la que las diferencias elevadas al cuadrado entre los valores calculados por la ecuación de la recta y los valores reales de la serie, son las menores posibles.

GRÁFICOS DE DISPERSIÓN / RECTA DE REGRESIÓN

1x 2x3x ix 1nx nx

1y

2y

3y

iy

1ny

ny

Intercepto

PendienteRecta de regresión

ˆiy

ˆi i iu y y

yi

iii ubxay

3uiu

Error

Llamemos a “u” perturbación o error, siendo la diferencia que hay entre el valor observado de la variable exógena (y) y el valor estimado que obtendremos a través de la recta de regresión .

La metodología para la obtención de la recta será hacer MÍNIMA la suma de los CUADRADOS de las perturbaciones. ¿Por qué se elevan al cuadrado?

2 2ˆ( )i i iu y y 2 2

1 1

ˆ( )n n

i i ii i

u y y

22 2

, 1 1 1

ˆ( )minn n n

i i i i iq p i i i

xpu qy y y

ˆiy

ii bxay

a b

En el modelo de regresión lineal simple la función elegida para aproximar la relación entre las variables es una recta, es decir y=a+bx, donde a,b son los parámetros. A esta recta la llamaremos RECTA DE REGRESIÓN DE Y SOBRE X.

Vamos a deducir su ecuación usando el método de los mínimos cuadrados. Dado un valor de X, tenemos los dos valores de Y, el observado, yi , y el teórico, yi* = a + bxi. Hemos de minimizar los errores cometidos:

n

i

ii

n

i

ii bxaybxay

1

22

1El valor que hemos

aproximado para “y” con la recta de regresión y*

Errores cometidos al aproximar por una recta

MINIMIZAR

02

02

i

i

ii

i

ii

xbxayb

bxaya

xbyaxbyna

i

i

i

i

i i

ii

i

ii

i i i

ii

xbxayx

xbay

2

22

22

2

2

x

xyxxy

i

i

i

ii

i i

iii

i

ii

i i

ii

i

ii

S

SbbSS

xnxbxnyyx

xbxnxbxn

yyx

xbxxbyyx

Estadística Económica 2007-2008. Sara Mateo.

y obtenemos que la recta de regresión de Y sobre X: y = a + bx con los valores a y b anteriormente calculados, o bien la siguiente expresión:

Aplicando el mismo razonamiento llegaríamos a la expresión de la recta de regresión de X sobre Y: x = a’ + b’y con los valores a’ y b’ calculados como:

xxS

Syy

x

xy 2

ybxayS

Sb

y

xy'''

2

Por tanto, se podría expresar como:

yyS

Sxx

y

xy 2

2

2 2ˆ

y

i iu R

y yS S

N

2

21 u

Y

SR

S

Cuando solo exista una variable explicativa o independiente y una sola dependiente se cumple:

22

222 ' xy

yx

xy

y

xy

x

xyr

SS

S

S

S

S

SbbR

Varianza residual: Ayuda a medir la dependencia.

Si es grande, los residuos, por término medio, serán grandes. Dependencia pequeña y viceversa.

Varianza marginal: Es la varianza total de X o de Y. Si dividimos la varianza residual entre esta se elimina el problema de unidades de medida.

2yS

2xS

VR =

yy

u

VT

VR

S

S

2

2

Elevado al cuadrado obtenemos el coeficiente de determinación que sirve como medida del buen ajuste de la recta de regresión

2R

Ayuda a determinar la asociación pero en sentido inverso. La mejor medida es R.

Haciendo unas transformaciones se demuestra que r(xy) Rrxy

Coeficiente de correlación general:

Para el caso de distribuciones bidimensionales: 2 2R r R r

2 21 1 1 1 0 1 0 1r R r R

2 2 2ˆ XY XY XY

i i iX X X

S S Sy y x x y x x

S S S

2ˆ XY Y

i i i iX

X Y Y

Y

Y

X Y X

X

X X

SS Sy y x x y x

S S S

S Sx y x

SS Sr

S Sx

Recta de regresión:

1 0r 0 1r 1r 1r 0r

Pendiente Negativa PositivaNula

2YS

2 2u ryS S

2 2 22

2 21 u Y u

Y Y

S S SR

S S

2 2 2R Y uS S S

2 22R uY SS S

2R Tanto por uno de la Y que viene explicado por la X

SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR, SI LA VARIABLE X EXPLICA LAS VARIACIONES DE LA VARIABLE Y. DEBERÁ SER > 0.75

VEVRVT

VT

VE

VT

VR1

VR

VE

2

2

Y

R

S

S

Se descompone en:

2ˆ XY

i i iX

Sy q px y x x

S

Dado un valor de la variable “X” que no ha sido observado, estimar el correspondiente valor de “Y”

0 0ˆDado x estimar y

0 0 02ˆ XY

X

Sq p y xy x

Sx

a

a

b

b

El objetivo último de la regresión es la predicción de una variable para un valor determinado de la otra. La predicción de Y para X = x0 será simplemente el valor obtenido en la recta de regresión de Y sobre X al sustituir el valor de x por x0. La fiabilidad de esta predicción será tanto mayor cuando mayor sea la correlación entre las variables (es decir mayor sea R2 )

VAR EXPLICATIVA

4003002001000

VA

R R

ES

PU

ES

TA

100

80

60

40

20

0

•Los resultados de la regresión sólo son fiables si el modelo cumple ciertas hipótesis sobre los residuos

•Es preciso realizar una validación del modelo

Validación

Siempre hay una diferencia entre el valor real de la variable respuesta y la estimación a partir de la ecuación de regresión: el residuo

CORRELACIÓN Y REGRESIÓN LINEAL SIMPLE

VALIDACIÓN DEL MODELO

Calidad del modelo:

Para determinar hasta que punto las variables explicativas permiten estimar a la variable respuesta seguimos usando el R2 (COEFICIENTE DE DETERMINACIÓN=VARIANZA EXPLICADA).

Cuanto más cercano a 1 más adecuado es el modelo

Cuanto más cercano a 0 peor resulta el modelo. Es decir, las variables explicativas no se ajustan linealmente a la variable respuesta.

R2 aumenta con muchas VI y en muestras pequeñas R2

ajustado

Un R2 bajo no necesariamente indica que las variables seleccionadas no permiten estimar adecuadamente la

variable respuesta.

Es posible que la relación no sea lineal.

REGRESIÓN LINEAL MÚLTIPLE

CALIDAD DEL MODELO

Contrastes de hipótesis:

Se puede contrastar si cada pendiente individualmente es significativa o no, es decir, si cada variable explicativa influye realmente sobre la variable respuesta (“t”)

Se puede contrastar si globalmente todas las variables explicativas influyen sobre la variable respuesta (“F”).

Las siguientes paradojas pueden darse,

• Individualmente una variable explicativa puede estar significativamente relacionada con la variable respuesta, pero no ser un predictor significativo en el modelo de regresión lineal múltiple

• Una variable individualmente puede NO estar significativamente relacionada con la variable respuesta, pero en un modelo de regresión lineal múltiple SÍ lo está

REGRESIÓN LINEAL MÚLTIPLE

CONTRASTES

Validación del modelo:

Los residuos del modelo debe seguir cumpliendo ciertas hipótesis básicas:

Media cero

Incorrelación

Normalidad

Para poder interpretar adecuadamente los coeficientes estimados y hacer uso de la recta de

regresión es imprescindible que el modelo sea válido.

REGRESIÓN LINEAL MÚLTIPLE

VALIDACIÓN

LIMITACIONES Y ERRORES

• NO DETERMINAN CAUSA Y EFECTO

INTERPRETACION ERRONEA• • INCORRECTO r = .6 la ecuación de regresión

explica el 60% de la variación total en Y• • CORRECTO r² = .36 Solo el 36% de la variación

total se explica por la recta de regresion

CORRELACIÓN

• Al observar la gráfica de puntos dispersos, tenemos una idea de si hay una asociación entre dos variables numéricas.

• Para medir el grado de asociación, calculamos un coeficiente de correlación.

• El método estándar es el coeficiente de correlación de Pearson, r.

COEFICIENTE DE CORRELACIÓN DE PEARSON, R

• Mide la dispersión de los puntos, alrededor de una tendencia lineal subyacente (línea recta).

• Puede tomar cualquier valor entre – 1 y +1.• La fórmula es: Ʃ(x-x)(y-y)r= ---------------- √Ʃ(x-x)2 (y-y)2

COEFICIENTE DE CORRELACIÓN DE PEARSON, R

10 20 30 40 50

1

2

3

4

5

A

Distancia del punto A del promedio de X

Distancia del punto A del promedio de Y

COEFICIENTE DE CORRELACIÓN DE PEARSON, R

r= +1 r= -1

CORRELACIÓN

• Si hay una relación no lineal, la correlación es cero. • Pero hay que tener cuidado, cuando r = 0; puede

haber una relación no lineal fuerte entre las dos variables.

• Siempre examine los datos gráficamente primero

SUPOSICIONES DE LA CORRELACIÓN

• Un coeficiente de correlación puede ser calculado en cualquier grupo de datos.

• Es más significativo cuando las dos variables tienen una distribución aproximadamente Normal.• Datos de este tipo tendrán una forma elíptica.

• Otra suposición para el uso de la correlación, es que todas las observaciones deberán ser independientes, esto significa que sólo una observación por cada variable debería venir de cada individuo en el estudio.

INTERPRETACIÓN DE LA CORRELACIÓN

• El coeficiente de correlación deberá estar entre -1 y +1.• Un valor de +1 indica una correlación perfecta positiva.• Un valor de – 1 indica una correlación perfecta negativa.• Un valor de 0 indica que no hay asociación lineal entre las dos

variables.

• Una correlación elevada puede mostrar una relación débil cuando se examina en una gráfica de puntos dispersos.

• Una correlación de 0 no siempre indica no relación, ya que la relación puede no ser lineal.

• “Buen” coeficiente de correlación(r>0,7)• Coeficiente de determinación: porcentaje de la varianza

que explica el modelo.

PRESENTACIÓN DE CORRELACIÓN

• Hay tres puntos a recordar:• Los datos deberán ser mostrados en una gráfica de

puntos dispersos.• El coeficiente de correlación, r, deberá ser dado a dos

sitios decimales. • El número de observaciones deberá ser señalado.

SIGNIFICACIÓN

• Fórmula:

• Interpretación:• Se rechaza la Hipótesis nula. La

correlación no procede de una población cuyo valor ρxy = 0. Las variables están relacionadas.

• Se acepta la Hipótesis nula. La correlación procede de una población cuyo valor ρxy = 0. Las variables no están relacionadas.

21 2

Nr

rt

XY

XY

)2,( Ntt

)2,( Ntt

OTRAS CUESTIONES A CONSIDERAR

• Correlación no implica causalidad.• La significación estadística depende del tamaño

de la muestra (a mayor N, más probable es encontrar significación).

• Otra posible interpretación la da el coeficiente de determinación , en términos de proporción de variabilidad de Y compartida o explicada por X.

• La proporción de variabilidad no explicada, aquello de Y que queda sin explicar por X, se denomina coeficiente de no determinación:

2XYr

21 XYr

EJERCICIO

• Tengamos las siguientes puntuaciones en las variables X (inteligencia) e Y (rendimiento académico):

• X: 105 116 103 124 137 126 112 129 118 105• Y: 4 8 2 7 9 9 3 10 7 6

EJERCICIO

• Los datos de la producción de trigo en toneladas (X) y el precio del kilo de harina en pesos (Y ) en la década de los 80 fueron:

• Producción de trigo 30 28 32 25 25 25 22 24 35 40

• Precio de la harina 25 30 27 40 42 40 50 45 30 25

¿QUÉ ES LA CHI CUADRADA?

• Es una prueba estadística para evaluar hipótesis acerca de la relación entre dos variables categóricas

• Se simboliza por χ2

• Hipótesis a probar : Correlaciónales ( H0 : no hay asociación y H1 hay asociación)

• Variables involucradas: Dos, esta prueba no considera relaciones causales

• Nivel de medición de las variables: Nominal u ordinal

OTRAS CARACTERÍSTICAS

• Es una distribución asimétrica

• Sólo toma valores positivos y es asintótica con respecto al eje de las x positivas ( 0 < χ2 < +∞)

• Está caracterizada por un único parámetro “ n” llamado “grados de libertad” adoptando formas distintas según el valor de “n”

• El área comprendida entre la curva y el eje de las x es 1 ó 100%

APLICACIONES

1. Entre las aplicaciones más frecuentes de esta distribución en el área de salud, podemos señalar:

2. La prueba de asociación, la cual permite al investigador determinar si existe asociación entre dos variables en escala de medición nominal u ordinal. También aparece en la literatura con el nombre de “tablas de contingencia”

3. La prueba de “bondad de ajuste”

PROCEDIMIENTO

• Se calcula a través de una tabla de contingencia o tabulación cruzada.

• Es una tabla de dos dimensiones y cada dimensión contienen una variable

• Cada variable se subdivide en dos o más categorías.

• Ejemplo: tabla 2x2 => cada dígito indica una variable y el valor de este indica el número de categorías de la variable

EJEMPLO DE UNA TABLA DE CONTINGENCIA

SEXO

MASCULINO

FEMENINO

CANDIDATO “A”CANDIDATO “ B”

Dos variables : voto y sexo

Cada variable con dos categorías VOTO

EJEMPLO TABLA 2X3

Norte Sur

Partido 1 180 100

Partido 2 190 280

Partido 3 170 120

Identificación politica

Zona Distrito electoral

EN ESENCIA LA PRUEBA DE CHI CUADRADO ES .......

“ es una prueba que parte del supuesto de “no relación entre las variables”

“ una comparación entre la “tabla de frecuencias observadas” y la denominada “tabla de frecuencias esperadas”

La lógica es “Si no hay relación entre las variables debe tenerse una tabla como la de frecuencias esperadas, si la hay la tabla que obtengamos como resultado de nuestra investigación debe ser muy diferente respecto de la tabla de frecuencias esperadas”

CHI- CUADRADOE N T RA DA S I M P L E

EJEMPLO 1 : En un juego de Cara y Corona , y una muestra de 200 lanzamientosSe observaron 115 caras y 85 coronas .

Ensayar la hipótesis “ La moneda está bien hecha” con un limite De significación de 0.05

Con la información obtenidaConstruirás un cuadro .Parecido al anterior.

Para llenar la casilla “fe” .Sabemos que la probabilidad al lanzar una Moneda al aire es de 50%, eso quiere decir 100 caras , 100 coronas.

Haz clic en el botón marcado .Te aparecerá un menú

Ahora emergió otro menú.Haz clic , en el botón marcado

Ahora apareció este menú .Harás clic en aceptar

En este cuadro habrás de sombrarDesde C7:C8 y en la siguiente casilla desdeD7:D8

Clic en aceptar

En la casilla B12 esta calculado El valor probabilístico de chi- cuadrado

Para obtener chi calculadoRepetimos el proceso y haz clic en aceptar

Haz clic, en la celda B12

Escribes “1” como valor del grado de libertad

1121 k

Haz clic

Chi - cuadrado calculado es 4.5

Criterios para determinar , si “Ho” se Acepta ó Rechaza

22TC xx

22TC xx

Ho: se Rechaza

Ho: se Acepta

84.35.4

Ho: se Rechaza

EJEMPLO 2S I M P L E E N T RA DA

En los experimentos de Mendel con guisantes, observo 315 guisantesLisos y amarillos ;108 lisos y verdes;101 rugosos y amarillos; y 32 rugososY verdes .De acuerdo con su teoría estos números deberán presentarse en la proporción9:3::3:1 ; Hay alguna evidencia que permita dudar de la teoría , con un nivelDe significación de : a) 0.01 b) 0.05

Ho : No hay evidencia que permita dudar de su teoría

CON LA INFORMACION OBTENIDA EN EL ENUNCIADO CONSTRUIMOS UNA TABLA , TAL COMO SE MUESTRA.

PARA LLENAR LAS CELDAS DE “fe” USAREMOS LA RELACION 9:3::3:1 = 16Y HACEMOS (9/16)*556 ; (3/16)*556 ; (3/16)*556Y (1/16)*556 ; SUS RESULTADOS LOS ESCRIBIMOS EN SUS RESPECTIVAS CELDAS.

22TC xx 22

TC xx Ho: se Rechaza Ho: se Acepta

3141 k

34.1147002398.0

22TC xx

82.747002398.0

22TC xx

Ho: se Acepta

Ho: se Acepta

CHI- CUADRADOD O B L E E N T RA DA

fose

recuperanno se

recuperan total

grupo A 75 25 100

grupo B 65 35 100

total 140 60 200

fe se recuperan no se recuperan total

grupo A     100

grupo B     100

total 140 60 200

200100*140

200100*140

200100*60

200100*60

70

703030

¡¡¡¡GRACIAS!!!!