desarrollo del proyecto de investigación-educacion - modulo 1 final
TRANSCRIPT
UNIVERSIDAD CESAR VALLEJOUNIVERSIDAD CESAR VALLEJOFACULTAD DE EDUCACIÓNFACULTAD DE EDUCACIÓN
MAESTRÍA EN EDUCACIÓN Y GESTIÓN EDUCATIVAMAESTRÍA EN EDUCACIÓN Y GESTIÓN EDUCATIVA
MODULO DE APRENDIZAJE 1
DESARROLLO DEL PROYECTO DE INVESTIGACIÓN I
Dr. ATILIO GAMALIEL OLANO MARTINEZMg. LUIS ALZAMORA DE LOS GODOS URCIA
Lima, 2008
FILIAL - LIMA
César Acuña PeraltaRector Fundador
Sigifredo Orbegoso VenegasRector
Francisco Cardoso RomeroVicerrector Académico
1
ÍNDICE
Introducción ………………………………………………………..
Programación Académica……………………………………….. Objetivos………………………………………………………..Cuadro de programación académica ……………………….
I. Primera Unidad: Ajustes Metodológicos. Concepto de tesis y estructura de tesis.1.1 Tesis.1.2 Conceptos de estadística y análisis de datos I1.3 Conceptos de estadística y análisis de datos II
II. Segundad Unidad: Trabajo de Bases de Datos en Spss: Manejo de conceptos básicos de estadística aplicada2.1 El programa estadístico SPSS 2.2 Introducción al SPSS en español2.3 Editor de datos de SPSS en español
III. Tercera Unidad: Manejo del Data Entry, ingreso y codificación de variables3.2 Base de datos en SPSS: Las Variables
IV. Cuarta Unidad: Ingresos de instrumentos a la Base de Datos.4.1 Base de datos en SPSS II: El formato de la base
V. Quinta Unidad: Ajuste y afinamiento de bases de datos llenadas para análisis.5.1 Categorizar Variables con SPSS5.2 Definir valores antiguos y nuevos: recodificar
Lecturas complementarias: Variables y la hipótesis en la investigaciónGuía metodológica para la elaboración de un informe final de investigación¿Qué es una tesis? ¿para quien se escribe? ¿cómo debe estar escrita?
Bibliografía
34567
8132639
404448
54
5562
6368
6978
8391
102112
2
INTRODUCCIÓN
Todo proceso de post grado culmina con un trabajo científico que generalmente
constituye una investigación científica. Se dice generalmente porque algunas carreras
culminan con un Trabajo de grado.
En el caso de las carreras o los programas de post grado en educación, maestría o
doctorado, el producto final es una tesis. Por ese motivo se hace necesario, dentro
del diseño curricular, incluir módulos que permitan a los cursistas aspirantes
desarrollar este proceso con la mayor calidad posible, es así que se imparte el Curso
de Desarrollo del Proyecto de investigación que culmina con la presentación de la
tesis.
Para lograr el armado de una tesis, se aprenderá SPSS, además de los conceptos
básicos de un informe de investigación, con lo que se logrará en esta primera parte la
estructura de una base de datos y los conceptos principales de la tesis.
3
PROGRAMACIÓN ACADÉMICA
4
OBJETIVOS
OBJETIVO GENERAL DE LA ASIGNATURA
Elaborar la Primera Etapa de la Tesis de Maestría.
OBJETIVOS ESPECÍFICOS
Diseñar un sistema de validación eficiente
Elaborar un Data Entry para el Ingreso de Encuestas
Diseñar una Base de Datos.
Ingresar eficientemente los instrumentos a la base de datos.
Generar una edición de Base de Datos con adecuada codificación y clasificación de variables..
5
Cuadro de programación académica
CAPACIDADES CONTENIDOS ESPECÍFICOS
(Unidades)
ACTIVIDADES
ESTRATEGIA
METODOLÓGICA
TIEMPO TÉCNICA
1.1 Manejo de bases de datos y
entorno estadístico por la
generación de la TESIS
1.1.1 Taller I: Ajustes
Metodológicos.
Concepto de tesis y estructura de
tesis.
Lectura y evaluación de los
proyectos realizados en el
módulo previo
5 horas Aprender Haciendo
1.1.2 Taller II: Trabajo de Bases
de Datos en Spss: Manejo de
conceptos básicos de estadística
aplicada
Trabajo en computadoras,
práctica individualizada
5 horas Aprender Haciendo
1.1.3 Taller III: Trabajo de
Bases de Datos en Spss: Manejo
del Data Entry, ingreso y
codificación de variables
Trabajo en computadoras,
práctica individualizada
5 horas Aprender Haciendo
1.1.4: Taller IV: Trabajo de
Bases de Datos en Spss: Ingresos
de instrumentos a la Base de
Datos.
Trabajo en computadoras,
práctica individualizada
5 horas Aprender Haciendo
1.154: Taller V: Trabajo de
Bases de Datos en Spss: Ajuste y
afinamiento de bases de datos
llenadas para análisis .
Trabajo en computadoras,
práctica individualizada
5 horas Aprender Haciendo
6
Primera unidad……………………………..
Generación de Resultados descriptivos en SPSS
7
1.1 TESIS
Objetivo: El alumno al terminar el aprendizaje del presente capítulo tendrá el
conocimiento.
DEFINICIÓN DE TESIS
La tesis es el documento en el que se exponen los resultados científicos alcanzados
por el aspirante en su trabajo de investigación. Se presentan de forma sistematizada,
lógica y objetiva esos resultados en correspondencia con el proyecto presentado,
discutido y aprobado para la búsqueda de soluciones al problema planteado con
respuestas científicas contextualizadas a partir de la utilización del método
científico.d).
MOMENTOS IMPORTANTES EN EL DESARROLLO DE UNA TESIS
Una tesis tiene dos momentos importantes: la escritura y la defensa.
1. La escritura del documento que es la demostración de la capacidad del aspirante
para diseñar, estructurar, organizar y ejecutar una investigación en su campo de
conocimiento.
2. La defensa, que es la demostración de la capacidad del aspirante, de convencer
acerca de que sus resultados son valederos, expresándolos con coherencia,
organicidad y en forma sintética.
Estos dos momentos deben complementarse mutuamente. Sin embargo, todos los
profesores que se han visto implicados en el trabajo de tutoría y asesoramiento y por
consiguiente han tenido que integrar tribunales para la evaluación de tesis a cualquier
nivel, saben que en ocasiones se observan “historias muy bonitas, pero muy mal
contadas”. Pueden verse trabajos en los cuales se denota un trabajo arduo de
investigación, resultados con una gran repercusión y aporte a la ciencia, pero la
redacción está tan complicada y defectuosa que dificulta la comprensión, en cambio,
la defensa se realiza de un modo tan elocuente que compensa la deficiente escritura.
De lo anterior se desprende que debe existir correspondencia entre el rigor científico
de la escritura y la exposición oral en la defensa del trabajo investigativo.
Además de los requisitos de orden metodológico, debe cumplirse con las exigencias
indispensables en cuanto a novedad, actualidad y originalidad en el tratamiento del
tema, su fundamentación científica y las posibilidades de introducción en la práctica
8
como contribución a los procesos de cambio en las realidades educacionales de los
diferentes países. Otros aspectos que deben estar contenidos de forma general en la
tesis son:
Ampliación de los límites del conocimiento científico en un área específica del
saber.
Demostración de conocimientos básicos sobre el tema de investigación.
Evaluación crítica sobre la bibliografía e investigaciones precedentes.
Manejo adecuado de las técnicas de investigación, o la introducción de
nuevas técnicas y procedimientos.
Demostración de la adquisición de criterios novedosos suficientemente
argumentados.
1. Requisitos para la escritura de la tesis
La escritura de la tesis debe cumplimentar un grupo de requisitos para lograr su
comprensión y elegancia. En muchas ocasiones a pesar de tener resultados
relevantes, la forma en que se expresan los mismos no los hace comprensibles, o no
son científicamente fundamentados y ello hace que se pierda la calidad de la
investigación. De ahí que en la escritura de la tesis se deban tener en cuenta dos
tipos de requisitos: el fondo y la forma.
a. Requisitos de fondo:
Unidad: Es el principio armónico de las partes con el todo. La unidad en toda tesis es
la armonía de todas las ideas, tanto principales como secundarias. La unidad aporta
perfecta concordancia entre problema, demostración y conclusiones.
Aunque se manejen varias ideas, hay una que es la idea fundamental, la base de la
investigación y el objeto final de la misma. Las otras ideas son secundarias o
subordinadas con respecto a ella.
Demostración: La tesis debe ser demostrada mediante el razonamiento lógico de los
resultados a través de los procesos del pensamiento, cada análisis realizado debe
conducir a conclusiones.
Profundidad: La tesis debe penetrar en la esencia del problema, no debe limitarse
a sus cualidades fenoménicas.
Originalidad: La tesis tiene por objeto una materia demostrable o que no ha sido
9
demostrada. Por eso una cualidad importante de la tesis es la originalidad. Ésta se
logra mediante el análisis de los intentos realizados anteriormente por otros
investigadores, o por el propio investigador, de resolver el problema.
En la tesis deben quedar demostradas las siguientes relaciones:
Problema – Objeto de estudio
Objeto de estudio – Campo de acción
Campo de acción – Objetivo
Problema – Objetivo - Población
Objetivo – Tareas investigativas
Tareas investigativas – Métodos de investigación
Problema – Objetivo – Idea científica
Diseño de investigación – Estructura de la tesis
Objetivos – Resultados
Resultados – Discusión
Objetivos – Conclusiones
Conclusiones – Recomendaciones
b. Requisitos de forma:
Laos integran dos componentes básicos: el uso apropiado del lenguaje. y la
organización del texto. Algunas ideas al respecto son:
El lenguaje de la tesis debe reunir las siguientes condiciones:
Debe ser propio, adecuado al objeto de estudio y a la ciencia donde se
desenvuelve la investigación. El aspirante debe mostrar dominio de los
términos empleados en la tesis, así como del área de investigación donde
desarrolla la tesis.
La claridad es un elemento vital, la escritura debe ser accesible, explicar con
pocas palabras, y saber ilustrar los conceptos difíciles de comprender
mediante ejemplos u otras formas. La sintaxis debe ser correcta y el
vocabulario al alcance de los lectores, no se deben usar palabras ambiguas,
vagas, jerga, abreviaturas, ni elogios desmedidos. No se deben exagerar los
conceptos ni los términos.
10
Cuando se empleen sinónimos para aumentar la riqueza del léxico, debe
cuidarse que la palabra afín tenga el significado que se busca y armonice en
el texto.
Debe especificarse la región, el país donde se realiza el estudio. En no pocas
ocasiones pueden verse trabajos que dicen: en nuestra provincia, en nuestro
país, lo que hace que el lector tenga que buscar otras páginas para localizar
el área de estudio.
La organización del texto:
Debe escribirse en forma impersonal, es decir, en tercera persona del
singular, por ejemplo, en lugar de “mi opinión es”, se debe decir: “en opinión
de esta autora”, o “esta investigadora encontró diferencias con respecto a los
resultados obtenidos por tal autor en tal lugar”. En ocasiones se leen trabajos
que plantean: “nosotros vamos a presentar…”. Puede decirse: Se presenta…
Escribir con mayúscula cuando sea necesario, sin abusar de su uso.
Todas las comillas que se abran deben ser cerradas.
No escribir demasiadas cifras con números arábigos, en el caso de números menores
de diez, tratar de expresar los mismos por su palabra genérica.
Usar los números romanos cuando sea necesario
Ser coherentes con las siglas, que queden explícitas en el primer momento de
su uso en el texto y de ser posible no abusar de ellas.
No exagerar los subrayados.
Alternar con prudencia los numerales y los cardinales, los números romanos y
los arábigos.
Debe revisarse la versión impresa con el fin de constatar:
Si hay un correcto paginado
Si las citas están entrecomilladas y referidas.
Si se corresponde el número de las notas con la referencia y se aprecia
correctamente en el texto.
Si la bibliografía está ordenada de acuerdo a una misma norma Vancouver
APA. Es frecuente ver tesis escritas con una mezcla de normas.
Si la bibliografía cuenta con todos los datos necesarios, ya sea libro o artículo
de revista.
Los tiempos verbales:
11
El resumen, se redacta en pasado.
La introducción, fundamentación y marco teórico se redacta en presente, pues
son aspectos válidos hasta el momento y que mantienen su vigencia en el
tiempo.
El material y método y los procedimientos se escriben en pasado, pues
representan acciones ya realizadas. (En el perfil del proyecto se escriben en
futuro)
Los resultados se escriben en pasado, pues fueron encontrados mucho antes
de escribir la tesis.
En la discusión al debatir y opinar sobre contenidos de otros autores se
escribe en presente, pues son conocimientos actuales que se usan como
referencia, cuando se comentan los resultados obtenidos se escriben en
pasado. Escribir correctamente una discusión es un arte para poder llevar las
reglas de la escritura de forma adecuada.
A continuación se presenta una guía y es necesario insistir en que se trata de guía,
que se ha integrado con algunos consejos que pueden resultar útiles, pero que los
autores de las tesis deben complementar con sus conocimientos particulares en el
tema que presenta.
Es importante que los autores de las tesis sepan que deben utilizar estas guías como
modelos y no interpretarlas como documentos normativos o como “camisas de
fuerza”. Un trabajo de tesis, en cualquier nivel, no debe juzgarse sólo por su formato,
sino también por la calidad de su contenido, del mismo modo que una obra
arquitectónica puede satisfacer todos los requerimientos técnicos dentro de una
virtual infinidad de concepciones estéticas. El amplio espectro de temáticas en que
podría legítimamente desarrollarse una tesis de maestría o doctorado hace estéril
cualquier esfuerzo por diseñar un patrón único para los manuscritos de las tesis.
PREGUNTAS
¿Qué es una tesis y para que sirve?
¿Explique los momentos de la tesis?
¿Qué requisitos de forma y fondo debe tener una tesis?
12
1.2 CONCEPTOS DE ESTADÍSTICA Y ANÁLISIS DE DATOS I
Objetivo: El alumno al terminar el aprendizaje del presente capítulo conocerá el los
diversos métodos aplicados al análisis de datos básicos y formulación de resultados
de una tesis de postgrado.
10.1 EL ANÁLISIS DE LOS DATOS
Una división clásica de la Estadística, es la de Descriptiva (ED) e Inferencial (EI). La
primera tiene por objeto procesarlas medidas necesarias de las cosas, individual y/o
grupalmente, sin abrir juicio de calidad, valor, diferencia, importancia, etc., sobre las
mismas. La segunda atiende a las necesidades de tomar decisiones a partir de esos
valores; compara, afirma, infiere la probabilidad de la ocurrencia de tales valores,
estima, etc.
En la Estadística Descriptiva, el método es Matemático, basado en algunos
conceptos extra-matematicos, mientras que en la Estadística Inferencial es un
método ampliamente utilizado y precisado, sobre las operaciones lógico-matemáticas
a utilizar. Suele denominarse Método Estadístico o Metodología de la Investigación
Estadística.
El Método Hipotético Deductivo, no incluye a este como una de las herramientas de
decisión, este método sólo habla de inferir conclusiones a partir de los datos hallados,
sin embargo la mayoría de las investigaciones utilizan al Método Estadístico dentro
de su esquema de Método Hipotético Deductivo.
Los resultados obtenidos en la recolección de datos, a partir de la definición de las
variables en estudio, necesitan ser procesados, ordenados, Sistematizados,
presentados de manera tal que sean entendibles. Raras veces trabajamos con un
conjunto pequeño de los mismos, en general necesitamos un número considerable
de observaciones, que de ningún modo son posibles de analizar individualmente, a
no ser que queramos mostrar un único dato.
Es conveniente para introducirse a este tema, volver a aquella parte de los Sistemas
de Clarificación, dentro de Sistemas de Recolección de Datos, donde se parte del
13
concepto de Dato, se pasa por una aplicación a la Tabulación y Graficación y se llega
a definir los datos en función de variables y escalas.
PROCESAMIENTO DE DATOS
VARIABLE TIPO ESCALA POSICIÓN DISPERSIÓN
CUALITATIVA No tiene Nominal Frecuencia No tiene Ejemplo: PorcentajePATOLOGIA ModoSEXO TasasPROFESION Razones
CUALITATIVA Ordinal Frecuencia Rango Ejemplo: Porcentaje DesviaciónGRADO DE COMA Con modificacionesHIPO,NORMO,HIPER Media Semi-inter GRADO ACADEMICO Mediana cuartílica
CUANTITATIVAS
NRO HIJOS Discreta Intervalar Media VarianzaCANT PARTOS NRO AUTOMOVILES Sesgo o
CurtosisPESO, TALLA Continua Moda CoeficienteTENSION ARTERIAL Media de Covaria-LONGITUD Mediana cion,
Desviación estándar, etc
GRÁFICOS y CÁLCULOS
Hemos introducido el tema en los Sistemas de Recolección de Datos y la idea, en
principio, no es la de efectuar un manual de Estadística.
Toda Tabla y Gráfico, debe tener un Titulo, que del se desprenda con precisión (ni
vago, ni ambiguo) el significado de lo que contiene. La misma indicación vale para la
definición de las variables que se tabulan o grafican, los pie de pagina tienen por
misión ampliar información por un lado, indicar su procedencia si no es original el
trabajo, indicar las fuentes, etc.
En fin, deben ser autoexplicadas. Pruebe esto con alguien que no tenga un
conocimiento del trabajo que ha llevado a cabo, si lo entiende sin preguntas (fuera de
lo que la tabla o gráfico indica), es que ha logrado su propósito.
14
Errores frecuentes son el llevar una ordenada de porcentajes hasta el 100 % cuando
el mayor de nuestros porcentajes es mucho menor. Otro es el de indicar el 0 en la
abscisa, pero nuestra variable comienza con un valor muy superior, sin indicar un
corte en la abscisa; hágalo con dos líneas paralelas.
No use colores, por lo general si puede ser publicado lo será en blanco y negro.
Utilice diferentes formas de rayados o algo por el estilo. Indique además, en la parte
inferior al gráfico, a que corresponde cada esquema.
PARA UNA VARIABLE CUALITATIVA
Para Una Variable Cualitativa Nominal
Su gráfico se denomina de Barras, estas no se tocan entre si, pues, cada categoría
es independiente de la otra por ejemplo. Tipo de patología en los servicios de cirugía
del Hospital Lazarte o cualquier otro..
También pueden hacerse Pictogramas, es decir gráficos con dibujos que de alguna
medida dan la idea de la variable. un ejemplo común son los censos, donde se
"amontonan" figuras Humanas y también gráficos sectoriales o tortas donde se
parten en forma proporcional al porcentaje.
No son variables "Acumulables", a no ser sus porcentajes, pero tenga en cuenta que
cualquier atributo puede cambiar de posición y cambiar la "Acumulación".
La Frecuencia simplemente es a cantidad de cosas que se agrupan en cada uno de
los valores de la variables o en sus intervalos de clase..
Los porcentajes, La parte proporcional en que aparece un valor respecto de todos
los valores. (La cantidad/el total) por 100. Su gráfico de mayor empleo es la torta si se
trata de 4 a menos variables y si es de esta cinco a más se emplea las barras.
Frecuencias Relativas, su uso es frecuente en las Cuantitativas. Su suma da 1)
Tasa
Es el cociente entre la frecuencia de un valor de la variable, respecto de la suma de
todas la frecuencias.
15
Razón
Es el cociente entre las frecuencias de dos valores de la variable.
Para Una Variable Cualitativa Ordinal
Su gráfico es de barras pero estas pueden tocarse "si la propiedad es teóricamente
continua", lo que implica que "lo ordinal es nuestra medición". Son acumulables
10.4.1 PARA UNA VARIABLE CUANTITATIVA
Para una Variable Cuantitativa Discreta
Su gráfico es de Bastones. Por cada valor de la variable se levanta una línea, pero
entre cada valor no existe nada.
Son acumulables. Su acumulación se hace en "saltos escalonados".
Para una Variable Cuantitativa Continua
Su grafico, denominado Histograma de Frecuencias, son barras que se tocan entre
cada uno de los valores de la variable y los puntos medios pueden ser unidos,
formando el Polígono de Frecuencias. Lo que realmente se hace es graficar la
Distribución de Frecuencias y esto lo llamamos el comportamiento de la variable.
La diferencia entre el valor inferior y el superior de un sub-grupo de valores de la
variable se denomina el Intervalo de Clase o Modulo, su punto medio es la marca
de Clase o Punto Medio.
PARA AMBAS
La Moda
Es el número que más se repite por lo tanto es lo que mas aparece, la Moda es el
valor de la variable con mayor frecuencia.
En las cualitativas, las cuasi-cuantitativas y la cuantitativas discretas solo se indica
este valor, en las cuantitativas continuas existe un cálculo exacto.
16
NOTA: A veces existen dos o más Modas en la distribución y se llaman distribuciones
multimodales, el caso especifico donde existen dos Modas se denomina Bimodal. Si
Ud. encuentra esto en su distribución, busque una variable extraña o intermedia que
se haya "colado" en las mediciones, la mayoría de las veces pasa esto, otras en
cambio, es el real comportamiento de la variable.
Mediana
La Mediana es el valor de la variable por debajo y por sobre el cual, se encuentran el
50 % de los casos relevados. La forma gráfica de determinación se explico cuando
hablamos de acumulación en las variables cuantitativas continuas. A propósito: Para
evitar definiciones "largas", desde ahora diremos, cualitativas, ordinales, discretas y
continuas.
La Mediana es un cuartil, basta reemplazar N/2 por el porcentaje de casos que
queramos ubicarnos en la ojiva, reemplazar los datos, y habremos hallado el valor
del cuartil.
Un cuartil es, entonces, el valor de la variable donde se encuentra una parte del todo.
Los mas típicos son los cuartilos pues se divide la distribución en cuatro partes del
25, 50 y 75 % y con ellos se puede sacar la desviación semi-intercualtilica que no
es mas que Q = (Q3 - Q1) / 2 y da una idea importante de donde a donde se
mueven los datos, sumándola o restándola a la Mediana.
Otros cuantilos son los Decilos, cuando la distribución se divide en diez partes, los
Centilos cuando se divide en cien, cuando estos centilos "hablan" de un porcentaje,
se denominan Percentiles.
Rango
Es la indicación del valor mínimo y el máximo de la distribución de frecuencias de los
datos.
17
Mediana y Rango O Q
Se informan juntos. Posición y Dispersión. Útil para las ordinales, aconsejable
informar para las continuas.
Hay otra información mas precisa que el rango o Q: es la Desviación Media, pero
dejémosla para analizar luego del Sesgo, porque viene justo al caso en ese
momento.
Media
La media o valor medio de los datos, es sencillamente el promedio de los valores de
las variables.
Su formula es Media = Sumatoria de todos los valores / la cantidad de cosas.
Cuando los datos se "amontonan" en las clases, es decir se agrupan, es la sumatoria
del punto medio de la clase por la frecuencia de cada clase todo dividido la cantidad
de cosas y se denomina Media Ponderada, pues a cada valor de la variable se le
aplica "el peso" de la frecuencia.
La media de una muestra es la Media Muestral y existe la Media de la Población.
Existen otros tipos de Medias, tal como la Geométrica, la Armónica y la Cuadrática,
que tienen un uso muy especifico
Desvío o desviación estándar
Tiene un valor pragmático indiscutible. Su cálculo es muy simple habiendo sacado la
varianza, pues solo hay que sacarle a la misma la raíz cuadrada y listo.
Existe el Desvío de la Muestra y el de la Población
Existe el Coeficiente de Variación CV, que es la división de la media por el desvío.
CV = Media / Desvío. Esto implica aplicarse para determinar la validez de la
desviación estándar como prueba.
18
Media y Desvío
Al sumar o restar al valor de la media, al valor del desvío, obtenemos dos valores que
representan el intervalo entre el cual existen el 68 % de los casos
(aproximadamente). Pero eso no es lo mas importante, sino que esto puede
denominarse la Normalidad, estadísticamente hablando.
Luego podemos restar dos veces el desvío y aun tres, obteniendo el 95 y el 99 %
respectivamente y esto se encuentra íntimamente ligado a la estimación y al cálculo
de probabilidades.
Nota: existen varias medidas más de posición y dispersión, que pueden buscarse en
textos estadísticos comunes.
La media y la varianza, además, son deducibles de formulas de momentos muy
útiles en muchos aspectos.
El Sesgo
Otro cuyo valor pragmático es indiscutible. Existen formulas complejas de su calculo,
pero nos conformamos con una sencilla.
Sesgo = (Media - Modo) / Desvío
La Varianza
Es el promedio de las desviaciones estándar respecto de la media. Es un valor que
nos indica cuan "dispersos" están los datos.
Su forma para pocos datos es:
Varianza = Sumatoria de cada valor - la Media, todo elevado al cuadrado y todo
dividido por la cantidad total de casos
LA TOMA DE DECISIÓN ESTADÍSTICA
Es obvio que hoy en día no se necesita de conocer mucho de estadística y cada vez
se hace menos necesario el apoyo del estadístico en la investigación científica,
19
especialmente en lo que se relaciona a las ciencias de la salud, conducta y
educación, pues las variables se manejan por el investigador, los diseños se trabajan
por la epistemología y la metodología y solo queda decidir que prueba estadística
emplear, y para esto solo es necesario conocer el tipo de variable con la que se
trabaja y el número de muestras que intervienen.
Procedimiento:
a) Postule la hipótesis estadística contraria a lo que espera H0
b) Postule "su" hipótesis estadística. Ha
c) Determine el riesgo o Nivel de significación. Alfa
d) Establezca la Prueba estadística a utilizar.
e) Establezca las condiciones de la toma de decisión
f) Realice el cálculo
PRUEBAS ESTADÍSTICAS USUALES
La cantidad de pruebas estadísticas es abrumadora. Sin embargo, no debemos saber
todas, sino entender su construcción, al menos aproximadamente.
Casi toda prueba estadística, tiene la siguiente forma:
Valor Valor hallado en la var. - Valor esperado de la Var.
de la = -----------------------------------------------------------------
Prueba Variabilidad esperada de la Var.
Lo que hace una prueba estadística en general, es hallar la "diferencia" entre lo que
espero y lo que obtengo y a esa diferencia la "reduzco" o "expreso" en términos de la
variabilidad que espero.
PRUEBAS PARA UNA SOLA VARIABLE
CUANDO TENEMOS UNA SOLA MUESTRA: Cuando se desea comparar la muestra
estudiada con la población con respecto a una variable
A.- Cuando se desea hacer inferencia acerca de la media de una variable continua
con respecto a la media de la población cuando la distribución de la variable es
20
normal (o se asume el teorema de límite central) y la varianza (cuadrado de la
desviación estándar) de la población es conocida.
PRUEBAS PARA VARIABLES CUANTITATIVAS
Este tipo de cálculo estadístico es para trabajo eminentemente descriptivos.
CÁLCULO PARA UNA LA MEDIA POBLACIONAL
PRUEBA Z NORMAL PARA UNA MUESTRA.
Ej: queremos saber si el promedio de hemoglobina en sangre de una muestra de
1000 pacientes usuarias de anticonceptivos orales es diferente o no del promedio de
los niveles de hemoglobina en la población general. Sabemos que los valores de
hemoglobina siguen una distribución normal y conocemos la desviación estándar (por
lo tanto la varianza) de los valores normales de glicemia en la población
B.- Cuando se desea hacer inferencia acerca de la media de una variable continua
con respecto a la media de la población cuando la distribución de la variable es
normal (o se asume el teorema de límite central) y la varianza (cuadrado de la
desviación standard) no es conocida
_ ___
= x z / .
√ n
PRUEBA t PARA UNA MUESTRA
Ej. El caso anterior si es que no conociéramos la desviación estándar (por lo tanto la
varianza) de los valores de hemoglobina en la población.
C.- Cuando se desea hacer inferencia acerca de la varianza (cuadrado de la
desviación estándar) de una variable continua con respecto a la varianza de la
población cuando la distribución de la variable es normal (o se asume el teorema de
límite central).
_ _____ = x t / Sx . √ n_
x = Promedio de la muestra.
= Desviación estándar de la población (puede usarse Se).
21
Sx = Desviación estándar muestral.
Z = Coeficiente de confiabilidad para la distribución normal (>30 casos )
t = Coeficiente de confiabilidad para la t de student con 1 grado de libertad.
= Media poblacional
CALCULO DE LA PROPORCIONAL POBLACIONAL
____
= p z / pq . √ n
p = Proporción muestral.
Q = 1 - p
PRUEBAS PARA VARIABLES CUALITATIVAS
PRUEBA Chi CUADRADO PARA VARIANZAS PARA UNA MUESTRA
Cuando queremos comparar una muestra con la población con respecto a una
variable de distribución binomial (no sigue una distribución normal).
Ej: Cuando queremos saber si la varianza (cuadrado de la desviación estándar, que
es una medida de dispersión de los datos) de la distribución de los valores de notas
en la muestra de alumnos de baja autoestima es diferente de la varianza de los
valores de notas de los alumnos de la población general. Esta prueba estadística es
muy sensible y por lo tanto no da resultados confiables si la distribución de los
valores de notas no siguen una curva normal en la población.
(Obs - Esp)²
JI = SUMA -------------------
Esp
Obs= es el número observado de casos clasificados por cada categoría.
Esp= es el número esperado de casos clasificados por cada categoría.
TEST BINOMIAL PARA UNA MUESTRA
Cuando queremos comparar una muestra con la población con respecto a una
variable de distribución no normal ni binomial.
22
Ej. Queremos comparar una muestra de escolares de un colegio con la población
escolar en general con respecto a la presencia o no de parasitosis. Variable binomial:
Presencia de parasitosis: Si o No.
PRUEBAS PARA DOS VARIABLES
PRUEBAS PARA DOS MUESTRAS:
Se desea comparar dos muestras con respecto a una variable.
A.- Cuando queremos comparar medias entre dos muestras independientes, las
varianzas no son diferentes y la distribución de la variable es normal (o se asume
teorema de límite central):
PARA DOS VARIABLES CUANTITATIVAS
LA PRUEBA DE Z PARA DOS PROMEDIOS
Esta prueba es aplicada para n1 y n2 mayores a 30 casos.
__ __
Z = ( X1 - X2) .
/ S1² + S2²
n1 n2
LA PRUEBA T PARA DOS PROMEDIOS
Esta prueba es aplicada para n1 y n2 menores a 30 casos.
____________
t = ( X1 - X2) .
/ S²p + S²p
n1 n2
S²p = (n1 –1)s²1 + (n2 – 1)S²2
n1 + n2 - 2
PRUEBA T PARA DOS PROMEDIOS INDEPENDIENTES CON IGUALES
VARIANZAS.
Cuando queremos comparar las medias de dos muestras independientes, las
varianzas son diferentes y asumimos que la distribución de la variable es normal (o se
asume teorema de límite central):
23
Ej: queremos saber si el promedio de notas de una muestra de alumnos con el
método ABP no es diferente del promedio de los valores de notas de una muestra de
alumnos con el Método Aprender Haciendo. Se supone que la distribución de los
valores de notas sigue un patrón normal, las muestras de alumnos con ABP y las que
llevan el Aprender Haciendo son independientes (No están relacionadas) y la
varianza de los valores de notas no es diferente entre ambos grupos.
PRUEBA T PARA DOS PROMEDIOS CON DIFERENTES VARIANZAS.
Cuando queremos comparar medias entre dos muestras dependientes, asumiendo
que la distribución de la variable es normal (o se asume teorema de límite central):
Ej: El caso anterior si es que asumimos que la varianza de los valores de notas es
diferente entre los alumnos que llevan el ABP y los alumnos que llevan Aprender
Haciendo.
PRUEBA T PAREADA
Inferencia acerca de varianzas, distribución normal (o se asume teorema de límite
central), se emplea cuando existe la comparación de los promedios de dos muestras
relacionadas:
Ej. Cuando queremos comparar el promedio en un test antes y después la aplicación
de una nueva estrategia de aprendizaje. Asumimos que la distribución de los
promedios sigue una distribución normal. También son muestras dependientes
aquellas en que se realiza un pareamiento para una o más variables.
_
t = d , t con (n-1) grados de libertad
Sd n
PRUEBA F PARA DOS MUESTRAS PARA COMPARAR VARIANZAS (muy
sensible cuando el patrón no es normal).
Cuando tenemos dos muestras de distribución binomial y las muestras son
dependientes:
Ej. Queremos comparar si las varianzas (cuadrado de la desviación estándar) son
diferentes entre los valores de notas en matemáticas de un grupo de 100 alumnos de
24
Lima y un grupo de 100 alumnos de Trujillo. Es decir queremos ver si la dispersión de
los valores entre estas dos muestras es diferente. Asumimos que la distribución de
los valores de notas en matemáticas siguen una curva normal.
F = n1s1² /(n1-1)
n2s2² /(n2-1)
n – 1 = grados de libertad del numerador
n -2 = grados de libertad del denominador
s² = Varianza muestral
n = cantidad de muestra
PREGUNTAS
¿Qué tipo de pruebas estadísticas se emplean cuando existe una
variable cualitativa?
¿Qué tipo de pruebas estadísticas se emplean cuando existe una
variable cuantitativa?
Mencione la utilidad de cada prueba
25
1.3 CONCEPTOS DE ESTADÍSTICA Y ANÁLISIS DE DATOS II
Objetivo: El alumno al terminar el aprendizaje del presente capítulo conocerá el los
diversos métodos aplicados al análisis de datos avanzados y formulación de
resultados de una tesis de postgrado, especialmente con el empleo de estadística
inferencial.
EL ANÁLISIS DE LOS DATOS 2
CORRELACIÓN DE PEARSON:
Es la relación entre dos variables continuas que no tienen distribución normal. Se
realiza entre valores de dos variables en un grupo o dos grupos con la misma
variable o distinta. También puede ser de tipo lineal, la característica recta que tanto
llama la atención, parcial, curvilínea, múltiple o de varias variables a la vez. En
principio puede hacerse para cualquier tipo de función.
Ej. Existe o no relación entre los valores de la edad y el coeficiente intelectual en un
grupo de 1000 escolares de Villa el Salvador.
R = n XY - X y .
√(n X² - (X)² (n Y² - (Y)²)
Antes de la correlación, normalmente se efectúa lo que se denomina la recta de
regresión. El valor de la correlación, es predecir el valor de una variable a partir del
valor de la otra.
Es bastante complicada para lo que se pretende de unos "apuntes estadísticos".
Calcula también una "dispersión" respecto de cada función que se trabaja, es decir
"predice los valores entre tal y tal valor". Un valor 0 es ausencia de correlación
(predicción), el opuesto, 1, es lo máximo, jamás alcanzado a no ser matemáticamente
con objetos de orden ideal. La realidad es otra.
Como valores establecidos se denota que intensidades de correlación:
Cuando esta entre 0 y 0,25 = No hay correlación
Cuando esta entre 0,26 y 0,50 = baja correlación.
Cuando está entre 0,51 y 0,74 = Mediana Correlación
26
Cuando está entre 0,76 y 1 = Existe alta correlación.
Hay que cuidar que siempre se encuentre la significancia estadística p < 0,05.
Valor Predictivo
Que es r.r (r cuadrado) es de 0.49 (0.7x0.7) y esto es lo mismo que decir "una
predicción de una variable a través de otra puede acertar como no", o es blanco o es
negro, no dice nada mas, debemos tener como mínimo 0.85 y ahí empezar a inferir la
influencia de la variable.
Métodos de correlación RANK.: Coeficiente de Correlación Spearman
Ej. El uso de un módulo (medido en porcentaje de exámenes) en una muestra de
estudiantes de maestría y el número de horas de estudio.
ANÁLISIS DE REGRESIÓN
El investigador suele tener razones teóricas o prácticas para creer que determinada
variable es causalmente dependiente de una o más variables distintas. Si hay
bastantes datos empíricos sobre estas variables, el análisis de regresión es un
método apropiado para desvelar el patrón exacto de esta asociación.
El algoritmo de análisis de regresión construye una ecuación, que tiene el siguiente
patrón. Además, da los parámetros a1, a2 etc. y b valores tales que la ecuación
corresponde a los valores empíricos con tanta precisión como es posible.
y = a1x1 + a2x2 + a3x3 + ... + b
En la ecuación, y = la variable dependiente x1 , x2 etc. = variables independientes a1,
a2 etc. = parámetros b = coeficiente.
En su estructura para un análisis de dos variables cuantitativas la fórmula para un
análisis de regresión sería:
Y = a + bX.
En donde
27
Y = Variable dependiente (numérica).
X = variable independiente (numérica)
A = Ordenada de origen
B = Coeficiente de regresión lineal.
Cálculo de a:
_ _
a = Y – bX
_
Y = Promedio de las Y
_
X = Promedio de las X
n = Tamaño muestral
b = n XY - X Y
nX² - (X²)
PRUEBAS PARA VARIABLES CUALITATIVAS
LA PRUEBA DE Z PARA DOS PROPORCIONES
Esta prueba es aplicada para n1 y n2 mayores a 30 casos.
Z = ( P1 - P2) .
/ p1q1 + p2q2
n1 n2
PRUEBA DE JI CUADRADO PARA DOS PROPORCIONES
Sume cada diferencia entre lo que observo y lo que esperaba, elevada al cuadrado y
dividida por lo que esperaba
X² = (fo - fe)²
fe²
En donde:
fe = ( fi) ( c)²
ft
28
gl = (fi -1) ( c – 1)
fo = Frecuencias observadas
fe = Frecuencias esperadas.
fi = Filas
c = Columna
gl = Grados de libertad
No es el mismo concepto que el anterior, pues no mide "diferencias de medias"
propiamente dichas, sino cual es la "variabilidad total", un resultado "significativo" no
nos dice quien es mas o menos, sino que son diferentes.
Utiliza el concepto de GL pero no por cantidad de sujetos sino por cantidad de
Grupos Fi de Condiciones C, GL =(Fi-1) (C-1) Para un único grupo, GL = C-1, para
una única condición GL = Fi-1.
Además contiene condiciones de restricción como que ningún valor esperado sea
menor a 5. Formas para sacar los "esperados" si no se tiene idea de lo que se espera
y otras aplicaciones de "asociación", "contingencia", etc.
VARIACIONES DE LA PRUEBA DE CHI² Y PRUEBAS ALTERNATIVAS
TEST X² de Mc NEMAR
Cuando tenemos dos variables de distribución binomial, las muestras son
independientes pero algún valor esperado de alguna de las celdas de la tabla de 2 x
2 es < 5:
Ej: Se desea determinar si dos técnicas educativas difieren en la detección de cierto
tipo de problema de aprendizaje (+). Se toma una prueba, por ejemplo, 100 alumnos
y cada una se divide en dos, una sub muestra se analiza la técnica A y la otra la B.
Con la prueba de c2 de Mc Nemar se determina si la proporción de los (+ al problema
de aprendizaje) con la técnica A difiere de los (+ a problemas de aprendizaje) con la
técnica B.
29
DESPUES
+ -
ANTES + a b
- c d
X² de Macnemar = ( |a - d| - 1 )² , x² con un grado de libertad
( a + d)
PRUEBA EXACTA DE FISHER
Cuando tenemos dos variables de distribución binomial, las muestras son
independientes y todos los valores esperados son ≥ 5. Los valores usados no
corresponden a densidad de incidencia:
Ej: Cuando en el ejemplo anterior uno de los valores esperados de una de las celdas
de la tabla de 2 x 2 es menor de 5. El valor esperado se halla multiplicando el total de
la columna (a + b) por el total de la fila (a + c) correspondientes a esa celda (ej. la
celda a) y dividiendo por el total de participantes (a+b+c+d).
+ -
I + a b
II - c D
Se calcula el valor de p (nivel de significancia) con la siguiente fórmula:
p = (a +c)! (b +d)! (a+b)! (c + d)!
a! b! c! d!
Pruebas para proporciones binomiales a dos muestras o metodos para tablas
de 2x2 si no existen confusores. Si existen confusores: prueba de Mantel-
Haenszel
Distribución binomial, muestras independientes, todos los valores esperados ≤5,
valores de densidad de incidencia incluidos:
Ej: Cuando el ejemplo anterior uno de los valores esperados son ≤ de 5 y el estudio
no es uno de tipo cohortes: es uno de tipo caso control o transversal
a B F1
30
c d F2
C1 C2 N
XMH² = ( a .d – b.c /N)²
F1F2C1C2/N3
C = Filas
F = Columnas
Trabaja con 1 grado de libertad
Métodos de tablas de contingencias r x c
Distribución no normal (o teorema de límite central no asumido), datos no
categóricos:
Ej. Queremos saber si existe asociación entre la variable violencia familiar (leve,
moderada o severa) en tres grupos de alumnos con rendimiento académico bajo,
regular y alto.
Prueba Kappa
Ej. Queremos saber en que grado concuerdan el diagnóstico clínico de un ginecólogo
y el diagnostico de laboratorio en la etiología de la vulvovaginitis en 100 mujeres que
venían con el síntoma de flujo vaginal anormal.
PRUEBA COCHRAN Q
La prueba Cochran Q puede usarse para evaluar la relación entre dos variables que
se miden en una escala nominal. Una de las variables puede incluso ser dicotómica,
o consistir en sólo dos valores posibles.
_
Q = k.(k – 1) (V - V)²
kH - H²
k = número de variables
H = Total de situaciones en filas
V = Total de situaciones en columnas
Prueba Wilcoxon
31
Con la prueba Wilcoxon podemos comprobar la representatividad de las preferencias
entre dos (o más) alternativas. La escala al dar las preferencias es ordinal.
32
PRUEBAS PARA VARIABLES CUALITATIVAS Y CUANTITATIVAS.
ANÁLISIS DE VARIANZA
Básicamente la variable independiente es cualitativa nominal y la dependiente es
cuantitativa. El análisis de varianza (en inglés ANOVA, ANalysis Of VAriance)
examina dos o más conjuntos de mediciones, especialmente sus varianzas, e intenta
detectar diferencias estadísticamente representativas entre los conjuntos. Estos
conjuntos podrían ser, por ejemplo, reacciones medidas para dos grupos
experimentales, y el investigador quiere examinar si hay una diferencia en las
reacciones, tal vez causada por los distintos estímulos a los grupos.
El método de análisis de varianza se basa en el hecho matemáticamente probado de
que hay una diferencia entre los grupos sólo si la varianza inter-grupos es mayor
que la varianza intra-grupo.
El análisis se inicia calculando la varianza intra-grupo para cada grupo, y la media de
todas estas varianzas de grupo.
El siguiente paso es calcular la media para cada grupo, y entonces la varianza de
estas medias. Esa es la varianza inter-grupos.
Entonces calculamos la proporción de las dos cifras que acabamos de obtener, que
es llamada F. En otras palabras, = (varianza de las medias de grupo) / (media de las
varianzas de grupo).
variabilidad inter
F = --------------------
variabilidad intra
Fórmulas:
La prueba de F para la regresión lineal
F = CM entre-grupos
CM intra-grupos
33
CM = Cuadrados medios
CM = SC/gl
SC = Suma de cuadrados
gl = Grados de libertad
proviene de :
Cálculo de la suma de cuadrados intragrupo:
SC iintragrupo = SC total – SC entre grupos
Para esto se calcula:
Suma de cuadrados totales:
Sctotal = x² - ( x) ²
N
x = Suma de las observaciones (puntuaciones de la variable dependioente).
X²= Suma de los cuadrados de las observaciones
N = número total de casos
Suma de los cuadrados entre grupos
SC entre grupos = ( x1)² + ( x2)² + ( x3)² + ( x4)² - ( x)²
n n n n N
Lo que precisamente trata de ver Fisher es que si el numerador es grande y el
denominador es pequeño, F es grande y por lo tanto significativa. Por que? porque
arriba será "grande" si y solo si hay una gran diferencia entre los grupos y abajo
será pequeño si y solo si los grupos tienen datos "equivalentes", de poca
variabilidad. Fisher trata de manejar eso de que hay mucha diferencia entre los
grupos, pero dentro de cada uno hay cualquier "causalidad", es decir, no afirmar la
diferencia significativa, si los grupos no son "representativos" de esa diferencia. Muy
buena solución.
34
[ ]
Finalmente nos referimos a la tabla (en manuales estadísticos) que muestra qué
valores puede alcanzar el coeficiente F cuando sólo actúa el azar. Si el F obtenido
del ANOVA es mayor que el valor de la tabla, hay una diferencia entre los grupos que
es significativa según muestra la tabla.
La fórmula del análisis de varianza es muy compleja y es preferible saber la decisión
y emplearla en un paquete estadístico.
Anova un factor
Ej: Queremos comparar el promedio de horas de estudio (variable continua y
dependiente) entre cuatro técnicas de motivación para la lectura (variable
independiente y categórica) en u un grupo de 100 estudiantes universitarios.
Asumimos que los valores de las diferencias de las horas de estudio siguen un patrón
normal.
Prueba de Kruskal-Wallis: No Paramétrica
Inferencia acerca de varianzas, distribución normal (o teorema de límite central
asumido):
Ej. Queremos comparar los promedios de horas de estudio en el hogar entre tres
grupos de estudiantes: con bajo rendimiento escolar, otro en el que existe un
resultado regular rendimiento escolar y el ultimo grupo donde el rendimiento escolar
es bajo.
Prueba de Bartlett's para homogeneidad de varianzas
Distribución no normal (o teorema de limite central no asumido), datos categóricos.
Ej: Queremos en el ejemplo anterior, comparar la dispersión de los promedios de
horas de estudio en los tres grupos, tomando en cuenta las varianzas (cuadrado de la
desviación estándar).
Anova de dos factores.
Ej: Queremos ver la diferencia de promedios de calificaciones de un examen
(variable dependiente continua) entre dos grupos de estudiantes: 100 que estudian
mediante ABP y 100 mediante Aprender Haciendo. Pero hay que considerar que
35
dentro de estos dos grupos existen estudiantes que no tienen buenos hábitos de
estudio y estudiantes que sí tienen buenos hábitos de estudio. En realidad habrían 4
grupos en la variable independiente: ABP con Buenos ya malos hábitos, Con
aprender Haciendo y con Buenos ya malos hábitos de estudio. Asumimos que los
valores de las calificaciones siguen un patrón normal.
ANÁLISIS DE COVARIANZA
Distribución no normal de la variable dependiente (o no se asume teorema de limite
central):
Ej: Queremos comparar el promedio del efecto del método Aprendizaje Basado en
proyectos (variable dependiente y continua) entre cuatro programas diferentes
(variable independiente y categórica) en un grupo de 100 estudiantes de diferentes
edades. Variables a ser controlada: la edad, horas de estudio asociada. Asumimos
que los valores de las diferencias de las notas antes y después de la administración
de los métodos siguen un patrón normal.
ANÁLISIS FACTORIAL
A veces tiene el investigador una gran cantidad de datos sobre numerosas variables
diferentes con correlación entre ellas. Con ayuda del análisis factorial, tales datos
suelen poder comprimirse y las variaciones presentarse a través de sólo unas pocas
variables.
Como ejemplo, consideremos los datos de un cuestionario (mostrado en otra parte)
donde a un cierto número de sujetos de un test se les preguntó en qué grado se
correspondían sus problemas de bajo rendimiento académico, analizando los
diversos factores, sociales, económicos y culturales potencialmente relacionados a
este problema y las costumbres de estas personas referidas por el investigador
(mostrados en escalas "semánticas diferenciales"). El investigador ahora quiere
descubrir si tras las estimaciones de los sujetos, hay algunas "variables de fondo"
cuya medición directa por a través de medios lingüísticos no sería posible a causa de
la carencia de adjetivos apropiados en el lenguaje. La hipótesis del investigador es
que estas variables de fondo "aparecen" a través de los adjetivos usados en las
escalas semánticas, habitualmente no con un adjetivo único, sino mediante un grupo
de adjetivos con correlación entre ellos.
36
Con la ayuda de un análisis factorial, las variables de combinación o factores ocultos
tras los atributos medidos pueden detectarse y especificarse, y el análisis también
dice lo estrechamente que estos factores están vinculados con las variables
originalmente verificadas.
Un inconveniente del método del análisis factorial es que es demasiado fácil de usar
para estudios que son formalmente correctos pero en la práctica absurdos, porque
siempre presenta los resultados de una forma elegante y matemáticamente exacta,
incluso cuando los factores obtenidos son tienen ningún contenido empírico sensato.
ANÁLISIS DE SERIE TEMPORAL
Una serie cronológica es una línea de valores de variables reunidos en un cierto
periodo de tiempo, habitualmente en intervalos regulares. Si cada valor nuevo se
añade a los previos, la serie es acumulativa.
La curva es la presentación más usual para la serie cronológica. El tiempo siempre
se presenta en el eje horizontal, x. Si es necesario, pueden situarse varias variables o
series de datos en el mismo diagrama. Esto tiene especial sentido cuando se están
investigando sus conexiones o ha de ponerse énfasis en éstas. Cuando se presentan
dos series cronológicas distintas con distintas escalas, podemos situar una escala
cuanto al margen izquierdo de la figura y la otra junto al margen derecho.
Toda serie cronológica es intrínsecamente discontinua, es decir, obtiene un valor
discreto para cada periodo de tiempo. Esto es por lo que la presentación elegida para
una serie cronológica suele ser una curva "en escalera", que es en principio lo mismo
que un histograma donde las columnas se dibujan una junto a otra.
Si dirigimos una mirada más detenida a la variación de la serie cronológica, ésta
suele revelar componentes, todos los cuales tienen sus regularidades específicas que
pueden ser analizadas. Los más habituales de estos componentes son:
Tendencia
Variación periódica
Variación coyuntural
37
Una tendencia es una dirección lineal de desarrollo en un periodo de tiempo. Una
forma sencilla de estudiarla es hacer un diagrama de dispersión y entonces situar
manualmente una estimación aproximada de la línea que describe la tendencia en él
(la línea roja).
Un método más refinado y exacto para la tarea arriba mencionada es el análisis de
regresión. Tras haber encontrado la ecuación que se ajusta de forma óptima a la
tendencia, ésta habitualmente es también presentada de forma gráfica, posiblemente
junto con el diagrama de dispersión original.
Una variación periódica es una variación cíclica recurrente en forma similar una y
otra vez. El periodo de variación suele ser una unidad natural de tiempo, como un
año o un día.
Por ejemplo, el promedio de calificaciones de una muestra de escolares varía
simultáneamente con dos frecuencias: anual y semanal. Estos se calculan uno cada
vez, por el siguiente método, básicamente el mismo en los tres casos:
La variación periódica anual se halla haciendo un grupo de los valores para
Abril, otro de los de Marzo, etc. Entonces, para cada uno de estos doce
grupos se calcula la media y finalmente las doce medias se presentan como la
variación anual.
Cuando calculan los valores semanales, habrá siete grupos, es decir, uno
para cada día de la semana. Se calcula la media para cada uno de los siete
grupos, y las siete medias conforman la variación semanal.
Cuando se ha encontrado la variación periódica, ésta se presenta, sea gráficamente
como curva de la longitud de un periodo, o bien numéricamente como un índice. Este
índice habitualmente se hace a partir de una base de 100 (ó 1,00), y sus valores
periódicos se obtienen cuando las medias periódicas (por ejemplo mensuales) se
dividen por la media común del conjunto de los datos.
38
CUANDO SE ESTUDIA TRES O MÁS VARIABLES
CUANDO LA VARIABLE DEPENDIENTE ES CONTINUA:
MÉTODO DE REGRESIÓN MÚLTIPLE
Ej. Queremos saber si la variable dependiente peso esta independientemente
relacionada (y en que grado) a otras variables como edad, estado nutricional, talla,
etc.
CUANDO LA VARIABLE DEPENDIENTE ES BINARIA Y EL TIEMPO EN QUE
OCURRE EL EVENTO ES IMPORTANTE.
CUANDO LA VARIABLE DEPENDIENTE NOMINAL Y LAS INDEPENDIENTES
NUMÉRICA
MÉTODO DE REGRESIÓN LOGÍSTICA
Ej. Queremos saber cuales de las variables (edad, número horas de estudio, etc.)
están independientemente asociadas a la presencia o no de deserción escolar en
niños que estudian la primaria en un colegio de Comas.
Ej. Se desea identificar los factores con variables independientes cuantitativas de la
motivación para estudiar.
PREGUNTAS
¿Qué tipo de pruebas estadísticas se emplean cuando se asocian dos
tipos de variables cuantitativas?
¿Qué tipo de pruebas estadísticas se emplean cuando se asocian dos
tipos de variables cualitativas?
Mencione la utilidad de cada prueba
39
Segunda unidad……………………………..
Trabajo de Bases de Datos en Spss: Manejo de conceptos básicos de
estadística aplicada
40
2.1 EL PROGRAMA ESTADÍSTICO SPSS
Objetivo: El alumno al terminar el aprendizaje del presente capítulo conocerá el
programa SPSS, su estructura básica y su utilidad para la realización de la tesis.
SPSS
Statistical Package for the Social Sciences (SPSS) es un programa estadístico
informático muy usado en las ciencias sociales y las empresas de investigación de
mercado. Originalmente SPSS fue creado como el acrónimo de Statistical Package
for the Social Sciences. En la actualidad, la sigla se usa tanto para designar el
programa estadístico como la empresa que lo produce. Parece que se esta
popularizando la idea de traducir el acrónimo como "Statistical Product and Service
Solutions"..
Versiones del SPSS
SPSS Inc. desarrolla un módulo básico del paquete estadístico SPSS, del que han
aparecido las siguientes versiones:
SPSS-X (para grandes servidores tipo UNIX)
SPSS/PC (1984, en DOS. Primera versión para computador portátil)
SPSS/PC+ (1986 (en DOS)
SPSS for Windows 6 (1992) / 6.1 for Macintosh
SPSS for Windows 7
SPSS for Windows 8
SPSS for Windows 9
SPSS for Windows 10 / for Macintosh 10 (2000)
SPSS for Windows 11 (2001) / for Mac OS X 11(2002)
SPSS for Windows 11.5 (2002)
SPSS for Windows 12 (2003)
SPSS for Windows 13 (2004): Permite por primera vez trabajar con multiples
bases de datos al mismo tiempo.
SPSS for Windows 14 (2005)
SPSS for Macintosh 13 (2006)
41
SPSS for Windows 15 (2006)
SPSS for Windows 16 (Octubre 2007): En la lista de usuarios de SPSS
"SPSSX(r) Discussion [[email protected]]" varios funcionarios
de la empresa anunciaron previamente la salida de la versión 16 de este
software. En ella se incorporó una interfase basada en Java que permite
realizar mejoras importantes en las facilidades de uso del sistema.
Módulos del SPSS
El sistema de módulos de SPSS, como los de otros programas (similar al de algunos
lenguajes de programación) provee toda una serie de capacidades adicionales a las
existentes en el sistema base. Algunos de los módulos disponibles son:
Manejo
SPSS tiene un sistema de ficheros en el cual el principal son los archivos de datos
(extensión .SAV). Aparte de este tipo existen otros dos tipos de uso frecuente:
Archivos de salida (output, extensión .SPO): en estos se despliega toda la
información de manipulación de los datos que realizan los usuarios mediante
las ventanas de comandos. Son susceptibles de ser exportados con varios
formatos (originalmente HTML, RTF o TXT, actualmente la versión 15
incorpora la exportación a PDF junto a los formatos XLS y DOC que ya se
encontraban en la versión 12)
Archivos de sintaxis (extensión .SPS): Casi todas las ventanas de SPSS
cuentan con un botón que permite hacer el pegado del proceso que el usuario
desea realizar. Lo anterior genera un archivo de sintaxis donde se van
guardando todas las instrucciones que llevan a cabo los comandos del SPSS.
Este archivo es susceptible de ser modificado por el usuario. Muchos de los
primeros usuarios del SPSS suelen escribir estos archivos en vez de utilizar el
sistema de pegado del programa.
Existe un tercer tipo de fichero: el fichero de scripts (extensión .SBS). Este fichero es
utilizado por los usuarios más avanzados del software para generar rutinas que
permiten automatizar procesos muy largos y/o complejos. Muchos de estos procesos
suelen no ser parte de las salidas estándar de los comandos del SPSS, aunque
parten de estas salidas. Buena parte de la funcionalidad de los archivos de scripts ha
sido ahora asumida por la inserción del lenguaje de programación Python en las
42
rutinas de sintax del SPSS. Procedimientos que antes solo se podían realizar
mediante scripts ahora se pueden hacer desde el sintax mismo.
El programa cuando se instala trae un determinado número de ejemplos o utilidades
de casi todos los ficheros en cuestión. Estos son usados para ilustrar algunos de los
ejemplos de uso del programa.
Fichero de datos de SPSS
Los ficheros de datos en formato SPSS tienen en Windows la extensión .SAV. Al abrir
un fichero de datos con el SPSS, vemos la vista de datos, una tabla en la que las filas
indican los casos y las columnas las variables. Cada celda corresponde al valor que
una determinada variable adopta en un cierto caso.
Además de esta vista de datos, en las últimas versiones del programa existe una
vista de variables en la que se describen las características de cada una. En esta
vista las filas corresponden a cada variable y las columnas nos permiten acceder a
sus características:
Nombre, limitado a 8 caracteres.
Tipo de variable (compárese este listado de opciones con los tipos de variables estadísticas existentes)
o Numérico, número en formato estándar)
o Coma decimal, número con comas cada tres posiciones y con un punto como delimitador de los decimales
o Punto decimal, número con puntos cada tres posiciones y con una coma como límite delimitador de los decimales.
o Notación científica, número que se expresa con un formato tal que se sigue de una E y un número que expresa la potencia de 10 a la que se multiplica la parte numérica previa
o Fecha
o Moneda dólar, formato numérico con el que se expresan cantidades en dólares
o Moneda del usuario, formato numérico con el que se expresan cantidades en la moneda definida en la pestaña de monedas del cuadro de diálogo "Opciones"
o Cadena de caracteres o variable alfanumérica
Tamaño total
Tamaño de la parte decimal
43
Etiqueta de la variable
Etiquetas para los valores
Valores perdidos
Espacio que ocupa en la vista de datos
Alineación de la variable en la vista de datos
Escala de medición.
Algunos usuarios pasan por alto las características de las variables cuando se trabaja
en la base de datos. Sin embargo, cuando se utilizan scripts o Python las
características de las variables pueden tomar gran relevancia en la construcción de
procedimientos ad-hoc.
PREGUNTAS
¿Qué es el SPSS?
¿Qué tipos de archivos genera el SPSS?
¿Cómo Trabaja las variables el programa SPSS?
44
2.2 INTRODUCCIÓN AL SPSS EN ESPAÑOL
Objetivo: El alumno conocerá las funciones básicas del SPSS en español.
INTRODUCCIÓN AL SPSS EN ESPAÑOL:
Para ingresar al programa, tenemos dos opciones; la primera es mediante el acceso
directo ubicado en el Escritorio (Si lo hay) y la segunda es mediante la ruta Inicio.
Programas.. SPSS para Windows.. SPSS 12.0 para Windows.
.
.
Al iniciar el programa se abre automáticamente el Asistente de inicio [Fig.1]; a través
de este asistente podemos comenzar a trabajar con SPSS de seis diferentes
maneras; entre las que encontramos Ejecutar el tutorial, Introducir datos (Crear nuevo
archivo), Ejecutar una consulta creada anteriormente (Importar los datos de una
archivo de base de datos), Crear una nueva consulta mediante el asistente de base
de datos (Definir los parámetros de ubicación y nombre de un archivo de Base de
datos), Abrir una fuente de datos existente (Esta opción cuenta con una casilla en su
parte inferior, en donde aparecen todos los archivos de datos que se hayan utilizado
con anterioridad en el programa; si es la primera vez que se abre el programa desde
su instalación sólo aparece la opción Más archivos, la cual al ser elegida abre una
ventana de navegación para la ubicación del archivo).
La última opción que aparece en el asistente corresponde a Abrir otro tipo de archivo;
a través de esta opción podemos ubicar y abrir cualquier tipo de archivo de SPSS
distinto al de datos. Para seleccionar alguna de las opciones basta con hacer clic
sobre ella de manera que aparezca un punto en la casilla de activación ( ). A pesar
de la utilidad que nos brinda el asistente, el programa nos da la posibilidad de decidir
si queremos que aparezca el asistente cada vez que se ejecute el programa o no.
45
Para desactivar el asistente debemos activar la opción No volver a mostrar este
cuadro de diálogo, ubicada en la parte inferior del asistente.
Figuras 1
Antes de continuar es necesario aclarar los tipos de archivos que genera SPSS, los
cuales son:
Archivos de Datos: son los archivos generados por el sistema (SPSS), en
los cuales se almacena la información (casos y variables) que se haya
creado en el editor o se haya importado de otras fuentes. Este tipo de
archivo se genera con la extensión (*.sav).
Archivos de resultados: son los archivos generados por el sistema, en los
cuales se plasman todos los resultados de los procesos que se han
realizado con el paquete (Tablas, Gráficos, Estadísticos, etc). Este tipo de
archivo se identifica con la extensión (*.spo).
Archivos de sintaxis: este tipo de archivos contienen las líneas de código o
palabras clave de cada uno de los procedimientos que se hayan realizado
con el paquete (Frecuencias, Gráficos, etc.). Este tipo de archivo se
identifica con la extensión (*.sps).
Desde luego SPSS nos permite trabajar con un gran número de formatos de archivo,
provenientes de diferentes programas de bases de datos, hojas de cálculo,
procesadores de palabras e incluso generadores de gráficos.
46
Para continuar seleccionamos la opción Abrir una fuente de datos existente y
sucesivamente hacemos clic en Aceptar, surgiendo la ventana de exploración de
Windows [Fig. 2 y 3]. A través de esta ventana, podemos ubicar de forma rápida y
sencilla un archivo dentro del ordenador o la red. Por defecto la ventana de
exploración se ubica en la carpeta SPSS ubicada en la unidad [C:]; en esta carpeta
se encuentran todos los archivos de muestra que se incluyen con el programa, los
cuales son nombrados en la mayoría de los tutoriales del paquete.
Figuras 2 y 3
Esto es una vista de datos
Figura 4
PREGUNTAS
¿Explique que es un archivo de datos?
¿Mencione la diferencia entre un archivo de datos y uno de resultados?
47
2.3 EDITOR DE DATOS DE SPSS EN ESPAÑOL
El alumno al culminar el capitulo, conocerá las pautas fundamentales y tendrá los
elementos necesarios para realizar adecuadamente una edición de datos.
EDITOR DE DATOS
Esta es la ventana principal del programa, en ella se encuentra la mayoría de los
procedimientos que se pueden realizar con el paquete, así como los accesos directos
a las opciones de los diferentes módulos. Además esta es la única ventana del
programa en la que podemos apreciar la información (Casos y Variables) en su
estado original (Desagrupado). El Editor de datos esta compuesto por cinco
secciones, cada una de las cuales nos ofrece opciones e información diferente. Los
componentes del editor de datos son:
Barra de Menús
Como la mayoría de los programas basados en el sistema operativo Windows, el
Editor de datos de SPSS cuenta con una barra de menús desplegables, en donde se
encuentran las diferentes opciones, procedimientos y aplicaciones que se pueden
ejecutar con el programa. En SPSS se cuenta con diez diferentes menús
desplegables [Fig.5]; dentro de los que encontramos Archivo, Edición, Ver, Datos,
Transformar, Analizar, Gráficos, Utilidades, Ventana y Ayuda (?).
Figuras 5
Las opciones y procedimientos de los menús Archivo, Edición y Ver, están orientados
a las propiedades de Editor de datos. Las opciones y procedimientos de los menús
Datos y Transformar se enfocan a las propiedades y modificación de los datos (Casos
o variables) del archivo que se encuentre abierto. Los procedimientos de los menús
Analizar y Gráficos se encaminan en la descripción y análisis de los datos a través de
pruebas estadísticas o gráficos representativos. El menú Utilidades en cambio se
orienta a la generación y ejecución de los procesos automáticos; es decir, sus
opciones y procedimientos se emplean en la utilidad de producción. Por último
aparecen los menús Ventana y Ayuda (?), los cuales como su nombre lo indica se
orientan a las opciones de ventana y las ayudas del paquete. El contenido de cada
uno de estos menús se irá explorando a través de los capítulos del libro.
48
Barra de Herramientas
En esta barra se encuentran los botones de acceso directo a los procedimientos más
comúnmente utilizados del programa. Los procedimientos de esta barra pueden ser
modificados por el usuario de acuerdo a su criterio y necesidades; permitiéndole
personalizar su contenido. Por defecto el programa incluye dentro de la barra de
herramientas los procedimientos:
Abrir Archivo ( ), Guardar archivo ( ) e Imprimir ( ): Al seleccionar
(Hacer clic) el botón Abrir archivo, aparece la ventana de exploración de Windows por
medio de la cual podemos ubicar un archivo en el ordenador (Sólo admite algunos
tipos de formato [Ver Tipos de archivo en la ventana de exploración]). Al seleccionar
Guardar archivo, los cambios que se hayan realizado en el editor de datos al archivo
activo (Abierto), son guardados. Al seleccionar Imprimir, se abre la ventana de
impresión de Windows; a través de esta opción se imprime el contenido del archivo
de datos; es decir, los casos y las variables. Esta opción sólo es útil si el número de
datos es muy pequeño.
Recuperar cuadro de diálogo ( ): Este botón nos permite acceder de forma
rápida a los últimos procedimientos que hayamos efectuado en SPSS; es decir, nos
muestra los diferentes cuadros de diálogo (ventanas) que se hayan ejecutado
(Empleado) con anterioridad en el programa, como frecuencias, gráficos, tablas, etc.
Al seleccionar esta opción se despliega una lista con el nombre de los procedimientos
que se han realizado [Fig.6]; si elegimos alguna de ellas (Hacer clic), aparecerá el
cuadro de diálogo del procedimiento.
Figuras 6
Deshacer ( ) y Rehacer ( ): Este par de iconos también son comunes en la
mayoría de los programas de Windows, con la diferencia que en SPSS, sólo nos
permite deshacer o rehacer la última acción y solamente una. Para que se activen
49
estos botones, se debe realizar alguna operación en el Editor de datos (Cortar,
copiar, eliminar, etc.).
Ir a gráfico ( ): Este icono nos permite ir rápidamente al último gráfico realizado
durante la sesión actual de SPSS; al seleccionarlo aparece la ventana de resultados
y nos enseña el gráfico.
Ir a caso ( ): Como su nombre lo indica nos permite ir a un caso específico dentro
del archivo de datos activo; es decir, nos ubica en la posición donde se encuentra el
caso. Al seleccionar esta opción aparece la ventana correspondiente [Fig.7]; en este
cuadro debemos ingresar el número del caso que nos interesa ubicar.
Figuras 7
Variables ( ): a través de esta opción podemos obtener la información
(Propiedades) que se haya definido para cada una de las variables del archivo activo.
Cuando seleccionamos este icono se abre un nuevo cuadro de diálogo [Fig. 8], en el
cual nos muestra toda la información de cada una de las variables (el nombre, la
etiqueta, si hay o no valores perdidos, el nivel de medida, los valores y las etiquetas
de cada valor).
Figura 8
Si se desea observar la información de otra variable, basta con señalarla en la lista
de variables (Hacer clic) y la información de ella aparece dentro de la casilla del
cuadro de diálogo. Este botón es de bastante utilidad cuando se desconoce el
50
contenido de los datos o sencillamente se nos olvida el contenido y estamos
realizando análisis con los procedimientos del programa.
Barra de herramientas de SPSS en Español
Buscar ( ): A través de este icono podemos ubicar un valor dentro de una
variable; es decir, nos permite encontrar un número o una combinación de caracteres
dentro de los registros de una variable. Dado que generalmente se utilizan números
para representar las categorías de las variables (Por ejemplo: hombre = 0 y mujer =1)
y las bases de datos poseen múltiples variables, sería ilógico esperar que la
búsqueda se realice en todo el archivo.
Al seleccionar el procedimiento Buscar, aparece un nuevo cuadro de diálogo [Fig.9];
para identificar la variable en la que se realizará la búsqueda, el cuadro adiciona en la
parte superior la frase “Buscar datos en la variable ***” (donde *** = nombre de la
variable). Para seleccionar una variable se debe hacer clic sobre ella directamente en
el editor de datos, de manera que el nombre de la variable en la frase cambie por el
de la variable seleccionada.
Figura 9
Si nos fijamos en el cuadro de diálogo Buscar datos, notaremos que aparece en la
parte inferior del cuadro la opción Coincidir mayúsculas y minúsculas; esta opción nos
permite especificarle al programa que realice la búsqueda de forma más exacta;
51
desde luego esta opción sólo es aplicable a las variables que tengan caracteres
alfanuméricos (Letras). Por último encontramos el botón Buscar siguiente; a través de
este botón podemos pasar de un caso o registro encontrado, que coincida con las
condiciones de búsqueda, al siguiente.
Insertar caso ( ) e Insertar variable ( ): Como su nombre lo indica, estas
dos opciones nos permiten ingresar un nuevo Caso o Variable. Al seleccionar la
opción Ingresar caso, el programa nos permite ingresar los valores del caso para
cada una de las variables del archivo. Si por el contrario seleccionamos la opción
Insertar variable, el programa nos permite ingresar una nueva variable o pregunta
para los casos del archivo de datos activo.
Segmentar archivo ( ): Este icono nos permite dividir nuestra base de datos
(Archivo activo) en distintos grupos de acuerdo a la variable que utilicemos para la
segmentación. Al seleccionar esta opción, se abre un nuevo cuadro de diálogo
[Fig.10]; en el que encontramos tres diferentes opciones de segmentación. La
primera opción del cuadro es Analizar todos los casos, no crear los grupos; esta
opción nos permite trabajar con todos los casos de la base y calcular los resultados
de los estadísticos empleando la totalidad de los casos u observaciones.
La segunda opción corresponde a Comparar los grupos; esta opción nos permite
comparar los resultados de los procedimientos que se realicen con el programa para
las categorías de la variable de agrupación; para realizar la comparación el programa
realiza los cálculos solamente con los datos de cada categoría y presenta los
resultados de forma comparativa; es decir ubica de forma jerárquica los resultados de
cada categoría (por ejemplo: tabla categoría 1, tabla categoría 2, gráfico categoría 1,
gráfico categoría 2, estadístico categoría 1, estadístico categoría 2).
La tercera opción corresponde a Organizar los resultados por grupos; esta opción es
muy similar a la opción anterior, con la diferencia que los resultados de los
procedimientos que se realicen con el programa se representan en forma organizada
(Por ejemplo: Tabla Cat1, Gráfico Cat1, Estadístico Cat1, Tabla Cat2, Gráfico Cat2,
Estadístico Cat2). Esta opción es bastante útil si nosotros deseamos hacer un
análisis separado de la muestra por algún tipo de “rangos”, como por ejemplo el
género, la región, la fecha, etc.
52
Figuras 10
Para realizar la segmentación de archivo debemos seleccionar una de las dos últimas
opciones, de manera que se active la casilla “Grupos basados en”; una vez se activa
se ingresa en ella la variable o las variables que deseamos utilizar como rango y
finalmente hacemos clic en Aceptar. Después de segmentar el archivo, cada
procedimiento (tablas, gráficos o estadísticos) que se realice con el programa,
mostrará los resultados de acuerdo a la segmentación. En capítulos posteriores
emplearemos este procedimiento para comprender los resultados que ocasiona.
Ponderar ( ): A través de esta opción, podemos asignarle un peso o valor
diferente a cada uno de los casos; es decir, darle mayor importancia a unos valores
de registro que a otros, esto se hace con el fin de poder sacar algún resultado
representativo de la población y no de la muestra. Para poder realizar este
procedimiento, es necesario tener una variable de ponderación en la cual se
encuentran los valores (Pesos) de cada registro; en capítulos posteriores
emplearemos esta opción para comprender los resultados que ocasiona.
Seleccionar casos ( ): A través de esta opción, podemos seleccionar solamente
los casos que cumplan con los criterios que el investigador imponga; por ejemplo, las
personas del género femenino. A su vez, este procedimiento nos brinda la
oportunidad de pedirle al programa que tome un fragmento de los casos de forma
aleatoria. Al activar la selección de casos el programa realiza los cálculos de los
procedimientos sólo con los casos que hayan sido seleccionados.
53
Etiquetas de valor ( ): Esta opción nos permite observar en el editor de datos, los
valores de los datos o la categoría a la que corresponde. Al activar esta opción
aparecen en el editor de datos las categorías (palabras) de cada una de las variables
[Fig.11]. Si por el contrario desactivamos esta opción, aparecen en el editor de datos
los números (Valores) de cada variable [Fig.12]. La utilidad de esta opción radica en
la capacidad de darnos información sobre los datos que contiene cada una de las
variables categóricas.
Figuras 11 y 12
Usar conjuntos ( ): Este procedimiento nos permite generar o utilizar conjuntos de
variables, para restringir el número de variables mostradas en las listas de origen de
los cuadros de diálogo. Los conjuntos de variables pequeños hacen que la búsqueda
y la selección de variables para los análisis sea más fácil y pueden incluso mejorar el
rendimiento. Si el archivo de datos contiene un elevado número de variables y los
cuadros de diálogo se abren con lentitud, es necesario restringir las listas de origen
de los cuadros con subconjuntos de variables más pequeños, lo que reduce la
cantidad de tiempo empleado en abrirlos.
.
PREGUNTAS
¿Qué utilidad tiene la inserción de casos?
¿Qué utilidad tiene la ponderación?
¿Cómo se aplican las etiquetas de valor?
54
Tercera unidad……………………………..
Manejo del Data Entry, ingreso y codificación de variables
55
3.2 BASE DE DATOS EN SPSS I: Las variables
Objetivo: El alumno al culminar el capitulo, conocerá los elementos que le
permitirán realizar una base de datos en SPSS como el dominio de las variables y
edición de las mismas.
Propiedades de las Variables en SPSS
Las variables en SPSS cuentan con una serie de propiedades que deben ser
definidas por el investigador o usuario antes de realizar cualquier tipo de análisis con
ella. De la correcta definición de las propiedades, depende en gran medida la calidad
de los análisis que se realicen y por lo tanto la veracidad de los resultados o
conclusiones que se generen. SPSS ha estipulado diez propiedades informativas de
las variables entre las que encontramos:
.
I. Nombre:
Este parámetro nos permite identificar y diferenciar las variables que componen el
archivo; para cada una de las variables se debe definir un nombre específico. El
programa establece una serie de normas para los nombres de variables, entre las
que encontramos:
Cada nombre de variable debe ser único; no se permiten duplicados.
La longitud del nombre no debe exceder los 64 bytes. Sesenta y cuatro
bytes suelen equivaler a 64 caracteres en idiomas de un sólo byte (por
ejemplo, inglés, francés, alemán, español, italiano, hebreo, ruso, griego,
árabe, tailandés) y 32 caracteres en los idiomas de dos bytes (por ejemplo,
japonés, chino, coreano).
El nombre debe comenzar por una letra. Los demás caracteres pueden ser
letras, dígitos, puntos o los símbolos @, #, _ o $.
Los nombres de variable no pueden terminar en punto.
Se deben evitar los nombres de variable que terminan con subrayado (para
evitar conflictos con las variables creadas automáticamente por algunos
procedimientos).
No se pueden utilizar espacios en blanco ni caracteres especiales (por
ejemplo, !, ?, ' y *).
56
Las palabras reservadas (ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT,
OR, TO, WITH) no se pueden utilizar como nombres de variable.
Los nombres de variable se pueden definir combinando de cualquier
manera caracteres en mayúsculas y en minúsculas, esta distinción entre
mayúsculas y minúsculas se conserva en lo que se refiere a la
visualización.
Para las versiones anteriores de SPSS (11.5, 11.0, 10.0, etc.) la longitud de las
variables es de sólo ocho Bytes, lo cual generalmente no es suficiente para identificar
una variable, por lo que es recomendable utilizar las tres primeras letras de cada
palabra de la frase; es decir,
Estado Civil = estciv
Nivel de confianza = nivdecon
No necesariamente se debe seguir esta regla, lo realmente importante es que el
nombre de la variable le permita identificar al usuario o investigador, el contenido a
que se hace referencia; es decir, permitirle al usuario hacerse una idea del tema que
abarca los datos de esa variable.
II. Tipo:
La propiedad Tipo, nos permite especificarle al programa la naturaleza de los datos
que se incluyen dentro de la variable; es decir, nos permite definir la forma y el
significado de los caracteres que se encuentran en los registros de la variable. SPSS
nos permite elegir entre ocho diferentes tipos de variables para representar Números
(Magnitudes), Fechas (Tiempo), Monedas (Dinero) y Letras (Cadena). Desde luego
es aconsejable trabajar las variables de forma numérica ya que el análisis estadístico
es una ciencia matemática y para su correcto funcionamiento es necesario realizar
las operaciones con números; ya que en algunos casos no es posible tener los datos
de forma numérica, el paquete nos permite trabajarlos como una cadena de
caracteres (Letras y Números).
Para definir el Tipo, debemos hacer clic en la casilla de la variable de interés, de
manera que aparezca en el costado derecho de la casilla un pequeño cuadrado con
puntos suspensivos ( ). Al seleccionar el botón (Hacer clic), aparece el cuadro de
57
diálogo Tipo de variable [Fig.13], en donde aparecen los diferentes Tipos de variable
que se pueden elegir para la variable seleccionada.
Figura 13
Numérico: Se emplea en una variable numérica cuyos valores representan
magnitudes o cantidades y se asocian de forma estándar; es decir, asume la notación
por defecto de Windows para la separación decimal (Enteros (,) Decimales)
“1000,00”; este suele ser el tipo mas usado.
Coma y/o Punto: Estos dos tipos de variables se emplean en una variable numérica
cuyos valores representan magnitudes o cantidades. Al seleccionar la opción Coma
los valores se asocian con comas que delimitan cada tres posiciones y con el punto
como delimitador decimal “1,000.00”. Cuando se selecciona el Punto los valores se
asocian con puntos que delimitan cada tres posiciones y con la coma como
delimitador decimal “1.000,00”.
Notación científica: Se utiliza en una variable numérica cuyos valores son
demasiado grandes o pequeños, por lo cual se emplea un exponente con signo que
representa una potencia en base diez. 1’000.000.00 = 1.0E+6 ó 0.000001 = 1.0E(-6).
SPSS nos permite representarlo de varias formas como 1000000, 1.0E6, 1.0D6,
58
1.0E+6, 1.0+6. La notación es útil cuando manejamos cifras extremas de lo contrario
es mejor manejarlo de forma numérica.
Anchura, Decimales y Etiquetas en SPSS
Fecha: Este tipo de variable se emplea cuando los valores de la variable representan
fechas de calendario u horas de reloj; al seleccionarla aparece en el cuadro de
diálogo una casilla con el listado de los diferentes formatos que el programa reconoce
[Fig.14]. Para elegir alguno de ellos basta con hacer clic sobre el formato y
sucesivamente en Aceptar.
Figura 14
Dólar: se emplea en una variable numérica cuyos valores representan sumas de
dinero en dólares. Al seleccionar este tipo de variable aparece en el cuadro de
diálogo un listado de formatos monetarios [Fig.15], en donde debemos seleccionar el
formato que más se acomode a los datos.
Figuras 15
Moneda personalizada: Este tipo de variable se emplea cuando los valores de una
variable representan sumas de dinero diferentes al dólar (Pesos, pesetas, Euros,
etc.); al seleccionar esta opción aparece un nuevo listado [Fig.16], en el cual
59
debemos seleccionar uno de los formatos existentes. Estos formatos no representan
monedas especificas, si no que por el contrario el programa asume que la moneda es
de origen distinto al dólar. La diferencia con el tipo dólar es que nos permite trabajar
con cinco (5) diferentes tipos de moneda.
Cadena: Este tipo de variable se emplea cuando los valores no son numéricos o
sencillamente no representan magnitudes o cantidades; estas variables no son
utilizadas en los cálculos de los estadísticos. Las variables de cadena pueden
contener cualquier tipo de caracteres siempre que no exceda la longitud máxima de
255; las mayúsculas y las minúsculas se consideran diferentes ya que el programa
trabaja bajo el código ASCII. A este tipo de variables, también se le suele denominar
como variable alfanumérica. Para definir alguno de los tipos de variable, basta con
hacer clic sobre la opción que se desee y sucesivamente hacer clic en el botón
Aceptar, con lo que se cierra la ventana y el tipo elegido aparece en la casilla
seleccionada.
III. Anchura:
Por medio de esta propiedad podemos definir el máximo de dígitos que contienen los
registros de una variable; para el cálculo del ancho se incluyen los dígitos enteros y
los decimales. Por ejemplo;
Anchura 5 = xxx.xx ó x,xxx.x ó xx,xxx donde x representa un número aleatorio.
No debemos cometer el error de pensar que una vez establecida la anchura, ya no
podremos encontrar una cifra con mayor cantidad de números dentro de los registros.
La opción Anchura se emplea para darle una idea al investigador, de las cifras que
encontrará cuando le pida al paquete información de las variables, es decir, no
restringe la cantidad de números sino que es un parámetro informativo, el cual le
brinda a la persona que opere el programa una idea de los rangos máximos que
puede tomar esta variable, pero no impide que se ingresen valores que sobrepasen
esta longitud.
IV. Decimales
A través de este parámetro se define el número de dígitos decimales que pueden
contener los registros de la variable. Las cifras que superen esta longitud serán
aproximadas por el programa. Cuando una cifra supera la longitud, el programa
60
aproxima hacia arriba los dígitos que sobrepasen la longitud si el valor del último de
ellos es igual o mayor que cinco, de lo contrario (menor que 5) se aproxima hacia
abajo; es decir:
1.07X si X < 5 entonces se aproxima a 0 es decir = 1.07
1.07X si X => 5 entonces se aproxima a 10 es decir = 1.08
Las propiedades Anchura y Decimales pueden ser editadas directamente desde la
ventana de Tipo de variable cuando se eligen los tipos numéricos de variables
Numérica, Coma, Punto, Notación científica, Dólar o Moneda personalizada [Fig.17],
ya que al seleccionar estas opciones se habilita en el cuadro de diálogo las casillas
Anchura y Decimales.
Figura 17
Hay que notar que cuando seleccionamos los Tipos de variables como la Fecha y
Cadena estas propiedades se desactivan; esto se debe a que para el tipo de formato
Fecha el programa ha predefinido estos parámetros y no podemos alterarlo, la única
opción que tenemos es escoger otro formato de fecha; mientras que para el tipo
cadena no se puede tener números decimales.
V. Etiqueta
Dado que generalmente los sesenta y cuatro (64) caracteres del nombre (Versiones
anteriores ocho [8]) y las normas que se deben cumplir, no permiten describir de
forma clara la variable y el contenido de ella; SPSS nos brinda la posibilidad de
utilizar una etiqueta por medio de la cual podemos describir la variable mediante la
utilización de un máximo de 255 caracteres.
El uso de la etiqueta es bastante útil para facilitar la interpretación de los resultados
(Tablas, Gráficos o estadísticos), para las personas que no han participado en la
61
generación de los procedimientos y desconocen el significado del nombre de la
variable. El uso de la etiqueta es opcional, el programa en caso de no existir una
etiqueta utiliza el nombre de la variable para generar los resultados. Para saber si
una variable tiene estipulada una etiqueta debemos ubicar el cursor del ratón sobre el
nombre de la variable en la vista de datos, de manera que aparezca una leyenda
informativa. Para comprender el valor practico del uso de etiquetas, debemos
observar las tablas de la figura [18].
Figura 18
Estas tablas contienen la frecuencia y el porcentaje de las categorías de la variable
Estado civil (Casado y Soltero); la primera tabla cuenta con etiquetas para el nombre
de la variable y para las categorías de la variable, mientras que la segunda tabla no
cuenta con etiquetas. Si nos fijamos en la tablas notaremos que para interpretar la
segunda tabla encontramos dificultades ya que no podemos determinar que
categoría representan los números cero (0) y uno (1). Esta misma dificultad puede
presentarse cuando nosotros realizamos un análisis de datos y entregamos los
resultados a una persona que no haya participado en los procedimientos; para evitar
estos inconvenientes se sugiere definir las etiquetas de variable y de valores.
Antes de definir la propiedad Valores debemos ver primero las propiedades Perdidos
y Medida, ya que la utilización de la etiquetas de valor está determinado por estos
dos parámetros y en este momento no seria muy clara su definición.
PREGUNTAS
¿Cómo delimitamos las variables?
¿Cómo codificamos las según el tipo y la etiqueta?
62
63
Cuarta unidad……………………………..
Ingresos de instrumentos a la Base de Datos.
64
4. 1 BASE DE DATOS EN SPSS II: El formato de la base
Objetivo: El alumno al culminar el capitulo, conocerá prácticos para codificar y
terminar una base de datos de cualquier tipio y poder ingresar datos a la base de
datos.
Valores perdidos y Etiquetas de valor en SPSS
V. Valores perdidos
Los valores perdidos son razones por las cuales no obtenemos una respuesta
coherente de algún entrevistado; es decir, es una razón que nos indica la causa por
la que no me aporta información el entrevistado. Dentro de los valores perdidos
podemos encontrar:
No sabe
No responde o se niega a responder
No aplica o sencillamente la pregunta no lo afecta EJ: preguntarle a una
persona soltera la edad a la que se caso por primera vez, si no se ha casado
nunca esta pregunta no lo afecta.
Debemos tener claro que los valores perdidos son razones y no errores,
generalmente tendemos a confundir un valor perdido con un valor que no esta dentro
de nuestro rango. Por ejemplo, si en la variable género (sexo), tenemos los valores (1
= mujeres y 2 = hombres) y después de revisar el archivo nos damos cuenta que
tenemos en algunos registros el valor 3, generalmente cometemos el error de pensar
que este es un valor perdido, pero no lo es, este tipo de valores los debemos
considerar como errores ya sea de digitación o de captura y la forma de corregirlos es
ir hasta la fuente (entrevistas) y determinar a que grupo pertenecía el individuo. Si no
podemos determinar el grupo y los valores son muy pocos es recomendable
prescindir de estos casos.
SPSS maneja dos tipos de valores perdidos; el primero es perdido por el sistema, el
cual se identifica por la ausencia total de datos; es decir, casillas vacías y el segundo
corresponde a los datos perdidos definidos por el usuario (No sabe, No responde o
No aplica). El programa detecta automáticamente los valores perdidos por el sistema
y los omite, mientras que los valores perdidos por el usuario deben ser definidos al
65
programa o de lo contrario los cálculos se realizarán contando con estos valores, lo
cual puede afectar severamente los resultados.
Figuras 19
Para definir un valor perdido por el usuario debemos activar la casilla correspondiente
a Perdidos de la variable de interés, de manera que aparezca al costado derecho de
la casilla un cuadrado con puntos suspensivos ( ). Al seleccionar el cuadrado (Hacer
clic) aparece la ventana de Valores Perdidos [Fig.19]. En este cuadro encontramos
tres diferentes posibilidades. La primera corresponde a No hay valores perdidos (Los
cálculos se realizan con la totalidad de los registros). La segunda corresponde a
Valores perdidos discretos (son un máximo de tres valores perdidos en la variable; se
puede emplear los valores (números) que se deseen.
Para este tipo de valores se recomienda que exista una distancia considerable entre
los valores representativos y los perdidos con el fin de facilitar su identificación). La
tercera y última opción corresponde a Rango más un valor discreto opcional (se
utiliza cuando tenemos varios parámetros de valores perdidos, los cuales se
encuentran dentro de un rango. Para seleccionar esta opción es necesario que no
existan valores representativos de grupos dentro del rango de lo contrario serán
omitidos de los cálculos. Además esta opción nos permite ingresar un valor discreto
adicional). Para seleccionar cualquiera de las opciones basta con hacer clic sobre la
opción de manera que aparezca en la casilla de activación ( ) un punto negro y
sucesivamente ingresar los valores.
66
VII. Columnas y Alineación
Estos dos parámetros son netamente de formato (es decir de presentación) y sus
efectos son apreciables únicamente en la vista de datos. La primera propiedad
(columnas) nos indica el ancho de la columna, mientras que la segunda (Alineación)
determina la alineación de los datos dentro de la casilla. El parámetro columna, al
igual que en una hoja de cálculo, podemos alterarlo de forma directa en la vista de
datos colocando el cursor al lado de la columna hasta que aparezca el indicador,
hacemos clic y lo sostenemos arrastrando hasta obtener el ancho deseado.
VIII. Medidas
Este es el parámetro más importante de las variables, de su definición depende el
tipo de análisis que podemos realizar con el programa. Dentro de la estadística se
han catalogado cuatro diferentes escalas de medida, pero para SPSS estas escalas
se resumen en sólo tres:
Nominal: son variables numéricas cuyos valores (Números) indican una
categoría de pertenencia. Para este tipo de medida, las categorías no
cuentan con un orden lógico que nos permita establecer una comparación
de superioridad entre ellas. Un ejemplo de variable nominal puede ser el
género, la raza, el estado civil, etc.
Ordinal: son variables numéricas cuyos valores indican una categoría de
pertenencia y a su vez las categorías poseen un orden lógico que nos
indica una superioridad o prelación. Un ejemplo de variable ordinal puede
ser el nivel de ingresos, categoría del vehículo, nivel educativo, etc.
Escala: son variables numéricas cuyos valores representan una magnitud o
cantidad y no una categoría; los valores de este tipo de medida pueden ser
empleados en operaciones aritméticas como la suma, la resta, la
multiplicación y la división ya que los intervalos (Distancia entre los
números) cuentan con la misma longitud. Un ejemplo de variable de escala
puede ser la edad, las ventas, la distancia en metros, la altura, etc.
Para los archivos de datos con formato SPSS creados en versiones anteriores se
aplican las siguientes reglas.
67
Las variables de cadena (alfanuméricas) se establecen en nominales.
Las variables de cadena y numéricas con etiquetas de valor definidas se
establecen en ordinales.
Las variables numéricas sin etiquetas de valor definidas que no superen un
número específico de valores únicos (24), se establecen como ordinales,
mientras que si el número de valores supera los 24 se definen como de
Escala.
IX. Valores
Los valores o Etiquetas de valor nos permiten generar una leyenda que facilite la
interpretación de los números representativos de cada categoría de una variable, ya
sea en los resultados o en la vista de datos. Debido a que se utilizan números para
representar cada categoría es necesario crear una pequeña leyenda que nos permita
ver en letras la categoría a la que corresponde cada número. Las etiquetas de valor
no pueden exceder los 60 caracteres y se deben emplear solamente si se cumplen
los siguientes requisitos:
La variable es categórica, es decir Nominal u Ordinal.
Se tienen valores perdidos por el usuario.
Para definir las etiquetas de valor debemos activar la casilla de valor correspondiente
a la variable de interés de tal manera que aparezca al costado derecho un cuadrado
con puntos suspensivos en su interior. Al hacer clic sobre el cuadrado aparece la
ventana Etiquetas de valor [Fig.20]; en esta ventana encontramos tres casillas.
Figura 20
La primera corresponde al Valor o número, en ella debemos digitar el número al que
deseamos dar la etiqueta. La segunda casilla corresponde a la Etiqueta de valor, en
68
ella digitamos la categoría a la que corresponde ese valor (máximo 60 caracteres) y
la tercera casilla corresponde a las etiquetas añadidas; es decir, las categorías que
ya se han definido. Para ingresar una etiqueta de valor, debemos primero ingresar el
valor en la casilla Valor, sucesivamente ingresar la leyenda en la casilla Etiqueta y
finalizar haciendo clic en el botón Añadir, con lo que aparece en la casilla el número y
la leyenda correspondiente.
Si deseamos cambiar una etiqueta que ya haya sido añadida, debemos seleccionarla
en la casilla (hacer clic sobre ella), editar ya sea el número o la etiqueta y hacer clic
en Cambiar. Si por el contrario deseamos eliminarla, debemos seleccionarla y hacer
clic en Eliminar. Para finalizar basta con hacer clic en Aceptar, con lo que la ventana
se cerrara y las etiquetas quedarán definidas. Es necesario Añadir antes de Aceptar
o de lo contrario se perderá cualquier operación de Añadir o Cambiar pendiente.
ÁREA DEL PROCESADOR
La última sección del editor de datos corresponde al área del procesador, la cual esta
ubicada en la parte inferior de la ventana. A través de esta área podemos saber el
estado del procesador de acuerdo al proceso que se este realizando. Esta sección es
de bastante utilidad cuando le pedimos al programa un procedimiento y se cuenta
con un elevado número de registros; en algunos casos la base es tan extensa que
puede tardar bastante tiempo la ejecución del resultado, en estos casos
generalmente se tiende a pensar que el programa se bloqueo, antes de determinarlo
es importante saber cual es el estado del procesador ya que el retardo puede ser
ocasionado por la extensión de los datos. Además, cuando la licencia caduca, en
esta área encontramos el mensaje el procesador no esta disponible.
.
PREGUNTAS
¿Cómo realizamos una codificación de una variable nominal?
¿Cómo realizamos una codificación de una variable ordinal
69
Quinta unidad……………………………..
Ajuste y afinamiento de bases de datos llenadas para análisis
70
5.1 CATEGORIZAR VARIABLES CON SPSS
Objetivo: El alumno al culminar el capitulo, podrá realizar categorizaciones de
variables mediante el programa SPSS.
Categorizar Variables
En la mayoría de los casos, las bases de datos cuentan con variables cuya
información representa cantidades o magnitudes como la edad, los ingresos, las
ventas, etc. Generalmente este tipo de variables no son actas para realizar tablas de
frecuencia, debido a su elevado número de valores. SPSS nos ofrece la posibilidad
de reunir esta información dentro de rangos representativos, que vinculen una gran
cantidad de valores y cuyos resultados son ingresados en una nueva variable, lo que
nos permite mantener la información original intacta.
Para esta labor, SPSS cuenta con el procedimiento Categorizar Variables (Sólo
versiones anteriores a la 12.0), el cual convierte los datos de una variable de escala
(Valores numéricos que representan cantidad), en un número discreto de categorías;
es decir, reúne un grupo de valores y les asigna un número representativo de
categoría de pertenencia. Los nuevos valores son guardados en una nueva variable
la cual se identifica con el nombre original precedido de la letra ene (n); por ejemplo
la variable Altura al ser categorizada quedaría naltura. Si cuentas con la versión 12.0
omite este apartado y pasa al siguiente, ya que esta nueva versión (12.0), cuenta con
un procedimiento de categorización mejorado, que nos ofrece mayor asistencia.
Para realizar la categorización, el programa conforma los grupos de acuerdo con los
percentiles (fracciones del porcentaje total), por lo que cada grupo contiene
aproximadamente el mismo número de casos. Por ejemplo, si le especificamos al
programa la creación de cuatro (4) grupos, el asignará el valor 1 a los casos situados
bajo el percentil 25 o los casos comprendidos desde el menor valor hasta el valor que
se encuentre aproximadamente en el 25% del total de los casos.
El valor 2 a los casos entre el percentil 25 y 50; es decir, a los valores
correspondientes desde el nivel anterior hasta el valor que se encuentre en el 50%
del total de los casos. El valor 3 a los casos situados entre el percentil 50 y 75 y el
valor 4 a los casos por encima del percentil 75. Por ninguna razón un valor puede
estar representado en dos categorías diferentes, sin importar si este valor produce un
71
porcentaje mayor o menor del establecido; es decir, si un valor se encuentra entre el
42% y el 57% de los casos, el programa no selecciona la mitad, sino el número que
se encuentre en el limite inferior o superior de este valor.
Para comprender el funcionamiento de este procedimiento, vamos a generar un
ejemplo con la variable edad del archivo Encuesta.sav. Para acceder al
procedimiento, debemos dirigirnos al menú Transformar y seleccionar la opción
Categorizar Variables [Fig.21]; al hacer clic sobre él, aparece el cuadro de diálogo
correspondiente [Fig.22]. A través de este cuadro, debemos definir la (s) variable (s)
que deseamos categorizar, así como el número de categorías que deseamos obtener
en la variable de resultados.
Figuras 21 y 22
Este cuadro de diálogo esta dividido en tres secciones; la primera corresponde a la
lista de variables existentes en el archivo, la segunda a la casilla de selección y la
tercera sección corresponde al número de categorías que deseamos generar; a la
derecha de esta sección encontramos una casilla en la cual debemos ingresar el
número de categorías que deseamos obtener en la nueva variable, teniendo en
cuenta que esta asignación se realiza de acuerdo al porcentaje de los casos. Para
continuar con el ejemplo vamos a categorizar las variables Edad y Número de años
estudiados (Educaños).
Para realizarlo, debemos ubicar cada una de las variables dentro del listado e
ingresarlas a la casilla de selección haciendo clic en el botón Flecha ( ). Una vez
ingresadas las variables, sólo nos resta definir el número de categorías que
aparecerán en las variables de resultado, que para el caso corresponde a cinco (5).
Para definir la cantidad de categorías, activamos la casilla haciendo clic sobre ella y
sucesivamente introducimos el número cinco [Fig.23]. Para finalizar hacemos clic en
72
el botón Aceptar, con lo que las variables aparecen en la parte final del editor de
datos [Fig.24].
Figuras 23 y 24
Si nos fijamos en las nuevas variables creadas, notaremos que no cuentan con las
propiedades de la variable original y que a su vez las etiquetas de valor no han sido
definidas. Además, si tratamos de identificar los valores limítrofes de los rangos no lo
podríamos conseguir, ya que este procedimiento no nos proporciona esta
información. Para poder conocer los valores limítrofes de cada uno de los rangos
categóricos, es necesario emplear los estadísticos del procedimiento Frecuencias.
Por el momento no profundizaremos en la forma de obtener los límites de los rangos,
ya que en el capítulo siguiente se explorará en su totalidad el procedimiento
Frecuencias. Para orientar al lector, le hemos pedido al programa que nos enseñe los
valores de los percentiles 20, 40, 60 y 80 en las dos variables, cuyos resultados son
expuestos en la tabla de la figura [25]. Si nos fijamos en estos resultados, podremos
determinar los rangos de las nuevas variables Figura [26]..
Figura 25
73
Figura 26
En conclusión el procedimiento categorizar variables nos permite convertir
rápidamente una variable de Escala en una variable Ordinal, con la desventaja que
desconocemos los valores que involucra cada uno de los rangos; su utilidad radica en
la capacidad de organizar cada uno de las categorías con un valor porcentual
aproximadamente igual.
En resumen, los pasos que se deben ejecutar para categorizar variables son:
Activar el procedimiento [en el menú Transformar seleccionamos la opción
Categorizar variables].
Seleccionar la (s) variable (s) [en el listado de variables escogemos las
variables de interés y las ingresamos a la casilla de selección;
generalmente son variables de Escala].
Definir el número de categorías [Ingresar en la casilla el número de
categorías deseado]
Ejecutar la categorización [Hacer clic en el botón Aceptar].
Definir las etiquetas de valor para cada una de las categorías de las nuevas
variables generadas.
RECODIFICAR VARIABLES CON SPSS
En algunas ocasiones los datos de las variables cuentan con valores muy dispersos
que nos dificultan su interpretación o sencillamente no se prestan para el análisis
estadístico. Para subsanar estos inconvenientes, SPSS cuenta con el procedimiento
Recodificar, el cual nos permite transformar los datos de una o varias variables
numéricas o de cadena, ya sea reasignando los números representativos de cada
categoría o agrupando en rangos los valores de las variables existentes, según sean
las necesidades del análisis o el criterio del investigador.
La principal virtud de este procedimiento, radica en la posibilidad de asignar los
números representativos de cada categoría de acuerdo a nuestras necesidades, lo
que nos permite agrupar valores que no son consecutivos; como por ejemplo, el 1 y
el 5. Este procedimiento nos ofrece dos opciones En las mismas variables y En
distintas variables; la principal diferencia de estas dos posibilidades radica en el
destino de los resultados; es decir, el lugar en donde se guardarán los nuevos
valores asignados.
74
Dado que SPSS tiene la capacidad de trabajar con un gran número de variables
(33.000 aprox), es recomendable utilizar siempre la opción correspondiente a En
distintas variables, ya que de esta manera podemos conservar los datos originales.
Es necesario resaltar que SPSS permite agrupar la información pero NO permite
desagruparla; es decir, podemos utilizar los procedimientos para convertir una
variable de escala a una variable de categorías (Ordinal), pero no en viceversa.
Para comprender la metodología utilizada en la recodificación, vamos a generar un
ejemplo con la variable Área de trabajo (areatrab), la cual contiene las diferentes
áreas en la que se desempeñan cada uno de los empleados de la empresa Dkfé
tradición (1=Operario, 2=Planeación, 3=Mercadeo, 4=Ventas, 5=Administración,
6=Ingeniero de proceso y 7=Servicios generales). Para acceder al procedimiento,
debemos ir al menú Transformar y seleccionar el submenú Recodificar, con lo que
aparecen las dos opciones con que cuenta [Fig.27].
Dado que la diferencia en los cuadros de diálogo de estas dos opciones es muy
pequeña, elegiremos la opción correspondiente a En distintas variables. Al hacer clic
en ella, aparece el cuadro de diálogo correspondiente a Recodificar en distintas
variables [Fig.28]; este cuadro contiene los elementos habituales de los cuadros de
diálogo, como la lista de variables y la casilla de selección, pero además incluye tres
secciones adicionales denominadas Variable de resultado, Valores antiguos y nuevos
y Condicional.
Figuras 27 y 28
El primero de estos nuevos componentes corresponde a Variable de resultado; a
través de esta sección se definen las propiedades principales de la variable de
resultado, como lo son el Nombre y la Etiqueta. El nombre que se le defina a la nueva
75
variable debe cumplir con las características requeridas por el programa como la
longitud (64 caracteres máximo para versión 12.0 y 8 caracteres para las demás
versiones), no comenzar con un número, etc.
La asignación del nombre es indispensable, ya que el programa no permite ejecutar
la recodificación hasta que se defina una variable de resultado. En la opción etiqueta
podemos ingresar una pequeña leyenda explicativa que permita reconocer fácilmente
el contenido de la variable; este parámetro no es obligatorio pero es recomendable
para facilitar la interpretación de los valores en los resultados.
Para continuar con el ejemplo vamos a recodificar la variable área de trabajo
(areatrab); lo primero que debemos hacer es seleccionarla en la lista de variables e
ingresarla en la casilla de selección haciendo clic en el botón flecha ( ). Una vez
ingresada la variable, aparece al costado derecho de ella un signo de interrogación
(?); este signo se mantendrá hasta que se le defina un nombre a la nueva variable. A
continuación ingresamos en la casilla Variable de resultado el nombre Recarea y la
etiqueta Área de trabajo recodificada. Por último hacemos clic en el botón Cambiar,
con lo que el signo de interrogación desaparece y en su lugar aparece Recarea
[areatrab → Recarea].
La segunda nueva sección del cuadro la compone el botón Valores antiguos y
nuevos; al hacer clic sobre él, aparece un nuevo cuadro de diálogo [Fig 29]; en este
cuadro se definen los valores que deseamos cambiar y se especifican a su vez el
nuevo valor que le será asignado.
76
Figura 29
Dentro de este cuadro encontramos cuatro diferentes secciones (Valores antiguos,
Valores nuevos, Casilla de selección y las opciones de recodificación), cada una de
estas secciones define un segmento específico de la recodificación y su aplicación
depende exclusivamente de los criterios del investigador de acuerdo a las
necesidades del análisis. Los parámetros que se definan en este cuadro serán
aplicados en la nueva variable de resultado.
Cada una de estas secciones sera explorada y explicada en la siguiente lección.
VALORES ANTIGUOS Y NUEVOS
La primera sección del cuadro corresponde a Valor antiguo. Dentro de esta sección
se determinan los valores que se van a recodificar; podemos modificar valores
individuales, rangos de valores y los valores perdidos (ya sea del sistema o definido
por el usuario). Los rangos y los valores perdidos del sistema no se pueden
seleccionar para las variables de cadena, ya que ninguno de estos conceptos es
aplicable a este tipo de variables. Esta sección comprende siete diferentes opciones,
entre las que encontramos:
Valor: corresponde a un valor antiguo individual que se va a recodificar en
un valor (número) nuevo. El tipo de datos del valor introducido (numérico o
de cadena), debe coincidir con el tipo de datos de la variable que desea
recodificar; es decir, no podemos asignar un carácter (letra) como valor
antiguo si nuestra variable original es numérica.
Perdido por el sistema: Son valores asignados por SPSS cuando los valores
de los datos no están definidos de acuerdo al tipo de formato que haya
especificado (Por ejemplo, letras dentro de una variable numérica), así como
los campos que se encuentren vacios en una variable numérica (Los valores
numéricos perdidos del sistema se muestran como puntos). Para las
variables de cadena no se pueden tener valores perdidos del sistema, ya
que el espacio en blanco es tomado como un carácter. Estos valores son
definidos por el programa como SYSMIS.
Perdido por el usuario: son observaciones que tienen valores que han sido
declarados como perdidos por el usuario. Generalmente estos valores
representan razones por las cuales no se tiene información como por
ejemplo No Sabe, No Responde, No Aplica. Estos valores son definidos por
el paquete como MISSING.
77
Rango: dentro de las opciones de rango encontramos tres posibilidades, la
primera nos permite especificar el limite inferior y superior del rango; la
segunda nos permite asignar los caso desde el menor valor dentro de la
variable hasta un valor definido por el investigador y la tercera nos permite
agrupar los casos desde un valor definido por el investigador hasta el mayor
de los valores. Estas opciones no están disponibles para variables de
cadena.
Todos los demás valores: al seleccionar esta opción, se incluirán todos los
valores que no han sido definidos dentro de las especificaciones anteriores y
les asigna el valor deseado en la variable de resultado.
La segunda sección del cuadro corresponde a Valor Nuevo. En esta sección se
definen los valores que tomaran los datos en la variable de resultado después de la
recodificación. Dentro de las opciones de los nuevos valores encontramos:
Valor : En esta casilla se introduce un valor numérico individual, el cual
representará a uno o más de los valores antiguos. Si se desea recodificar
una variable numérica en una variable de cadena, también se debe
seleccionar la opción Las variables de resultados son cadenas, con lo que
el programa define los valores numéricos como caracteres (Por ejemplo: el
número 5 lo asume como el carácter ‘5’).
Copiar valores antiguos: esta opción retiene el o los valores antiguos que
no se hayan incluido dentro de de alguno de los nuevos valores. Si algunos
de los datos no requieren la recodificación, se utiliza esta opción para
incluirlos. Cabe aclarar que cualquier valor antiguo que no sea especificado
no será incluido en la nueva variable, y en su lugar aparecen espacios en
blanco.
Perdido por el sistema: esta opción recodifica el valor antiguo, en un valor
perdido por el sistema. Los valores perdidos por el sistema no son
utilizados en los cálculos. Esta opción no se encuentra disponible para las
variables de cadena ya que el carácter espacio es valido.
La tercera sección del cuadro corresponde a la Lista de Recodificación. En esta
sección se genera un listado con las especificaciones de los valores antiguos y
nuevos. Dentro de la sección encontramos las opciones Añadir (Agrega un valor a la
lista), Cambiar (Modifica un valor de la lista) y Borrar (Elimina un valor de la lista).
78
Para agregar un valor es necesario especificar los valores antiguos y el valor nuevo;
después de lo cual se hace clic en el botón añadir para ingresarlo a la lista.
Para modificar la recodificación de un valor es necesario seleccionarlo de la lista,
modificar los datos y hacer clic en el botón Cambiar y los valores se modifican dentro
de la lista. Para eliminar una asignación, se debe seleccionar en el listado y
sucesivamente hacer clic en borrar con lo que desaparece de la lista. Antes de
terminar la asignación de variables es indispensable añadir todas recodificaciones
pendientes o de lo contrario se perderán.
La última sección del cuadro la componen las Opciones de recodificación. En esta
sección encontramos dos opciones; la primera corresponde a Las variables de
resultados son cadenas, la cual define la nueva variable recodificada como variable
de cadena (alfanumérica); además nos ofrece una casilla en la que podemos
establecer el ancho de la variable. La segunda opción corresponde a Convertir
cadena numérica a números, en donde se convierten los valores de cadena que
contienen caracteres de números (Ejemplo, ‘5’) en valores numéricos. A las cadenas
que contengan cualquier carácter que no sean números, así como las que contengan
un signo opcional (+ ó -) se les asignará el valor perdido por el sistema. Esta opción
sólo se activa cuando la variable de origen es de cadena, de lo contrario no se
habilita.
Continuando con el ejemplo vamos a recodificar los valores de la variable Área de
trabajo (areatrab) en sólo tres niveles; el primer nivel comprenderá los casos que
cuenten con los valores 2 y 5 (Planeación y Administración). El segundo nivel
comprende los casos con valores 3 y 4 (Mercadeo y Vendedores) y el tercer nivel
comprende los casos con los valores 1, 6 y 7 (Operario, Ingeniero de proceso y
servicios generales).
El objetivo de esta recodificación es agrupar las diferentes áreas en las que se
desempeñan los empleados de la empresa en sólo tres niveles generales
(Administrativa, Comercial y Operativa) [Fig.30]. Si nos fijamos en los valores que
componen cada uno de los nuevos niveles, notaremos que están dispersos, por lo
que sería imposible realizar esta agrupación con el procedimiento Categorizador
visual.
79
Figuras 30
Para comprender las diferentes secciones de esta ventana, en la siguiente lección
haremos la recodificación de las Areas, Administrativa, Comercial y Operativa.
80
5.2 DEFINIR VALORES ANTIGUOS Y NUEVOS: RECODIFICAR
Objetivo: El alumno al culminar el capitulo, definir los valores antiguos y nuevos
del programa SPSS.
La recodificación la realizaremos para cada uno de los niveles, iniciando con el
Administrativo. Lo primero que debemos hacer es activar la casilla Valor en la sección
Valores antiguos haciendo clic sobre ella; una vez activa ingresamos el número 2 y
sucesivamente activamos la Casilla Valor en la sección Valor nuevo, en donde
ingresamos el número 1; para terminar hacemos clic en el botón Añadir, con lo que
aparece en la casilla de listado la frase (2→1) [Fig.31].
Figura 31
Después de definir el primer valor, debemos definir el segundo por lo que ingresamos
en la casilla valor de la sección valores antiguos el número cinco y sucesivamente
ingresamos en la casilla valor de la sección valor nuevo el número 1; al hacer clic en
el botón Añadir aparece en la casilla de listado la frase (5→1) [Fig.32]. Si nos fijamos
en las expresiones, notaremos que le pedimos al programa que incluya los valores 2
y 5 en la nueva variable y que a su vez les asigne el valor 1.
81
Figura 32
Después de definir el primer nivel, procedemos con el segundo. Para el segundo nivel
activaremos la primera opción de rango de la sección valores antiguos
correspondiente a (Desde / Hasta). En la primera casilla de esta opción ingresamos el
valor 3 y en la segunda casilla el valor 4, sucesivamente ingresamos el número 2 en
la casilla valor de la sección Valor nuevo; para terminar hacemos clic en el botón
Añadir con lo que aparece en la casilla de listado la frase (3 thru 4 →2) [Fig.33]. Si
nos fijamos en la expresión, notaremos que le hemos pedido al programa que incluya
los valores desde el 3 hasta el 4 en la nueva variable y que a su vez le asigne el valor
2.
Figura 33
Para el tercer y último nivel, debemos activar primero la casilla valor en la sección
valores antiguos e ingresar en ella el número 1, sucesivamente ingresamos en la
casilla valor de la sección Valor nuevo el número 3; para terminar hacemos clic en el
botón Añadir con lo que aparece en la lista la leyenda (1→3) [Fig.34]. Si nos fijamos
en el listado de expresiones, notaremos que el valor que acabamos de definir
aparece antes de la expresión del segundo nivel, esto se debe a que el programa va
organizando las expresiones de acuerdo si se tratan de valores específicos o rangos.
Figura 34
82
Continuando con la recodificación, sólo nos basta finalizar con el tercer nivel de
trabajo, por lo que activamos la primera opción de rango (Desde / Hasta), e
ingresamos en la primera casilla el número 6 y en la segunda casilla el número 7;
sucesivamente ingresamos en la casilla valor de la sección Valor nuevo el número 3 y
posteriormente hacemos clic en el botón Añadir, con lo que aparece en el listado la
frase (6 thru 7 →3) [Fig.35].
Figura 35
Si nos fijamos en la expresión del tercer nivel, notaremos que le pedimos al programa
que incluya en la nueva variable los valores 1, 6 y 7 y que a su vez les asigne a ellos
el valor 3. Después de ingresar todas las expresiones hacemos clic en Continuar con
lo que volvemos al cuadro de diálogo principal del procedimiento. Si no se han
añadido todas las expresiones, aparece en la pantalla el mensaje Se perderán todas
las operaciones pendientes de Añadir o cambiar.
CONDICIONAR CASOS - RECODIFICAR VARIABLES 4
La última sección del procedimiento Recodificar corresponde a la Condicional. A
través de esta opción, podemos restringir el número de casos que serán
recodificados mediante expresiones de comparación (Ecuaciones), las cuales pueden
estar sujetas a cualquiera de las variables del archivo; es decir podemos utilizar una o
más variables del archivo para crear la restricción sin importar si estas variables serán
recodificadas o no.
83
Para utilizar una expresión condicional debemos hacer clic en el botón SI... del
cuadro de diálogo principal. Al hacer clic en él, aparece un nuevo cuadro de diálogo
correspondiente a Si los casos [Fig.36]; este cuadro nos permite aplicar
transformaciones de los datos para subconjuntos de casos seleccionados por medio
de expresiones condicionales. Una expresión condicional devuelve un valor
verdadero, falso o perdido para cada caso. Si el resultado de una expresión
condicional es verdadero, la transformación se aplicará al caso. Si el resultado de una
expresión condicional es falso o perdido, la transformación no se aplicará al caso.
Figura 36
Este cuadro de diálogo esta dividido en las secciones Lista de variables, Zona de
ecuación (en esta casilla se ingresa la expresión de condición), Calculadora de SPSS
(ver Depuración Capitulo III) y las posibilidades de selección donde encontramos la
posibilidad de escoger las opciones Todos los casos (Aplica la transformación a todos
los casos) o la opción Incluir si el caso satisface la condición (Aplica la transformación
sólo a los casos que cumplen las condiciones especificadas en la expresión).
Generalmente la mayoría de las expresiones condicionales utilizan al menos uno de
los seis operadores de relación (<, >, <=, >=, = y ~=) ubicados en el teclado de
calculadora. Las expresiones condicionales pueden incluir nombres de variable,
constantes, operadores aritméticos, funciones numéricas, variables lógicas y
operadores relaciónales.
Las condicionales se utilizan cuando deseamos seleccionar sólo un fragmento de la
información; es decir, nuestra atención esta dedicada exclusivamente a un grupo
84
específico de respuestas. Por ejemplo, supongamos que deseamos saber cuantos de
los entrevistados son hombres y se encuentran dentro del área administrativa, con el
fin de determinar su conducta. Para realizarlo, debemos definir la restricción en la
ventana de condiciones, por lo que hacemos clic en la opción Incluir si el caso
satisface la condición, de manera que se activen todas las secciones de la ventana.
A continuación seleccionamos en el listado la variable Género y la ingresamos en la
casilla de ecuación e inmediatamente ingresamos el signo igual (=) por medio del
teclado de la calculadora, así como el número dos (2) el cual representa a las
personas del genero Masculino; la expresión debe quedar (GÉNERO = 2). Una vez
introducida la ecuación correctamente hacemos clic en Continuar con lo que
volveremos al cuadro de diálogo Recodificar en distintas variables [Fig.37]; si nos
fijamos en la parte inferior del cuadro de diálogo notaremos que aparece la expresión
de la restricción que se ha definido.
Figuras 37
Una vez definidos todos los parámetros del procedimiento, hacemos clic en el botón
Aceptar con lo que se ejecuta la recodificación y la variable de resultado aparece en
la parte final del editor de datos de SPSS [37].
Esta variable contendrá sólo los niveles del área de trabajo de los casos que
pertenezcan al género masculino; para los casos pertenecientes al género Femenino
se le asignan valores perdidos por el sistema; es decir, aparece un espacio en blanco
(. ). A cada nueva variable generada por la Recodificación se le debe definir las
propiedades por medio de la pestaña vista de variables o el procedimiento Definir
propiedades de variables, ya que por defecto el programa las crea sin propiedades.
85
LECTURAS COMPLEMENTARIAS
LECTURA 1:
VARIABLES Y LA HIPÓTESIS EN LA INVESTIGACIÓN
JORGE L. CASTILLO T.
Representa un elemento fundamental en el proceso de investigación. Luego de
formular un problema, el investigador enuncia la hipótesis, que orientará el proceso y
permitirá llegar a conclusiones concretas del proyecto que recién comienza.
La hipótesis bien formulada tiene como función encausar el trabajo que se desea
llevar al efecto. Hayman (1974) cita: además que aclaran acerca de cuales son las
variables, que han de analizarse y las relaciones que existen entre ellas, y permiten
derivar los objetivos del estudio constituyéndose en la base de los procedimientos de
investigación.
Tamayo (1989), señala que éstas se constituyen en un eslabón imprescindible entre
la teoría y la investigación que llevan al descubrimiento de un hecho. Las razones
anteriormente esgrimidas hacen suponer que éstas ocupan un lugar primordial en la
investigación al proporcionar los elementos necesarios que permitirán llegar a los
datos necesarios que permitirán llegar a los datos y resolver el problema planteado.
DEFINICIÓN DE HIPÓTESIS
Es una proposición que establece relaciones, entre los hechos; para otros es una
posible solución al problema; otros mas sustentan que la hipótesis no es mas otra
cosa que una relación entre las variables, y por último, hay quienes afirman que es un
método de comprobación.
La hipótesis como proposición que establece relación entre los hechos : una
hipótesis es el establecimiento de un vínculo entre los hechos que el investigador va
aclarando en la medida en que pueda generar explicaciones lógicas del porqué se
produce este vínculo.
86
Tamayo (1989 – 75): afirma que:
"La hipótesis es una proposición que nos permite establecer relaciones entre los
hechos. Su valor reside en la capacidad para establecer mas relaciones entre los
hechos y explicar el por que se producen".
Arias (1897 – 55) asegura que:
La hipótesis tiene como propósito llegar a la comprensión del porqué entre dos
elementos se establece algún tipo definido de relación y establece que la hipótesis:
"Es una proposición respecto a alguno elementos empíricos y otros conceptos y sus
relaciones mutuas, que emerge mas allá de los hechos y las experiencias conocidas,
con el propósito de llegar a una mayor comprensión de los mismos".
La hipótesis como una posible solución del problema: la hipótesis no es
solamente la explicación o comprensión del vínculo que se establece entre los
elementos inmersos en un problema, es también el planteamiento de una posible
solución al mismo.
Pardinas (1974 – 132):
"La hipótesis es una proposición anunciada para responder tentativamente a un
problema".
Deben ser sustentada por Van Dalen (1974 – 170) conduce a una definición en la
que se establece que:
"La hipótesis son posibles soluciones del problema que se expresan como
generalizaciones o proposiciones. Se trata de enunciados que constan de elementos
expresados según un sistema ordenado de relaciones, que pretenden describir o
explicar condiciones o sucesos aún no confirmados por los hechos".
Hipótesis como relación entre variables: Kerlinger (1985 : 12) expresa; una
expresión de las relaciones existentes entre dos o mas variables, la hipótesis se
formula en términos de oración aseverativa por lo tanto:
"Es una expresión conjetural de la relación que existe entre dos o más variables.
Siempre aparece en forma de oración aseverativa y relaciona de manera general o
específica, una variable con otra.
87
Hipótesis como método de comprobación: para otros investigadores, la hipótesis
es algo mas que el establecimiento de relaciones entre elementos, o la posible
solución a un problema; por lo tanto; afirman que es fundamentalmente y ante todo,
una herramienta de comprobación de los supuestos con la realidad.
Abouhamad (1965:74) sostiene:
"La hipótesis es una proposición, condición o principio que se supone sin certeza con
el fin de derivar sus consecuencias con hechos lógicos y, por este método comprobar
su concordancia con hechos conocidos o que puedan determinarse".
IMPORTANCIA DE LA HIPÓTESIS
Las hipótesis son el punto de enlace entre la teoría y la observación. Su importancia
en que dan rumbo a la investigación l sugerir los pasos y procedimientos que deben
darse en la búsqueda del conocimiento.
Cuando la hipótesis de investigación ha sido bien elaborada, y en ella se observa
claramente la relación o vínculo entre dos o mas variables, es factible que el
investigador pueda:
Elaborar el objetivo, o conjunto de objetivos que desea alcanzar en el
desarrollo de la investigación
Seleccionar el tipo de diseño de investigación factible con el problema
planteado.
Seleccionar el método, los instrumentos y las técnicas de investigación
acordes con el problema que se desea resolver, y
Seleccionar los recursos, tanto humanos como materiales, que se emplearán
para llevar a feliz término la investigación planteada.
ORIGEN DE LA HIPÓTESIS
Selltiz (1974:53) señala:
"Una hipótesis puede estar basada simplemente en una sospecha, en los resultados
de otros estudios y la esperanza de que una relación entre una o mas variables se
den en el estudio en cuestión. O pueden estar basadas en un cuerpo de teorías que,
por un proceso de deducción lógica, lleva a la predicción de que, si están presentes
ciertas condiciones, se darán determinados resultados.
88
La elaboración de una buena hipótesis tiene como punto de partida el conocimiento
del área en la que se desea hacer la investigación, sin este conocimiento previo se
corre el riesgo de recorrer caminos ya transitados y trabajar en temas ya tratados que
carecen de interés para la ciencia.
Si la hipótesis se basa u origina de otros estudios, la investigación estará en clara
relación con un cuerpo de conocimientos ya existentes, probados, por lo que el
trabajo será una contribución que permitirá reforzar ese cuerpo de conocimientos.
Función de la Hipótesis:
Cuando se describe su importancia, se plantean algunas de las funciones que ellas
cumplen, porque además de ser guías en el proceso de investigación, también
pueden servir para indicar que observaciones son pertinentes y cuales no lo son con
respecto al problema planteado.
La hipótesis puede señalar loas relaciones o vínculos existentes entre las variables y
cuales de ellas se deben estudiar, sugieren una explicación en ciertos hechos y
orientan la investigación en otros, sirve para establecer la forma en que debe
organizarse eficientemente el análisis de los datos. Hernández agrega que entre
otras funciones, su objetivo principal, es de aprobar y sugerir teorías.
Formulación de Hipótesis:
Es un planteamiento que elabora el investigador a partir de la observación de una
realidad que tiene explicación en una teoría, por lo tanto se afirma que ellas
representan un punto medio entre la teoría y la realidad.
CLASIFICACIÓN DE LA HIPÓTESIS
La hipótesis puede adoptar diferentes y clasificarles de acuerdo a la convivencia de
cada autor:
a. Hipótesis general: es cuando trata de responder de forma amplia a las dudas
que el investigador tiene acerca de la relación que existe entre las variables.
b. Hipótesis específica: es específica aquella hipótesis que se deriva de la
general, estas tratan de concretizar a la hipótesis general y hace explícitas las
orientaciones concebidas para resolver la investigación.
89
c. Hipótesis estadística: la hipótesis estadística es aquella hipótesis que
somete a prueba y expresa a las hipótesis operacionales en forma de
ecuaciones matemáticas.
d. Problema: se quiere determinar si el entrenamiento en técnicas de estudio
mejora el rendimiento académico de los estudiantes de la UNELLEZ.
e. Hipótesis específica: los alumnos del subproyecto lenguaje y comunicación
del I semestre, programa educación integral, entrenados en técnicas de
estudio, obtendrán altas calificaciones al mejorar sus técnicas de
aprendizajes.
f. Hipótesis operacional: el promedio de rendimiento de los alumnos del
subproyecto lenguaje y comunicación, sometidos a entrenamientos en
técnicas de estudio (grupo experimental), será mayor que el promedio de
rendimiento de aquellos alumnos no sometidos al entrenamiento (grupo
control).
g. Hipótesis estadística:
Hipótesis nula: (X1) = (X2); no existe relación en los promedios obtenidos
por los estudiantes entrenados en técnicas de estudio (X1) y los no
entrenados (X2)
Hipótesis alternativas: X1 > X2; los alumnos sometidos a entrenamientos
en técnicas de elaboración de resumen (X1) obtuvieron mejor promedio de
rendimiento que aquellos alumnos que no recibieron ningún tipo de
entrenamiento (X2).
Requisitos para la elaboración de hipótesis:
La formulación de hipótesis es una tarea que se logra cuando se cumple con algunos
requisitos, entre ellos:
a. Formularse en términos claros, es decir, emplear palabras precisas que no
den lugar a múltiples interpretaciones. La claridad con que se formulen es
fundamental, debido a que constituyen una guía para la investigación.
b. Tener un referente empírico, ello hace que pueda ser comprobable. Una
hipótesis sin referente empírico se transforma en un juicio de valor al no poder
ser comprobable, verificable, carece de validez para la ciencia.
90
Evaluación de la Hipótesis:
Existe algunos criterios que sirven de guía para determinar si la hipótesis cumple con
algunos requisitos Mc Güigan (1971: 67) afirma:
a. Permite ser comprobada, es decir, establece claramente su referente
empírico.
b. Está en correlación y armonía con el conjunto de las hipótesis del proyecto de
la investigación
c. Responde en términos claros y precisos al problema planteado, es decir,
señala la relación que se espera de las variables.
d. Son susceptibles de ser cuantificadas.
Dificultades en la Elaboración de la Hipótesis:
La hipótesis resulta una tarea ardua, de difícil elaboración, esta dificultad
generalmente proviene de circunstancias tales como:
a. Un planteamiento poco claro del problema a investigar
b. Falta de conocimiento del marco teórico de la investigación como
consecuencia de la poca claridad que se tiene del problema que se desea
resolver.
c. Carencia de habilidad para desarrollar y utilizar el referente teórico –
conceptual.
d. En general, por el desconocimiento de los procesos de la ciencia y la
investigación, por lo tanto ausencia de criterios para la elaboración de
hipótesis y selección de técnicas de investigación adecuadas al problema que
se investiga.
VARIABLE
La definición más sencilla, es la referida a la capacidad que tienen los objetos y las
cosas de modificar su estado actual, es decir, de variar y asumir valores diferentes.
Sabino (1980) establece:
"entendemos por variable cualquier característica o cualidad de la realidad que es
susceptible de asumir diferentes valores, es decir, que puede variar, aunque para un
objeto determinado que se considere puede tener un valor fijo".
91
Briones (1987 : 34) define:
"Una variable es una propiedad, característica o atributo que puede darse en ciertos
sujetos o pueden darse en grados o modalidades diferentes. . . son conceptos
clasificatorios que permiten ubicar a los individuos en categorías o clases y son
susceptibles de identificación y medición".
CLASIFICACIÓN DE LAS VARIABLES
Variable Independiente:
es aquella característica o propiedad que se supone ser la causa del fenómeno
estudiado. En investigación experimental se llama así, a la variable que el
investigador manipula.
Variable Dependiente:
Hayman (1974 : 69) la define como propiedad o característica que se trata de
cambiar mediante la manipulación de la variable independiente.
La variable dependiente es el factor que es observado y medido para determinar el
efecto de la variable independiente.
Variable Interviniente:
Son aquellas características o propiedades que de una manera u otra afectan el
resultado que se espera y están vinculadas con las variables independientes y
dependientes.
Variable Moderadora:
Según Tuckman: representan un tipo especial de variable independiente, que es
secundaria, y se selecciona con la finalidad de determinar si afecta la relación entre la
variable independiente primaria y las variables dependientes.
Variables Cualitativas:
Son aquellas que se refieren a atributos o cualidades de un fenómeno. Sabino
(1989 : 80) señala que sobre este tipo de variable no puede construirse una serie
numérica definida.
Variable Cuantitativa:
92
Son aquellas variables en las que características o propiedades pueden presentarse
en diversos grados de intensidad, es decir, admiten una escala numérica de
medición.
Variables Continuas:
Son aquellas que pueden adoptar entre dos números puntos de referencias
intermedio. Las calificaciones académicas (10.5, 14.6, 18.7, etc.)
Variables Discretas:
Son aquellas que no admiten posiciones intermedias entre dos números. Ej., en
Barinas la división de territorial la constituyen 11 municipios por no (10.5 u 11.5
municipios).
Variables de Control:
Según Tuckman: La define como esos factores que son controlados por el
investigador para eliminar o neutralizar cualquier efecto que podrían tener de otra
manera en el fenómeno observado.
Operacionalización de la Variable:
Es un paso importante en el desarrollo de la investigación. Cuando se identifican las
variables, el próximo paso es su operacionalización.
Comprende tres tipos de definiciones:
a. Nominal: es el nombre de la variable que le interesa al investigador.
b. Real: consiste en determinar las dimensiones que contienen las variables
nominales.
c. Operacional: o indicadores. Esta da las base para su medición y la definición
de los indicadores que constituyen los elementos mas concretos de una
variable y de donde el investigador derivará los items o preguntas para el
instrumento con que recolectará la información.
93
LECTURAS COMPLEMENTARIAS
LECTURA 2:
GUÍA METODOLÓGICA PARA LA ELABORACIÓN DE
UN INFORME FINAL DE INVESTIGACIÓN
ELIZABETH PÉREZ OLIVA.
INTRODUCCIÓN
Ningún proyecto se considera completo hasta que se prepara el informe de
investigación, incluso el estudio más brillante tiene poco valor sino se difunde a la
comunidad científica.
El informe de investigación representa el resultado final del largo proceso de
investigación. Su articulación estructural constituye ser el modo de como los
investigadores ordenan, clasifican y presentan los datos.
Cualquiera que sea el tipo de investigación, la presentación de los resultados se hace
con base a normas que permiten estructurar de una manera lógica la forma y el
contenido de la exposición teórica. El objetivo de esta guía GUIA METODOLOGICA
PARA LA ELABORACIÓN DE UN INFORME FINAL DE INVESTIGACIÓN con
aplicabililidad al área de la Salud es brindar algunos lineamientos generales para
ayudar al estudiante investigador de las ciencias de la salud a comunicar sus
resultados. La experiencia que se tiene en investigación para esta área a mostrado
que existe una limitante en el ámbito estudiantil sobre la obtención de modelos o
guías que le permitan presentar los resultados que se han obtenido en una
investigación.
Como su nombre lo dice esta guía viene estructurada de tal forma para que el
estudiante desarrolle paso a paso el informe final de su investigación.
Básicamente todo informe de investigación está compuesto por: Portada, Indice,
Introducción, Resumen, Cuerpo del trabajo, Conclusiones, Recomendaciones,
94
Anexos y la Bibliografía. Sin embargo a esta guía se le han agregado otros
elementos que complementan la oportuna comunicación de los resultados.
SUGERENCIAS BÁSICAS PARA LA PRESENTACIÓN DEL INFORME.
a. El trabajo se sugiere que sea elaborado con el mismo tipo de letra (ARIAL), el
tamaño de la letra se sugiere sea de 12 puntos, color negro y a doble
espacio entre líneas.
b. El papel a emplear debe de ser tamaño carta, bond, base 20.
c. Los márgenes del trabajo serán los siguientes:
d. Parte superior 4.0 cm. ( 1 2 pulgadas).
e. Parte inferior 2.5 cm. ( 1 pulgada).
f. Parte derecha 2.5 cm. ( 1 pulgada).
g. Parte izquierda 4.0 cm. ( 1 2 pulgadas).
h. Cada página se numera en la esquina superior derecha, con números
arábigos en el orden correlativo correspondiente. El número debe aparecer al
menos a 2.5 cm. ( 1 pulgada) de la orilla derecha de la página, en el espacio
entre el borde superior del documento y la primera línea del texto.
i. El índice, la introducción y el resumen se enumeran en el orden i, ii, iii. El
cuerpo del trabajo se enumera siguiendo el orden correlativo acostumbrado.
LA PORTADA
La portada es la parte inicial del informe de investigación, ésta está compuesta por
los siguientes elementos que van centrados en la página :
1. Nombre de la institución, facultad y departamento.
2. Logo de la Institución.
3. Título del informe de investigación.
4. Nombre de autores en orden alfabético. Primero apellidos y luego nombres.
5. Nombre de la asignatura, ciclo y año.
6. Nombre del asesor(es) de contenido.
7. Nombre del asesor de metodología.
8. Nombres de los miembros del comité evaluador.
95
9. Lugar y fecha de presentación.
¡EL INDICE
Es un listado de las partes estructurales del informe de investigación,
se coloca después de la portada y antes de la introducción. Incluye los
capítulos y subcapítulos, temas y subtemas que son y forman parte de
la totalidad de la investigación.
Se señalan las partes y su numeración de página correspondiente.
El lector al consultar el índice se pone en contacto con todo el
contenido del escrito, lo cual facilita la localización de los temas
generales y específicos.
La forma que se sugiere adoptar para el índice del trabajo de
investigación será la llamada sistema general, en el que se utilizan
números romanos para identificar los capítulos; letras mayúsculas para
los temas, números arábigos para los subtemas y letras minúsculas
para las subdivisiones de éstos.
ii LA INTRODUCCION
Es la comunicación inicial que permite (sin necesidad de explicar)
penetrar a detalles incentivadores, creando un ambiente de
familiaridad y confianza entre el autor del escrito y la persona lectora.
Además de ser incentivadora, la introducción presenta el tema de
investigación, los propósitos esenciales y datos generales del
contenido estructural del escrito, es decir una breve descripción
capitular.
Para redactar la introducción deberán cumplirse las siguientes recomendaciones:
a. Redactarla al finalizar el ordenamiento y clasificación de todos los datos, es
decir, cuando se ha terminado todo el trabajo.
b. Se ubica luego de la tabla de contenidos o índices.
c. Prepara al lector para la descripción de lo que se hizo.
96
d. Se menciona el tema de investigación y los objetivos. Describe el estudio e
incluye una breve reseña bibliográfica, la explicación del marco conceptual,
las hipótesis y la justificación.
e. No se presentan resultados ni definiciones.
f. Debe ser clara y concreta.
g. Articular en forma lógica: la presentación (¿qué es el escrito?, ¿cuál es el
título?, ¿a quién se presentará? y a qué institución?), el propósito, las partes
estructurales generales y una breve metodología de exposición.
iii EL RESUMEN
En él se detalla sintéticamente todo el contenido del informe de
investigación, planteando las ideas centrales y el perfil del escrito, es
decir, reducir a términos breves y precisos la idea central de la
investigación realizada. Debe incluir la justificación, objetivo general,
principales resultados y conclusiones. Su extensión varía de las 75
hasta las 150 palabras como máximo.
CAPITULO I
PLANTEAMIENTO DEL PROBLEMA
Es una breve descripción de la problemática que puede sustentarse en
el desconocimiento de las causas que la generan, los factores
asociados o el grado de intensidad mostrado en el comportamiento de
algunos indicadores o variables en un contexto determinado.
Puede subdividirse en los siguientes apartados:
A. PROBLEMATICA (Relativa al tema de estudio)
En este apartado puede plantearse:
Breves antecedentes de la problemática.(Antecedentes del
problema)
Síntomas que la reflejen.(Situación Problemática)
Efectos inmediatos y futuros.
Causas probables. Factores asociados.
97
Datos que verifiquen que el problema es parte de un contexto
en el que se conjugan otros problemas relativos.
Actores y/o instituciones involucradas.
Soluciones que se han intentado.
Interrogantes fundamentales, preguntas a responderse en la
investigación.(Enunciado del problema)
Todo lo anterior, redactado en forma lógica y coherente con un
enfoque deductivo; a menos que el tipo de investigación amerite un
enfoque inductivo.
B. DELIMITACIÓN DE LA INVESTIGACIÓN.
En este apartado se establecerá descriptivamente la cobertura que
tuvo la investigación en lo relativo a:
Espacio geográfico, es decir, el lugar donde se realizó la
investigación.
Sujetos y/u objetos que participaron en la realización del estudio.
Tiempo, especificando el periodo de tiempo en el que fue realizado
la investigación.
Contenidos, se debe mencionar la o las variables que se
consideraron en el estudio.
C. JUSTIFICACIÓN.
Este apartado debe reflejar la importancia y relevancia que tiene la
investigación que se ha realizado, exponiendo argumentos tales como:
Evidencias que demuestren la magnitud de la problemática o
necesidad de éstas para profundizar en el análisis.
Necesidad de corregir o diseñar medidas correctivas que
contribuyan a la solución de los problemas expuestos.
Demostrara que la investigación constituye una estrategia para
enfrentar la problemática mencionada.
Mencionar los beneficios futuros que pueden obtenerse, tanto para
las personas como para las instituciones y/o grupos sociales.
98
C. LIMITACIONES.
Este apartado debe reflejar las restricciones que tiene la investigación,
para poder expandir o generalizar los resultados, así como el
reconocimiento de la incidencias de otras variables que en el proceso
de la investigación no se controlan. Debe evitarse mencionar
limitantes que puedan preveerse antes de realizar la investigación,
tales como tiempo, costos, falta de información y otras propias de los
investigadores.
E. OBJETIVOS.
Deben expresarse como proposiciones orientadas a definir los
logros que se esperan obtener a partir de los resultados que arroje
la investigación.
Los elementos que lo constituyen son el verbo, la (s) variables, la
(s) relaciones y el contexto.
Deben reflejar lo que se espera obtener al estudiar cada variable
(cuando no se establezca una relación bivariada), o lo que se
espera al estudiar la relación de dos o más variables.
Debe formularse un objetivo general y varios específicos, en donde
estos últimos sean desglosados del primero.
CAPITULO II
FUNDAMENTACIÓN TEORICA.
En este capítulo se exponen algunos principios, axiomas o leyes que
rigen las relaciones de los fenómenos que son parte de la realidad a
estudiar y que de alguna manera están incidiendo o son parte de la
casualidad o estructura lógica de las explicaciones teóricas de alguna
disciplina científica
Este capítulo debe estructurarse dependiendo de la naturaleza de
cada investigación, pero en términos generales deben considerarse
aspectos tales como:
Breve marco histórico.
99
Contexto en el que están inmersas las variables del problema.
Síntesis del marco social, cultural, legal, institucional.
Comportamiento de las variables en otros ambientes y contextos.
Enfoques de autores o teorías que las respaldan.
Relación de las variables.
Todo lo anterior debe plantearse bajo un enfoque deductivo, es decir
desde lo más general hasta lo más específico, (a menos que el tipo de
investigación demande otro tipo de enfoque).
Así también, cada aspecto debe ser comentado e interpretado con
ideas propias de los investigadores de manera que se refuercen sus
hipótesis. Con respecto a las referencias bibliográficas se usan las
citas cortas, así: (3,6) ó (Polit, pág. 6), en donde 3 corresponde al
tercer libro de la bibliografía y 6 corresponde al número de la página en
donde está ese párrafo textual.
CAPITULO III.
HIPOTESIS Y VARIABLES.
En este capítulo deben expresarse los supuestos básicos que orientan
la búsqueda de la información y cómo éstos han sido
operacionalizados a través de la relación esperada de las variables. De
igual manera deben exponerse los indicadores que permitirán medir el
comportamiento de las variables a evaluar.
Los apartados sugeridos son:
A. HIPOTESIS.
General y específicas.
En este apartado se sugiere formular las hipótesis de investigación, tal
como estaban en el anteproyecto(si éste se hubiese elaborado). Estas
deben correlacionarse con cada objetivo (solamente cuando la
investigación demande efectuar las respectivas pruebas). Si dentro del
100
trabajo no se realizaron pruebas de hipótesis ya que el estudio es
descriptivo o exploratorio, entonces debe de hacerse esta aclaración.
B. DIAGRAMA DE VARIABLES.
En este apartado debe presentarse en forma esquemática, lógica y
cronológica, la relación supuesta entre las variables, definiendo la (s)
independiente (s) y dependiente (s).
C. DEFINICIÓN OPERACIONAL DE VARIABLES.
En este apartado debe formularse una definición de cada una de las
variables, tal como deben entenderse en esta investigación.
D. INDICADORES DE LAS VARIABLES.
El concepto de indicador se refiere a aquellos aspectos medibles que
nos muestran como es el comportamiento de las variables. En el caso
de las variables que representan procesos, no se deben definir
indicadores que no sean sujetos de medición.
CAPITULO IV
METODOLOGÍA DE LA INVESTIGACIÓN.
Este capítulo comprende la descripción de la estrategia a seguir
expresada a través del tipo y modalidad de la investigación, la
caracterización de las unidades de análisis, las técnicas, procesos e
instrumentos de medición a ser utilizados; los cuales se expresarán en
los siguientes apartados:
A. TIPO DE INVESTIGACIÓN
Este apartado debe reflejar la manera de cómo se enfocó la investigación en
cuanto al propósito, amplitud y profundidad, mencionando las características
propias del nivel o modalidades de investigación que se aplicó en base a los
planteamientos de algunos autores de textos actualizados. Cuando el tipo de
101
investigación demande la aplicación de algún diseño, será necesario exponerlo
y explicarlo en cada uno de sus elementos y procesos dentro de este apartado.
B. POBLACIÓN Y MUESTRA
Aquí debe describirse detalladamente las características propias del
conglomerado de sujetos u objetos hacia los cuales se orientó la investigación,
es decir, a la totalidad de elementos que podrían ser objeto de medición.
Cuando no se trabaje con toda la población, sino con una parte de ella
(muestra), debe definirse si ésta fue tomada aleatoriamente. En este caso debe
de determinarse un tamaño muestral calculado mediante probabilidades y
niveles de confianza definidos. Si la selección no fuese aleatoria, debe
justificarse el por qué y reconocer las limitaciones que esto implica y los criterios
que se definieron para escoger a los sujetos. Para cualquiera de los dos casos,
debe describirse el proceso de selección de los elementos que conformaron la
muestra.
C. MATERIALES Y METODOS
Descripción detallada de cómo fue realizada la investigación y los
elementos utilizados en la misma. Incluye:
Detalle de procedimientos: Explicación general sobre aspectos
como número de grupos, asignación de sujetos a grupos,
manipulación, etc.)
A. TÉCNICAS APLICADAS EN LA RECOLECCIÓN DE LA INFORMACIÓN.
INSTRUMENTOS DE MEDICIÓN.
En este apartado deben explicarse cada una de las técnicas que se aplicaron
(entrevista, encuesta o alguna otra), a quiénes se les aplicó, con qué propósito,
cómo se desarrollo, pasos que siguieron, y cuál fue el uso específico que se le
dió a la información o datos recopilados a través de éstos.
También deben describirse los instrumentos que se han utilizado en la
investigación, mencionando cómo es su estructura, su contenido, en qué se han
basado para su construcción, cómo se califican y ponderan las respuestas y
cuál ha sido el proceso de validación.
102
B. RESULTADOS.
En este apartado se debe exponer desde cómo se tabularon y organizaron los
datos, los respectivos cuadros y gráficos con su respectiva descripción de los
resultados, los modelos estadísticos y/o programas que se utilizaron para su
exposición, la justificación del por qué se usaron y cómo se efectuaron las
pruebas de hipótesis en el caso que se realicen.
C. DISCUSIÓN DE RESULTADOS.
Autoevaluación de los procedimientos empleados y discusión de los posibles
alcances y significados de la investigación. Se hace una interpretación acerca
de los resultados obtenidos con respecto a la información encontrada en la
revisión de la literatura, evitando hasta dónde sea posible especular.
D. CONCLUSIONES.
Las conclusiones en el informe de investigación, hacen referencia a los
resultados concretos que se obtuvieron en el desarrollo de la
investigación y que fueron presentados ampliamente en el desarrollo
del cuerpo del trabajo, prácticamente es un resumen sintético de los
puntos más importantes y significativos para los autores. Estas van
acorde al numero de objetivos planteados en la investigación, esto no
quiere decir que no se presentará otra información importante obtenida
durante el estudio.
H. RECOMENDACIONES.
Las recomendaciones constituyen el aparato del documento, dónde la
creatividad del investigador (es) se pone de manifiesto en el
planteamiento de políticas, estrategias y medidas de acción a tomar
por instituciones (públicas o privadas), requisitos, entidades, etc. para
la solución del problema que se investigó.
I. ANEXOS
Aquí se ubicarán los instrumentos y otro tipo de documento que han
sido necesarios para el desarrollo del trabajo y que no se ha
considerado otro lugar para ellos en el documento.
103
Los anexos son secciones adicionales que se adjuntan al documento
escrito, el objetivo es presentar información adicional importante, ya
sea para prolongar la explicación de los datos, como también para
confirmarlos. Se ubica después de las conclusiones y
recomendaciones, antes de la bibliografía.
Ejemplo de anexos: copias de documentos, mapas, planos,
cuestionarios, guías de entrevista y observación, proyectos,
programas, cuadros, gráficos, diagramas, resultados de laboratorios,
cronogramas, presentación de la exposición etc. Dichos agregados son
ordenados de acuerdo a cómo han sido citados en el cuerpo del
trabajo.
J. BIBLIOGRAFIA
Es la última parte del informe de investigación, agrupa todas las
fuentes consultadas para la realización de la investigación y redacción
del informe. Las fuentes pueden ser libros, revistas, boletines,
periódicos y documentos varios(referencias electrónicas o de Internet).
Cuando la bibliografía es utilizada en el trabajo comprende otras
fuentes además de libros, se dividirán en secciones que se clasifican y
ordenan de la siguiente manera: libros, revistas, boletines, periódicos,
documentos y otras fuentes ( como por ejemplo la entrevista,
referencias electrónicas o de Internet), los titulados de estas secciones
irán en mayúscula en el centro de la página. Lo que se presenta a
continuación es una sugerencia para elaborar la bibliografía. Sin
embargo, se remite a los lectores a consultar las Normas que la
American Psychological Association (APA), 5° Edición a elaborado con
el objetivo de que sean consideradas para la elaboración de una
Bibliografía más completa.
104
LECTURAS COMPLEMENTARIAS
LECTURA 3:
¿QUÉ ES UNA TESIS? ¿PARA QUIEN SE ESCRIBE?
¿CÓMO DEBE ESTAR ESCRITA?
JOE WOLFE
u tesis es un trabajo de investigación. El informe concierne a un problema o conjunto
de problemas en un área definida de la ciencia y debe explicar lo que se sabe de él
previamente, lo que se hacía para resolverlo, lo que sus resultados significan, y
dónde o cómo se pueden proponer progresos, más allá del campo delimitado por el
trabajo.
¡No se aturda con sus temores de estudiante en examen!: una tesis no es una
respuesta a una pregunta de examen.
El lector de un examen es normalmente quien tiene la respuesta. El ya conoce la
respuesta (o alguna de las respuestas), por no mencionar los antecedentes, la
bibliografía, los supuestos y teorías complementarias. También conoce de Ud. sus
fortalezas y debilidades en el tema.
El lector de una tesis, en cambio, no sabe cuál es "la respuesta" a la hipótesis
planteada. Si la tesis es para obtener un doctorado, la universidad exige que se haga
una contribución original al saber científico: su investigación debe descubrir algo
científicamente original, hasta ahora desconocido.
Nadie sabe más que Ud. mismo
El jurado leerá su tesis. Ellos son expertos en el área genérica de su trabajo, pero
sobre el tema concreto de su tesis, nadie sabe más, que usted mismo... ¡en todo el
mundo! Por lo tanto debe escribirlo de manera que resulte de clara comprensión, en
especial para el jurado de "expertos", que no han ocupado demasiado de su tiempo
en analizar los pormenores del problema, objeto de su tesis.
105
Su tesis es un informe científico y será consultada por investigadores que querrán
enterarse en detalle, de los pormenores de sus experiencias de laboratorio. Las tesis
son consultadas por personas de otras instituciones, y la biblioteca puede proveer
fotocopias en papel o microfilm. Pero cada vez más se digitalizan (en imágenes y
texto) las obras. Una consecuencia directa es que su tesis será consultada más
fácilmente, por investigadores de todo el mundo. Por lo tanto, escriba su tesis en
atenta atención de estas posibilidades.
Siempre será útil tener a alguien, aparte de su asesor, que lea objetivamente unas
secciones de la tesis, particularmente la introducción y los capítulos de la conclusión
que debe estar íntimamente relacionadas. Sería muy apropiado también consultar a
los otros miembros del jurado... si podrían leer algunas secciones de la tesis que
consideraran pertinentes o de interés, en las que se podrían descubrir contribuciones
valiosas. A ellos, permítales concentrarse en el contenido, provéales sólo versiones
revisadas, de manera que no pierdan tiempo corrigiendo su gramática, o su
presentación.
¿Cuán detallada?
¡Bastante más que para un artículo científico! Una vez que se ha evaluado su tesis y
sus amigos han leído las tres primeras páginas, los únicos lectores que querrán
continuar, serán las personas que investigan seriamente en el área. Por ejemplo, un
estudiante más joven desea seguir su misma línea de investigación y está
interesado en saber exactamente lo que usted ha experimentado. Pregúntese:
¿podrá hacerlo con su tesis?
Ud. debe estar en condiciones de proveerle todo lo necesario: debe incluir bocetos,
dibujos, diagramas y programas de computadora, normalmente como apéndices.
Una omisión muy frecuente e irritante, se encuentra en los programas de
computación indocumentados e incomentados, lo que lleva a una, casi imposible
interpretación. ¡Ud. no debe caer en esta negligencia!
Seguramente alguna vez tuvo la oportunidad de leer las tesis de estudiantes
anteriores en el laboratorio donde actualmente trabaja, así que ya conoce de las
ventajas de una tesis explícita, en contraposición con una inconsistente.
106
Ponga en claro lo suyo
La referencias bibliográficas son el medio adecuado de documentar conceptos que
no son propios, debe declarar donde está documentado ese resultado, en la literatura
científica. Las excepciones son los descubrimientos de larga data, por ejemplo en
física: las ecuaciones de dinámica no requieren ser referenciadas por una cita de
Newton; el análisis de circuitos no requiere una referencia a Kirchoff.
La importancia de esta práctica en ciencia es que permite al lector verificar su
posición inicial. Se sabe que la física (y muchas otras ciencias), es una ciencia
vertical: los resultados se construyen apoyándose en anteriores resultados, los
cuales, a su vez, fueron construidos sobre otros resultados.
Las buenas referencias, dejan que verifiquemos los fundamentos de sus
aportaciones a la estructura de la disciplina, o por lo menos retraerlas a un nivel que
juzgamos fiable. Las buenas referencias también les dicen a los lectores, cuáles
partes de la tesis son descripciones de conocimientos previos y cuáles partes son sus
contribuciones originales a ese conocimiento.
El texto de una tesis, escrita para un lector científico con poca familiaridad con la
literatura en ese campo, debe quedar especialmente claro. Parecería tentador omitir
una referencia, con la esperanza de que un lector pudiera pensar que una idea
buena o un "pedazo bueno" del análisis es suyo. ¡Cuidado!, le prevengo contra este
acto deshonesto. Puede caer descuidadamente en el delito de plagio.
El lector pensará: " ¡Qué idea tan buena, debo comprobar su originalidad! ". Se
enterará de su verdadero origen, en la biblioteca, en la red o con sólo una llamada
telefónica.
Sin descartar la posibilidad de descubrir de pronto, un verdadero genio escritor de
ciencia, que con su estilo personalísimo cautive el interés de acreditados lectores,
más allá de lo supuesto, es necesario afirmar, que un escrito científico debe
expresarse siempre en voz activa, con el verbo en modo infinitivo . Una tesis es un
escrito científico.
Esta afirmación cobra mayor verdad cuando los descubrimientos científicos son de tal
magnitud (como los de Albert Einstein) que la persona del científico en si, pasa a
107
segundo plano en los escritos. Este debe despersonalizarse por completo, siempre
que el escrito sirva para comunicar ciencia.
¡La ciencia debe ser escrita siempre en voz activa y en modo impersonal!
Es como si la misma ciencia se expresara a través de la Naturaleza como autora.
Imagínese por un momento ¿cómo escribiría la Naturaleza? Ella nunca diría "Yo hice
esto, ellos obtuvieron esto otro": más bien diría "se debe hacer esto, es correcto
determinar aquello".
Suele ocurrir un extraño fenómeno. Es nítidamente más notorio, cuando el
descubrimiento científico es de una gran magnitud (Teoría de la Relatividad). El
escrito parece haber sido (o debería haber sido) redactado por la propia Naturaleza,
como en un generoso acto de despojo de sus secretos muy bien guardados. La
persona del investigador queda en segundo plano, el protagonismo en la escritura lo
toma (o lo debe tomar) la propia Naturaleza; expresándose en el texto científico, en
voz activa e impersonal (verbos en modo infinitivo).
Por esta razón, no se trata del rechazo de "un yo inmodesto", por parte del científico
al escribir en modo impersonal, sino más bien un simple acto de respeto por la
ciencia.
Algunos escritores piensan, -tal vez equivocadamente- que si escriben en voz pasiva,
deben ser más cuidadoso sobre la atribución. Por ejemplo, si escribe en voz pasiva
"La muestra fue preparada por itrio calentado. . .", se puede dudar si era Ud. quien
preparaba la muestra o si lo hacía la Compañía Itrio. "Preparé la muestra . . ." es más
claro expresándolo en voz activa, fundamentarán...
No obstante y con el afán de dar por terminada la discusión, a todas luces es correcto
expresar científicamente: "...preparar una muestra de itrio calentado..." que no da
lugar a las incorrectas interpretaciones enunciadas, y por supuesto está escrito en
voz activa, totalmente impersonal.
El Estilo
El texto debe ser claro. La buena gramática y la escritura reflexiva harán la tesis más
fácil de leer. La escritura científica tiene que ser un poco formal --bastante más formal
que este texto--. Los angloparlantes nativos deben recordar que el inglés científico es
108
un idioma internacional, lo cual es cierto especialmente para la ciencia. La jerga y la
escritura informal serán más difíciles de entender por un parlante no-nativo.
La escritura de párrafos muy largos no siempre guardan el sentido de unidad. Pero
creo que este "defecto", es más bien un problema en el que prima el "ahorro" de
papel, lo que no lleva necesariamente al concepto de brevedad.
Si su obra escrita es importante, no escatime espacio de papel en contra de la
presentación. La correcta separación de los párrafos debe estar entre 3 y 6 puntos
para Word'97 (analice como ejemplo, este mismo párrafo).
Es mucho más efectivo la separación entre párrafos, que la sangría de la primera
línea de un párrafo (entre 2 y 5 caracteres), destinado a facilitar una rápida ubicación
visual de los párrafos, durante la lectura.
Yo personalmente, como puede ver aquí, no uso sangría, puesto que los párrafos
quedan perfectamente destacados solo con su separación. Obtenga esta excelente
característica de formato de párrafo: la separación de párrafo, en el menú de
Word'97, con la opción: Formato, Párrafo.
Frases y palabras cortas, simples son a menudo mejores que las largas. Algunos
políticos usan retóricamente "en este momento del tiempo" en lugar de "ahora",
precisamente porque toma más tiempo obtener el mismo significado. No tienen
cuidado particularmente con la comunicación eficaz. Usted sí debe.
Habrá ocasiones en las que se requiera una frase complicada porque la idea misma
lo es. Si su declaración primaria requiere varias calificaciones, cada una de éstas
requeriría una cláusula subordinada: "Cuando [calificación], y donde [lugar], y si
[condición] entonces [declaración]."
La Presentación
No existe obligación para una tesis, de ser una obra maestra de publicación. Su
tiempo puede ser más productivo si lo emplea en mejorar el contenido, mucho más
que en la apariencia. Pero piense que una buena presentación, invitará a una lectura
más agradable. Solo Ud. es capaz de establecer una relación de compromiso con
ambos aspectos perfectamente equilibrados.
109
Actualmente (fines de 1998) se dispone de un dispositivo que viene en nuestro
auxilio: me refiero al scanner. Con él podemos "escanear" (rastrear, escudriñar) todo
documento que se nos ocurra y guardarlo digitalizado en el disco rígido.
Por ejemplo, Ud. puede hacer un dibujo a mano alzada (o como quiera), luego
escanearlo y finalmente retocarlo, colorearlo con una aplicación gráfica fotográfica.
Pero el scanner va mucho más allá. Es posible rastrear el texto de un libro para
llevarlo directamente a su procesador de texto. ¡Cuidado con esto!, es una invitación
al plagio. No se tiente con este "canto de sirena" (repase lo analizado en el tema
Ponga en claro lo suyo).
¡ Su tesis hoy (1999), debe estar hecha con todas las capacidades para procesarse,
conservarse y transmitirse íntegramente en archivos de computadora !
Un diagrama, un dibujo, una tabla, una fotografía y en general una figura habla por si
sola. No es necesario redundar en explicaciones que las mismas figuras o
ilustraciones muestran con alta propiedad.
No ponga más figuras (dibujo, tabla, diagrama, fotografía, sonido, video, etc.) que las
necesarias. Deben estar correctamente construidas según las normas. En el texto
refiérase a ellas solo en el sentido de aclarar lo que no resulta obvio, de su sola
inspección.
No pienso que haya una correlación fuerte (de cualquier modo) entre cantidad y
calidad. No hay necesidad de dejar grandes huecos de papel, para hacer la tesis más
voluminosa. Los Lectores no apreciarán grandes cantidades de texto vago o
innecesario.
¿Cuántas copias? Consulte con su asesor sobre esto. Así como para los
examinadores, las bibliotecas universitarias y usted mismo, debe hacer unas copias
del original para la distribución. Recuerde que debe tener en cuenta también las
copias informáticas de los archivo de computadora. El soporte que se impone, dado
el volumen extenso de una tesis es el CD-ROM. Si se trata de una tesina , quizá
alcance solo con un juego de disquetes. Se deben enviar estas copias a otros
científicos que trabajan en el mismo campo de investigación de manera que:
110
puedan tomar nota del trabajo que estuvo haciendo, antes de que
aparezca en las revistas especializadas;
puedan buscar los detalles finos de trabajos parciales que
conforman su tesis, los métodos y resultados que serán o han sido
publicados, sintéticamente en otra parte;
puedan finalmente descubrir ¡el maravilloso científico que es usted!
Este descubrimiento le será útil si existe una oferta de estudios
post-doctoral (o doctoral si es Ud. un maestrando) disponible en
sus ambientes. ¡Debe colocar su nombre en estas candidaturas, de
inmediato!
Independientemente de las normas de presentación de una tesis en la Universidad,
en cuanto a utilizar un solo lado o los dos de las hojas (anverso y reverso), las copias
para distribución deben ser siempre de doble faz, de manera que los gastos del papel
y las estampillas (de correo) no sean excesivos. Digamos de paso que esto va
también en favor de un más cómodo manipuleo de la encuadernación, por contener
la mitad de las hojas. Su asesor podría ayudarlo a elaborar una lista de interesados
y/o personas potencialmente útiles para tal envío masivo de copias por el correo
normal. Su asesor puede ayudar también al financiamiento de los gastos de
distribución, si es que no están cubiertas por su beca. Esto dependerá en gran
medida de las costumbres imperantes en la institución.
No se olvide de hacer una copia para sus padres, quienes como ningunos otros, se
sentirán profundamente honrados y orgullosos de merecer el alto honor de
constituirse en depositarios, de tan importante documento.
En lo personal
Está asegurado que Ud. empleará gran parte de su tiempo --quizás la mayoría--
escribiendo su tesis. Esto podría ser perjudicial para su salud física y mental. Reciba
unos cuantos consejos:
Aprenda Dactilografía
Instale su silla y computadora apropiadamente. Hay publicaciones (libros) que
abordan aspectos de una ciencia nueva denominada Ergonomía . En ellos podrá
111
encontrar sugerencias sobre: alturas relativas, posturas saludables y también
ejercicios recomendados si pasa mucho tiempo al teclado.
En esto último vale la pena asegurarse: usted no debe permitir una molestia extra en
la espalda o un dolor de cuello. Trate de intercalar sesiones largas de dactilografía
con otras actividades preferentemente físicas.
Si no sabe "escribir a máquina", ¡debe aprender a hacerlo!, tanto a causa de su cuello
como por su productividad. Hay varias aplicaciones buenas de software que enseñan
dactilografía interactivamente. Si usa uno de estos programas por lo menos 30
minutos por día, por un par de semanas, seguro podrá aprender.
Para cuando termine su tesis, podrá teclear rápidamente, con precisión y su inversión
en horas se habrá amortizado plenamente. Sea cuidadoso de no usar el ejercicio de
la mecanografía como una actividad distractiva. Tómelo seriamente.
Haga ejercicios físicos
No deje de ejercitarse físicamente en las pausas. La pérdida de estado físico le hará
sentirse mal. 30-60 minutos de ejercicio por día no es tiempo perdido para su tesis:
yo he descubierto que si no hago ejercicio regularmente, duermo menos sanamente y
por más tiempo.
¿Camine para irse al trabajo y también para retornar? Muchas personas opinan que
una caminata les ayuda a pensar, o les despeja la mente. Descubrirá que un paseo
ocasional, mejora su productividad.
Aliméntese
No se olvide de comer bien, y haga un esfuerzo por comer rico y saludablemente. No
debe perder aptitud física o arriesgarse a contraer una enfermedad en este tiempo
crítico. El ejercicio sirve para mantener el apetito. Sé que tiene poco tiempo para
cocinar, pero guarde una provisión de fruta fresca, verduras y pan. Toma menos
tiempo hacer un bocadillo, que ir al restaurante local de comida rápida... seguro que
se sentirá mejor después.
Drogas
Los escritores de tesis tienen una tradición larga de consumir café como un
estimulante y alcohol o marihuana como relajantes. El uso del alcohol y el café es
112
legal, usar marihuana no. Tomados con moderación, no parecen tener efectos
nocivos en la calidad de la tesis producida. Los excesos, sin embargo, son
obviamente contraproducentes: varios cafés cargados y a usted le costará demasiado
sentarse a trabajar; varias bebidas por la noche lo volverán más lento y torpe al día
siguiente.
Otros
Personas de su ambiente le mostrarán su afecto, así que aprécielas suficientemente.
Cónyuges, amantes, familia y amigos no se deben sub-valorar. Pase algo de tiempo
con ellos y, cuando lo haga, diviértase. Cuando esté en compañía de ellas, no
desperdicie su tiempo refunfuñando de su tesis: ellos ya la condenaron, por
mantenerlo alejado.
Si puede encontrar a un colega (otro educando) escribiendo una tesis, entonces
encontrarán terapéutico quejarse mutuamente de las dificultades. Él o ella no
requieren, necesariamente, estar en la misma disciplina en la que está usted.
Fin
La escritura de una tesis es un trabajo exigente y duro. Es también un rito importante
de transición en la vida de un estudiante. En nombre de los estudiantes universitarios
de todas las latitudes, les deseo ¡buena suerte!
113
BIBLIOGRAFÍA
1. ANDER EGG, Ezequiel “Técnicas de investigación social”. Edic. 14 Edit. 2. Cid Editor, Argentina 1980.3. ARNDT, Clara y DADERIAN, Loucine M. Administración de Enfermería.
Teoría para la Práctica con un Enfoque de Sistemas. Segunda Edición OPS. México 1980.
4. CABALLERO ROMERO, Alejandro “Criterios operativos y prácticas 5. sobre investigación científica aplicados especialmente en el estudio del
Cooperativismo”. Univ. de Lima 1984.6. CANALES , F.H. & COLS “Metodología de la investigación”. Manual 7. para el Desarrollo del Personal de Salud. Edit. Limusa Organización
Panamericana de la Salud. México 1986..8. CHAVEZ CONSTANTINO, Daniel “Metodología de la investigación en
salud”. Impreso en Calidad S. Santo Domingo D.N. Febrero de 1982.9. GONZALES, G.F. Metodología de la Investigación en Reproducción Humana.
Universidad Cayetano Heredia. Lima 1994. 10. HERNANDEZ, Roberto. “Metodología de la investigación”. Edit Mc. Graw
Hill Interamericana de México S.A. de C.V. impreso en Colombia. 1991. 11. KERLINGER, Fred. “Investigación del comportamiento”. 2da. Edición. Edit,
Interamericana. México 1982.12. LAM DE SHOJI, Julia. “Módulo autoinstructivo para elaborar proyectos de
investigación en salud”. Revista Cultural de la Asociación de Docentes U.S.M.P. Nº 9 Edit. Logos. 1995.
13. LEON, Federico y CHU, Magdalena. Investigación de Operaciones en Planificación Familiar y Salud Reproductiva. Concepto, Caos. Universidad Cayetano Heredia. Lima 1998.Biblioteca de la Facultad de Obstetricia-USMP.
14. LEON, Orfelio y MONTERO, Ignacio. Diseño de Investigación. Edit. Mc. Graw Hill. España 1997. Biblioteca de la Facultad de Obstetricia-USMP.
15. NEUPERT, Ricardo. “Manual de investigación social”. Edit. Universitaria Honduras. 1977.
16. OBLITAS GUADALUPE, Luis. “Metodología de la investigación”. Bibliografía de Psicología Peruana. Perú S/F.
17. SANCHEZ, Hugo / REYES, Carlos. “Metodologías y diseños en la investigación científica aplicados en la psicología , educación y ciencias sociales”. Edit. Educativa. Inide, Perú 1984.
18. TAMAYO TAMAYO, Mario. “El proceso de la investigación científica”. Edit. Libusa, México. 1981.
19. CAMPBELl, Mary. base IV Guía de Autoenseñanza. España. Editorial McGraw Hill – Interamericana. 1990. pp110/111,121/122,161,169, 179-191/192.
20. HARWRYSZKIEWYCZ, I T. Análisis y diseño de base de datos. Editorial Megabyte. Noriega Editores. México. 1994. pp29/31
21. LAUDON, Kenneth C. Administración de los sistemas de información. 3ra. Edición. México. 1996. pp 271/295
22. MARQUÉZ R. Omar A. El Proceso de la Investigación en las Ciencias Sociales. Ediciones de la Universidad Ezequiel Zamora colección Docencia Universitaria.
23. Hernández, Sampieri. Roberto. Metodología de la investigación 2a. Edición. Editorial McGraw-Hill, México, 1998.
114
24. Polit, Denise, F. Hungler Bernadette P. Investigación científica en ciencias de la salud, 5ta. edición. Mc-Graw Hill Interamericana, Editores, S.A. México, D.F. 1997.
25. Polit, Denise, F. Hungler Bernadette P. Investigación científica en ciencias de la salud, 6ta. edición. Mc-Graw Hill Interamericana, Editores, S.A. México, D.F. 2000.
26. Artiles Visbal, Leticia. El articulo Científico. Revista Cubana de Medicina General Integral, Abril Junio, 1995. Disponible en el URL http://bvs.sid.cu/revistas/mgi/vol11_4_95/mgi15495.htm
27. American Psychological Association (APA) (1994). Publication manual of the American Psychological Association. (4th ed.). Wasington, D. C. Disponible en http://www.apa.org
28. Day R. Cómo escribir y publicar trabajos científicos. Washington: Organización Panamericana de la salud. 1990:8,34.
29. Cazau, Pablo. Normas de Publicación de la APA. Disponible en http://www.monografias.com
30. Badal, Mauricio. Elaboración de referencias y citas según las normas de la American Psychological Association (APA), 5° Edición. Disponible en http://www.momografias.com/apa.shtml
115