domingo, 17 de mayo de 2009

SPSS PARA LA INVESTIGACION CUANTITATIVA


SPSS: UN INSTRUMENTO DE ANÁLISIS DE DATOS
CUANTITATIVOS

Resumen: En este artículo presentamos un software informático, SPSS, como instrumento de análisis cualitativo
de datos, presentamos las posibilidades básicas y más importantes del mismo. El SPSS, junto con el BMDP son los
más utilizados en investigación aplicada a las Ciencias Sociales, hemos de señalar que aunque destacamos su
utilidad, su fácil manejo y su fácil comprensión, no obstante, su uso se ve supeditada a un periodo determinado,
condicionado por una licencia, lo cual en ocasiones dificulta y entorpece poder sacar su máximo rendimiento. Esta
dirigido a alumnado que cursa materias relacionadas con la investigación educativa, en titulaciones como
educación especial, audición y lenguaje y psicopedagogía, así, como alumnos doctorandos, siendo uno de los
software que actualmente estamos impartiendo en la asignatura Métodos de Investigación en Educación de la
licenciatura de psicopedagogía
Palabras Clave: SPSS, análisis de datos cuantitativos, matriz de datos.
SPSS: Un instrumento de análisis de datos cuantitativos

1. Programas informáticos utilizados en el análisis de datos
Desde los años ochenta venimos experimentando una invasión del mundo de la informática en el campo de la investigación educativa a todos los niveles; bases de datos, bases bibliográficas... pero muy especialmente en el análisis de los datos. Los aplicaciones de la informática a la investigación son importantes, teniendo en cuenta que cada vez más la cantidad de datos que se manejan y la variedad de análisis que se realizan rebasan la capacidad del cálculo manual (Buendía, Colas y Hernández, 1997).
Una relación completa de programas de Estadística Aplicada, aparte de ser difícil de elaborar, no es el fin de esta tesis, por lo que únicamente presentamos algunos programas para el análisis de datos cuantitativos que nos pueden servir de ejemplo: BMDP, LISREL, SAS, SCA, SPAD,
CLUSTAN, BOX – JENKIS, MDS, INDSCAL, OSIRIS, STAP – PACK. Todos estos programas
son dirigidos a profesionales con un coste económico alto. A nivel más simple destacamos
SYSTAT y MINITAB, asequibles a cualquier estudiante.
Las últimas versiones de todos estos programas, operando bajo Windows, comparten una característica básica como es la disponer de una hoja, que sin llegar a ser como una hoja de cálculo, permiten la definición de variables actuando en las cabeceras de columnas, para posteriormente registrar los datos en las filas. Esta capacidad, en cierta medida anula la necesidad del empleo de una de cálculo tipo LOTUS o EXCEL como paso previo, aunque en cualquier caso es posible, posteriormente la importación de los datos desde las mismas (González – Conde, 2000).
El SPSS, junto con el BMDP son los más utilizados en investigación aplicada a las Ciencias Sociales (Bisquerra, 1989), hemos de señalar que aunque destacamos su utilidad, su fácil manejo y su fácil comprensión, no obstante, su uso se ve supeditada a un periodo determinado, condicionado por una licencia, lo cual en ocasiones dificulta y entorpece poder sacar su máximo rendimiento.
Dada la relevancia de la informática en el análisis estadístico de datos, finalizamos enumerando las ventajas e inconvenientes que podrían derivarse de ello (Álvarez, García, Gil, Martínez, Romero y Rodríguez, 2002) (ver figura 1)
USO DE LA INFORMÁTICA EN EL ANÁLISIS VENTAJAS INCONVENIENTES
Permite un importantísimo ahorro de tiempo y esfuerzo, realizando en segundos un trabajo que requeriría horas e incluso días. Hace posible cálculos más exactos, evitando los redondeos y aproximaciones del cálculo manual.
Permite trabajar con grandes cantidades e datos, utilizando muestras mayores e incluyendo más variables. Permite trasladar la atención desde las tareas mecánicas de cálculo alas tareas conceptuales:
decisiones sobre el proceso, interpretación de resultados, análisis crítico. El aprendizaje del manejo de paquetes de programas estadísticos requiere un cierto A veces, la capacidad de cálculo del evaluador supera la capacidad para comprender el análisis realizado e interpretar los resultados. Lleva a veces a una sofisticación innecesaria, al permitir el empleo de técnicas complejas para responder a cuestiones simples Figura 1 Ventajas e inconvenientes del uso de la informática en el análisis de datos (tomado de Álvarez, García, Gil, Martínez, Romero y Rodríguez, 2002)

2. Procedimiento y métodos estadísticos
El punto de partida para el análisis de datos comienza con una matriz de datos n+p. Esta matriz se registro de forma natural en las filas y columnas de una hoja del programa SPSS. Una matriz es un conjunto de valores representadas en n filas y n columnas. Nuestra matriz de datos figura en el anexo, ésta esta configurada por xxx columnas, que representa las variables investigadas y las variables investigadoras, e yyy filas que representan los casos objeto de estudio. En el anexo se incluyen las matrices de esta investigación, esta por razones de espacio ha tenido que ser seccionada en diversos fragmentos. Una vez recogidos los datos, procedimos a describirlos y a resumirlos. Esta descripción se efectúo mediante descripciones gráficas (polígonos de frecuencias, curva normal..) y descripciones numéricas (promedios, medidas de variabilidad,
forma de la distribución, medida de la relación entre variables...).
Las técnicas multivariables, son según Bisquerra (1989) aquellas técnicas que se aplican al análisis de muchas variables, siendo el tratamiento de los datos, por tanto, multidimensional. Recogiendo las aportaciones de diversos autores el profesor Bisquerra (1989) propone una clasificación de los métodos multivariables. Los criterios clasificatorios son: (i) métodos descriptivos o explicativos, (ii) número de variables dependientes,
(iii) escalas de medida-. En cierta forma, esta clasificación es considerada por el autor como un intento de algoritmo conducente a la determinación del método más adecuado para las características del problema objeto de estudio. En él se formulan una serie de preguntas que facilitan la toma de decisión.
3. Descripción del SPSS
El SPSS (Statistical Product and Service Solutions) es una potente herramienta de tratamiento de datos y análisis estadístico.
Estructura general
􀃖 Al iniciar una sesión aparece una ventana Editor de datos, es la ventana principal, similar a una hoja de cálculo. Esta ventana muestra dos contenidos diferentes:
a. Los datos propiamente dichos.
b. Variables del archivo acompañadas del conjunto de características que las definen.
􀃖 La barras de menús contienen una serie de submenús desplegables que permiten controlar la mayoría de las acciones que el SPSS puede llevar a cabo (ver imagen 1):
Imagen 1 Ventana del editor de datos
- Proceso Sirve para crear nuevas funciones y subgrupos de procesamiento, controlar color y tipo de letra de letra de las palabras clave.
- Depurar Permite depurar procesos básicos y acceder a un editor de objetos.
- Formato Permite cambiar la apariencia de textos, gráficos...
- Analizar Contiene todos los procedimientos estadísticos.
- Gráficos Permite generar todo tipo de gráficos.
- Utilidades Permite obtener
Información sobre las variables y sobre el archivo de datos.
- Ventana Permite cambiar de una ventana a otra dentro del SPSS y minimizar todas las ventanas abiertas.
Barra de herramientas, es un conjunto de botones-iconos que permiten ejecutar algunas de las funciones anteriores del SPSS de forma rápida y sencilla.
. Una sesión con el SPSS
Esta sesión es estándar, y en ella desarrollamos las siguientes tareas básicas:
- Abrir un archivo de datos:
el archivo titulado Análisis de Necesidades seleccionarlo, pulsar dos veces el botón derecho del ratón (o, alternativamente,
seleccionarlo y pulsar el botón Abrir).
- Ejecutar un procedimiento estadístico:
Analizar seleccionar Estadísticos descriptivos Frecuencias (igual forma de proceder con los otros estadísticos).
Gráficos Frecuencias
Seleccionar las opciones Histograma y con curva normal Continuar Aceptar.
- Examinar los resultados:
La ventana del Visor de resultados se encuentra dividida verticalmente en dos panales:
a. Esquema del Visor (panel izquierdo), que contienen un índice de los resultaos generados por el SPSS.
b. Contenido del Visor (panel derecho), que contienen los resultados (texto, tablas y gráficos) generados por el SPSS.
- Imprimir: Seleccionar la opción Imprimir del menú Archivo.
- Salir del SPSS: La opción Salir cierra el programa.
El editor de datos
Un archivo de datos puede crearse de dos formas:
I.1. Introduciendo datos directamente en el Editor de datos.
I.2. Importando la información ya existente de alguna fuente externa (archivo de texto, hoja de cálculo o una base de datos).
La estructura del Editor de datos del SPSS
es siempre la misma:
- Las filas representan casos.
- Las columnas representan
Modificar archivos de datos
Los archivos de datos no siempre están organizados de forma idónea. En ocasiones puede ser interesante cambiar el orden de los casos, trasponer filas y las columnas. Todas estas opciones se encuentran en el menú Datos.
Características descriptivas de la muestra
Análisis descriptivo: Frecuencias y descriptivos
En este punto describimos dos procedimientos que permiten obtener la información necesaria para caracterizar apropiadamente tanto variables categóricas como cuantitativas: el procedimiento Frecuencias y el procedimiento Descriptivos.
. Procedimiento de análisis
Métodos explicativos
Contrastes sobre medias:
Procedimientos Medias y Prueba t
- Analizar , Comparar medias , Prueba t para dos muestras independientes seleccionar la variable independiente definir la variable de agrupación (por ejemplo género) definir grupos.
Análisis de correlación lineal (bivaraidas)
- Analizar Correlaciones Bivaraidas Seleccionar variables
cuantitativas y llevar a la lista de variables (al menos dos)􀃆 seleccionar
coeficiente de correlación (Pearson) Marcar correlaciones significativas.
Métodos descriptivos
Análisis de conglomerados:
Procedimiento K-medias
- Analiza, Clasificar
Conglomerados de K medias, seleccionar Variables numéricas y trasladarlas a la lista de variables opcionalmente seleccionar una variable para identificar los casos en las tablas de resultados y en los gráficos y trasladarla a la lista de Etiquetar casos
Determinar Nº de conglomerado , método (iterar y clasificar y solo clasificar)
1.13. Análisis factorial
- Analizar, Reducción de datos, análisis factorial Seleccionar el conjunto de variables que se desea analizar y trasladarlas a la lista de variables Pulsar Descriptivos:
Estadísticos (descriptivos univariados) y Matriz de correlaciones (coeficientes, nivel de significación, determinante, inversa, reproducida, anti – imagen, KMO y prueba de esfericidad de Barlett)
Extracción: Seleccionar Método (Componentes principales, Mínimos cuadrados no ponderados, Mínimos cuadrados generalizados, Máxima verosimilitud, Ejes principales, Alfa e Imagen), Analizar (Matriz de correlaciones o Matriz de covarianza), Extraer (Autovalores mayores que, Número de factores) y Mostrar (solución factorial sin rotar y gráfico de sedimentación), Nº de iteraciones por convergencia 􀃆 Rotación: Seleccionar
método (Ninguno, Varimax, Equamax, Oblimin directo y Promax) y mostrar (solución rotada, gráfico de saturaciones)
􀃆 Opciones: Valores perdidos y (Excluir casos según lista, Excluir casos según pareja o reemplazar por la media)
Formato de visualización de los coeficientes (ordenados por tamaño y suprimir valores absolutos menores que).
Otros análisis
Análisis de variables de respuesta múltiple
La expresión variables de respuesta múltiple se utiliza para identificar variables en las que los sujetos pueden dar más de una respuesta, es decir, variables en las que un mismo sujeto puede tener valores distintos.
- Crear tantas variables dicótomicas como alternativas de respuesta tiene la pregunta En el editor de datos se recoge en primer lugar las variables dicótomicas en las que el valor 1 indica que sí es necesario ese tipo de orientación y el valor 0 que no es necesario (método de dicotomías múltiples). Las últimas tres columnas nos ofrecen la misma información que las cuatro variables dicótomicas, pero en formato de categorías múltiples. Así, el primer sujeto ha marcado dos
categorías: académica y profesional, luego en la variable Resp 1 tiene un 1 (código correspondiente a académica) y en la variable Frecuencias