sábado, 13 de agosto de 2011

Tablas de Contingencia y Medidas de Asociación.

La prueba de Chi Cuadrado de Pearson en Tablas de Contingencia.
Una parte importante del análisis de datos provenientes de variables dicotómicas, variables en escala nominal, ordinal, o en escala de intervalo o de razón, se realizan con el SPSS por medio de tablas de contingencia, que facilitan la obtención de diversos estadísticos apropiados para realizar el análisis descriptivo e inferencial de la información social.
La prueba de Chi cuadrado de Pearson, se aplica en aquellos casos en que se disponga de una tabla de contingencia con “r” filas y “c” columnas correspondientes a la observación de muestras dos variables de X e Y, con r y c categorías respectivamente. Se utiliza para contrastar la hipótesis nula:
Ho: Las variables X e Y son independientes

Si el p-valor asociado al estadístico de contraste es menor que α, se rechaza la Ho al nivel de significancia establecido, usualmente α = 0.05, (Ferran, A. M., 1996).

Para desarrollar las tablas de contingencia, la rutina de comandos a seguir es: Analizar/Estadísticas Descriptivas/Tablas de Contingencia/ en la ventana de diálogo Filas(s), debe incluirse la variable que se desea aparezca en la hilera o fila de la tabla, -es la variable independiente (X)-, en este caso se incluye la variable ¿Fuma Usted?; y en la ventana de diálogo Columna(s), debe incluirse la variable que se desea aparezca en la columna de la tabla, -la variable de la columna es la variable dependiente (Y)-, en este caso se incluye la variable Sexo. Luego, si desea los gráficos selecciona la opción Mostrar los gráficos de barras agrupados, para generar el gráfico bivariado correspondiente a estas variables. En la ventana Estadísticos, seleccionar Chi Cuadrado; después en la ventana Casillas, se selecciona Observados, si desea marca también los Esperados (en este caso no los tomare), a fin de obtener los valores observados (y esperados); se selecciona Fila, Columna y Total, para obtener los porcentajes de la tabla por hilera, columna y total. Finalmente dar Aceptar.

El estadístico Chi cuadrado, se construye a partir de las diferencias entre las frecuencias observadas y esperadas bajo la hipótesis de independencia. Dado que se obtuvo un valor de significancia mayor de 0.05, se Acepta la Ho de independencia entre las variables ¿Fuma Usted? y Sexo. Es decir, Ser hombre o mujer no influye en fumar.

Siguiente Ejm.:
Me planteo por ejemplo si el ser fumador o no influye en estar de acuerdo con que se suban los impuestos.


P<0,05. Hay dependencia. Si influencia.
Fumar o no lleva a tener una opinión diferente respecto al pago de impuestos.

PASW como herramienta tecnológica para el análisis de datos cuantitativos

Qué es PASW (SPSS)?

Es uno de los programas de estadística más difundidos en las ciencias sociales para procesar investigaciones cuantitativas. En tal sentido, la gran mayoría de las encuestas que se realizan en el país son procesadas con este programa. “Procesar” no es otra cosa que manipular la base de datos con las respuestas dadas por los encuestados, con el objeto obtener una aproximación respecto a la cantidad de personas que responden cada una de las opciones dadas en las distintas preguntas formuladas en el cuestionario
Ofrece ventajas de realizar cálculos más complejos de la estadística de manera eficiente y eficaz, y con un mínimo de esfuerzos.

Para qué sirve?
Importancia de procesamiento de datos por parte del investigador (manejar sus propios datos sin errores).
Es imprescindible que el investigador mantenga el control de la situación en todo momento, y sea él quien se convierta en el tomador de decisiones; ya que el software lo único que hace es obedecer una orden, pero no manifiesta en ningún momento si el diseño de nuestro estudio es el adecuado, si la técnica es la idónea, etc.

¿Por qué crear SPSS?
  Investigadores de las ciencias sociales NO somos matemáticos.
  SPSS hace el trabajo matemático por nosotros.
  Investigador de ciencias sociales hace trabajo conceptual.
  SPSS= Poder hacer procedimientos matemáticos sin preocupación de cálculos.
  Necesitamos saber qué hacer mas no cómo hacerlo.

Datos.
 —  Aspectos previos a la preparación de datos.
 —  Vista de menús ->Vista de datos, vista de variables


 —  Formatos de los datos
 —   Matriz de datos
 —   Menú vista variables

Base de datos (Data) 
La base de datos es una planilla similar a la que encontramos en Ms. Excel. Esta base constituye el componente central del programa, dado que en ella se encuentran todas las respuestas dadas por los entrevistados.


 
Output
Una vez conformada la base de datos y ejecutadas las funciones necesarias como para obtener los datos necesarios para analizar el universo, sólo resta describir la manera en que el programa expone los resultados. Estos son presentados en el tercer componente del programa denominado “output” bajo la forma de cuadros, con porcentajes relativos y cruces de datos entre variables.
Obtener frecuencias.
 —  Ir al margen superior y seleccionar la opción “Analizar”
 —  Dentro de “analizar” seleccionar “Estadísticos Descriptivos
     Dentro de “estadísticos descriptivos” se debe seleccionar “frecuencias


 —  Una vez que se abre el cuadro de diálogo de “frecuencias” aparecerá a la izquierda el listado con todas las variables/columnas de la base de datos. Lo único que se debe hacer es seleccionar las variables donde se quieren obtener porcentajes y pasarlos al listado de la derecha.
 —  Los resultados serán expuestos en el componente “output”. El cuadro presentará resultados de la siguiente manera:


Hasta aquí la clase de hoy…