ASIGNATURA
Técnicas Cuantitativas Módulo 1. Organización, Preparación y Manejo de Datos Autores: Prof. Roberto Alonso, Prof. Daniel Vázquez Vargas y Prof. Sylvia Fischer
Marzo 2012
Tecnicatura Superior en Gestión y Administración Universitaria Departamento de Planificación y Políticas Públicas UNLa. Virtual / Universidad Nacional de Lanús
Universidad Nacional de Lanús Rectora Dra. Ana Jaramillo Vicerrector Mg. Nerio Neirotti Directora Departamento de Planificación y Políticas Públicas Mg. Ana Farber Director Tecnicatura Superior en Gestión y Administración Universitaria Dr. Jorge Molina
© Universidad Nacional de Lanús UNLa Virtual Coordinadora Campus Virtual UNLa Prof. Laura Virginia Garbarini Asignatura Técnicas Cuantitativas Módulo 1. Organización, Preparación y Manejo de Datos Autores: Prof. Roberto Alonso, Prof. Daniel Vázquez Vargas y Dra. Sylvia Fischer Coordinación Pedagógica: Mg. Mónica Perazzo Procesamiento Didáctico: Lic. Roxana Pascolini Diseño Gráfico: DG Andrea Gergich Diagramación: DG Beatriz Acosta Marzo 2012
Índice M1 Índice de íconos
VI
Presentación Objetivos Estrategias metodológicas Bibliografía básica para el alumno Sitios de Internet utilizados y recomendados Evaluación
1 1 1 2 2 2
M1. Técnicas cuantitativas
3
1. Historia de la organización de la información
3
2. Datos e información
5
2.1. Qué son los datos 2.2. Qué es la información
5 6
Actividad A.1.1.
7
3. Hipótesis de Investigación
7
Actividad A.1.2.
8
3.1. Diseño, validez y fiabilidad 4. Fuentes de información
8 9
Actividad A.1.3. 4.1. Organización y Sistematización 5. Conceptos, variables y casos
10 10 10
Actividad A.1.4.
12
5.1. Dimensiones, áreas, categorías e indicadores 6. Unidades de análisis
13 14
Actividad A.1.5.
14
7. Precisión y Exactitud
14
8. Población y Muestra
16
Actividad A.1.6. 8.1. Muestras probabilísticas y no probabilísticas. Elementos de diseño muestral
16 17 IV
8.2. Matriz de datos
18
Actividad A.1.7.
20
Foro
20
Bibliografía
21
V
Índice de íconos
Actividad
Foro
Lectura obligatoria
Lectura recomendada
Referencia externa
Referencia interna
VI
Presentación El propósito del presente módulo es analizar las herramientas conceptuales básicas que regulan las prácticas ligadas al análisis de datos y la investigación. La investigación científica pretende describir y comprender fenómenos cuya particular característica es la complejidad. Precisa para ello de la elaboración y utilización de conceptos instrumentales que permitan el análisis sistemático y riguroso tanto de aspectos físicos del mundo, como de aquellos de índole social, económica y cultural. Una estrategia posible para producir conocimiento es ver lo que nos rodea en términos de relaciones entre cantidades que configuran aquello que aparece ante nosotros, los fenómenos. Las técnicas cuantitativas pretenden, entonces, brindar elementos que procuren orden, sistematicidad, rigor y objetividad a las observaciones que realicemos sobre la realidad. De esta manera términos tales como dato, información, dimensión o variable no son más que conceptos elaborados para tal fin. Junto con el desarrollo de esos conceptos analizaremos también diversas técnicas que tienen la misma finalidad, ordenar y sistematizar el conjunto de nuestras percepciones.
Objetivos Esperamos que los estudiantes logren: Reconocer los conceptos básicos que constituyen y regulan las prácticas de la investigación. Adquirir nociones ligadas al diseño de experiencias y a la obtención de información.
Estrategias metodológicas El módulo desarrolla su contenido en un contexto que recupera elementos propios de las prácticas de la investigación y el análisis de datos. Tanto los ejemplos que se brindan como las actividades que se proponen están diseñados en ese marco. 1
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
La realización de las actividades por parte de los cursantes requiere, además de la atenta lectura del material bibliográfico, pensar en los conceptos como instrumentos de análisis e indagación.
Bibliografía básica para el alumno Blanch N. y Joekes. S. (1997): Cuadernillos del curso de postgrado “Estadística aplicada a la investigación”. Universidad Nacional de Córdoba, Facultad de Ciencias Económicas. Yuni J. y Urbano C. (2006): Técnicas para investigar 2. Recursos metodológicos para la preparación de proyectos de investigación. Editorial Brujas.
Sitios de Internet utilizados y recomendados http://es.wikipedia.org/wiki/Wikipedia:Portada www.sectormatematica.cl/media/NM4/NM4_como_producir_datos.doc http://mmujica.files.wordpress.com/2007/03/material-2-de-investigacion.pdf
Evaluación Las evaluaciones parciales pretenden rescatar los aprendizajes propios de la unidad y deben servir de síntesis a los cursantes en cuanto a la preparación para la instancia final presencial. Las actividades que las conforman son obligatorias y deberán ser entregadas al docente para su evaluación.
2
1
Organización, Preparación y Manejo de Datos 1. Breve historia de la organización de la información Hoy en día, la importancia de la recolección y el uso de datos ya no se discute. Sin lugar a dudas, la constante mejora en el equipamiento informático favorece el auge de la Era de la información.
Augusto de Prima Porta, estatua de César Augusto en el Museo Chiaramonti, Ciudad del Vaticano, Roma. Fuente: es.wikipedia.org
Pero el manejo de datos no es una práctica propia del siglo XXI o de fines del siglo XX. De hecho, debemos remontarnos varios siglos atrás para encontrar los primeros antecedentes. Por ejemplo, en el Antiguo Testamento podemos hallar referencias a censos. También en Egipto y Babilonia se llevaban registros detallados de la población y sus recursos. Aunque otras fuentes afirman que las primeras estadísticas de las que se tienen noticias datan de China allá por el 2200 a.C.
Nos trasladamos ahora a la era romana, durante la cual podemos recordar el famoso censo de población de Augusto. Cabe mencionar que los romanos, además de censos de población, registraban recuentos de nacimientos y defunciones, anotaban datos sobre la población agrícola y demás. En realidad, los romanos fueron maestros de la organización política. Por ejemplo, realizaban un censo de la población cada cinco años y hacían recuentos periódicos del ganado y de las riquezas de las tierras conquistadas. En tiempos del naci3
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
miento de Cristo, sucedía uno de estos empadronamientos de la población, bajo la autoridad del imperio. A partir de la declinación del imperio romano sobrevino una época en la que se daba poca importancia a los datos. Pocos hechos merecen ser mencionados, tal vez el que más sobresale es el acontecido en el año 762 dC, año en que el emperador Carlomagno requirió información detallada de las propiedades de la iglesia. Seguimos adelante en el tiempo, hasta la época en que el registro de datos comenzó a transformarse en una práctica menos aislada. En el año 1532 comenzó el registro de las defunciones en Inglaterra y, también en esos años, en Francia, se les exigió a los clérigos registrar los bautismos, fallecimientos y matrimonios. Un siglo más tarde, en 1662, John Graunt usó documentos que abarcaban treinta años de nacimientos y fallecimientos por sexo para predecir las proporciones de nacimientos y el número de muertos por distintas enfermedades. De hecho, muchos historiadores sitúan el inicio de la estadística moderna a partir de la publicación de su famoso libro, cuya imagen de la tapa incluimos aquí.
Fuente: eumed.net
A decir verdad, a lo largo del siglo XVII hubo una continua mejora en los métodos de observación y análisis cuantitativo, y los científicos mostraban especial interés en la Estadística Demográfica ya que por esos tiempos se debatía si la población aumentaba, decrecía o era constante. Bien vale mencionar una anécdota que refleja el espíritu de esos tiempos respecto del uso de datos, en lo que se considera como el primer empleo de la estadística para analizar cuestiones no relacionadas con la política:
Fuente: es.wikipedia.org
En 1691, un profesor alemán llamado Gaspar Neumann se propuso destruir la antigua creencia popular de que en los años terminados en siete, moría más gente que en los restantes. Para alcanzar su objetivo estudió concienzudamente los archivos parroquiales de la ciudad y, después de revisar miles de partidas de defunción, pudo demostrar que en dichos años no fallecían más personas que en los demás.
4
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Asimismo y en forma paralela, durante los siglos XVII y XVIII se desarrolló la teoría de probabilidades tomando como primer objeto de estudio a los juegos de azar. Durante los siglos XVIII y XIX, tanto la Estadística como la Teoría de Probabilidades amplían su campo de aplicación al ser adoptadas en el ámbito científico. Por esos años -para ser más precisos en 1760- Gottfried Achenwall se convierte en el primer tratadista que usó el término Estadística –en realidad él utilizó 'Statistik'–, extrayéndolo del término italiano statista –estadista–. Creía que esta novedosa ciencia se convertiría en el mejor aliado del gobernante consciente. Como decíamos al principio, durante el siglo pasado y el actual, la recolección de información de la más variada clase, se ha transformado en una costumbre. El acceso a la información y el procesamiento y análisis de la misma ya no es algo restringido a unos pocos expertos iluminados, sino que hoy en día está disponible para un amplio sector de la población. Por eso adquieren gran importancia las herramientas conceptuales para poder interpretar y/o analizar la información disponible. Una de estas herramientas es el Análisis Cuantitativo, cuyas técnicas están directamente relacionadas con la probabilidad y la estadística. Y justamente serán los conceptos básicos de estadística y probabilidad los que nos acompañarán cuando presentemos y desarrollemos diversas técnicas cuantitativas en éste y los siguientes módulos.
2. Datos e información Pasemos ahora al estudio de los conceptos fundamentales relacionados con la organización de la información. Comencemos por el principio...
2.1. ¿Qué son los datos? Los datos constituyen una manera de describir sucesos y entidades. Un dato es una característica de un objeto o una idea, y en general se considera que es una expresión elemental de contenido sobre un tema. El dato aislado no tiene sentido en sí mismo, pero si recibe un tratamiento –procesamiento– adecuado, puede ser utilizado para tomar decisiones. A través del procesamiento de los datos se obtiene información. Un dato por sí mismo no constituye información, es el procesamiento de los datos lo que nos proporciona información.
5
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Ejemplo
Ejemplos de datos son: la altura de una persona o su fecha de nacimiento, el número de personas que viven en una ciudad, la cantidad de alumnos inscriptos en una universidad, la distancia entre dos sitios, la religión mayoritaria de un país, etc., etc.
Si el procesamiento de los datos es clave, pasemos entonces al siguiente concepto, tal vez el más importante: el de información.
2.2. ¿Qué es la información? La información es un conjunto organizado de datos procesados que constituyen un mensaje sobre un determinado objeto o fenómeno. No todos los datos se pueden transformar en información, y una parte del trabajo de procesamiento incluye la selección de los datos útiles –pertinentes– para obtener información. La generación de información tiene distintos objetivos según el ámbito, por ejemplo permite proporcionar a quien toma decisiones los elementos necesarios para hacerlo. Sin embargo, hay que tener en cuenta que la información por sí sola no dota al individuo de más conocimiento, sino que es él quien tiene que valorar cuáles son los aspectos significativos, organizarla y convertirla en conocimiento. Veamos un ejemplo para poder comprender mejor la idea de información. Ejemplo
Supongamos que estudiamos la situación socioeconómica de los países y consideramos que la idea de densidad de población debe estar incluida en nuestro análisis.
Entonces, para poder obtener la densidad de población de cada país, debo recolectar los siguientes dos datos: población y superficie. A partir del procesamiento de estos dos datos, en este caso particular calculando población / superficie, puedo obtener la información que necesito.
6
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
A.1.1. Seguimos con el estudio de la situación socioeconómica de un país. En esta oportunidad necesitamos información sobre: - Proporción de personas alfabetizadas en la población. - Distribución de la población –en porcentaje– de hombres y mujeres. Le proponemos que: a. Determine los datos que necesita recolectar. b. ¿Qué operaciones debe realizar en cada caso para procesar los datos y obtener la información solicitada. En el ejemplo que utilizamos, podemos notar que se ha definido una situación particular, un objetivo a estudiar. Profundicemos en este tema...
3. Hipótesis de investigación Una hipótesis de investigación es un elemento fundamental en el proceso de indagación llevado adelante en un estudio determinado. Después de formular un problema, el investigador enuncia la hipótesis que orientará el proceso y permitirá llegar a conclusiones concretas del proyecto que recién comienza. La hipótesis es una afirmación –o negación– provisoria formulada para responder tentativamente a una pregunta. En general una hipótesis describe el tipo de relación que se espera encontrar. Veamos esto más en detalle mediante un par de ejemplos: Ejemplo - Estudiamos algunas características que nos permitan describir la relación entre educación y nivel cultural –estamos estudiando relaciones–. - Pretendemos analizar si el nivel educativo impacta sobre el nivel económico –estamos estudiando causas–.
Por lo tanto, la hipótesis es el elemento que condiciona el diseño de la investigación, ya que ayuda a definir y enfocar en el problema y a organizar el pensamiento. Generalmente a partir de las hipótesis es posible realizar predicciones de lo que sucedería con los objetos de estudio si la hipótesis fuera verdadera. Entonces el siguiente paso es obtener información empírica sobre los objetos de estudio y evaluar si las predicciones se cumplen o no. Y para obtener información, será necesario recolectar datos. 7
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
A.1.2. La siguiente tabla representa en forma parcial resultados del ONE – Operativo Nacional de Evaluación– para Matemática en el tercer año de la escuela primaria realizado por el Ministerio de Educación durante el año 2007. Ud. está dispuesto a investigar sobre el rendimiento en matemática en la escuela primaria. Cuadro 2.1.5 Porcentaje de alumnos por nivel de desempeño en Matemática de 3º año de la Educación Primaria. Total país, según ámbito y sector de gestión. - ONE 2007 Ámbito y sector de gestión
Bajo
Medio
Alto
Medio y Alto
Total país
31,8
43,1
25,1
68,2
Urbano estatal
36,6
43,8
19,6
63,4
Urbano privado
15,0
44,4
40,6
85,0
Rural
37,3
37,1
25,7
62,8
Fuente: Ministerio de Educación - DINIECE
a. Lea atentamente los datos y formule una pregunta que pueda transformarse en un problema de investigación. b. De acuerdo con la pregunta que se haya formulado en el punto anterior, elabore una hipótesis. Después de establecer la hipótesis de investigación, de acordar cuál será su objeto de estudio y cómo se lo analizará, ¿cuál será el siguiente paso? Seguramente pasar a la acción, pero antes debemos saber de qué forma pasaremos a accionar...
3.1. Diseño, validez y fiabilidad Una vez formulada la hipótesis, el siguiente paso es diseñar la metodología de recolección de los datos en los objetos de estudio para poder contrastarlos con las predicciones. El diseño de la recolección de datos es un momento importante en el desarrollo de una investigación. El método de recolección de datos está constituido por la secuencia de pasos o etapas que se realizan en función de la búsqueda, adquisición y recopilación de los datos necesarios para alcanzar los objetivos planteados en el estudio, e incluye diferentes etapas: Etapa de planificación: En esta etapa se define y planifica el conjunto de acciones que serán ejecutadas en las etapas siguientes. Sus objetivos fundamentales son: 8
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
a. Precisar los datos que se requieren para alcanzar los objetivos del estudio. b. Seleccionar la forma de observación o medición. c. Indicar la escala de medición de cada variable. d. Seleccionar las técnicas e instrumentos para la recolección de datos. e. Definir las formas y etapas del trabajo en el terreno. f. Precisar el flujo de la información. g. Determinar el nivel de competencia necesario para el personal que va a intervenir, y su entrenamiento. h. Determinar las técnicas y equipos de medición que se utilizarán. i. Forma y tiempo que deberá conservarse la información. Etapa de ejecución: En la misma se llevan a la práctica las acciones planificadas en la etapa anterior. Etapa de verificación: En esta etapa se comprueba la validez y confiabilidad de la información recogida, garantizando así que ésta sea lo más objetiva y precisa posible, es decir que se corresponde con los hechos reales. Tenemos entonces determinado cuál será el camino, pero necesitamos saber dónde está la información, y de qué forma la obtendremos. ¿Qué haremos? ¿Buscaremos la información recurriendo a personas? ¿Buscaremos en Internet? ¿Leeremos la sección económica de periódicos especializados?...
4. Fuentes de información Dependiendo del tipo de pregunta, existen numerosas técnicas para la obtención de datos sobre los objetos de estudio. Algunos ejemplos son: - El censo: consiste en la obtención de datos procedentes de todos los elementos de la población u objeto de estudio. - La encuesta: A diferencia del censo, la encuesta se aplica sólo a una muestra de la población u objeto de estudio. - La entrevista: Es la técnica de obtención de información a través del diálogo, por lo que requiere de ciertas habilidades por parte del entrevistador. La entrevista puede o no estar estructurada a partir de un cuestionario. - El registro: Consiste en recoger información sobre determinadas variables en forma sistemática y continua o periódica.
9
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Por otro lado, independientemente de la técnica de obtención de datos que se utilice, podemos diferenciar distintos instrumentos para la recolección de datos. A continuación mencionamos algunos ejemplos: - Cuestionario: Es un instrumento que generalmente se utiliza para el censo y la encuesta, y eventualmente en la entrevista. Consiste en una serie de preguntas específicas que permiten evaluar una o varias variables definidas en el estudio. - Planilla de recolección de datos: Es un instrumento muy utilizado con la finalidad de facilitar la recopilación referente a cada elemento de la muestra o población. La información obtenida, como resultado de las mediciones de las variables, es recogida en una planilla específicamente diseñada al efecto. - Base de datos: Es la forma organizada y estructurada de recopilar información obtenida de todos los elementos estudiados.
A.1.3. Supongamos que le encargan planificar una investigación sobre la evolución en los últimos tres años de ciertas características –cantidad, distribución por edad y sexo– de la matrícula en la universidad en la que Ud. se desempeña. a. Le proponemos que elabore un plan para la recolección de datos. Para ello responda a los incisos a; b; c; y d: indicados en el ítem sobre planificación.
Ver página 8, Etapa de planificación
b. En su opinión ¿Cuál es la técnica para la obtención de datos adecuada?
4.1. Organización y sistematización Una vez recolectados los datos es necesario organizarlos, clasificarlos y resumirlos adecuadamente, de manera que sea posible un mejor análisis de la información obtenida. Para esto se utilizan distintos tipos de medidas resumen y análisis gráficos, que serán desarrollados en profundidad en los próximos módulos. Sigamos entonces adelante con la configuración de nuestro estudio, precisando mejor el camino entre conceptos y datos...
5. Conceptos, variables y casos El proceso de investigación relaciona conceptos y variables, los conceptos son abstracciones que representan fenómenos empíricos y para pasar de la etapa conceptual de la investigación a la etapa empírica, los conceptos se convierten en variables. 10
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Las propiedades del objeto de estudio consideradas en la hipótesis, están formuladas en términos abstractos, en conceptos, lo cual con mucha frecuencia impide que en la práctica puedan ser observadas y medidas directamente. Estas propiedades del objeto de estudio que no son cuantificables directamente, son llevadas a expresiones más concretas y directamente medibles mediante un proceso que se llama operacionalización de las variables. La variable es determinada característica o propiedad del objeto de estudio, a la cual se observa y/o cuantifica en la investigación y que puede variar de un elemento a otro de la población, o en el mismo elemento si éste es comparado consigo mismo al transcurrir un tiempo determinado. En unas situaciones se determina en qué cantidad está presente la característica, en otras, sólo se determina si está presente o no. Se pueden diferenciar dos grandes clases de variables: las que obtienen información cualitativa y variables que obtienen información cuantitativa. Dentro de las variables cualitativas distinguimos dos tipos: Variables cualitativas nominales: son aquellas cuyos posibles valores son clases o categorías, que clasifican los elementos observados. Ejemplos de este tipo de variables son: - sexo –femenino o masculino– - estado civil –casado, soltero, divorciado, viudo, otros– - nombre –Daniel, Roberto, Sylvia, Mónica, Roxana,...– - equipo de fútbol favorito –no haremos una lista para no molestar a los equipos que no incluyamos– - color preferido –rojo, verde, amarillo,...–. Variables cualitativas ordinales: son aquellas cuyos valores son categorías o clases que clasifican y ordenan los elementos observados. Podemos mencionar los siguientes ejemplos: - estrato social –bajo, medio, alto– - nivel educativo –sin educación, educación básica, media, superior–. Este tipo de variables se miden con una escala ordinal, que clasifica los objetos en forma jerárquica, según el grado que posea una característica determinada. Este tipo de escala no nos da una idea de distancia entre una categoría y otra, o cuánto mayor es una de otra. Por ejemplo podemos ordenar las categorías de nivel educativo –sin educación < educación básica < media < superior–1, pero es claro que no podemos decir que la distancia entre 'sin educación' y 'educación básica' es la misma distancia que entre 'educación básica' y 'educación media'.
1. Tan sólo para refrescar la memoria, A < B significa que A es menor que B.
11
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Pasemos a la otra clase de variables: las cuantitativas se miden con escalas de intervalo, en las cuales la distancia entre dos puntos cualesquiera es cuantificable. Este tipo de variables pueden clasificarse en: Variables cuantitativas discretas: son aquellas cuyos valores forman un conjunto numerable de números, que surgen frecuentemente de un conteo, como por ejemplo número de hermanos. Variables cuantitativas continuas: son aquellas cuyos posibles valores forman un intervalo de números reales y que resultan normalmente de una medición, como por ejemplo estatura o peso de un individuo. Debe quedar claro que la diferencia entre los dos tipos de variables cuantitativas tiene que ver con los valores intermedios: no podemos considerar tener un hermano y tres cuartos, pero podemos pesar 70,75 kg. Es más, podríamos obtener el peso en gramos o incluso en miligramos, cosa imposible para la cantidad de hermanos. No obstante esto, muchas variables continuas son “discretizadas” en su uso diario. Por ejemplo, habitualmente medimos edad en años –¡no en segundos!–, peso en kilos, etc. Ya es hora de que Uds. muestren su capacidad con la siguiente...
A.1.4. Determine el tipo de variable que corresponde a cada ítem: - Cantidad de tarjetas de débito que tiene una persona - Dentro de una universidad, pertenencia de docentes a las diferentes facultades - Tipo de mascota de una familia - Número de integrantes de una familia - Color de ojos de las personas - Continente al que pertenece un país - Habitantes de una ciudad - Tiempo de vida de un mosquito - Número de universidades públicas de países de América - Temperaturas mínimas diarias en una ciudad - Grados militares en el ejército - Tipo de películas preferidas - Peso de un bebé al nacer
Las variables se observan o miden sobre individuos o elementos de la población, y cada elemento sobre el cual se mide u evalúa una o más variables, constituye un caso. 12
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
5.1. Dimensiones, áreas, categorías e indicadores Como ya mencionamos en el punto anterior, en muchos estudios nos encontramos con variables que son complejas, están formuladas en términos de conceptos y por lo tanto no son cuantificables directamente. Entonces, para transformar una variable conceptual –la que representa la idea que queremos estudiar– en una variable que se puede cuantificar de alguna manera, son necesarios algunos elementos intermedios. Estos elementos intermedios son las dimensiones y los indicadores. No es muy difícil entender que obtener datos como superficie de países o altura de edificios es diferente a obtener 'imagen de un gobierno' o 'inteligencia de una persona'; queda claro que para llegar a medir correctamente estos dos últimos conceptos no sirve preguntar “¿Cómo es la imagen de tal gobierno?” o “¿Ud.es inteligente?”. Considerando esta situación de variables complejas, algunos autores proponen que la operacionalización de la hipótesis se debe trabajar de la siguiente forma: Hipótesis, variables, conceptos, dimensión, indicador. Tal vez podamos comprender mejor esto observando el siguiente ejemplo: Pensemos en un estudio que analice la siguiente cuestión: “Los alumnos que reciben un curso de técnicas de redacción y análisis, elaboran su monografía con mayor calidad, que los que los alumnos que no reciben este curso.” Veamos una posible organización:
HIPÓTESIS
VARIABLE
DEFINICIÓN CONCEPTUAL
DEFINICION OPERACIONAL
DIMENSION
INDICADOR
Los alumnos que reciben un curso de técnicas de redacción y análisis, elaboran su monografía con mayor calidad, que los alumnos que no reciben este curso.
VARIABLE INDEPENDIENTE reciben un curso de técnicas de redacción y análisis.
Adquisición y aplicación de conocimientos para redactar y analizar información.
Participación en el curso.
Horas de asistencia al curso.
Número de horas dedicadas al curso.
Aplicación de las técnicas.
Conocimiento de técnicas de redacción.
Número de técnicas que domina.
Aplicación de las técnicas.
Número de técnicas que aplican
Cantidad de ideas coherentes.
Cantidad de ideas coherentes.
Relación de las ideas con los objetivos.
Número de recomendaciones sencillas y aplicables a la solución del problema.
VARIABLE DEPENDIENTE elaboran su monografía con mayor calidad.
Presentar el informe final de la monografía con ideas coherentes, claras y sencillas.
Informe con ideas coherentes de acuerdo a los objetivos de la investigación.
Extraído del blog: metodología de la investigación 2011
13
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
A través de este ejemplo tratamos de ilustrar cómo se puede operacionalizar una hipótesis. Hay que recordar que este proceso se usa cuando tenemos variables que son complejas. Para sintetizar, podemos decir que el pasaje de la dimensión al indicador hace un recorrido de lo general a lo particular, del plano de lo teórico al plano de lo empíricamente contrastable. En un sentido más restringido, los indicadores son datos concretos que representan algo más abstracto o difícil de precisar: las dimensiones. Lo que resulta un poco extraño es que en Estadística nadie habla de 'indicadores'. Todos adoptan el criterio más general –y más simple– de hablar de 'variables'. Para no complicarnos, seguiremos este criterio en los siguientes Módulos. Ya nos hemos dedicado a pensar cómo plantear una hipótesis y a distinguir diferentes clases de variables. Pasemos ahora a pensar a quiénes les preguntaremos, de dónde obtendremos nuestros datos; y comencemos por el principio: la unidad de análisis.
6. Unidad de análisis La Unidad de Análisis es el objeto –o sujeto– sobre el cual queremos saber algo. Saliendo del lenguaje coloquial, una unidad de análisis es aquella entidad sobre la cual se hace una observación o medición. Las unidades de análisis –o unidades de observación– pueden ser personas, viviendas, plantas, universidades, países, empresas, etc. En el proceso de observación –o medición– se registra para cada unidad de análisis alguna característica, y esta observación constituye un dato.
A.1.5. En la planificación de la investigación de la Actividad A.1.3. ¿cuál es la unidad de análisis?
Ver página 10, Actividad A.1.3
Para que la observación o medición de una variable sobre una unidad de análisis sea útil, es necesario considerar aspectos como la precisión y la exactitud. Vamos entonces a definirlos...
7. Precisión y exactitud La precisión se refiere a la dispersión del conjunto de valores obtenidos de mediciones repetidas de una magnitud. Cuanto menor es la dispersión mayor es la precisión, o dicho de otra manera, a mayor variabilidad entre observaciones, menor es la precisión obtenida. 14
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
La exactitud se refiere a la cercanía del valor medido con respecto al valor real de la población En términos estadísticos, la exactitud está relacionada con el sesgo de una estimación, y cuanto menor es el sesgo, más exacta es una estimación. Esto se puede entender mejor mediante un ejemplo: Supongamos que varias flechas son disparadas hacia un blanco. En este ejemplo la precisión es el tamaño del grupo de flechas. Cuanto más cercanas entre sí estén las flechas que impactaron el blanco, más preciso será el sistema. En la figura que sigue se pueden ver dos ejemplos de mucha precisión en la situación A y la situación C, y dos ejemplos de menor precisión en la situación B y la situación D. La exactitud describe la proximidad de las flechas al centro del blanco, las flechas que impactaron más cerca del centro se consideran las más exactas. En la figura tenemos los ejemplos de mucha exactitud: en la situación A y la situación B, y los ejemplos donde hay poca exactitud: en la situación C y la situación D.
Situación A: Mucha exactitud
Situación B: mucha exactitud
y mucha precisión
y poca precisión
Situación C: poca exactitud
Situación D: poca exactitud
y mucha precisión
y poca precisión
Del análisis de las figuras queda claro que el hecho de que las flechas estén muy cercanas entre sí es independiente del hecho de que estén cerca del centro del objetivo. Es decir que la precisión es independiente de la exactitud. En síntesis, se podría decir que la exactitud representa el grado de veracidad de la experiencia, mientras que la precisión representa el grado de reproductibilidad. Bueno, sabemos que al conjunto de perros se lo llama jauría, que al conjunto de cerdos se lo llama piara, y que al conjunto de peces se lo llama cardumen. ¿Tendrá un nombre el conjunto de unidades de análisis? 15
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
8. Población y Muestra Se denomina población al conjunto total de objetos o individuos –es decir de unidades de análisis– de interés para el estudio. El tamaño de la población está determinado por el número de unidades o elementos que la componen, y se denota por “N”. Algunos ejemplos de poblaciones pueden ser: los alumnos de una escuela, las hectáreas de bosque en una provincia, los peces en un lago, etc. En general si el tamaño N de la población es muy grande, el tiempo y el costo de observar cada uno de los elementos son muy altos. Estas razones, entre otras, nos obligan a restringirnos a observar un subconjunto –una parte– de la población. A ese subconjunto de elementos se le llama muestra, y se espera que la muestra sea representativa de la población. El tamaño de la muestra está determinado por el número de elementos que la componen, y se denota por “n”. Unidad
Población
Muestra
Por supuesto, hay muchas formas de obtener una muestra a partir de una población. Veremos a continuación algunas de ellas...
A.1.6. Considere el siguiente recorte de la revista Panorama Match para responder. a. ¿Cuál considera que es la población en la estadística realizada por la revista? b. ¿Cuál es la herramienta utilizada para recolección de datos? c. ¿Cuál es la muestra de dicha estadística? ¿Cómo se obtuvo? ¿Cuál es el tamaño?
16
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
8.1. Muestras probabilísticas y no probabilísticas. Elementos de diseño muestral Los métodos de muestreo se conforman en correspondencia con los tipos de muestras que se necesitan seleccionar. Es evidente que el tipo de muestra está en relación directa con los objetivos del trabajo y el tipo de estudio que se pretende hacer. En general se plantea que existen dos grandes tipos de muestreo que son el muestreo probabilístico, cuando todos los elementos de la población tienen la misma probabilidad de ser seleccionados y el muestreo no probabilístico, cuando no se cumple lo anterior. Los métodos de muestreo pueden ser de conveniencia, opinático, aleatorio simple, sistemático, estratificado, de conglomerado y combinado. Muestreo de conveniencia: Cuando se toman los elementos de los que podemos disponer de forma más fácil. Muestreo opinático: La selección de los elementos de la muestra se basa en la experiencia y juicio del seleccionador. Muestreo aleatorio simple: Es el método de muestreo más importante porque además se utiliza como procedimiento en otros métodos de muestreo. Consiste en seleccionar los elementos que integrarán la muestra mediante un procedimiento aleatorio –al azar–. Muestreo sistemático: Se establece una forma de selección que se repite siguiendo un intervalo prefijado, el cual responde a la fórmula k =N/n donde: k=número entero que representa al intervalo de selección; N=tamaño de la población; n=tamaño que se fijó para la muestra. Se toma como punto de arranque cualquier punto situado entre 1 y k, a partir del cual se va adicionando el valor k. Ejemplo: Para controlar la calidad de los exámenes complementarios realizados en un laboratorio clínico, el jefe de laboratorio decide repetir personalmente la prueba a 10 de las 250 extracciones de sangre realizadas ese día. N = 250 n =10 k =250/10 =25. Se escoge como punto de arranque cualquier número entero entre 1 y 25 para iniciar la selección. Supongamos que se escoge el 8, la muestra quedará entonces integrada por las extracciones número: 8; 33; 58; 83; 108; 133; 158; 183; 208 y 233. Muestreo Estratificado: Los elementos son seleccionados atendiendo a su pertenencia a determinada clase o estrato, de manera que en la muestra estén representados los elementos de cada clase en la misma proporción en que lo están en la Población objeto de estudio. Muestreo por Conglomerado: Los elementos son seleccionados en forma agrupada del Universo, siguiendo algún criterio determinado de grupo de pertenencia. Muestreo combinado: Es la forma de muestreo que resulta de combinar en varias etapas dos o más de los métodos antes descritos. 17
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Hemos visto cómo podemos llevar adelante un estudio, pero para poder analizar la información obtenida tenemos que organizarla de una forma adecuada. En la forma de una...
8.2. Matriz de datos Una matriz o un conjunto de datos es una forma particular de organización de la información. Esta organización se realiza diseñando una tabla con las siguientes características:
Unidades de análisis
Variables
Cada unidad de análisis será una fila, y cada variable será una columna. La intersección de las filas y columnas indica los valores que toma cada variable para cada individuo. Ejemplo
Se realizó una encuesta a 100 personas. El cuestionario incluía sólo tres preguntas:
Cuestionario:
Sexo:
¿Cuál es su estado civil?
¿En qué año nació?
¿Cuál es máximo nivel de estudios que alcanzó?
Ante todo, queda claro que el cuestionario no incluye la pregunta sobre el sexo de la persona, porque el encuestador la completa directamente por observación.
18
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
Veamos entonces qué variables tenemos: - Sexo –variable nominal; categorías: F=Femenino, M=Masculino– - Estado civil –variable nominal; categorías: Casado, Soltero, Viudo, Otro– - Año de nacimiento –variable discreta– - Estudios –variable ordinal; categorías: SE=Sin estudios, PI=Primaria incompleta, PC=Primaria completa, SI=Secundaria incompleta, SC= Secundaria completa, UI=Estudios superiores incompletos, UC= Estudios superiores completos– También debemos saber cuál es la unidad de análisis, que en este estudio son personas. Pasemos los resultados de cada cuestionario a nuestra matriz de datos: Caso
Sexo
Estado civil
Año de nacimiento
Estudios
1
F
Casado
1960
SE
2
F
Soltero
1975
SC
3
M
Otro
1977
SI
...
...
...
...
...
...
...
...
...
...
99
F
Casado
1980
PC
100
M
Viudo
1955
PC
Verán que: - la primer columna presenta los individuos –o sea las unidades de análisis– numerados en forma creciente. Esta columna sirve para poder identificar cada individuo; - las variables 'Sexo' y 'Estado civil' tienen sus categorías codificadas. Ésta es una práctica usual, que tiene el propósito de reducir errores y facilitar la carga de datos.
19
UNLa. Virtual / Técnicas cuantitativas / m1. Organización, Preparación y Manejo de Datos
A.1.7. La matriz de datos –o el conjunto de datos– Países de América, que pueden ver en la siguiente página, contiene datos de diferentes países.
Ver Países de América
Le solicitamos que responda estas preguntas: a. ¿Cuál es la unidad de análisis? b. ¿Hay alguna columna que sirva como identificador de las unidades de análisis? c. ¿Cuántos casos –o registros– tenemos en la matriz de datos? d. ¿Cuáles son las variables nominales que puede encontrar en este conjunto de datos? ¿Cuáles son las categorías de cada una de estas variables? e. Dé un ejemplo de variable cuantitativa discreta y otro de variable cuantitativa continua f. Si consideráramos estos datos como una muestra de una población, ¿cuál sería la población? ¿y cómo sería el tipo de muestreo que se realizó?
Para discutir en el foro Veamos si son capaces de describir los tipos de muestreo que se desarrollaron en las siguientes situaciones... - Para saber qué programa de televisión está viendo la gente, una empresa de encuestas llama por teléfono a 1000 personas elegidas al azar. - Para saber si las hojas de 50 cuadernos de 80 hojas no están falladas, veo si la primera y la última hoja no están falladas. - Para nuestro cumpleaños deseamos contar con 5 botellas de distintas marcas de vino. Para realizar la elección le preguntamos a un conocido sommelier –que es amigo nuestro–. - Para tener una idea de lo que piensan los alumnos de sus profesores, les hacemos 3 preguntas al primer alumno que entra a cada una de las clases. - Una empresa quiere analizar su imagen a través de una encuesta, y para esto selecciona al azar al 1% de los clientes que presentaron quejas en el último año, y también al 1% de los clientes que no se quejaron.
20
Bibliografía Blanch N. y Joekes. S. (1997): Cuadernillos del curso de postgrado “Estadística aplicada a la investigación”. Universidad Nacional de Córdoba, Facultad de Ciencias Económicas. Yuni J. y Urbano C. (2006): Técnicas para investigar 2. Recursos metodológicos para la preparación de proyectos de investigación. Editorial Brujas.
21