miércoles, 31 de agosto de 2011

Estructura de un texto científico

La estructura de un documento científico es un reflejo del mismo método científico, en otras palabras, es la expresión de la ciencia, por lo que su correcta elaboración es esencial. La ciencia y los escritos científicos siguen un método deductivo-inductivo, pues primero se particulariza y se termina generalizando. Lo anterior se puede observar en la introducción y la discusión. Primeramente a través de un marco teórico general, se particulariza un problema, el cual es tratado y a partir de los resultados (que son particulares) se generaliza.
Si lo vemos desde la óptica de los análisis estadísticos, el planteamiento es una particularización de un marco teórico general, luego se toman muestras y se infiere a cerca de la población. Nuevamente se observa una particularización primaria y una generalización final.
Dado lo anterior, la introducción es deductiva y a partir de ella debe de llegarse al planteamiento del problema, así mismo, debe de justificar el estudio con la bibliografía (o referencias) previa, por lo que introducción, justificación y antecedentes son iguales. Dado que en un documento científico se procura evitar información repetitiva o poco importante, el hacer distinción entre estos tres apartados estaría de más.
El objetivo es el eje central del trabajo, en torno a él gira la investigación, pues es la meta a la cual se espera llegar. Si los resultados no cumplen con el objetivo, faltaron cosas por hacer; si los resultados ofrecen más que el objetivo, se hicieron cosas de más. Y lo mismo puede aplicar para los otros apartados en un documento científico. De ser requerido, se pueden plantear objetivos particulares, los cuales tienen que cumplir cabalmente con el objetivo general y si sobra o falta, significa que hay particulares de más o de menos.
La metodología es un paso muy importante, pues la verdadera ciencia es replicable, por lo que tiene que ser descrita claramente, aunque se pueden obviar metodologías muy conocidas o sólo citarlas, nuevamente, por el espacio, pues está de más describir una metodología que se encuentra en cualquier libro o artículo especializado. Los análisis estadísticos son parte de la metodología.
En resultados se describe lo obtenido a partir de la metodología, de manera sencilla y lo más brevemente posible, evitando el caer en un simplismo y en una deficiencia en la transmisión de la información. Lo que corresponde a los estadísticos son sólo el sustento de las afirmaciones, pero no son resultados como tal, son sólo la herramienta que permite tomar decisiones. Por ejemplo: se puede considerar que la población a es de tal manera y la población b es de tal manera, siendo entre sí diferentes (se coloca el valor del estadístico con grados de libertad o tamaño muestral y el valor de p).
En discusión se explican los resultados, ésta debe de cubrir todos, no pueden quedar resultados sin discutir. Es ésta la parte inductiva, pues a partir de los resultados particulares, se generaliza de entidades o conceptos mayores. Se debe evitar el poner resultados, salvo que sean totalmente indispensables, así como repetir información escrita en otros apartados (lo más usual es repetir información de introducción).
Estas son las partes de un documento científico que reflejan con mayor claridad el método científico. Para mayor detalle, les dejo el enlace de un libro especializado en ello (en español), es una buena guía, aunque las indicaciones a seguir dependerán de a quien vaya dirigido el escrito, pues cada revista, editorial o similares, tiene sus especificaciones al respecto, pero el orden y contenido de los apartados es esencialmente el mismo.

lunes, 29 de agosto de 2011

Pruebas de hipótesis con varianzas

Dentro de las pruebas de hipótesis, quizás la menos socorrida es la de la varianza de una población, en la cual se compara la varianza de una muestra obtenida a partir de una población con distribución normal y se compara con alguna varianza hipotética, ya sea que por algún motivo se crea o porque lo indica la literatura.
Para plantear un ejemplo con esta prueba, debe de pensarse en un caso en el que la variación de una población difiera de otra. Lo más fácil es pensar en temporadas o lugares en los que converjan individuos de la misma población con diferencias notorias en la variable a medir, o que los valores tiendan hacia un grupo en particular. Ejemplo de lo primero sería que la varianza de edades en las primarias en México fuera de tanto (nuestro valor hipotético), pero creemos que en las universidades la varianza será mayor, pues hay estudiantes desde 17 hasta 40 (o más) años de edad. Un ejemplo de lo segundo sería que sabemos la varianza de edad de la gente de La Paz (valor hipotético), pero creemos que la varianza en un local de videojuegos será menor, debido a que en su mayoría son visitados por niños y jóvenes. En general, cualquier motivo para tener una mayor o menor dispersión de los datos puede ser motivo de análisis por este medio.
Los pasos para resolver un ejercicio de estos son diez (los mismos que para otras pruebas de hipótesis). En datos sólo se requiere la varianza y el tamaño de muestra. Los supuestos son los mismos Aleatoriedad, Normalidad e Independencia (ANI). Las hipótesis son iguales, pero en lugar de usar µ, se usa σ2. La estadística de prueba es la siguiente:
X2=(n-1)s22
donde X2 es la distribución que sigue la estadística de prueba (chi cuadrada) con n-1 grados de libertad, n es el tamaño de muestra, s2 es la varianza muestral y σ2 es la varianza poblacional (hipotética).
El la regla de decisión se construye de igual manera que con distribución t, pero X2 no es simétrica, por lo que los dos valores (si la H0 es de igualdad) deben de buscarse en la tabla en la columna de 0.025 y 0.975 (respectivamente, si se trabaja con α=0.05), en pocas palabras, cada valor crítico, sea cual sea, sean cuantos sean, deben de ser buscados en la tabla en el mismo renglón (grados de libertad).
El cálculo de la estadística de prueba se obtiene sustituyendo los valores en la fórmula. La decisión estadística se toma en torno a los valores críticos, de la misma manera que en otras pruebas. La conclusión sólo muestra de forma escrita la decisión tomada. Y el cálculo de p se realiza de la misma forma que con t, a través de intervalos.
Ahora, si sigue una distribución X2, ¿por qué uno de los supuestos es de normalidad? Pues X2 con n-1 grados de libertad es la distribución de probabilidades de la variable aleatoria que se obtiene al sumar los cuadrados de los valores observados en n extracciones de una población normalmente distribuida. En pocas palabras, es la sumatoria de cuadrados de normales y por eso tiene que cumplir con el supuesto de normalidad.
En cuanto a la prueba de hipótesis para la razón de varianzas de dos poblaciones, el tipo de ejemplos son los mismos, sólo que en lugar de tener una varianza muestral y una hipotética, se tendrán dos muestrales. Volviendo al primer ejemplo, en ese caso se tomarían muestras de escuelas primarias y universidades para comparar sus varianzas. En el segundo, se tomaría una muestra de algún lugar común, por ejemplo la calle, y otra en el local de videojuegos, con el mismo objetivo que el ejemplo anterior. Un uso adicional es el de comprobar si las varianzas de dos muestras son iguales en una prueba de hipótesis para la diferencia de medias de dos poblaciones y a partir de ello ponderar o corregir por grados de libertad.
Los pasos son también diez. En datos sólo se requiere saber las varianzas y el tamaño de muestra. Los supuestos son los mismos. Las hipótesis nulas pueden ser: σ12=1, σ12≤1 ó σ12≥1. Esto porque si dos varianzas son iguales, su razón será 1 (cualquier número entre sí mismo es 1).
La distribución es F (Fisher o Snedecor) con n1+n2-2 grados de libertad. La estadística de prueba es muy sencilla:
R.V.=s12/s22
donde R.V. significa razón de varianzas, s12 es la varianza de la muestra 1 y s22 es la varianza de la muestra 2.
Para la regla de decisión se tiene que buscar en la tabla G de distribución F (según Daniel) la página de la confianza requerida, en las columnas se tienen que localizar los grados de libertad del numerador (muestra 1) y en los renglones los grados de libertad del denominador (muestra 2); la intersección será el valor crítico. En torno a lo anterior surge un problema, no hay tablas de confianzas pequeñas, todas son de 0.90 en adelante, ¿qué hacer ante una hipótesis de igualdad o de mayor o igual? Pues se buscan los grados de libertad al revés, es decir, el denominador en el numerador y el numerador en el denominador y a lo resultante se le saca el inverso (1/el valor en la tabla). Pongamos un ejemplo para clarificar: si tenemos dos muestras de tamaño 16 (muestra 1) y 23 (muestra 2) y se trabaja con α=0.05, con una hipótesis nula de igualdad, el valor crítico superior sería 2.5 (con 15 y 22 grados de libertad en tabla de 0.975) y el menor sería 1/2.76 (con 20 [no hay 22, así que se toma el inmediato inferior] y 15 grados de libertad en la tabla de 0.975)=0.362. Otra alternativa es que se use la muestra de la varianza mayor como muestra 1, pues así el único valor crítico requerido es el superior.
El cálculo de la estadística de prueba se resuelve sustituyendo los valores en la fórmula anterior. La decisión estadística, conclusión y cálculo de p son iguales que en la prueba anterior.
Por último, ¿por qué normalidad si la distribución es F? Pues esta distribución es el resultado del cociente de dos X2 y recordando lo dicho anteriormente, es obvia la necesidad de su distribución normal.