Estadística. Preguntas frecuentes
Respondemos a preguntas que pueden surgir en un curso general de estadística. Tratan sobre el material del curso y también sobre temas que pueden aparecer en discusiones sobre lo que es la estadística, sus dificultades y sus aplicaciones.Es el resultado de nuestra experienca moviéndonos en este terreno y esperamos que sea útil a estudiantes, profesores que empiezan, e intersados por la estadística en general. Cualquier comentario o sugerencia (hay espacio al final) será bienvenido.
General (sobre lo que es y lo que no es la Estadística)
Estadística Descriptiva
- ¿Para qué sirve la mediana si ya tenemos la media aritmética?
- ¿Tiene alguna aplicación práctica la media geométrica?
- ¿Por qué en estadística se da tanta importancia a la variabilidad?
- ¿Por qué en la fórmula de la varianza se utiliza el cuadrado de las diferencias en vez de su módulo?
- ¿Por qué cuando se calcula la varianza de una muestra se divide por n-1 en vez de dividir por n?
- ¿Por qué la desviación típica -o desviación estándar-es la medida típica de dispersión?
- ¿Cuál es la forma “correcta” de calcular los cuartiles?
- ¿De dónde sale el 1,5 utilizado para marcar las anomalías en un boxplot?
- ¿Qué hay que hacer cuando nos encontramos con valores atípicos?
- ¿Para qué sirve la curtosis?
- ¿Qué gráfico debo usar para representar mis datos?
- ¿Qué gráfico NO debo usar para representar mis datos?
- ¿Cuáles son los mejores paquetes de software para analizar datos gráficamente?
- ¿Cómo se pasa de la frecuencia (en los histogramas) a la densidad de probabilidad (en las distribuciones de probabilidad)?
- ¿Cómo se sabe qué distribución sigue una variable aleatoria?
- ¿Por qué se dice que la media es una variable aleatoria?
- ¿De dónde sale la fórmula de la distribución Normal?
- ¿Por qué para la distribución Normal solo se necesita la tabla de la N(0; 1)?
- ¿Por qué la probabilidad de tener mi estatura es igual a cero?
- ¿Existen variables con comportamiento contrario a la distribución Normal?
- ¿De dónde sale la fórmula de la distribución de Poisson?
- ¿Cómo se puede ver que la distribución de la varianza muestral está relacionada con la distribución Chi-cuadrado?
- ¿Por qué no es lo mismo sumar k veces una variable aleatoria que multiplicarla por k
- ¿Por qué nos creemos los resultados de una muestra sabiendo que si tomáramos otra serían distintos?
- ¿De dónde sale la expresión del intervalo de confianza?
- ¿Qué es el factor de corrección por población finita?
- ¿Cuántos elementos debe tener una muestra para que las conclusiones sean fiables?
- ¿Qué relación hay entre tamaño de muestra y tamaño de población?
- ¿Qué tipo de muestreo conviene elegir?
- ¿Es lo mismo muestra aleatoria que muestra representativa?
- ¿Por qué cuesta acertar en los sondeos electorales?
- ¿Qué es un estimador de máxima verosimilitud?
- ¿Qué es un contraste de hipótesis?
- ¿Por qué es controvertido el uso del contraste de hipótesis?
- ¿Cómo elegir la hipótesis alternativa que conviene plantear?
- ¿Por qué respecto a la hipótesis nula se habla de “no rechazo” y no de “aceptación”?
- ¿Cómo se sabe hacia qué lado hay que mirar el área de cola?
- ¿A partir de qué p-valor es razonable rechazar la hipótesis nula?
- ¿Qué tipos de error se pueden cometer en un contraste de hipótesis?
- ¿Es lo mismo diferencia significativa que diferencia importante?
- ¿Es correcto multiplicar por dos el área de cola en los tests de igualdad de varianzas?
- ¿Cómo que diseño de experimentos? ¿No es eso de física o de química?
- ¿Por qué no se usa el text de la t de Student para comparar más de dos tratamientos?
- ¿Por qué se llama Análisis de la Varianza si lo que se compara son medias?
- ¿Por qué no hay que mover las variables una a una?
- ¿Cómo es posible estudiar por separado el efecto de cada variable?
- ¿Cómo se puede escribir una ecuación para la respuesta con los resultados de un diseño factorial?
- ¿Qué es un diseño bloqueado?
- ¿Por qué se suponen no significativas las interacciones de tres o más factores?
- ¿Qué hacer si al aleatorizar el orden de experimentación se obtiene el orden estándar de la matriz de diseño?
- ¿Cómo se justifica la fórmula de la covarianza?
- ¿De dónde sale la fórmula del coeficiente de correlación?
- ¿Cómo se han calculado los valores críticos del coeficiente de correlación?
- ¿Sirven las tablas del coeficiente de correlación si X e Y no son Normales?
- ¿Por qué se utiliza el método de los mínimos cuadrados?
- ¿Por qué los coeficientes de la ecuación de regresión son variables aleatorias?
- ¿Para qué sirve y como se interpreta el valor de R2
- ¿Por qué cuando se ajusta la recta por el origen no se debe usar R2?
- ¿Por qué hace falta el valor de R2-ajustado si ya temeos el de R2?
- ¿Se pueden utilizar variables cualitativas en ecuaciones de regresión?
- ¿Por qué las variables que se incluyen en el modelo no necesariamente son las más correlacionadas con la respuesta?
- Cuando se habla de transformación logarítmica ¿se refiere al logaritmo decimal o al neperiano?
- ¿Debe decirse "Teorema central del límite" o "Teorema del límite central"?
- ¿Que significan los llamados "grados de libertad"?
- ¿Cuál es la mejor estrategia para que me toque la lotería?
- Acaba de salir 5 veces el rojo ¿debo aportar al negro?
- ¿Cómo se dice? ¿Qué significa?