Como se saca la varianza
Partición de la varianza lmer
He realizado una regresión múltiple en la que el modelo en su conjunto es significativo y explica aproximadamente el 13% de la varianza. Sin embargo, necesito encontrar la cantidad de varianza explicada por cada predictor significativo. ¿Cómo puedo hacerlo con R?
Esta pregunta se ha respondido aquí, pero la respuesta aceptada sólo se refiere a los predictores no correlacionados, y aunque hay una respuesta adicional que se refiere a los predictores correlacionados, sólo proporciona una pista general, no una solución específica. Me gustaría saber qué hacer si mis predictores están correlacionados.
Si se especifica un orden particular, se puede calcular esto trivialmente en R (por ejemplo, a través de las funciones update y anova, véase más adelante), pero un orden de entrada diferente produciría respuestas potencialmente muy diferentes.
Demostré que el porcentaje de la variación explicada por un predictor dado en una regresión lineal múltiple es el producto del coeficiente de la pendiente y la correlación del predictor con los valores ajustados de la variable dependiente (suponiendo que todas las variables han sido estandarizadas para tener una media cero y una varianza uno; lo cual es sin pérdida de generalidad). Encuéntrelo aquí:
Extraer componentes de varianza de lme
Soy ecologista y a menudo realizo experimentos de medidas repetidas en animales para observar las diferencias individuales en el comportamiento y el metabolismo. Me gustaría empezar a utilizar rstanarm para calcular las estimaciones de repetibilidad (coeficientes de correlación intraclase) y las correlaciones de pendiente-intercepto para varios rasgos que observo. Sin embargo, me resulta difícil averiguar cómo extraer los componentes de la varianza de los objetos de rstanarm. He pegado ejemplos de cómo lo hago con MCMCglmm (script completo y datos aquí: https://bit.ly/2LTCGBi) pero agradecería mucho que me aconsejaran sobre cómo hacer lo mismo con rstanarm. Sé que print() devuelve el coeficiente de correlación de intercepción de pendiente de los efectos aleatorios, pero no hay estimaciones de SD ni intervalos de credibilidad del 95% asociados a él.
En general, es mejor mostrar un gráfico de todo el margen de la distribución posterior que es de interés, pero si se va a centrar en un número, normalmente debería ser la media o la mediana. La moda posterior no es útil.
Componentes de la varianza en r
¿Cómo dividir la varianza total en componentes debidos a cada uno de los factores gent y blk junto con el residuo? Algo similar a la salida dada por PROC MIXED de SAS, donde se calcula el MSE incluso cuando la estimación es por ML o REML en lugar de por mínimos cuadrados.
Esto no es exactamente una respuesta, pero siempre que veo una pregunta sobre la «varianza explicada» en los modelos mixtos, siempre pienso en este correo electrónico de Douglas Bates, el autor original de lme4 y coautor de nlme, en la lista de correo R-Sig-ME el 26 de febrero de 2010, en respuesta a:
He escrito algo de código para implementar el Rsq de Gelman & Pardoe para un objeto lmer. Da algunos resultados creíbles, pero es difícil tener confianza debido a la traducción de los paradigmas bayesianos a los frecuentistas.
Extraer efectos aleatorios lmer
Algunas de las otras respuestas son factibles, pero afirmo que la mejor respuesta es utilizar el método accesorio que está diseñado para esto — VarCorr (es el mismo que en el predecesor de lme4, el paquete nlme).
Actualizado en las versiones recientes de lme4 (versión 1.1-7, pero todo lo que sigue es probablemente aplicable a las versiones >= 1.0), VarCorr es más flexible que antes, y debería hacer todo lo que usted desea sin tener que recurrir a la pesca dentro del objeto modelo ajustado.
Para una mayor flexibilidad, puede utilizar el método as.data.frame para convertir el objeto VarCorr, que proporciona la variable de agrupación, la(s) variable(s) de efecto, y la varianza/covarianza o la desviación estándar/correlaciones:
Por último, la forma bruta del objeto VarCorr (con la que probablemente no debería meterse si no es necesario) es una lista de matrices de varianza-covarianza con información adicional (redundante) que codifica las desviaciones estándar y las correlaciones, así como atributos («sc») que dan la desviación estándar residual y especifican si el modelo tiene un parámetro de escala estimado («useSc»).