Hogar odontologia infantil Se utiliza una ecuación de regresión para probar la significancia estadística. Evaluación de la importancia de la ecuación de regresión y sus coeficientes.

Se utiliza una ecuación de regresión para probar la significancia estadística. Evaluación de la importancia de la ecuación de regresión y sus coeficientes.

Evaluación de la importancia de una ecuación regresión múltiple

La construcción de una ecuación de regresión empírica es la etapa inicial del análisis econométrico. La primera ecuación de regresión construida a partir de una muestra rara vez es satisfactoria en términos de ciertas características. Por lo tanto, a continuación la tarea más importante El análisis econométrico es una prueba de la calidad de la ecuación de regresión. En econometría, se ha adoptado un esquema bien establecido para dicha verificación.

Entonces, la calidad estadística de la ecuación de regresión estimada se verifica usando las siguientes direcciones:

· comprobar la importancia de la ecuación de regresión;

· examen significancia estadística coeficientes de ecuaciones de regresión;

· comprobar las propiedades de los datos cuya viabilidad se asumió al estimar la ecuación (verificar la viabilidad de las premisas MCO).

La prueba de importancia de la ecuación de regresión múltiple, así como de la regresión pareada, se realiza mediante la prueba de Fisher. EN en este caso(a diferencia de la regresión por pares) se plantea una hipótesis nula H 0 que todos los coeficientes de regresión son iguales a cero ( segundo 1=0, segundo 2=0, … , b m=0). El criterio de Fisher está determinado por la siguiente fórmula:

Dónde D hecho: varianza del factor explicada por regresión, por un grado de libertad; D ost - dispersión residual por grado de libertad; R 2- coeficiente determinación múltiple; t X en la ecuación de regresión (en el par regresión lineal t= 1); PAG - número de observaciones.

El valor resultante de la prueba F se compara con el valor de la tabla en un cierto nivel de significancia. Si su valor real es mayor que el valor de la tabla, entonces la hipótesis Pero se rechaza la insignificancia de la ecuación de regresión y se acepta la hipótesis alternativa sobre su significancia estadística.

Utilizando el criterio de Fisher, es posible evaluar la importancia no solo de la ecuación de regresión en su conjunto, sino también la importancia de la inclusión adicional de cada factor en el modelo. Esta evaluación es necesaria para no cargar el modelo con factores que no tengan un impacto significativo en el resultado. Además, dado que el modelo consta de varios factores, se pueden introducir en él en diferentes secuencias, y dado que existe una correlación entre los factores, la importancia de incluir el mismo factor en el modelo puede variar dependiendo de la secuencia en la que se Se introducen factores en él.

Para evaluar la importancia de incluir un factor adicional en el modelo, se calcula el criterio parcial de Fisher. Fxi. Se basa en comparar el aumento de la varianza de los factores debido a la inclusión de un factor adicional en el modelo con la varianza residual por un grado de libertad para la regresión en su conjunto. Por tanto, la fórmula de cálculo prueba F privada para el factor tendrá la siguiente forma:

Dónde R 2 yx 1 x 2… xi… xp - coeficiente de determinación múltiple para un modelo de conjunto completo PAG factores ; R 2 yx 1 x 2… x i -1 x i +1… xp- coeficiente de determinación múltiple para un modelo que no incluye un factor xyo;PAG- número de observaciones; t- número de parámetros para factores X en la ecuación de regresión.

El valor real de la prueba parcial de Fisher se compara con el tabulado a un nivel de significancia de 0,05 o 0,1 y los números de grados de libertad correspondientes. Si el valor real F xi excede mesa F, entonces la inclusión adicional del factor xyo en el modelo está estadísticamente justificado, y el coeficiente de regresión "puro" b yo en factor xyo Estadísticamente significante. Si F xi menos mesa F, entonces la inclusión adicional del factor en el modelo no aumenta significativamente la proporción de variación explicada en el resultado y, y, por tanto, su inclusión en el modelo no tiene sentido; el coeficiente de regresión para este factor en este caso es estadísticamente insignificante.

Usando la prueba parcial de Fisher, puede probar la significancia de todos los coeficientes de regresión bajo el supuesto de que cada factor correspondiente xyo se ingresa en último lugar en la ecuación de regresión múltiple, y todos los demás factores ya se incluyeron en el modelo anteriormente.

Evaluación de la importancia de los coeficientes de regresión "puros" b yo Por prueba t de Student se puede realizar sin calcular privado F-criterios. En este caso, al igual que en la regresión pareada, la fórmula se aplica para cada factor

t bi = b yo / metro bi ,

Dónde b yo- coeficiente de regresión “pura” con el factor xyo ; m-bi- error estándar del coeficiente de regresión b yo .

Para evaluar la importancia y la importancia del coeficiente de correlación, se utiliza la prueba t de Student.

El error promedio del coeficiente de correlación se encuentra mediante la fórmula:

norte
y en base al error, se calcula el criterio t:

El valor calculado de la prueba t se compara con el valor tabulado que se encuentra en la tabla de distribución de Student a un nivel de significancia de 0,05 o 0,01 y el número de grados de libertad n-1. Si el valor calculado de la prueba t es mayor que el valor de la tabla, entonces el coeficiente de correlación se considera significativo.

En el caso de una relación curvilínea, la prueba F se utiliza para evaluar la importancia de la relación de correlación y la ecuación de regresión. Se calcula mediante la fórmula:

o

donde η es la relación de correlación; n – número de observaciones; m – número de parámetros en la ecuación de regresión.

El valor F calculado se compara con el tabulado para el nivel de significancia aceptado α (0,05 o 0,01) y los números de grados de libertad k 1 =m-1 y k 2 =n-m. Si el valor F calculado excede el de la tabla, la relación se considera significativa.

La importancia del coeficiente de regresión se establece mediante la prueba t de Student, que se calcula mediante la fórmula:

donde σ 2 y i es la varianza del coeficiente de regresión.

Se calcula mediante la fórmula:

donde k es el número de características de los factores en la ecuación de regresión.

El coeficiente de regresión se considera significativo si t a 1 ≥t cr. t cr se encuentra en la tabla de puntos críticos de la distribución de Student al nivel de significancia aceptado y el número de grados de libertad k=n-1.

4.3. Análisis de correlación y regresión en Excel.

Realicemos un análisis de correlación-regresión de la relación entre el rendimiento y los costos laborales por 1 quintal de grano. Para hacer esto, abra una hoja de Excel e ingrese los valores de la característica del factor en las celdas A1:A30 el rendimiento de los cultivos de cereales, en las celdas B1:B30, el valor de la característica resultante es el costo de la mano de obra por 1 quintal de grano. En el menú Herramientas, seleccione la opción Análisis de datos. Al hacer clic izquierdo en este elemento, abriremos la herramienta Regresión. Haga clic en el botón Aceptar y aparecerá el cuadro de diálogo Regresión en la pantalla. En el campo Intervalo de entrada Y, ingrese los valores de la característica resultante (resaltando celdas B1:B30), en el campo Intervalo de entrada X, ingrese los valores de la característica del factor (resaltando celdas A1:A30). Marque el nivel de probabilidad del 95% y seleccione Nueva hoja de trabajo. Haga clic en el botón Aceptar. En la hoja de trabajo aparece la tabla "CONCLUSIÓN DE RESULTADOS", que proporciona los resultados del cálculo de los parámetros de la ecuación de regresión, el coeficiente de correlación y otros indicadores que le permiten determinar la importancia del coeficiente de correlación y los parámetros de la ecuación de regresión.

CONCLUSIÓN DE RESULTADOS

Estadísticas de regresión

Plural R

R Plaza

R cuadrado normalizado

Error estándar

Observaciones

Análisis de variación

Significado F

Regresión

Impares

Error estándar

estadística t

Valor p

95% inferior

95% superior

95,0% inferior

95,0% superior

Intersección en Y

Variable X 1

En esta tabla, "R múltiple" es el coeficiente de correlación, "R cuadrado" es el coeficiente de determinación. “Coeficientes: Intersección Y” - término libre de la ecuación de regresión 2,836242; “Variable X1” – coeficiente de regresión -0,06654. También existen valores de la prueba F de Fisher 74,9876, la prueba t de Student 14,18042 y el "error estándar 0,112121", que son necesarios para evaluar la importancia del coeficiente de correlación, los parámetros de la ecuación de regresión y la ecuación completa.

Con base en los datos de la tabla, construiremos una ecuación de regresión: y x ​​= 2,836-0,067x. El coeficiente de regresión a 1 = -0,067 significa que con un aumento en el rendimiento de grano de 1 c/ha, los costos laborales por 1 c de grano disminuyen en 0,067 horas-hombre.

El coeficiente de correlación es r=0,85>0,7, por lo tanto, la relación entre las características estudiadas en esta población es estrecha. El coeficiente de determinación r 2 =0,73 muestra que el 73% de la variación en el rasgo efectivo (costos laborales por 1 quintal de grano) es causado por la acción del factor rasgo (rendimiento de grano).

En la tabla de puntos críticos de la distribución de Fisher-Snedecor encontramos el valor crítico de la prueba F con un nivel de significancia de 0,05 y el número de grados de libertad k 1 =m-1=2-1=1 y k 2 =n-m=30-2=28, es igual a 4,21. Dado que el valor calculado del criterio es mayor que el tabulado (F=74,9896>4,21), la ecuación de regresión se considera significativa.

Para evaluar la importancia del coeficiente de correlación, calculemos la prueba t de Student:

EN
En la tabla de puntos críticos de la distribución de Student encontramos el valor crítico de la prueba t con un nivel de significancia de 0,05 y el número de grados de libertad n-1=30-1=29, es igual a 2,0452. Dado que el valor calculado es mayor que el valor de la tabla, el coeficiente de correlación es significativo.

Estimación de la importancia de los parámetros de la ecuación de regresión.

La importancia de los parámetros de la ecuación de regresión lineal se evalúa mediante la prueba de Student:

Si t calc. > t cr, entonces se acepta la hipótesis principal ( Ho), indicando la significancia estadística de los parámetros de regresión;

Si t calc.< t cr, entonces se acepta la hipótesis alternativa ( H 1), lo que indica la insignificancia estadística de los parámetros de regresión.

Dónde m un , m b– errores estándar de parámetros a Y b:

(2.19)

(2.20)

El valor crítico (tabular) del criterio se encuentra utilizando tablas estadísticas de la distribución de Student (Apéndice B) o utilizando tablas Sobresalir(sección del asistente de funciones “Estadísticas”):

t cr = ESTUDIANTE( α=1-P; k=n-2), (2.21)

Dónde k=n-2 También representa el número de grados de libertad. .

La evaluación de la significancia estadística también se puede aplicar al coeficiente de correlación lineal.

Dónde señor– error estándar al determinar los valores del coeficiente de correlación ryx

(2.23)

A continuación se muestran opciones de tareas prácticas y trabajo de laboratorio sobre los temas de la segunda sección.

Preguntas de autoevaluación para la sección 2

1. Indique los principales componentes del modelo econométrico y su esencia.

2. El contenido principal de las etapas de la investigación econométrica.

3. La esencia de los enfoques para determinar los parámetros de regresión lineal.

4. Esencia y peculiaridades de aplicación del método. mínimos cuadrados al determinar los parámetros de la ecuación de regresión.

5. ¿Qué indicadores se utilizan para evaluar la cercanía de la relación entre los factores en estudio?

6. esencia coeficiente lineal correlaciones.

7. La esencia del coeficiente de determinación.

8. Esencia y características principales de los procedimientos para evaluar la adecuación (significación estadística) modelos de regresión.

9. Evaluación de la adecuación de los modelos de regresión lineal mediante el coeficiente de aproximación.

10. La esencia del enfoque para evaluar la adecuación de los modelos de regresión utilizando el criterio de Fisher. Definición de empírico y valores criticos criterio.

11. La esencia del concepto de “análisis de varianza” en relación con la investigación econométrica.

12. Esencia y características principales del procedimiento para evaluar la importancia de los parámetros. ecuación lineal regresión.

13. Características del uso de la distribución de Student al evaluar la importancia de los parámetros de una ecuación de regresión lineal.

14. ¿Cuál es la tarea de pronosticar valores únicos del fenómeno socioeconómico en estudio?

1. Construir un campo de correlación y formular una suposición sobre la forma de la ecuación para la relación de los factores en estudio;

2. Escribir las ecuaciones básicas del método de mínimos cuadrados, realizar las transformaciones necesarias, elaborar una tabla para cálculos intermedios y determinar los parámetros de la ecuación de regresión lineal;

3. Verifique la exactitud de los cálculos realizados utilizando procedimientos estándar y funciones hojas de cálculo Sobresalir.

4. Analizar los resultados, formular conclusiones y recomendaciones.

1. Cálculo del valor del coeficiente de correlación lineal;

2. Construyendo una mesa Análisis de variación;

3. Estimación del coeficiente de determinación;

4. Verificar la exactitud de los cálculos utilizando procedimientos y funciones estándar de hojas de cálculo de Excel.

5. Analizar los resultados, formular conclusiones y recomendaciones.

4. Realizar una evaluación general de la adecuación de la ecuación de regresión seleccionada;

1. Evaluar la adecuación de la ecuación con base en los valores del coeficiente de aproximación;

2. Evaluar la adecuación de la ecuación con base en los valores del coeficiente de determinación;

3. Evaluar la adecuación de la ecuación utilizando el criterio de Fisher;

4. Realizar una evaluación general de la adecuación de los parámetros de la ecuación de regresión;

5. Verificar la exactitud de los cálculos utilizando procedimientos y funciones estándar de hojas de cálculo de Excel.

6. Analizar los resultados, formular conclusiones y recomendaciones.

1. Utilizar procedimientos estándar del Asistente de funciones de hoja de cálculo de Excel (de las secciones “Matemáticas” y “Estadísticas”);

2. Preparación de datos y características del uso de la función LINEST;

3. Preparación de datos y características del uso de la función “PREDICCIÓN”.

1. Utilizar procedimientos estándar del paquete de análisis de datos de hoja de cálculo Excel;

2. Preparación de datos y características de la aplicación del procedimiento de “REGRESIÓN”;

3. Interpretación y síntesis de datos de tablas de análisis de regresión;

4. Interpretación y síntesis de datos del cuadro de análisis de varianza;

5. Interpretación y generalización de datos de la tabla para evaluar la importancia de los parámetros de la ecuación de regresión;

Al realizar trabajos de laboratorio basados ​​​​en una de las opciones, debe completar las siguientes tareas específicas:

1. Seleccionar la forma de la ecuación para la relación de los factores en estudio;

2. Determinar los parámetros de la ecuación de regresión;

3. Evaluar la estrecha relación de los factores en estudio;

4. Evaluar la adecuación de la ecuación de regresión seleccionada;

5. Evaluar la significancia estadística de los parámetros de la ecuación de regresión.

6. Verificar la exactitud de los cálculos utilizando procedimientos y funciones estándar de hojas de cálculo de Excel.

7. Analizar los resultados, formular conclusiones y recomendaciones.

Asignaciones para trabajos prácticos y de laboratorio sobre el tema “Regresión lineal pareada y correlación en la investigación econométrica”.

Opción 1 opcion 2 Opción 3 Opción 4 Opción 5
X y X y X y X y X y
Opción 6 Opción 7 Opción 8 Opción 9 Opción 10
X y X y X y X y X y

En la investigación socioeconómica a menudo es necesario trabajar con una población limitada o con datos de muestra. Por lo tanto, después de los parámetros matemáticos de la ecuación de regresión, es necesario evaluarlos a ellos y a la ecuación en su conjunto para determinar su significancia estadística, es decir, es necesario asegurarse de que la ecuación resultante y sus parámetros se formen bajo la influencia de factores no aleatorios.

En primer lugar, se evalúa la significancia estadística de la ecuación en su conjunto. La evaluación suele realizarse mediante la prueba F de Fisher. El cálculo del criterio F se basa en la regla de sumar varianzas. Es decir, la característica de dispersión general-resultado = dispersión del factor + dispersión residual.

Precio actual

Precio teórico
Al construir una ecuación de regresión, es posible calcular el valor teórico de la característica del resultado, es decir, calculado utilizando la ecuación de regresión teniendo en cuenta sus parámetros.

Estos valores caracterizarán el atributo del resultado, formado bajo la influencia de factores incluidos en el análisis.

Siempre existen discrepancias (residuales) entre los valores reales del atributo del resultado y los calculados a partir de la ecuación de regresión, debido a la influencia de otros factores no incluidos en el análisis.

La diferencia entre los valores teóricos y reales del atributo de resultado se denomina residuos. Variación general del rasgo de resultado:

La variación en el atributo del resultado, provocada por la variación en las características de los factores incluidos en el análisis, se evalúa mediante comparaciones de los valores teóricos de los resultados. característica y sus valores medios. Variación residual mediante comparación de valores teóricos y reales de la característica resultante. La varianza total, residual y real tienen diferentes números de grados de libertad.

General, PAG- número de unidades de la población que se estudia

Actual, PAG- número de factores incluidos en el análisis

Residual

La prueba F de Fisher se calcula como la relación entre y se calcula para un grado de libertad.

Usar la prueba F de Fisher como estimación de la significancia estadística de una ecuación de regresión es muy lógico. - este es el resultado. característica, determinada por los factores incluidos en el análisis, es decir esta es la proporción del resultado explicado. firmar. - se trata de una (variación) de un atributo de resultado causada por factores cuya influencia no se tiene en cuenta, es decir no incluidos en el análisis.

Eso. La prueba F está diseñada para evaluar significativo exceso sobre . Si no es significativamente menor que , y más aún si excede , entonces el análisis no incluye aquellos factores que realmente influyen en el atributo del resultado.

Se tabula la prueba F de Fisher y el valor real se compara con el valor tabulado. Si , entonces la ecuación de regresión se considera estadísticamente significativa. Si, por el contrario, la ecuación no es estadísticamente significativa y no se puede utilizar en la práctica, la significancia de la ecuación en su conjunto indica la significancia estadística de los indicadores de correlación.

Después de estimar la ecuación en su conjunto, es necesario evaluar la significancia estadística de los parámetros de la ecuación. Esta evaluación se lleva a cabo utilizando el estadístico t de Student. El estadístico t se calcula como la relación entre los parámetros de la ecuación (módulo) y su error cuadrático medio estándar. Si se estima un modelo de un factor, entonces se calculan 2 estadísticas.

En todos los programas informáticos, el cálculo del error estándar y la estadística t de los parámetros se realiza con el cálculo de los propios parámetros. Estadísticos T tabulados. Si el valor es , entonces el parámetro se considera estadísticamente significativo, es decir, formado bajo la influencia de factores no aleatorios.

Calcular el estadístico t significa esencialmente probar la hipótesis nula de que el parámetro es insignificante, es decir, su igualdad a cero. Con un modelo unifactorial se evalúan 2 hipótesis: y

El nivel de significancia de aceptar la hipótesis nula depende del nivel de aceptación probabilidad de confianza. Entonces, si el investigador establece el nivel de probabilidad en 95%, se calculará el nivel de significancia de aceptación; por lo tanto, si el nivel de significancia es ≥ 0,05, entonces se acepta y los parámetros se consideran estadísticamente insignificantes. Si , entonces se rechaza y se acepta la alternativa: y .

Los paquetes de software estadístico también proporcionan el nivel de significancia para aceptar las hipótesis nulas. La evaluación de la importancia de la ecuación de regresión y sus parámetros puede dar los siguientes resultados:

En primer lugar, la ecuación en su conjunto es significativa (según la prueba F) y todos los parámetros de la ecuación también son estadísticamente significativos. Esto significa que la ecuación resultante se puede utilizar para tomar tanto las decisiones de gestión y para realizar previsiones.

En segundo lugar, según la prueba F, la ecuación es estadísticamente significativa, pero al menos uno de los parámetros de la ecuación no es significativo. La ecuación se puede utilizar para tomar decisiones de gestión con respecto a los factores que se analizan, pero no se puede utilizar para realizar pronósticos.

En tercer lugar, la ecuación no es estadísticamente significativa o, según la prueba F, la ecuación es significativa, pero todos los parámetros de la ecuación resultante no son significativos. La ecuación no se puede utilizar para ningún propósito.

Para que la ecuación de regresión sea reconocida como un modelo de la relación entre el atributo de resultado y los atributos de factor, es necesario que todos los factores más importantes, determinando el resultado, de modo que la interpretación significativa de los parámetros de la ecuación corresponda a conexiones con base teórica en el fenómeno en estudio. El coeficiente de determinación R2 debe ser > 0,5.

Al construir una ecuación de regresión múltiple, es recomendable realizar una evaluación utilizando el llamado coeficiente de determinación ajustado (R 2). El valor de R2 (así como la correlación) aumenta con el número de factores incluidos en el análisis. El valor del coeficiente está especialmente sobreestimado en poblaciones pequeñas. Para suprimir la influencia negativa, R 2 y las correlaciones se ajustan teniendo en cuenta el número de grados de libertad, es decir el número de elementos que varían libremente cuando se incluyen ciertos factores.

Coeficiente de determinación ajustado

PAG–tamaño de la población/número de observaciones

k– número de factores incluidos en el análisis

n-1– número de grados de libertad

(1-R 2)- el valor del resto/varianza inexplicable de la característica resultante

siempre menos R 2. basado en uno se pueden comparar las estimaciones de las ecuaciones con diferentes numeros factores analizados.

34. Problemas del estudio de series temporales.

Las series de tiempo se llaman series temporales o series temporales. Una serie de tiempo es una secuencia ordenada en el tiempo de indicadores que caracterizan un fenómeno particular (volumen del PIB de 90 a 98). El propósito del estudio de series de tiempo es identificar el patrón de desarrollo del fenómeno en estudio (la tendencia principal) y pronosticar sobre esta base. De la definición de RD se desprende que cualquier serie consta de dos elementos: el tiempo t y el nivel de la serie (aquellos valores específicos del indicador a partir de los cuales se construye la serie RD). La serie DR puede ser 1) momento: series cuyos indicadores se registran en un momento determinado, en una fecha específica, 2) intervalo: series cuyos indicadores se obtienen durante un cierto período de tiempo (1. población de San Petersburgo, 2. volumen del PIB del período). La división de las series en momento e intervalo es necesaria, ya que esto determina las características específicas del cálculo de algunos indicadores de la serie DR. Suma de niveles serie de intervalos da un resultado significativamente interpretable, lo que no se puede decir de la suma de los niveles de las series de momentos, ya que estas últimas contienen recuentos repetidos. El problema más importante en el análisis de series temporales es el problema de la comparabilidad de los niveles de las series. Este concepto es muy diverso. Los niveles deben ser comparables en términos de métodos de cálculo y en términos de territorio y cobertura de unidades de población. Si la serie DR se construye en términos de costos, entonces todos los niveles deben presentarse o calcularse en precios comparables. Al construir series de intervalos, los niveles deben caracterizar períodos de tiempo idénticos. Al construir series de momentos, los niveles deben registrarse en la misma fecha. La serie DR puede estar completa o incompleta. En publicaciones oficiales se utilizan filas incompletas (1980,1985,1990,1995,1996,1997,1998,1999...). Análisis comprensivo RD incluye el estudio de los siguientes puntos:

1. cálculo de indicadores de cambios en los niveles de RD

2. cálculo de indicadores promedio de RD

3. identificar la tendencia principal de la serie, construir modelos de tendencia

4. evaluación de la autocorrelación en RD, construcción de modelos autorregresivos

5. Correlación RD (estudio de conexiones entre m/a series DR)

6. Previsión de calles de rodaje.

35. Indicadores de cambios en los niveles de las series temporales. .

EN vista general RowD se puede representar:

y – nivel de DR, t – momento o período de tiempo al que pertenece el nivel (indicador), n – duración de la Serie DR (número de períodos). al estudiar una serie de dinámicas, se calculan los siguientes indicadores: 1. crecimiento absoluto, 2. coeficiente de crecimiento (tasa de crecimiento), 3. aceleración, 4. coeficiente de crecimiento (tasa de crecimiento), 5. valor absoluto 1% de aumento. Los indicadores calculados pueden ser: 1. en cadena: se obtiene comparando cada nivel de la serie con el inmediatamente anterior, 2. básico: se obtiene en comparación con el nivel seleccionado como base de comparación (a menos que se indique específicamente, el 1er nivel de la la serie se toma como base). 1. Incrementos absolutos en cadena:. Muestra cuánto más o menos. Los aumentos absolutos en cadena se denominan indicadores de la tasa de cambio de niveles. series de tiempo. Crecimiento absoluto de referencia: . Si los niveles de la serie son indicadores relativos expresados ​​en %, entonces el aumento absoluto se expresa en puntos de cambio. 2. tasa de crecimiento (tasa de crecimiento): Se calcula como la relación entre los niveles de la serie y los inmediatamente anteriores (coeficientes de crecimiento en cadena), o con el nivel tomado como base de comparación (coeficientes de crecimiento básicos): . Caracteriza cuantas veces cada nivel de la serie > o< предшествующего или базисного. На основе коэффициентов роста рассчитываются темпы роста. Это коэффициенты роста, выраженные в %ах: 3. basado en aumentos absolutos, el indicador se calcula - aceleración del crecimiento absoluto: . La aceleración es un aumento absoluto en aumentos absolutos. Evalúa cómo cambian las ganancias mismas, si son estables o se aceleran (aumentan). 4. tasa de crecimiento es la relación entre el crecimiento y la base de comparación. Expresado en %: ; . La tasa de crecimiento es la tasa de crecimiento menos el 100%. Muestra qué % es el nivel dado de la serie > o< предшествующего либо базисного. 5. абсолютное значение 1% прироста. Рассчитывается как отношение абсолютного прироста к темпу прироста, т.е.: - сотая доля предыдущего уровня. Все эти показатели рассчитываются для оценки степени изменения уровней ряда. Цепные коэффициенты и темпы роста называются показателями интенсивности изменения уровней ДРядов.

2. Cálculo de indicadores RD promedio. Se calculan los niveles promedio de fila, los aumentos absolutos promedio, las tasas de crecimiento promedio y las tasas de crecimiento promedio. Los indicadores promedio se calculan con el objetivo de resumir la información y permitir comparar los niveles e indicadores de su cambio en diferentes series. 1. nivel de la fila del medio a) para series de tiempo de intervalo se calcula utilizando la media aritmética simple: , donde n es el número de niveles de la serie de tiempo; b) para las series de momentos, el nivel medio se calcula mediante una fórmula específica, que se denomina media cronológica: . 2. aumento absoluto promedio calculado sobre la base de incrementos absolutos en cadena basados ​​en la media aritmética simple:

. 3. Tasa de crecimiento promedio calculado sobre la base de los coeficientes de crecimiento de la cadena utilizando la fórmula de la media geométrica: . Al comentar los indicadores promedio de la serie DR, es necesario señalar 2 puntos: el período que caracteriza el indicador analizado y el intervalo de tiempo para el cual se construyó la serie DR. 4. Tasa de crecimiento promedio: . 5. tasa de crecimiento promedio: .

El análisis de regresión es un método de investigación estadística que le permite mostrar la dependencia de un parámetro particular de una o más variables independientes. En la era anterior a la informática, su uso era bastante difícil, especialmente cuando se trataba de grandes volúmenes de datos. Hoy, después de haber aprendido a crear regresión en Excel, puede resolver problemas estadísticos complejos en solo un par de minutos. A continuación se muestran ejemplos específicos del campo de la economía.

Tipos de regresión

Este concepto en sí se introdujo en las matemáticas en 1886. La regresión ocurre:

  • lineal;
  • parabólico;
  • sosegado;
  • exponencial;
  • hiperbólico;
  • demostrativo;
  • logarítmico.

Ejemplo 1

Consideremos el problema de determinar la dependencia del número de miembros del equipo que renuncian del salario promedio en 6 empresas industriales.

Tarea. En seis empresas analizamos el promedio mensual salarios y el número de empleados que se fueron debido a a voluntad. En forma tabular tenemos:

Número de personas que abandonan

Salario

30.000 rublos

35.000 rublos

40.000 rublos

45.000 rublos

50.000 rublos

55.000 rublos

60.000 rublos

Para la tarea de determinar la dependencia del número de trabajadores que renuncian del salario promedio en 6 empresas, el modelo de regresión tiene la forma de la ecuación Y = a 0 + a 1 x 1 +...+a k x k, donde x i son los variables influyentes, a i son los coeficientes de regresión y k es el número de factores.

Para este problema, Y es el indicador de empleados que renuncian y el factor que influye es el salario, que denotamos por X.

Usando las capacidades del procesador de hojas de cálculo de Excel.

El análisis de regresión en Excel debe ir precedido de la aplicación de funciones integradas a los datos tabulares existentes. Sin embargo, para estos fines es mejor utilizar el muy útil complemento "Analysis Pack". Para activarlo necesitas:

  • desde la pestaña "Archivo" vaya a la sección "Opciones";
  • en la ventana que se abre, seleccione la línea "Complementos";
  • haga clic en el botón “Ir” ubicado debajo, a la derecha de la línea “Administración”;
  • Marque la casilla junto al nombre "Paquete de análisis" y confirme sus acciones haciendo clic en "Aceptar".

Si todo se hace correctamente, el botón requerido aparecerá en el lado derecho de la pestaña "Datos", ubicada encima de la hoja de cálculo de Excel.

en excel

Ahora que tenemos a mano todas las herramientas virtuales necesarias para realizar cálculos econométricos, podemos empezar a solucionar nuestro problema. Para esto:

  • Haga clic en el botón "Análisis de datos";
  • en la ventana que se abre, haga clic en el botón "Regresión";
  • en la pestaña que aparece, ingrese el rango de valores para Y (el número de empleados que renuncian) y para X (sus salarios);
  • Confirmamos nuestras acciones presionando el botón “Ok”.

Como resultado, el programa completará automáticamente una nueva hoja de cálculo con datos de análisis de regresión. ¡Nota! Excel le permite configurar manualmente la ubicación que prefiera para este propósito. Por ejemplo, podría ser la misma hoja donde se encuentran los valores Y y X, o incluso un nuevo libro de trabajo diseñado específicamente para almacenar dichos datos.

Análisis de resultados de regresión para R cuadrado

En Excel, los datos obtenidos durante el procesamiento de los datos en el ejemplo considerado tienen la forma:

En primer lugar, debes prestar atención al valor de R cuadrado. Representa el coeficiente de determinación. En este ejemplo, R-cuadrado = 0,755 (75,5%), es decir, los parámetros calculados del modelo explican la relación entre los parámetros considerados en un 75,5%. Cuanto mayor sea el valor del coeficiente de determinación, más adecuado será el modelo seleccionado para una tarea específica. Se considera que describe correctamente la situación real cuando el valor de R cuadrado es superior a 0,8. Si R cuadrado<0,5, то такой анализа регрессии в Excel нельзя считать резонным.

Análisis de probabilidades

El número 64,1428 muestra cuál será el valor de Y si todas las variables xi en el modelo que estamos considerando se ponen a cero. En otras palabras, se puede argumentar que el valor del parámetro analizado también está influenciado por otros factores que no están descritos en un modelo específico.

El siguiente coeficiente -0,16285, ubicado en la celda B18, muestra el peso de la influencia de la variable X sobre Y. Esto significa que el salario mensual promedio de los empleados dentro del modelo considerado afecta el número de personas que abandonan con un peso de -0,16285, es decir el grado de su influencia es completamente pequeño. El signo "-" indica que el coeficiente es negativo. Esto es obvio, ya que todo el mundo sabe que cuanto mayor es el salario en la empresa, menos personas expresan el deseo de rescindir el contrato de trabajo o renunciar.

Regresión múltiple

Este término se refiere a una ecuación de relación con varias variables independientes de la forma:

y=f(x 1 +x 2 +…x m) + ε, donde y es la característica resultante (variable dependiente), y x 1, x 2,…x m son características de los factores (variables independientes).

Estimación de parámetros

Para la regresión múltiple (MR), se lleva a cabo mediante el método de mínimos cuadrados (OLS). Para ecuaciones lineales de la forma Y = a + b 1 x 1 +…+b m x m + ε construimos un sistema de ecuaciones normales (ver más abajo)

Para comprender el principio del método, consideremos un caso de dos factores. Entonces tenemos una situación descrita por la fórmula

De aquí obtenemos:

donde σ es la varianza del atributo correspondiente reflejado en el índice.

OLS es aplicable a la ecuación MR en una escala estandarizada. En este caso obtenemos la ecuación:

en el que t y, t x 1, ... t xm son variables estandarizadas, cuyos valores promedio son iguales a 0; β i son los coeficientes de regresión estandarizados y la desviación estándar es 1.

Tenga en cuenta que todos los β i en este caso se especifican como normalizados y centralizados, por lo que su comparación entre sí se considera correcta y aceptable. Además, es habitual descartar factores descartando aquellos con los valores de βi más bajos.

Problema que utiliza la ecuación de regresión lineal

Supongamos que tenemos una tabla de dinámica de precios para un producto específico N durante los últimos 8 meses. Es necesario tomar una decisión sobre la conveniencia de comprar un lote a un precio de 1.850 rublos/tonelada.

número de mes

nombre del mes

precio del producto sustantivo, masculino—

1750 rublos por tonelada

1755 rublos por tonelada

1767 rublos por tonelada

1760 rublos por tonelada

1770 rublos por tonelada

1790 rublos por tonelada

1810 rublos por tonelada

1840 rublos por tonelada

Para resolver este problema en el procesador de hojas de cálculo de Excel, es necesario utilizar la herramienta "Análisis de datos", ya conocida por el ejemplo presentado anteriormente. A continuación, seleccione la sección "Regresión" y configure los parámetros. Hay que recordar que en el campo “Intervalo de entrada Y” se debe ingresar un rango de valores para la variable dependiente (en este caso, precios de bienes en meses específicos del año), y en el campo “Intervalo de entrada X” - para la variable independiente (número de mes). Confirme la acción haciendo clic en "Aceptar". En una hoja nueva (si así se indica) obtenemos datos para la regresión.

Utilizándolos, construimos una ecuación lineal de la forma y=ax+b, donde los parámetros a y b son los coeficientes de la línea con el nombre del número del mes y los coeficientes y líneas "intersección Y" de la hoja con los resultados del análisis de regresión. Por tanto, la ecuación de regresión lineal (LR) para la tarea 3 se escribe como:

Precio del producto N = 11.714* número de mes + 1727,54.

o en notación algebraica

y = 11,714 x + 1727,54

Análisis de resultados

Para decidir si la ecuación de regresión lineal resultante es adecuada se utilizan los coeficientes de correlación múltiple (MCC) y de determinación, así como el test de Fisher y el test t de Student. En la hoja de cálculo de Excel con resultados de regresión, se denominan R múltiple, R cuadrado, estadístico F y estadístico t, respectivamente.

KMC R permite evaluar la cercanía de la relación probabilística entre las variables independientes y dependientes. Su alto valor indica una conexión bastante fuerte entre las variables "Número de mes" y "Precio del producto N en rublos por 1 tonelada". Sin embargo, la naturaleza de esta relación sigue siendo desconocida.

El cuadrado del coeficiente de determinación R2 (RI) es una característica numérica de la proporción de la dispersión total y muestra la dispersión de qué parte de los datos experimentales, es decir, Los valores de la variable dependiente corresponden a la ecuación de regresión lineal. En el problema que nos ocupa, este valor es igual al 84,8%, es decir, los datos estadísticos se describen con un alto grado de precisión mediante la DE resultante.

El estadístico F, también llamado prueba de Fisher, se utiliza para evaluar la importancia de una relación lineal, refutando o confirmando la hipótesis de su existencia.

(Prueba de Student) ayuda a evaluar la importancia del coeficiente para un término desconocido o libre de una relación lineal. Si el valor de la prueba t > tcr, entonces se rechaza la hipótesis sobre la insignificancia del término libre de la ecuación lineal.

En el problema considerado para el término libre, utilizando herramientas de Excel, se obtuvo que t = 169.20903, y p = 2.89E-12, es decir, tenemos probabilidad cero de que se rechace la hipótesis correcta sobre la insignificancia del término libre. . Para el coeficiente de la incógnita t=5,79405 y p=0,001158. En otras palabras, la probabilidad de que se rechace la hipótesis correcta sobre la insignificancia del coeficiente para una incógnita es del 0,12%.

Por tanto, se puede argumentar que la ecuación de regresión lineal resultante es adecuada.

El problema de la viabilidad de comprar un paquete de acciones.

La regresión múltiple en Excel se realiza utilizando la misma herramienta de Análisis de datos. Consideremos un problema de aplicación específico.

La dirección de la empresa NNN debe decidir sobre la conveniencia de adquirir una participación del 20% en MMM JSC. El costo del paquete (SP) es de 70 millones de dólares estadounidenses. Los especialistas de NNN han recopilado datos sobre transacciones similares. Se decidió evaluar el valor del bloque de acciones según parámetros tales, expresados ​​en millones de dólares estadounidenses, como:

  • cuentas por pagar (VK);
  • volumen de facturación anual (VO);
  • cuentas por cobrar (VD);
  • costo de los activos fijos (COF).

Además, se utiliza el parámetro de los atrasos salariales de la empresa (V3 P) en miles de dólares estadounidenses.

Solución utilizando el procesador de hojas de cálculo Excel.

En primer lugar, debe crear una tabla de datos de origen. Se parece a esto:

  • llame a la ventana "Análisis de datos";
  • seleccione la sección "Regresión";
  • En el cuadro “Intervalo de entrada Y”, ingrese el rango de valores de las variables dependientes de la columna G;
  • Haga clic en el icono con una flecha roja a la derecha de la ventana "Intervalo de entrada X" y resalte el rango de todos los valores de las columnas B, C, D, F en la hoja.

Marque el elemento "Nueva hoja de trabajo" y haga clic en "Aceptar".

Obtener un análisis de regresión para un problema determinado.

Estudio de resultados y conclusiones.

"Recopilamos" la ecuación de regresión a partir de los datos redondeados presentados arriba en la hoja de cálculo de Excel:

SP = 0,103*SOF + 0,541*VO - 0,031*VK +0,405*VD +0,691*VZP - 265,844.

En una forma matemática más familiar, se puede escribir como:

y = 0,103*x1 + 0,541*x2 - 0,031*x3 +0,405*x4 +0,691*x5 - 265,844

Los datos de MMM JSC se presentan en la tabla:

Sustituyéndolos en la ecuación de regresión, obtenemos una cifra de 64,72 millones de dólares estadounidenses. Esto significa que no vale la pena comprar acciones de MMM JSC, ya que su valor de 70 millones de dólares está bastante inflado.

Como puede ver, el uso de la hoja de cálculo Excel y la ecuación de regresión permitió tomar una decisión informada sobre la viabilidad de una transacción muy específica.

Ahora ya sabes qué es la regresión. Los ejemplos de Excel discutidos anteriormente lo ayudarán a resolver problemas prácticos en el campo de la econometría.



Nuevo en el sitio

>

Más popular