Hogar Eliminación Cómo encontrar el valor de la tabla del criterio de Fisher. Criterio φ*: transformación angular de Fisher

Cómo encontrar el valor de la tabla del criterio de Fisher. Criterio φ*: transformación angular de Fisher

Criterio de Fisher le permite comparar las varianzas muestrales de dos muestras independientes. Para calcular F emp, necesita encontrar la relación de las varianzas de dos muestras, de modo que la varianza mayor esté en el numerador y la menor en el denominador. La fórmula para calcular el criterio de Fisher es:

donde están las varianzas de la primera y segunda muestra, respectivamente.

Dado que, según las condiciones del criterio, el valor del numerador debe ser mayor o igual que el valor del denominador, el valor de F emp siempre será mayor o igual a uno.

El número de grados de libertad también se determina de forma sencilla:

k 1 =n yo - 1 para la primera muestra (es decir, para la muestra cuya varianza es mayor) y k 2 = norte 2 - 1 para la segunda muestra.

En el Apéndice 1, los valores críticos del criterio de Fisher se encuentran mediante los valores de k 1 (línea superior de la tabla) y k 2 (columna izquierda de la tabla).

Si t em >t crit, entonces se acepta la hipótesis nula; en caso contrario, se acepta la alternativa.

Ejemplo 3. Las pruebas se realizaron en dos de tercer grado. desarrollo mental diez estudiantes en la prueba TURMSH. Los valores promedio obtenidos no difirieron significativamente, pero al psicólogo le interesa la cuestión de si existen diferencias en el grado de homogeneidad de los indicadores de desarrollo mental entre clases.

Solución. Para la prueba de Fisher, es necesario comparar las varianzas de las puntuaciones de las pruebas en ambas clases. Los resultados de la prueba se presentan en la tabla:

Tabla 3.

Estudiantes núms.

Primer grado

Segunda clase

Habiendo calculado las varianzas para las variables X e Y, obtenemos:

s X 2 =572,83; s y 2 =174,04

Luego, utilizando la fórmula (8) para el cálculo utilizando el criterio F de Fisher, encontramos:

Según la tabla del Apéndice 1 para el criterio F con grados de libertad en ambos casos iguales a k = 10 - 1 = 9, encontramos F crit = 3,18 (<3.29), следовательно, в терминах статистических гипотез можно утвер­ждать, что Н 0 (гипотеза о сходстве) может быть отвергнута на уровне 5%, а принимается в этом случае гипотеза Н 1 . Иcследователь может утверждать, что по степени однородности такого показа­теля, как умственное развитие, имеется различие между выбор­ками из двух классов.

6.2 Pruebas no paramétricas

Al comparar visualmente (por porcentaje) los resultados antes y después de cualquier impacto, el investigador llega a la conclusión de que si se observan diferencias, entonces hay una diferencia en las muestras que se comparan. Este enfoque es categóricamente inaceptable, ya que para porcentajes es imposible determinar el nivel de confiabilidad de las diferencias. Los porcentajes tomados por sí solos no permiten sacar conclusiones estadísticamente fiables. Para demostrar la eficacia de cualquier intervención, es necesario identificar una tendencia estadísticamente significativa en el sesgo (desplazamiento) de los indicadores. Para resolver tales problemas, un investigador puede utilizar varios criterios de discriminación. A continuación consideraremos pruebas no paramétricas: la prueba de signos y la prueba de chi-cuadrado.

La importancia de la ecuación de regresión múltiple en su conjunto, así como en la regresión pareada, se evalúa mediante el criterio de Fisher:

, (2.22)

Dónde
– factor suma de cuadrados por grado de libertad;
– suma residual de cuadrados por grado de libertad;
– coeficiente (índice) de determinación múltiple;
– número de parámetros para variables (en regresión lineal coincide con el número de factores incluidos en el modelo); – número de observaciones.

Se evalúa la importancia no sólo de la ecuación en su conjunto, sino también del factor incluido adicionalmente en el modelo de regresión. La necesidad de tal evaluación se debe al hecho de que no todos los factores incluidos en el modelo pueden aumentar significativamente la proporción de variación explicada en el rasgo resultante. Además, si hay varios factores en el modelo, se pueden ingresar en el modelo en diferentes secuencias. Debido a la correlación entre factores, la importancia de un mismo factor puede ser diferente dependiendo de la secuencia de su introducción en el modelo. La medida para evaluar la inclusión de un factor en el modelo es el precio privado
-criterio, es decir .

Privado
-El criterio se basa en comparar el aumento en la dispersión de los factores debido a la influencia de un factor incluido adicionalmente con la dispersión residual por un grado de libertad para el modelo de regresión en su conjunto. En términos generales para el factor privado
-el criterio se determinará como

, (2.23)

Dónde
– coeficiente de determinación múltiple para un modelo con un conjunto completo de factores,
– el mismo indicador, pero sin incluir el factor en el modelo ,– número de observaciones,
– número de parámetros en el modelo (sin término libre).

Valor real del cociente
- el criterio se compara con la tabla en el nivel de significancia
y número de grados de libertad: 1 y
. Si el valor real excede
, entonces la inclusión adicional del factor en el modelo está estadísticamente justificado y el coeficiente de regresión pura en factor Estadísticamente significante. Si el valor real es menor que el valor de la tabla, entonces inclusión adicional del factor en el modelo no aumenta significativamente la proporción de variación explicada en un rasgo , por lo tanto, no resulta apropiado incluirlo en el modelo; El coeficiente de regresión para este factor en este caso es estadísticamente insignificante.

Para una ecuación de dos factores, los cocientes
-los criterios tienen la forma:

,
. (2.23a)

Usando privado
-criterio, se puede verificar la significancia de todos los coeficientes de regresión bajo el supuesto de que cada factor correspondiente ingresado en último lugar en la ecuación de regresión múltiple.

-Prueba de Student para ecuación de regresión múltiple.

Privado
-El criterio evalúa la importancia de los coeficientes de regresión pura. Conociendo la magnitud , es posible determinar -criterio para el coeficiente de regresión en -factor m, , a saber:

. (2.24)

Evaluación de la importancia de los coeficientes de regresión pura mediante -La prueba t de Student se puede realizar sin calcular el parcial
-criterios. En este caso, como en la regresión por pares, se utiliza la fórmula para cada factor:

, (2.25)

Dónde – coeficiente de regresión pura en el factor ,– error cuadrático medio (estándar) del coeficiente de regresión .

Para una ecuación de regresión múltiple, el error cuadrático medio del coeficiente de regresión se puede determinar mediante la siguiente fórmula:

, (2.26)

Dónde ,– desviación estándar de la característica ,
– coeficiente de determinación de la ecuación de regresión múltiple,
– coeficiente de determinación de la dependencia del factor con todos los demás factores de la ecuación de regresión múltiple;
– número de grados de libertad para la suma residual de las desviaciones al cuadrado.

Como puede ver, para utilizar esta fórmula, necesita una matriz de correlación interfactorial y el cálculo de los coeficientes de determinación correspondientes con ella.
. Entonces, para la ecuación
Evaluación de la importancia de los coeficientes de regresión. ,,Implica el cálculo de tres coeficientes de determinación interfactorial:
,
,
.

La relación entre los indicadores del coeficiente de correlación parcial, parcial.
-criterios y -La prueba t de Student para coeficientes de regresión pura se puede utilizar en el procedimiento de selección de factores. La eliminación de factores al construir una ecuación de regresión mediante el método de eliminación prácticamente se puede realizar no solo mediante coeficientes de correlación parcial, excluyendo en cada paso el factor con el valor más pequeño e insignificante del coeficiente de correlación parcial, sino también mediante valores. Y . Privado
-El criterio se usa ampliamente al construir un modelo utilizando el método de inclusión de variables y el método de regresión por pasos.

)

Cálculo del criterio φ*

1. Determinar aquellos valores del atributo que serán el criterio para dividir a los sujetos en los que “tienen efecto” y los que “no tienen efecto”. Si la característica se mide cuantitativamente, utilice el criterio λ para encontrar el punto de separación óptimo.

2. Dibuje una tabla de cuatro celdas (sinónimo: cuatro campos) de dos columnas y dos filas. La primera columna es “hay un efecto”; segunda columna - "sin efecto"; primera línea desde arriba: 1 grupo (muestra); segunda línea - grupo 2 (muestra).

4. Cuente el número de sujetos de la primera muestra que “no tienen ningún efecto” e ingrese este número en la celda superior derecha de la tabla. Calcula la suma de las dos celdas superiores. Debe coincidir con el número de sujetos del primer grupo.

6. Cuente el número de sujetos de la segunda muestra que “no tienen ningún efecto” e ingrese este número en la celda inferior derecha de la tabla. Calcula la suma de las dos celdas inferiores. Debe coincidir con el número de sujetos del segundo grupo (muestra).

7. Determinar el porcentaje de sujetos que “tienen un efecto” relacionando su número con el número total de sujetos en un grupo determinado (muestra). Escriba los porcentajes resultantes en las celdas superior izquierda e inferior izquierda de la tabla entre paréntesis, respectivamente, para no confundirlos con valores absolutos.

8. Verifique si uno de los porcentajes que se comparan es igual a cero. Si este es el caso, intente cambiarlo moviendo el punto de separación del grupo en una dirección u otra. Si esto es imposible o indeseable, abandone el criterio φ* y utilice el criterio χ2.

9. Determinar según la tabla. XII Apéndice 1 ángulos φ para cada uno de los porcentajes comparados.

donde: φ1 - ángulo correspondiente al porcentaje mayor;

φ2 - ángulo correspondiente al porcentaje menor;

N1 - número de observaciones en la muestra 1;

N2: número de observaciones en la muestra 2.

11. Comparar el valor obtenido φ* con los valores críticos: φ* ≤1.64 (p<0,05) и φ* ≤2,31 (р<0,01).

Si φ*emp ≤φ*cr. Se rechaza H0.

Si es necesario, determine el nivel exacto de significancia del φ*emp resultante según la Tabla. XIII Apéndice 1.

Este método se describe en muchos manuales (Plokhinsky N.A., 1970; Gubler E.V., 1978; Ivanter E.V., Korosov A.V., 1992, etc.) Esta descripción se basa en la versión del método que fue desarrollado y presentado por E.V. Gubler.

Propósito del criterio φ*

El criterio de Fisher está diseñado para comparar dos muestras según la frecuencia de aparición del efecto (indicador) de interés para el investigador. Cuanto más grande sea, más fiables serán las diferencias.

Descripción del criterio

El criterio evalúa la confiabilidad de las diferencias entre aquellos porcentajes de dos muestras en las que se registró el efecto (indicador) que nos interesa. En sentido figurado, comparamos las 2 mejores piezas cortadas de 2 pasteles y decidimos cuál es realmente más grande.

La esencia de la transformación angular de Fisher es convertir porcentajes en valores de ángulos centrales, que se miden en radianes. Un porcentaje mayor corresponderá a un ángulo mayor φ, y un porcentaje menor corresponderá a un ángulo menor, pero las relaciones aquí no son lineales:

donde P es el porcentaje expresado en fracciones de una unidad (ver Fig. 5.1).

Con una discrepancia creciente entre los ángulos φ 1 y φ 2 y al aumentar el número de muestras, aumenta el valor del criterio. Cuanto mayor sea el valor de φ*, más probable es que las diferencias sean significativas.

Hipótesis

h 0 : Proporción de personas, en el que se manifiesta el efecto estudiado, no hay más en la muestra 1 que en la muestra 2.

h 1 : La proporción de individuos que exhiben el efecto estudiado es mayor en la muestra 1 que en la muestra 2.

Representación gráfica del criterio. φ*

El método de transformación angular es algo más abstracto que los demás criterios.

La fórmula seguida por E.V. Gubler al calcular los valores de φ supone que el 100% constituye un ángulo φ=3,142, es decir, un valor redondeado π=3,14159... Esto nos permite presentar las muestras comparadas en forma de dos semicírculos, cada uno de los cuales simboliza el 100% de la población de su muestra. Los porcentajes de sujetos con “efecto” se representarán como sectores formados por los ángulos centrales φ. En la Fig. La figura 5.2 muestra dos semicírculos que ilustran el ejemplo 1. En la primera muestra, el 60% de los sujetos resolvió el problema. Este porcentaje corresponde al ángulo φ=1,772. En la segunda muestra, el 40% de los sujetos resolvió el problema. Este porcentaje corresponde al ángulo φ =1,369.

El criterio φ* le permite determinar si uno de los ángulos es de hecho estadísticamente significativamente superior al otro para tamaños de muestra determinados.

Limitaciones del criterio φ*

1. Ninguna de las proporciones que se comparan debe ser cero. Formalmente, no existen obstáculos para utilizar el método φ en los casos en que la proporción de observaciones en una de las muestras sea igual a 0. Sin embargo, en estos casos, el resultado puede resultar injustificadamente inflado (Gubler E.V., 1978, p. 86).

2. superior no hay límite en el criterio φ: las muestras pueden ser tan grandes como se desee.

Más bajo límite: 2 observaciones en una de las muestras. Sin embargo, se deben observar las siguientes proporciones en el número de dos muestras:

a) si una muestra tiene solo 2 observaciones, entonces la segunda debe tener al menos 30:

b) si una de las muestras tiene solo 3 observaciones, entonces la segunda debe tener al menos 7:

c) si una de las muestras tiene solo 4 observaciones, entonces la segunda debe tener al menos 5:

d) ennorte 1 , norte 2 ≥ 5 Cualquier comparación es posible.

En principio, también es posible comparar muestras que no cumplan esta condición, por ejemplo, con la relaciónnorte 1 =2, norte 2 = 15, pero en estos casos no será posible identificar diferencias significativas.

El criterio φ* no tiene otras restricciones.

Veamos algunos ejemplos para ilustrar las posibilidades.criterio φ*.

Ejemplo 1: comparación de muestras según una característica cualitativamente definida.

Ejemplo 2: comparación de muestras según una característica medida cuantitativamente.

Ejemplo 3: comparación de muestras tanto por nivel como por distribución de una característica.

Ejemplo 4: Uso del criterio φ* en combinación con el criterioX Kolmogorov-Smirnov para lograr el resultado más preciso.

Ejemplo 1: comparación de muestras según una característica determinada cualitativamente

En este uso del criterio, comparamos el porcentaje de sujetos en una muestra caracterizada por alguna cualidad con el porcentaje de sujetos en otra muestra caracterizada por la misma calidad.

Digamos que estamos interesados ​​en saber si dos grupos de estudiantes difieren en su éxito al resolver un nuevo problema experimental. En el primer grupo de 20 personas, 12 personas lo solucionaron, y en la segunda muestra de 25 personas, 10. En el primer caso, el porcentaje de quienes resolvieron el problema será 12/20·100%=60%, y en el segundo 10/25·100%= 40%. ¿Estos porcentajes difieren significativamente según los datos?norte 1 Ynorte 2 ?

Parecería que incluso “a simple vista” se puede determinar que el 60% es significativamente mayor que el 40%. Sin embargo, de hecho, estas diferencias, dados los datosnorte 1 , norte 2 faltón.

Vamos a ver. Dado que estamos interesados ​​en el hecho de resolver un problema, consideraremos el éxito en la resolución de un problema experimental como un “efecto” y el fracaso en su resolución como la ausencia de un efecto.

Formulemos hipótesis.

h 0 : Proporción de personasNo hubo más personas que completaron la tarea en el primer grupo que en el segundo grupo.

h 1 : La proporción de personas que completaron la tarea en el primer grupo es mayor que en el segundo grupo.

Ahora construyamos la llamada tabla de cuatro celdas o de cuatro campos, que en realidad es una tabla de frecuencias empíricas para dos valores del atributo: "hay un efecto" - "no hay ningún efecto".

Tabla 5.1

Tabla de cuatro celdas para calcular el criterio al comparar dos grupos de sujetos según el porcentaje de quienes resolvieron el problema.

Grupos

“Hay un efecto”: problema resuelto

"Sin efecto": el problema no se soluciona

Cantidades

Cantidad

asignaturas

% compartir

Cantidad

asignaturas

% compartir

1 grupo

(60%)

(40%)

2do grupo

(40%)

(60%)

Cantidades

En una tabla de cuatro celdas, por regla general, las columnas "Hay un efecto" y "Sin efecto" están marcadas en la parte superior, y las filas "Grupo 1" y "Grupo 2" están a la izquierda. De hecho, en las comparaciones sólo participan los campos (celdas) A y B, es decir, los porcentajes en la columna "Hay un efecto".

Según la tabla.XIIEn el Apéndice 1 se determinan los valores de φ correspondientes a las participaciones porcentuales en cada uno de los grupos.

Ahora calculemos el valor empírico de φ* usando la fórmula:

donde φ 1 - ángulo correspondiente al porcentaje de participación mayor;

φ 2 - ángulo correspondiente al porcentaje menor;

norte 1 - número de observaciones en la muestra 1;

norte 2 - número de observaciones en la muestra 2.

En este caso:

Según la tabla.XIIIEn el Apéndice 1 determinamos qué nivel de significancia corresponde a φ* ellos=1,34:

p=0,09

También es posible establecer valores críticos de φ* correspondientes a los niveles de significación estadística aceptados en psicología:

Construyamos un "eje de significación".

El valor empírico obtenido φ* se encuentra en la zona de insignificancia.

Respuesta: h 0 aceptado. El porcentaje de personas que completaron la tarea.Ven el primer grupo no más que en el segundo grupo.

Sólo se puede simpatizar con un investigador que considera significativas diferencias del 20% e incluso del 10% sin comprobar su fiabilidad utilizando el criterio φ*. En este caso, por ejemplo, sólo serían significativas diferencias de al menos el 24,3%.

Parece que al comparar dos muestras sobre cualquier base cualitativa, el criterio φ puede entristecernos en lugar de alegrarnos. Lo que parecía significativo puede no serlo desde el punto de vista estadístico.

El criterio de Fisher tiene muchas más oportunidades de complacer al investigador cuando comparamos dos muestras según características medidas cuantitativamente y puede variar el "efecto".

Ejemplo 2: comparación de dos muestras según una característica medida cuantitativamente

En este uso del criterio, comparamos el porcentaje de sujetos de una muestra que alcanzan un cierto nivel de valor de atributo con el porcentaje de sujetos que alcanzan este nivel en otra muestra.

En un estudio de G. A. Tlegenova (1990), de 70 jóvenes estudiantes de escuelas vocacionales de entre 14 y 16 años, se seleccionaron en base a los resultados 10 sujetos con una puntuación alta en la escala de Agresión y 11 sujetos con una puntuación baja en la escala de Agresión. de una encuesta utilizando el Cuestionario de Personalidad de Friburgo. Es necesario determinar si los grupos de jóvenes agresivos y no agresivos difieren en cuanto a la distancia que eligen espontáneamente en una conversación con un compañero de estudios. Los datos de G. A. Tlegenova se presentan en la tabla. 5.2. Puedes notar que los jóvenes agresivos eligen con mayor frecuencia una distancia de 50cm o incluso menos, mientras que los niños no agresivos eligen con mayor frecuencia una distancia superior a 50 cm.

Ahora podemos considerar una distancia de 50 cm como crítica y asumir que si la distancia elegida por el sujeto es menor o igual a 50 cm, entonces “hay un efecto”, y si la distancia seleccionada es mayor a 50 cm, entonces "No hay ningún efecto". Vemos que en el grupo de jóvenes agresivos el efecto se observa en 7 de cada 10, es decir, en el 70% de los casos, y en el grupo de jóvenes no agresivos, en 2 de 11, es decir, en el 18,2% de los casos. . Estos porcentajes se pueden comparar mediante el método φ* para establecer la significancia de las diferencias entre ellos.

Tabla 5.2

Indicadores de la distancia (en cm) elegida por jóvenes agresivos y no agresivos en una conversación con un compañero de estudios (según G.A. Tlegenova, 1990)

Grupo 1: chicos con puntuaciones altas en la escala de AgresiónFPI- R (norte 1 =10)

Grupo 2: chicos con valores bajos en la escala de AgresividadFPI- R (norte 2 =11)

corriente continua metro )

% compartir

corriente continua METRO )

% compartir

"Comer

Efecto"

d≤50cm

18,2%

"No

efecto"

d>50 cm

80 QO

81,8%

Cantidades

100%

100%

Promedio

5b:o

77.3

Formulemos hipótesis.

h 0 d 50 cm, en el grupo de chicos agresivos no hay más que en el grupo de chicos no agresivos.

h 1 : Proporción de personas que eligen la distanciad50 cm, más en el grupo de jóvenes agresivos que en el grupo de jóvenes no agresivos. Ahora construyamos la llamada tabla de cuatro celdas.

Tabla 53

Tabla de cuatro celdas para calcular el criterio φ* al comparar grupos de agresivos (nf=10) y hombres jóvenes no agresivos (n2=11)

Grupos

"Hay un efecto": d≤50

"Sin efecto." d>50

Cantidades

Número de sujetos

(% compartir)

Número de sujetos

(% compartir)

Grupo 1: jóvenes agresivos

(70%)

(30%)

Grupo 2: hombres jóvenes no agresivos

(180%)

(81,8%)

Suma

Según la tabla.XIIEl Apéndice 1 determina los valores de φ correspondientes a las participaciones porcentuales del “efecto” en cada uno de los grupos.

El valor empírico obtenido φ* se encuentra en la zona de significancia.

Respuesta: h 0 rechazado. Aceptadoh 1 . La proporción de personas que eligen una distancia en la conversación menor o igual a 50 cm es mayor en el grupo de jóvenes agresivos que en el grupo de jóvenes no agresivos

Con base en los resultados obtenidos, podemos concluir que los jóvenes más agresivos eligen con mayor frecuencia una distancia inferior a medio metro, mientras que los jóvenes no agresivos eligen con mayor frecuencia una distancia superior a medio metro. Vemos que los jóvenes agresivos en realidad se comunican en el límite entre la zona íntima (0-46 cm) y la personal (a partir de 46 cm). Recordamos, sin embargo, que la distancia íntima entre socios es prerrogativa no sólo de relaciones buenas y cercanas, sino también deYcombate mano a mano (Salami. t., 1959).

Ejemplo 3: comparación de muestras tanto por nivel como por distribución de la característica.

En este caso de uso, primero podemos probar si los grupos difieren en los niveles de algún rasgo y luego comparar las distribuciones del rasgo en las dos muestras. Esta tarea puede ser relevante al analizar las diferencias en los rangos o la forma de la distribución de las evaluaciones obtenidas por los sujetos que utilizan cualquier técnica nueva.

En un estudio de R. T. Chirkina (1995), se utilizó por primera vez un cuestionario destinado a identificar la tendencia a reprimir de la memoria hechos, nombres, intenciones y métodos de acción debido a complejos personales, familiares y profesionales. El cuestionario fue elaborado con la participación de E.V. Sidorenko a partir de materiales del libro 3. Freud “Psicopatología de la vida cotidiana”. Se examinó una muestra de 50 estudiantes del Instituto Pedagógico, solteros, sin hijos, con edades entre 17 y 20 años, mediante este cuestionario, así como la técnica de Menester-Corzini para identificar la intensidad del sentimiento de insuficiencia personal.o"complejo de inferioridad" (manásterGRAMO. j., CorsiniR. j., 1982).

Los resultados de la encuesta se presentan en la tabla. 5.4.

¿Es posible decir que existen relaciones significativas entre el indicador de energía de represión, diagnosticado mediante un cuestionario, y los indicadores de la intensidad del sentimiento de propia insuficiencia?

Tabla 5.4

Indicadores de la intensidad de los sentimientos de insuficiencia personal en grupos de estudiantes con alto (Nueva Jersey=18) y baja (n2=24) energía de desplazamiento

Grupo 1: energía de desplazamiento de 19 a 31 puntos (norte 1 =181

Grupo 2: energía de desplazamiento de 7 a 13 puntos (norte 2 =24)

0; 0; 0; 0; 0

20; 20

30; 30; 30; 30; 30; 30; 30

50; 50

60; 60

0; 0

5; 5; 5; 5

10; 10; 10; 10; 10; 10

15; 15

20; 20; 20; 20

30; 30; 30; 30; 30; 30

Cantidades

Promedio

26,11

15,42

A pesar de que el valor medio en el grupo con represión más enérgica es superior, en él también se observan 5 valores cero. Si comparamos los histogramas de la distribución de calificaciones en las dos muestras, se revela un contraste sorprendente entre ellas (Fig. 5.3).

Para comparar dos distribuciones podríamos aplicar la prueba.χ 2 o criterioλ , pero para ello habría que ampliar las filas, y además, en ambas muestrasnorte <30.

El criterio φ* nos permitirá comprobar el efecto de la discrepancia entre dos distribuciones observadas en el gráfico si aceptamos asumir que “hay un efecto” si el indicador de sensación de insuficiencia toma muy bajo (0) o, por el contrario , valores muy altos (S30), y que “no hay efecto” si el indicador de sentimientos de insuficiencia toma valores medios, de 5 a 25.

Formulemos hipótesis.

h 0 : Los valores extremos del índice de deficiencia (0 o 30 o más) en el grupo con más represión enérgica no son más comunes que en el grupo con menos represión enérgica.

h 1 : Los valores extremos del índice de deficiencia (ya sea 0 o 30 o más) en el grupo con más represión enérgica son más comunes que en el grupo con menos represión enérgica.

Creemos una tabla de cuatro celdas conveniente para realizar más cálculos del criterio φ*.

Tabla 5.5

Tabla de cuatro celdas para calcular el criterio φ* al comparar grupos con mayor y menor energía de represión en función de la proporción de indicadores de insuficiencia

Grupos

“Hay un efecto”: el indicador de deficiencia es 0 o >30

“Sin efecto”: índice de fracaso de 5 a 25

Cantidades

(88,9%)

(11,1%)

(33,3%)

(66,7%)

Cantidades

Según la tabla.XIIEn el Apéndice 1 determinamos los valores de φ correspondientes a los porcentajes comparados:

Calculemos el valor empírico de φ*:

Valores críticos de φ* para cualquiernorte 1 , norte 2 , como recordamos del ejemplo anterior, son:

MesaXIIIEl Apéndice 1 nos permite determinar con mayor precisión el nivel de significancia del resultado obtenido: p<0,001.

Respuesta: h 0 rechazado. Aceptadoh 1 . Los valores extremos del índice de deficiencia (0 o 30 o más) en el grupo con mayor energía de represión ocurren con más frecuencia que en el grupo con menos energía de represión.

Así, los sujetos con mayor energía de represión pueden tener indicadores de sentimiento de propia insuficiencia tanto muy altos (30 o más) como muy bajos (cero). Se puede suponer que están reprimiendo tanto su insatisfacción como la necesidad de éxito en la vida. Estas suposiciones necesitan más pruebas.

El resultado obtenido, independientemente de su interpretación, confirma las capacidades del criterio φ* para evaluar diferencias en la forma de la distribución de un rasgo en dos muestras.

Había 50 personas en la muestra original, pero 8 de ellas fueron excluidas de la consideración por tener una puntuación media en el índice de anergia de represión (14-15). Sus indicadores de intensidad de los sentimientos de insuficiencia también son medios: 6 valores de 20 puntos cada uno y 2 valores de 25 puntos cada uno.

Las poderosas capacidades del criterio φ* pueden verificarse confirmando una hipótesis completamente diferente al analizar los materiales de este ejemplo. Podemos demostrar, por ejemplo, que en un grupo con mayor energía de represión la tasa de insuficiencia es aún mayor, a pesar de la naturaleza paradójica de su distribución en este grupo.

Formulemos nuevas hipótesis.

h 0 Los valores más altos del índice de deficiencia (30 o más) en el grupo con mayor energía de represión no son más comunes que en el grupo con menor energía de represión.

h 1 : Los valores más altos del índice de deficiencia (30 o más) en el grupo con mayor energía de represión ocurren con más frecuencia que en el grupo con menos energía de represión. Construyamos una tabla de cuatro campos usando los datos de Tabla. 5.4.

Tabla 5.6

Tabla de cuatro celdas para calcular el criterio φ* al comparar grupos con mayor y menor energía de represión según el nivel de indicador de insuficiencia

Grupos

“Hay efecto”* el indicador de falla es mayor o igual a 30

“Sin efecto”: la tasa de fracaso es menor 30

Cantidades

Grupo 1 - con mayor energía de desplazamiento

(61,1%)

(38.9%)

Grupo 2 - con menor energía de desplazamiento

(25.0%)

(75.0%)

Cantidades

Según la tabla.XIIIEn el Apéndice 1 determinamos que este resultado corresponde al nivel de significancia de p = 0,008.

Respuesta: Pero es rechazado. Aceptadohj: Los indicadores más altos de deficiencia (30 o más puntos) en el grupo.Concon mayor energía de desplazamiento ocurren con mayor frecuencia que en el grupo con menor energía de desplazamiento (p = 0,008).

Entonces pudimos demostrar queVgrupoConcon una represión más enérgica predominan los valores extremos del indicador de insuficiencia, y el hecho de que este indicador supere sus valoresalcanzaexactamente en este grupo.

Ahora podríamos intentar demostrar que en el grupo con mayor energía de represión son más habituales valores más bajos del índice de insuficiencia, a pesar de que el valor medioV este grupo tiene más (26,11 versus 15,42 en el grupoCon menor desplazamiento).

Formulemos hipótesis.

h 0 : Tasas de deficiencia más bajas (cero) en el grupoCon Las represiones con mayor energía no son más comunes que en el grupo.Con menor energía de desplazamiento.

h 1 : Se producen las tasas más bajas de deficiencia (cero)V grupo con mayor energía de represión con mayor frecuencia que en el grupoCon represión menos enérgica. Agrupemos los datos en una nueva tabla de cuatro celdas.

Tabla 5.7

Tabla de cuatro celdas para comparar grupos con diferentes energías de represión según la frecuencia de valores cero del indicador de deficiencia

Grupos

"Hay un efecto": el indicador de falla es 0

"Ningún efecto" de la insuficiencia

el indicador no es igual a 0

Cantidades

Grupo 1 - con mayor energía de desplazamiento

(27,8%)

(72,2%)

1 grupo - con menos energía de desplazamiento

(8,3%)

(91,7%)

Cantidades

Determinamos los valores de φ y calculamos el valor de φ*:

Respuesta: h 0 rechazado. Los índices más bajos de insuficiencia (cero) en el grupo con mayor energía de represión son más comunes que en el grupo con menor energía de represión (p<0,05).

En total, los resultados obtenidos pueden considerarse como evidencia de una coincidencia parcial de los conceptos de complejo en S. Freud y A. Adler.

Es significativo que entre el indicador de energía de represión y el indicador de intensidad del sentimiento de insuficiencia propia en el conjunto de la muestra se obtuvo una correlación lineal positiva (p = +0,491, p<0,01). Как мы можем убедиться, применение критерия φ* позволяет проникнуть в более тонкие и содержательно значимые соотношения между этими двумя показателями.

Ejemplo 4: uso del criterio φ* en combinación con el criterio λ Kolmogorov-Smirnov para lograr el máximo precisoresultado

Si las muestras se comparan según indicadores medidos cuantitativamente, surge el problema de identificar el punto de distribución que puede usarse como punto crítico para dividir a todos los sujetos entre aquellos que “tienen un efecto” y aquellos que “no tienen un efecto”.

En principio, el punto en el que dividiríamos el grupo en subgrupos donde hay un efecto y donde no hay efecto puede elegirse de forma bastante arbitraria. Nos puede interesar cualquier efecto y, por tanto, podemos dividir ambas muestras en dos partes en cualquier momento, siempre que tenga algún sentido.

Sin embargo, para maximizar la potencia de la prueba φ*, es necesario seleccionar el punto en el que las diferencias entre los dos grupos comparados son mayores. Con mayor precisión, podemos hacer esto usando un algoritmo para calcular el criterio.λ , permitiéndole detectar el punto de máxima discrepancia entre dos muestras.

Posibilidad de combinar criterios φ* yλ descrito por E.V. Gubler (1978, págs. 85-88). Intentemos utilizar este método para resolver el siguiente problema.

En un estudio conjunto de M.A. Kurochkina, E.V. Sidorenko y Yu.A. Churakov (1992) en el Reino Unido realizó una encuesta entre médicos generales ingleses de dos categorías: a) médicos que apoyaban la reforma médica y ya habían convertido sus oficinas de recepción en organizaciones tenedoras de fondos con su propio presupuesto; b) los médicos cuyos consultorios aún no cuentan con fondos propios y están financiados íntegramente por el presupuesto estatal. Se enviaron cuestionarios a una muestra de 200 médicos, representativa de la población general de médicos ingleses en términos de representación de personas de diferente género, edad, antigüedad en el servicio y lugar de trabajo, en grandes ciudades o en provincias.

Respondieron al cuestionario 78 médicos, de los cuales 50 trabajaban en salas de espera con fondos y 28 en salas de espera sin fondos. Cada uno de los médicos tuvo que predecir cuál sería la proporción de ingresos con fondos para el próximo año, 1993. Sólo 70 médicos de 78 que enviaron respuestas respondieron a esta pregunta. La distribución de sus pronósticos se presenta en la Tabla. 5.8 por separado para el grupo de médicos con fondos y el grupo de médicos sin fondos.

¿Los pronósticos de los médicos con fondos y de los médicos sin fondos son diferentes en algún aspecto?

Tabla 5.8

Distribución de las previsiones de los médicos generales sobre cuál será la proporción de urgencias con fondos en 1993

Participación proyectada

salas de recepción con fondos

médicos con el fondo (norte 1 =45)

médicos sin fondo (norte 2 =25)

Cantidades

1. de 0 a 20%

4

5

9

2. del 21 al 40%

15

Y

26

3. del 41 al 60%

18

5

23

4. del 61 al 80%

7

4

Y

5. del 81 al 100%

1

0

1

Cantidades

45

25

70

Determinemos el punto de máxima discrepancia entre las dos distribuciones de respuesta utilizando el Algoritmo 15 de la cláusula 4.3 (ver Tabla 5.9).

Tabla 5.9

Cálculo de la diferencia máxima de frecuencias acumuladas en las distribuciones de pronósticos de médicos de dos grupos.

Proporción proyectada de admisiones con fondos (%)

Frecuencias empíricas de elección para una categoría de respuesta determinada

Frecuencias empíricas

Frecuencias empíricas acumuladas

Diferencia (d)

doctores con el fondo(norte 1 =45)

médicos sin fondo (norte 2 =25)

F* oh 1

F* a2

F* e1

F* a1

1. de 0 a 20%

2. del 21 al 40%

3. del 41 al 60%

4. del 61 al 80%

5. del 81 al 100%

4

15

18

7

1

5

11

5

4

0

0,089 0,333 0,400 0,156 0,022

0,200 0,440 0,200 0,160 0

0,089 0,422 0,822 0,978 1,000

0,200

0,640

0,840

1,000

1,000

0111

0,218 0,018 0,022

0

La diferencia máxima detectada entre dos frecuencias empíricas acumuladas es0,218.

Esta diferencia resulta acumulada en la segunda categoría del pronóstico. Intentemos utilizar el límite superior de esta categoría como criterio para dividir ambas muestras en un subgrupo donde "hay un efecto" y un subgrupo donde "no hay efecto". Supondremos que hay un “efecto” si un determinado médico predice entre el 41 y el 100% de los ingresos con fondos en1993 año, y que no hay “ningún efecto” si un determinado médico predice del 0 al 40% de los ingresos con fondos en1993 año. Combinamos las categorías de pronóstico 1 y 2 por un lado, y las categorías de pronóstico 3, 4 y 5 por el otro. La distribución resultante de pronósticos se presenta en la Tabla. 5.10.

Tabla 5.10

Distribución de pronósticos para médicos con fondos y médicos sin fondos.

Proporción proyectada de admisiones con fondos (%1

Frecuencias empíricas para elegir una categoría de pronóstico determinada

Cantidades

doctores con el fondo(norte 1 =45)

doctores sin fondo(norte 2 =25)

1. de 0 a 40%

19

16

35

2. del 41 al 100%

26

9

35

Cantidades

45

25

70

Podemos usar la tabla resultante (Tabla 5.10) para probar diferentes hipótesis comparando dos de sus celdas. Recordamos que se trata de la denominada tabla de cuatro celdas o de cuatro campos.

En este caso, nos interesa saber si los médicos que ya tienen fondos predicen que el movimiento será mayor en el futuro que los médicos que no tienen fondos. Por lo tanto, consideramos condicionalmente que “hay un efecto” cuando el pronóstico cae en la categoría del 41 al 100%. Para simplificar los cálculos, ahora necesitamos girar la mesa 90°, girándola en el sentido de las agujas del reloj. Incluso puedes hacerlo literalmente girando el libro junto con la mesa. Ahora podemos pasar a la hoja de trabajo para calcular el criterio φ*: Transformada angular de Fisher.

Mesa 5.11

Tabla de cuatro celdas para calcular la prueba φ* de Fisher para identificar diferencias en el pronóstico de dos grupos de médicos generales

Grupo

Hay un efecto: pronóstico del 41 al 100%

Sin efecto - previsión de 0 a 40%

Total

Igrupo - médicos que tomaron el fondo

26 (57.8%)

19 (42.2%)

45

IIgrupo - médicos que no aceptaron el fondo

9 (36.0%)

16 (64.0%)

25

Total

35

35

70

Formulemos hipótesis.

h 0 : Proporción de personasPrediciendo la distribución de fondos al 41%-100% de todos los consultorios médicos, en el grupo de médicos con fondos no hay más que en el grupo de médicos sin fondos.

h 1 : La proporción de personas que predicen la distribución de los fondos hasta el 41%-100% de todas las admisiones es mayor en el grupo de médicos con fondos que en el grupo de médicos sin fondos.

Determinando los valores de φ 1 y φ 2 según tablaXIIApéndice 1. Recuerde que φ 1 es siempre el ángulo correspondiente al mayor porcentaje.

Ahora determinemos el valor empírico del criterio φ*:

Según la tabla.XIIIEn el Apéndice 1 determinamos a qué nivel de significancia corresponde este valor: p = 0,039.

Utilizando la misma tabla del Apéndice 1, se pueden determinar los valores críticos del criterio φ*:

Respuesta: Pero se rechaza (p=0,039). La proporción de personas que predicen la distribución de fondos a41-100 % de todas las recepciones en el grupo de médicos que tomaron el fondo excede esta proporción en el grupo de médicos que no tomaron el fondo.

En otras palabras, los médicos que ya trabajan en sus salas de espera con un presupuesto separado predicen una mayor difusión de esta práctica este año que los médicos que aún no han aceptado pasar a un presupuesto independiente. Hay múltiples interpretaciones de este resultado. Por ejemplo, se puede suponer que los médicos de cada grupo inconscientemente consideran que su comportamiento es más típico. Esto también puede significar que los médicos que ya han adoptado la autofinanciación tienden a exagerar el alcance de este movimiento, ya que necesitan justificar su decisión. Las diferencias identificadas también pueden significar algo que está completamente fuera del alcance de las preguntas planteadas en el estudio. Por ejemplo, que la actividad de los médicos que trabajan con un presupuesto independiente contribuye a agudizar las diferencias en las posiciones de ambos grupos. Fueron más activos cuando aceptaron recibir los fondos; fueron más activos cuando se tomaron la molestia de responder el cuestionario por correo; son más activos cuando predicen que otros médicos serán más activos a la hora de recibir fondos.

De una forma u otra, podemos estar seguros de que el nivel detectado de diferencias estadísticas es el máximo posible para estos datos reales. Establecimos usando el criterioλ el punto de máxima divergencia entre las dos distribuciones, y fue en este punto que las muestras se dividieron en dos partes.

Tu marca.

En este ejemplo, consideraremos cómo se evalúa la confiabilidad de la ecuación de regresión resultante. La misma prueba se utiliza para probar la hipótesis de que los coeficientes de regresión son simultáneamente iguales a cero, a=0, b=0. En otras palabras, la esencia de los cálculos es responder a la pregunta: ¿se pueden utilizar para análisis y pronósticos adicionales?

Para determinar si las varianzas en dos muestras son similares o diferentes, utilice esta prueba t.


Entonces, el propósito del análisis es obtener alguna estimación, con la ayuda de la cual se podría afirmar que, para un cierto nivel de α, la ecuación de regresión resultante es estadísticamente confiable. Para esto Se utiliza el coeficiente de determinación R 2..
La prueba de significancia de un modelo de regresión se lleva a cabo mediante la prueba F de Fisher, cuyo valor calculado se encuentra como la relación entre la varianza de la serie original de observaciones del indicador en estudio y la estimación insesgada de la varianza de la secuencia residual. para este modelo.
Si el valor calculado con k 1 =(m) y k 2 =(n-m-1) grados de libertad es mayor que el valor tabulado en un nivel de significancia determinado, entonces el modelo se considera significativo.

donde m es el número de factores en el modelo.
La significación estadística de la regresión lineal pareada se evalúa mediante el siguiente algoritmo:
1. Se plantea la hipótesis nula de que la ecuación en su conjunto es estadísticamente insignificante: H 0: R 2 =0 en el nivel de significancia α.
2. A continuación, determine el valor real del criterio F:


donde m=1 para regresión por pares.
3. El valor tabulado se determina a partir de las tablas de distribución de Fisher para un nivel de significancia dado, teniendo en cuenta que el número de grados de libertad para la suma total de cuadrados (varianza mayor) es 1 y el número de grados de libertad para el residual La suma de cuadrados (varianza más pequeña) en la regresión lineal es n-2 (o mediante la función de Excel FRIST(probabilidad,1,n-2)).
La tabla F es el valor máximo posible del criterio bajo la influencia de factores aleatorios con determinados grados de libertad y nivel de significancia α. El nivel de significancia α es la probabilidad de rechazar la hipótesis correcta, siempre que sea cierta. Normalmente se considera que α es 0,05 o 0,01.
4. Si el valor real de la prueba F es menor que el valor de la tabla, entonces dicen que no hay razón para rechazar la hipótesis nula.
En caso contrario, se rechaza la hipótesis nula y con probabilidad (1-α) se acepta la hipótesis alternativa sobre la significancia estadística de la ecuación en su conjunto.
Tabla de valores del criterio con grados de libertad k 1 =1 y k 2 =48, F tabla = 4

conclusiones: Dado que el valor real F > F tabla, el coeficiente de determinación es estadísticamente significativo ( la estimación de la ecuación de regresión encontrada es estadísticamente confiable) .

Análisis de variación

.

Indicadores de calidad de la ecuación de regresión.

Ejemplo. Sobre la base de un total de 25 empresas comerciales, se estudia la relación entre las siguientes características: X - precio del producto A, en miles de rublos; Y es el beneficio de una empresa comercial, millones de rublos. Al evaluar el modelo de regresión se obtuvieron los siguientes resultados intermedios: ∑(y i -y x) 2 = 46000; ∑(y i -y avg) 2 = 138000. ¿Qué indicador de correlación se puede determinar a partir de estos datos? Calcule el valor de este indicador basándose en este resultado y utilizando Prueba F de Fisher Sacar conclusiones sobre la calidad del modelo de regresión.
Solución. A partir de estos datos podemos determinar la relación de correlación empírica: , donde ∑(y avg -y x) 2 = ∑(y i -y avg) 2 - ∑(y i -y x) 2 = 138000 - 46000 = 92,000.
η 2 = 92.000/138.000 = 0,67, η = 0,816 (0,7< η < 0.9 - связь между X и Y высокая).

Prueba F de Fisher: norte = 25, metro = 1.
R 2 = 1 - 46000/138000 = 0,67, F = 0,67/(1-0,67)x(25 - 1 - 1) = 46. Tabla F (1; 23) = 4,27
Dado que el valor real F > Ftabla, la estimación encontrada de la ecuación de regresión es estadísticamente confiable.

Pregunta: ¿Qué estadísticas se utilizan para probar la importancia de un modelo de regresión?
Respuesta: Para determinar la importancia de todo el modelo en su conjunto, se utiliza el estadístico F (prueba de Fisher).

Para comparar dos poblaciones distribuidas normalmente que no tienen diferencias en las medias muestrales, pero sí una diferencia en las varianzas, utilice prueba de pescador. El criterio real se calcula mediante la fórmula:

donde el numerador es el valor mayor de la varianza muestral y el denominador es el menor. Para concluir la confiabilidad de las diferencias entre muestras, use EL PRINCIPIO BÁSICO probar hipótesis estadísticas. puntos críticos para
están contenidos en la tabla. La hipótesis nula se rechaza si el valor real
excederá o será igual al valor crítico (estándar)
este valor para el nivel de significancia aceptado y número de grados de libertad k 1 = norte grande -1 ; k 2 = norte menor -1 .

Ejemplo: al estudiar el efecto de un determinado fármaco sobre la tasa de germinación de las semillas, se encontró que en el lote experimental de semillas y en el control, la tasa de germinación promedio es la misma, pero hay una diferencia en las variaciones.
=1250,
=417. Los tamaños de muestra son iguales e iguales a 20.

=2,12. Por tanto, se rechaza la hipótesis nula.

Dependencia de correlación. Coeficiente de correlación y sus propiedades. Ecuaciones de regresión.

TAREA El análisis de correlación se reduce a:

    Establecer la dirección y forma de conexión entre características;

    Midiendo su estanqueidad.

Funcional Se denomina relación inequívoca entre cantidades variables cuando un cierto valor de una variable (independiente) X , llamado argumento, corresponde a un cierto valor de otra variable (dependiente) en , llamada función. ( Ejemplo: dependencia de la velocidad de una reacción química de la temperatura; dependencia de la fuerza de atracción de las masas de los cuerpos que se atraen y la distancia entre ellos).

Correlación Es una relación entre variables que tiene carácter estadístico, cuando a un determinado valor de una característica (considerada como variable independiente) le corresponde toda una serie de valores numéricos de otra característica. ( Ejemplo: relación entre cosecha y lluvia; entre altura y peso, etc.).

Campo de correlación representa un conjunto de puntos cuyas coordenadas son iguales a pares de valores de variables obtenidos experimentalmente X Y en .

Por el tipo de campo de correlación se puede juzgar la presencia o ausencia de una conexión y su tipo.



La conexión se llama positivo , si cuando una variable aumenta, otra variable aumenta.

La conexión se llama negativo , si cuando una variable aumenta, otra disminuye.

La conexión se llama lineal , si se puede representar analíticamente como
.

Un indicador de la cercanía de la conexión es coeficiente de correlación . El coeficiente de correlación empírica viene dado por:

El coeficiente de correlación oscila entre -1 antes 1 y caracteriza el grado de cercanía entre cantidades X Y y . Si:


La correlación entre características se puede describir de diferentes maneras. En particular, cualquier forma de conexión puede expresarse mediante una ecuación de la forma general
. Ecuación de la forma
Y
son llamados regresión . Ecuación de regresión directa en en X en el caso general se puede escribir en la forma

Ecuación de regresión directa X en en en general parece

Los valores más probables de los coeficientes. A Y V, Con Y d se puede calcular, por ejemplo, utilizando el método de mínimos cuadrados.



Nuevo en el sitio

>

Más popular