Hogar Estomatitis El intervalo de confianza es igual a. Intervalo de confianza

El intervalo de confianza es igual a. Intervalo de confianza

Hay dos tipos de estimaciones en estadística: puntuales y de intervalo. Punto estimado representa una estadística de muestra separada que se utiliza para estimar un parámetro población. Por ejemplo, la media muestral es una estimación puntual expectativa matemática población y varianza muestral S 2- estimación puntual de la varianza poblacional s 2. Se ha demostrado que la media muestral es una estimación insesgada de la expectativa matemática de la población. Una media muestral se llama insesgada porque el promedio de todas las medias muestrales (con el mismo tamaño de muestra) norte) es igual a la expectativa matemática de la población general.

Para que la varianza muestral S 2 se convirtió en una estimación insesgada de la varianza poblacional s 2, el denominador de la varianza muestral debe establecerse igual a norte – 1 , pero no norte. En otras palabras, la varianza poblacional es el promedio de todas las posibles varianzas muestrales.

Al estimar parámetros poblacionales, se debe tener en cuenta que las estadísticas muestrales como , dependen de muestras específicas. Para tener en cuenta este hecho, para obtener estimación de intervalo expectativa matemática de la población general, analizar la distribución de las medias muestrales (para más detalles, ver). El intervalo construido se caracteriza por un cierto nivel de confianza, que representa la probabilidad de que el verdadero parámetro poblacional se estime correctamente. Se pueden utilizar intervalos de confianza similares para estimar la proporción de una característica. R y la principal masa distribuida de la población.

Descarga la nota en formato o, ejemplos en formato

Construir un intervalo de confianza para la expectativa matemática de la población con una desviación estándar conocida

Construir un intervalo de confianza para la proporción de una característica en la población

Esta sección amplía el concepto de intervalo de confianza a datos categóricos. Esto nos permite estimar la proporción de la característica en la población. R usando muestra compartida RS=X/norte. Como se indicó, si las cantidades norteR Y norte(1-p) excede el número 5, la distribución binomial se puede aproximar de forma normal. Por lo tanto, para estimar la proporción de una característica en la población R es posible construir un intervalo cuyo nivel de confianza sea igual a (1 – α)х100%.


Dónde pagS- proporción muestral de la característica igual a X/norte, es decir. número de éxitos dividido por el tamaño de la muestra, R- la proporción de la característica en la población general, z- valor crítico de estandarizado distribución normal, norte- tamaño de la muestra.

Ejemplo 3. Supongamos que una muestra compuesta por 100 facturas completadas durante el mes pasado. Digamos que 10 de estas facturas fueron compiladas con errores. De este modo, R= 10/100 = 0,1. El nivel de confianza del 95% corresponde al valor crítico Z = 1,96.

Así, la probabilidad de que entre un 4,12% y un 15,88% de las facturas contengan errores es del 95%.

Para un tamaño de muestra dado, el intervalo de confianza que contiene la proporción de la característica en la población parece más amplio que para una muestra continua. variable aleatoria. Esto se debe a que las mediciones de una variable aleatoria continua contienen más información que las mediciones de datos categóricos. En otras palabras, los datos categóricos que toman sólo dos valores no contienen información suficiente para estimar los parámetros de su distribución.

ENcalcular estimaciones extraídas de una población finita

Estimación de la expectativa matemática. Factor de corrección para la población final ( fpc) se utilizó para reducir el error estándar en un factor. Al calcular los intervalos de confianza para las estimaciones de los parámetros de la población, se aplica un factor de corrección en situaciones en las que las muestras se extraen sin ser devueltas. Por tanto, un intervalo de confianza para la expectativa matemática que tenga un nivel de confianza igual a (1 – α)х100%, se calcula mediante la fórmula:

Ejemplo 4. Para ilustrar el uso del factor de corrección para una población finita, volvamos al problema de calcular el intervalo de confianza para el monto promedio de facturas, discutido anteriormente en el Ejemplo 3. Supongamos que una empresa emite 5000 facturas por mes, y X=110,27 dólares, S= $28,95, norte = 5000, norte = 100, α = 0,05, t99 = 1,9842. Usando la fórmula (6) obtenemos:

Estimación de la participación de una característica. Al elegir sin retorno, el intervalo de confianza para la proporción del atributo que tiene un nivel de confianza igual a (1 – α)х100%, se calcula mediante la fórmula:

Intervalos de confianza y cuestiones éticas

Al tomar muestras de una población y sacar conclusiones estadísticas, a menudo surgen cuestiones éticas. El principal es cómo coinciden los intervalos de confianza y las estimaciones puntuales de las estadísticas muestrales. Publicar estimaciones puntuales sin especificar los intervalos de confianza asociados (normalmente al nivel de confianza del 95%) y el tamaño de la muestra de la que se derivan puede crear confusión. Esto puede dar al usuario la impresión de que la estimación puntual es exactamente lo que necesita para predecir las propiedades de toda la población. Por lo tanto, es necesario comprender que en cualquier investigación la atención no debe centrarse en estimaciones puntuales, sino en estimaciones de intervalo. Además, Atención especial debería ser dado la elección correcta tamaños de muestra.

Muy a menudo, los objetos de manipulación estadística son los resultados de encuestas sociológicas de la población sobre determinadas cuestiones políticas. En este caso, los resultados de la encuesta se publican en las portadas de los periódicos y el error encuesta de muestra y la metodología para el análisis estadístico está impresa en algún punto intermedio. Para demostrar la validez de las estimaciones puntuales obtenidas, es necesario indicar el tamaño de la muestra a partir de la cual se obtuvieron, los límites del intervalo de confianza y su nivel de significancia.

siguiente nota

Se utilizan materiales del libro Levin et al., Statistics for Managers. – M.: Williams, 2004. – pág. 448–462

Teorema del límite central afirma que con un tamaño de muestra suficientemente grande, la distribución muestral de medias puede aproximarse mediante una distribución normal. Esta propiedad no depende del tipo de distribución de la población.

En las subsecciones anteriores consideramos la cuestión de estimar un parámetro desconocido. A un número. Esto se llama estimación “puntual”. En una serie de tareas, no sólo es necesario buscar el parámetro A valor numérico adecuado, sino también para evaluar su precisión y fiabilidad. Necesita saber qué errores puede provocar la sustitución de un parámetro A su estimación puntual A¿Y con qué grado de confianza podemos esperar que estos errores no excedan los límites conocidos?

Los problemas de este tipo son especialmente relevantes con un número pequeño de observaciones, cuando la estimación puntual y en es en gran medida aleatorio y la sustitución aproximada de a por a puede provocar errores graves.

Para dar una idea de la exactitud y fiabilidad de la estimación. A,

V estadística matemática Utilizan los llamados intervalos de confianza y probabilidades de confianza.

Sea el parámetro A estimación insesgada obtenida de la experiencia A. Queremos estimar el posible error en este caso. Asignemos una probabilidad p suficientemente grande (por ejemplo, p = 0,9, 0,95 o 0,99) tal que un evento con probabilidad p pueda considerarse prácticamente confiable, y encontremos un valor s para el cual

Luego, el rango de valores prácticamente posibles del error que surge durante el reemplazo. A en A, será ± s; Los errores grandes en valor absoluto aparecerán sólo con una probabilidad baja a = 1 - p. Reescribamos (14.3.1) como:

La igualdad (14.3.2) significa que con probabilidad p valor desconocido parámetro A cae dentro del intervalo

Es necesario señalar una circunstancia. Anteriormente, hemos considerado repetidamente la probabilidad de que una variable aleatoria caiga en un intervalo no aleatorio determinado. Aquí la situación es diferente: la magnitud A no es aleatorio, pero el intervalo /p es aleatorio. Su posición en el eje x es aleatoria, determinada por su centro A; En general, la longitud del intervalo 2s también es aleatoria, ya que el valor de s se calcula, por regla general, a partir de datos experimentales. Por lo tanto en en este caso Sería mejor interpretar el valor p no como la probabilidad de "acertar" en un punto. A en el intervalo / p, y como la probabilidad de que un intervalo aleatorio / p cubra el punto A(Figura 14.3.1).

Arroz. 14.3.1

La probabilidad p generalmente se llama probabilidad de confianza, y intervalo / p - intervalo de confianza. Límites de intervalo Si. ax =a- arena un 2 = un + y se llaman límites de confianza.

Demos otra interpretación al concepto de intervalo de confianza: puede considerarse como un intervalo de valores de parámetros. A, compatible con los datos experimentales y no contradecirlos. De hecho, si aceptamos considerar un evento con probabilidad a = 1-p prácticamente imposible, entonces aquellos valores del parámetro a para los cuales un - un> s deben ser reconocidos como datos experimentales contradictorios, y aquellos para los cuales |a - A a t na 2 .

Sea el parámetro A hay una estimación imparcial A. Si conociéramos la ley de distribución de la cantidad A, la tarea de encontrar un intervalo de confianza sería muy sencilla: bastaría con encontrar un valor s para el cual

La dificultad es que la ley de distribución de estimaciones. A Depende de la ley de distribución de la cantidad. X y, por tanto, de sus parámetros desconocidos (en particular, del propio parámetro A).

Para solucionar esta dificultad, puede utilizar la siguiente técnica aproximada: reemplazar los parámetros desconocidos en la expresión para s con sus estimaciones puntuales. Con un número relativamente grande de experimentos. PAG(alrededor de 20...30) esta técnica suele dar resultados satisfactorios en términos de precisión.

Como ejemplo, consideremos el problema de un intervalo de confianza para la expectativa matemática.

Que se produzca PAG X, cuyas características son la expectativa matemática t y varianza D- desconocido. Se obtuvieron las siguientes estimaciones para estos parámetros:

Se requiere construir un intervalo de confianza / p correspondiente probabilidad de confianza p, para expectativa matemática t cantidades X.

Al resolver este problema, usaremos el hecho de que la cantidad t representa la suma PAG variables aleatorias independientes distribuidas idénticamente X h y de acuerdo con el teorema del límite central, para un valor suficientemente grande PAG su ley de distribución es cercana a la normal. En la práctica, incluso con un número relativamente pequeño de términos (alrededor de 10...20), la ley de distribución de la suma puede considerarse aproximadamente normal. Supondremos que el valor t distribuidos según la ley normal. Las características de esta ley (expectativa matemática y varianza) son iguales, respectivamente. t Y

(ver capítulo 13 subsección 13.3). Supongamos que el valor D conocemos y encontraremos un valor Ep para el cual

Usando la fórmula (6.3.5) del Capítulo 6, expresamos la probabilidad en el lado izquierdo de (14.3.5) mediante la función de distribución normal

¿Dónde está la desviación estándar de la estimación? T.

De la ecuación.

encuentre el valor de Sp:

donde arg Ф* (х) es la función inversa de Ф* (X), aquellos. el valor del argumento en el que función normal la distribución es igual a X.

Dispersión D, a través del cual se expresa la cantidad A 1P, no lo sabemos exactamente; como valor aproximado se puede utilizar la estimación D(14.3.4) y poner aproximadamente:

Así, se ha resuelto aproximadamente el problema de construir un intervalo de confianza, que es igual a:

donde gp está determinado por la fórmula (14.3.7).

Para evitar la interpolación inversa en las tablas de la función Ф* (l) al calcular s p, es conveniente compilar una tabla especial (Tabla 14.3.1), que da los valores de la cantidad.

dependiendo de r. El valor (p determina para la ley normal el número de desviaciones estándar que deben trazarse a la derecha y a la izquierda del centro de dispersión para que la probabilidad de entrar en el área resultante sea igual a p.

Utilizando el valor 7 p, el intervalo de confianza se expresa como:

Tabla 14.3.1

Ejemplo 1. Se realizaron 20 experimentos sobre la cantidad X; los resultados se muestran en la tabla. 14.3.2.

Tabla 14.3.2

Se requiere encontrar una estimación de la expectativa matemática de la cantidad. X y construir un intervalo de confianza correspondiente a la probabilidad de confianza p = 0,8.

Solución. Tenemos:

Eligiendo l: = 10 como punto de referencia, usando la tercera fórmula (14.2.14) encontramos la estimación insesgada D :

Según la tabla 14.3.1 encontramos

Límites de confianza:

Intervalo de confianza:

Valores paramétricos T, que se encuentran en este intervalo son compatibles con los datos experimentales que figuran en la tabla. 14.3.2.

De manera similar se puede construir un intervalo de confianza para la varianza.

Que se produzca PAG experimentos independientes con una variable aleatoria X con parámetros desconocidos tanto para A como para la dispersión D Se obtuvo una estimación insesgada:

Se requiere construir aproximadamente un intervalo de confianza para la varianza.

De la fórmula (14.3.11) queda claro que la cantidad D representa

cantidad PAG variables aleatorias de la forma . Estos valores no son

independiente, ya que cualquiera de ellos incluye la cantidad T, dependiente de todos los demás. Sin embargo, se puede demostrar que a medida que aumenta PAG la ley de distribución de su suma también se acerca a la normal. Casi en PAG= 20...30 ya se puede considerar normal.

Supongamos que esto es así y encontremos las características de esta ley: expectativa matemática y dispersión. Desde la evaluación D- imparcial, entonces M[D] = D.

Cálculo de varianza D D está asociado con cálculos relativamente complejos, por lo que presentamos su expresión sin derivación:

donde q 4 es el cuarto punto central cantidades X.

Para usar esta expresión, debe sustituir los valores \u003d 4 y D(al menos los cercanos). En lugar de D puedes usar su evaluación D. En principio, el cuarto momento central también puede sustituirse por una estimación, por ejemplo, un valor de la forma:

pero tal reemplazo dará una precisión extremadamente baja, ya que en general, con un número limitado de experimentos, los momentos alto orden determinado a partir de grandes errores. Sin embargo, en la práctica sucede a menudo que el tipo de ley de distribución de cantidades X conocido de antemano: sólo se desconocen sus parámetros. Entonces puedes intentar expresar μ 4 mediante D.

Tomemos el caso más común, cuando el valor X distribuidos según la ley normal. Luego su cuarto momento central se expresa en términos de dispersión (ver Capítulo 6, subsección 6.2);

y la fórmula (14.3.12) da o

Reemplazo de lo desconocido en (14.3.14) D su evaluación D, obtenemos: de donde

El momento μ 4 se puede expresar mediante D también en algunos otros casos, cuando la distribución del valor X No es normal, pero se conoce su apariencia. Por ejemplo, para la ley densidad uniforme(ver capítulo 5) tenemos:

donde (a, P) es el intervalo en el que se especifica la ley.

Por eso,

Usando la fórmula (14.3.12) obtenemos: donde encontramos aproximadamente

En los casos en que se desconoce el tipo de ley de distribución para la cantidad 26, al realizar una estimación aproximada del valor a/) se recomienda utilizar la fórmula (14.3.16), a menos que existan razones especiales para creer que esta ley es muy diferente al normal (tiene una notable curtosis positiva o negativa).

Si el valor aproximado a/) se obtiene de una forma u otra, entonces podemos construir un intervalo de confianza para la varianza de la misma manera que lo construimos para la expectativa matemática:

donde el valor que depende de la probabilidad p dada se encuentra según la tabla. 14.3.1.

Ejemplo 2. Encuentre aproximadamente un intervalo de confianza del 80% para la varianza de una variable aleatoria X en las condiciones del ejemplo 1, si se sabe que el valor X distribuidos según una ley cercana a la normal.

Solución. El valor sigue siendo el mismo que en la tabla. 14.3.1:

Según la fórmula (14.3.16)

Usando la fórmula (14.3.18) encontramos el intervalo de confianza:

Intervalo correspondiente de valores medios. desviación cuadrada: (0,21; 0,29).

14.4. Métodos exactos para construir intervalos de confianza para los parámetros de una variable aleatoria distribuida según una ley normal

En la subsección anterior, examinamos métodos aproximados para construir intervalos de confianza para la expectativa y la varianza matemáticas. Aquí daremos una idea de los métodos exactos para resolver el mismo problema. Destacamos que para encontrar con precisión los intervalos de confianza es absolutamente necesario conocer de antemano la forma de la ley de distribución de la cantidad. X, mientras que para la aplicación de métodos aproximados esto no es necesario.

Idea métodos precisos La construcción de intervalos de confianza se reduce a lo siguiente. Cualquier intervalo de confianza se encuentra a partir de una condición que expresa la probabilidad de cumplir ciertas desigualdades, que incluyen la estimación que nos interesa. A. Ley de distribución de valoración. A V caso general depende de parámetros de cantidad desconocidos X. Sin embargo, a veces es posible pasar desigualdades de una variable aleatoria A a alguna otra función de los valores observados X p X 2, ..., X pág. cuya ley de distribución no depende de parámetros desconocidos, sino que depende únicamente del número de experimentos y del tipo de ley de distribución de la cantidad X. Este tipo de variables aleatorias juegan un papel importante en la estadística matemática; han sido estudiados con mayor detalle para el caso de una distribución normal de la cantidad X.

Por ejemplo, se ha demostrado que con una distribución normal del valor X valor aleatorio

obedece a los llamados Ley de distribución de estudiantes Con PAG- 1 grado de libertad; la densidad de esta ley tiene la forma

donde G(x) es la función gamma conocida:

También se ha demostrado que la variable aleatoria

tiene una "distribución %2" con PAG- 1 grado de libertad (ver Capítulo 7), cuya densidad se expresa mediante la fórmula

Sin detenernos en las derivaciones de las distribuciones (14.4.2) y (14.4.4), mostraremos cómo se pueden aplicar al construir intervalos de confianza para parámetros. ty d.

Que se produzca PAG experimentos independientes con una variable aleatoria X, Distribución normal con parámetros desconocidos. A. Para estos parámetros se obtuvieron estimaciones

Se requiere construir intervalos de confianza para ambos parámetros correspondientes a la probabilidad de confianza p.

Primero construyamos un intervalo de confianza para la expectativa matemática. Es natural tomar este intervalo simétrico con respecto a t; Sea sp p la mitad de la longitud del intervalo. El valor s p debe elegirse de manera que se cumpla la condición.

Intentemos movernos hacia el lado izquierdo de la igualdad (14.4.5) desde la variable aleatoria. t a una variable aleatoria T, distribuido según la ley de Student. Para hacer esto, multiplica ambos lados de la desigualdad |m-w?|

por un valor positivo: o, usando la notación (14.4.1),

Encontremos un número /p tal que el valor /p se pueda encontrar a partir de la condición

De la fórmula (14.4.2) queda claro que (1) - incluso función, entonces (14.4.8) da

La igualdad (14.4.9) determina el valor / p en función de p. Si tienes a tu disposición una tabla de valores integrales

entonces el valor de /p se puede encontrar mediante interpolación inversa en la tabla. Sin embargo, es más conveniente elaborar una tabla de valores /p de antemano. Esta tabla figura en el Apéndice (Tabla 5). Esta tabla muestra los valores en función del nivel de confianza p y del número de grados de libertad. PAG- 1. Habiendo determinado / p de la tabla. 5 y suponiendo

encontraremos la mitad del ancho del intervalo de confianza /p y el intervalo mismo

Ejemplo 1. Se realizaron 5 experimentos independientes con una variable aleatoria. X, Distribución normal con parámetros desconocidos. t y sobre. Los resultados de los experimentos se dan en la tabla. 14.4.1.

Tabla 14.4.1

encontrar calificación t para la expectativa matemática y construya un intervalo de confianza del 90% / p para ella (es decir, el intervalo correspondiente a la probabilidad de confianza p = 0,9).

Solución. Tenemos:

Según el cuadro 5 de la solicitud de PAG - 1 = 4 y p = 0,9 encontramos dónde

El intervalo de confianza será

Ejemplo 2. Para las condiciones del ejemplo 1 del inciso 14.3, asumiendo el valor X distribuida normalmente, encuentre el intervalo de confianza exacto.

Solución. Según la tabla 5 del apéndice encontramos cuando PAG - 1 = 19 ir =

0,8/p = 1,328; de aquí

Comparando con la solución del ejemplo 1 del inciso 14.3 (e p = 0,072), estamos convencidos de que la discrepancia es muy insignificante. Si mantenemos la precisión hasta el segundo decimal, entonces los intervalos de confianza encontrados por los métodos exacto y aproximado coinciden:

Pasemos a construir un intervalo de confianza para la varianza. Considere el estimador de varianza insesgado

y expresar la variable aleatoria D a través de magnitud V(14.4.3), teniendo distribución x 2 (14.4.4):

Conociendo la ley de distribución de la cantidad. V, puedes encontrar el intervalo /(1) en el que cae con una probabilidad dada p.

Ley de distribución kn_x(v) La magnitud I 7 tiene la forma que se muestra en la Fig. 14.4.1.

Arroz. 14.4.1

Surge la pregunta: ¿cómo elegir el intervalo /p? Si la ley de distribución de magnitud. V fuera simétrico (como la ley normal o la distribución de Student), sería natural tomar el intervalo /p simétrico con respecto a la expectativa matemática. En este caso la ley k p_x (v) asimétrico. Acordemos elegir el intervalo /p de modo que la probabilidad de que el valor sea V más allá del intervalo a la derecha y a la izquierda (áreas sombreadas en la Fig. 14.4.1) eran iguales e iguales

Para construir un intervalo /p con esta propiedad, usamos la tabla. 4 aplicaciones: contiene números y) tal que

por el valor V, teniendo x 2 -distribución con r grados de libertad. En nuestro caso r = norte- 1. Arreglemos r = norte- 1 y buscar en la fila correspondiente de la tabla. 4 dos significados x2- uno correspondiente a la probabilidad el otro - probabilidad Denotemos estos

valores a las 2 Y ¿SG? El intervalo tiene y 2, con tu izquierda, y y ~ extremo derecho.

Ahora encontremos a partir del intervalo / p el intervalo de confianza deseado /|, para la dispersión con límites D, y D2, que cubre el punto D con probabilidad p:

Construyamos un intervalo / (, = (?> ь А) que cubra el punto D si y sólo si el valor V cae en el intervalo /r. Demostremos que el intervalo

satisface esta condición. De hecho, las desigualdades son equivalentes a desigualdades

y estas desigualdades se satisfacen con probabilidad p. Por tanto, se ha encontrado el intervalo de confianza para la varianza y se expresa mediante la fórmula (14.4.13).

Ejemplo 3. Encuentre el intervalo de confianza para la varianza en las condiciones del ejemplo 2 de la subsección 14.3, si se sabe que el valor X Normalmente distribuido.

Solución. Tenemos . Según la tabla 4 del apéndice

encontramos en r = norte - 1 = 19

Usando la fórmula (14.4.13) encontramos el intervalo de confianza para la varianza

El intervalo correspondiente para la desviación estándar es (0,21; 0,32). Este intervalo supera sólo ligeramente el intervalo (0,21; 0,29) obtenido en el ejemplo 2 del apartado 14.3 utilizando el método aproximado.

  • La figura 14.3.1 considera un intervalo de confianza simétrico con respecto a a. En general, como veremos más adelante, esto no es necesario.

Intervalos de confianza.

El cálculo del intervalo de confianza se basa en el error medio del parámetro correspondiente. Intervalo de confianza muestra dentro de qué límites con probabilidad (1-a) se encuentra el valor real del parámetro estimado. Aquí a es el nivel de significancia, (1-a) también se denomina probabilidad de confianza.

En el primer capítulo mostramos que, por ejemplo, para la media aritmética, la verdadera media poblacional en aproximadamente el 95% de los casos se encuentra dentro de 2 errores estándar de la media. Por lo tanto, los límites del intervalo de confianza del 95% para la media estarán dos veces más lejos de la media muestral. error promedio promedio, es decir multiplicamos el error promedio de la media por un cierto coeficiente dependiendo del nivel de confianza. Para la media y diferencia de medias se toma el coeficiente de Student (valor crítico de la prueba de Student), para la participación y diferencia de participaciones, el valor crítico del criterio z. El producto del coeficiente y el error promedio se puede denominar error máximo de un parámetro dado, es decir lo máximo que podemos obtener al valorarlo.

Intervalo de confianza para significado aritmetico : .

Aquí está la media muestral;

Error promedio de la media aritmética;

s - desviación estándar de la muestra;

norte

f = norte-1 (coeficiente de Student).

Intervalo de confianza para diferencias de medias aritméticas :

Aquí está la diferencia entre las medias muestrales;

- error medio de la diferencia entre medias aritméticas;

s 1 , s 2 – desviaciones estándar muestrales;

n1, n2

Valor crítico Prueba t de Student para un nivel de significancia dado a y un número de grados de libertad f=norte 1 +norte 2-2 (coeficiente de Student).

Intervalo de confianza para Comparte :

.

Aquí d es la fracción de muestra;

– error de fracción promedio;

norte– tamaño de la muestra (tamaño del grupo);

Intervalo de confianza para diferencia de acciones :

Aquí está la diferencia en las acciones de muestra;

– error medio de la diferencia entre medias aritméticas;

n1, n2– volúmenes de muestra (número de grupos);

El valor crítico del criterio z en un nivel de significancia dado a ( , , ).

Al calcular los intervalos de confianza para la diferencia entre indicadores, en primer lugar, vemos directamente valores posibles efecto, y no solo eso punto estimado. En segundo lugar, podemos sacar una conclusión sobre la aceptación o el rechazo de la hipótesis nula y, en tercer lugar, podemos sacar una conclusión sobre la potencia de la prueba.

Al probar hipótesis utilizando intervalos de confianza, se debe cumplir con la siguiente regla:

Si el intervalo de confianza del 100(1-a) por ciento de la diferencia de medias no contiene cero, entonces las diferencias son estadísticamente significativas en el nivel de significancia a; por el contrario, si este intervalo contiene cero, entonces las diferencias no son estadísticamente significativas.

De hecho, si este intervalo contiene cero, significa que el indicador que se compara puede ser mayor o menor en uno de los grupos en comparación con el otro, es decir las diferencias observadas se deben al azar.

La potencia de la prueba se puede juzgar por la ubicación del cero dentro del intervalo de confianza. Si cero está cerca de inferior o limite superior intervalo, entonces quizás con un mayor número de grupos comparados, las diferencias alcanzarían significancia estadística. Si cero está cerca de la mitad del intervalo, entonces significa que tanto un aumento como una disminución del indicador en el grupo experimental son igualmente probables y, probablemente, realmente no hay diferencias.

Ejemplos:

Para comparar la mortalidad quirúrgica cuando se utilizan dos tipos diferentes de anestesia: 61 personas fueron operadas con el primer tipo de anestesia, 8 murieron, con el segundo tipo: 67 personas, 10 murieron.

d1 = 8/61 = 0,131; d2 = 10/67 = 0,149; d1-d2 = - 0,018.

La diferencia en letalidad de los métodos comparados estará en el rango (-0,018 - 0,122; -0,018 + 0,122) o (-0,14; 0,104) con una probabilidad de 100(1-a) = 95%. El intervalo contiene cero, es decir hipótesis sobre la misma letalidad en dos diferentes tipos No se puede rechazar la anestesia.

Por lo tanto, la tasa de mortalidad puede disminuir y disminuirá al 14% y aumentará al 10,4% con una probabilidad del 95%, es decir. cero está aproximadamente en el medio del intervalo, por lo que se puede argumentar que, muy probablemente, estos dos métodos realmente no difieren en letalidad.

En el ejemplo analizado anteriormente, se comparó el tiempo promedio de presión durante la prueba de tapping en cuatro grupos de estudiantes que diferían en las puntuaciones de los exámenes. Calculemos los intervalos de confianza para el tiempo promedio de presión de los estudiantes que aprobaron el examen con calificaciones 2 y 5 y el intervalo de confianza para la diferencia entre estos promedios.

Los coeficientes de Student se calculan utilizando las tablas de distribución de Student (ver apéndice): para el primer grupo: = t(0,05;48) = 2,011; para el segundo grupo: = t(0,05;61) = 2,000. Así, intervalos de confianza para el primer grupo: = (162,19-2,011*2,18; 162,19+2,011*2,18) = (157,8; 166,6), para el segundo grupo (156,55- 2.000*1,88; 156,55+2.000*1,88) = (152,8 ; 160,3). Así, para quienes aprobaron el examen con 2, el tiempo promedio de presión varía de 157,8 ms a 166,6 ms con una probabilidad del 95%, para quienes aprobaron el examen con 5, de 152,8 ms a 160,3 ms con una probabilidad del 95%. .

También puede probar la hipótesis nula utilizando intervalos de confianza para las medias, y no solo para la diferencia de medias. Por ejemplo, como en nuestro caso, si los intervalos de confianza de las medias se superponen, entonces no se puede rechazar la hipótesis nula. Para rechazar una hipótesis en un nivel de significancia elegido, los intervalos de confianza correspondientes no deben superponerse.

Encontremos el intervalo de confianza para la diferencia en el tiempo promedio de presión en los grupos que aprobaron el examen con calificaciones 2 y 5. Diferencia de promedios: 162,19 – 156,55 = 5,64. Coeficiente de Student: = t(0,05;49+62-2) = t(0,05;109) = 1,982. Las desviaciones estándar del grupo serán iguales a: ; . Calculamos el error promedio de la diferencia entre las medias: . Intervalo de confianza: =(5,64-1,982*2,87; 5,64+1,982*2,87) = (-0,044; 11,33).

Así, la diferencia en el tiempo medio de presión en los grupos que aprobaron el examen con 2 y 5 estará en el rango de -0,044 ms a 11,33 ms. Este intervalo incluye cero, es decir El tiempo medio de presión para aquellos que aprobaron bien el examen puede aumentar o disminuir en comparación con aquellos que aprobaron el examen de manera insatisfactoria, es decir, la hipótesis nula no se puede rechazar. Pero cero está muy cerca del límite inferior y es mucho más probable que el tiempo de presión disminuya para aquellos que aprobaron bien. Por lo tanto, podemos concluir que todavía existen diferencias en el tiempo promedio de presión entre aquellos que pasaron 2 y 5, simplemente no pudimos detectarlas dado el cambio en el tiempo promedio, la dispersión del tiempo promedio y los tamaños de muestra.



La potencia de una prueba es la probabilidad de rechazar una hipótesis nula incorrecta, es decir encontrar diferencias donde realmente existen.

El poder de la prueba se determina en función del nivel de significancia, la magnitud de las diferencias entre grupos, la dispersión de valores en los grupos y el tamaño de las muestras.

Para la prueba de estudiante y Análisis de variación Puede utilizar diagramas de sensibilidad.

El poder del criterio se puede utilizar para determinar preliminarmente el número requerido de grupos.

El intervalo de confianza muestra dentro de qué límites se encuentra el valor real del parámetro estimado con una probabilidad dada.

Utilizando intervalos de confianza, puede probar hipótesis estadísticas y sacar conclusiones sobre la sensibilidad de los criterios.

LITERATURA.

Glanz S. – Capítulo 6,7.

Rebrova O.Yu. – p.112-114, p.171-173, p.234-238.

Sidorenko EV – páginas 32-33.

Preguntas para el autoexamen de los estudiantes.

1. ¿Cuál es el poder del criterio?

2. ¿En qué casos es necesario evaluar el poder de los criterios?

3. Métodos de cálculo de potencia.

6. ¿Cómo probar una hipótesis estadística utilizando un intervalo de confianza?

7. ¿Qué se puede decir sobre el poder del criterio al calcular el intervalo de confianza?

Tareas.

Supongamos que tenemos una gran cantidad de artículos con una distribución normal de algunas características (por ejemplo, un almacén lleno de verduras del mismo tipo, cuyo tamaño y peso varía). Quiere conocer las características medias de todo el lote de productos, pero no tiene el tiempo ni las ganas de medir y pesar cada verdura. Entiendes que esto no es necesario. Pero, ¿cuántas piezas habría que llevar para un control aleatorio?

Antes de dar varias fórmulas útiles para esta situación, recordemos algunas notaciones.

En primer lugar, si midiéramos todo el almacén de hortalizas (este conjunto de elementos se llama población general), sabríamos con toda la precisión de que disponemos el peso medio de todo el lote. Llamemos a esto promedio X promedio .g es . - promedio general. Ya sabemos lo que está completamente determinado si se conocen su valor medio y su desviación. . Es cierto, si bien no somos ni de la generación promedio X ni s No conocemos la población general. Solo podemos tomar una muestra determinada, medir los valores que necesitamos y calcular para esta muestra tanto el valor promedio X avg como la desviación estándar S select.

Se sabe que si nuestra muestra de verificación contiene una gran cantidad de elementos (generalmente n es mayor que 30) y se toman realmente aleatorio, entonces s la población general apenas se diferenciará de la selección S.

Además, para el caso de distribución normal podemos utilizar las siguientes fórmulas:

Con una probabilidad del 95%


Con una probabilidad del 99%



EN vista general con probabilidad P (t)


La relación entre el valor t y el valor de probabilidad P(t), con el que queremos conocer el intervalo de confianza, se puede extraer de la siguiente tabla:


Por tanto, hemos determinado en qué rango se encuentra el valor medio de la población (con una probabilidad determinada).

A menos que tengamos una muestra lo suficientemente grande, no podemos decir que la población tiene s = seleccionar Además, en este caso la cercanía de la muestra a la distribución normal es problemática. En este caso, también usamos S select en su lugar. s en la fórmula:




pero el valor de t para una probabilidad fija P(t) dependerá del número de elementos de la muestra n. Cuanto mayor sea n, más cercano estará el intervalo de confianza resultante al valor dado por la fórmula (1). Los valores de t en este caso se toman de otra tabla ( prueba t de Student), que presentamos a continuación:

Valores de la prueba t de Student para probabilidad 0,95 y 0,99


Ejemplo 3. Se seleccionaron aleatoriamente 30 personas entre los empleados de la empresa. Según la muestra, resultó que el salario promedio (por mes) es de 30 mil rublos con una desviación estándar de 5 mil rublos. Determine el salario promedio en la empresa con una probabilidad de 0,99.

Solución: Por condición tenemos n = 30, X promedio. =30000, S=5000, P = 0,99. Para encontrar el intervalo de confianza utilizaremos la fórmula correspondiente a la prueba t de Student. De la tabla para n = 30 y P = 0,99 encontramos t = 2,756, por lo tanto,


aquellos. fideicomisario buscado intervalo 27484< Х ср.ген < 32516.

Entonces, con una probabilidad de 0,99 podemos decir que el intervalo (27484; 32516) contiene en sí mismo el salario medio de la empresa.

Esperamos que utilices este método y no es necesario que tengas una mesa contigo todo el tiempo. Los cálculos se pueden realizar automáticamente en Excel. Mientras esté en el archivo de Excel, haga clic en el botón fx en el menú superior. Luego, seleccione el tipo “estadístico” entre las funciones, y de la lista propuesta en la ventana - STUDAR DISCOVER. Luego, cuando se le solicite, colocando el cursor en el campo "probabilidad", ingrese el valor de la probabilidad inversa (es decir, en nuestro caso, en lugar de la probabilidad de 0,95, debe escribir la probabilidad de 0,05). Aparentemente hoja de cálculo se compila de tal manera que el resultado responde a la pregunta con qué probabilidad podemos cometer un error. De manera similar, en el campo Grado de libertad, ingrese un valor (n-1) para su muestra.

Intervalo de confianza para la expectativa matemática - este es un intervalo calculado a partir de datos que, con una probabilidad conocida, contiene la expectativa matemática de la población general. Una estimación natural de la expectativa matemática es la media aritmética de sus valores observados. Por lo tanto, a lo largo de la lección usaremos los términos “promedio” y “valor promedio”. En los problemas de cálculo de un intervalo de confianza, la respuesta que con mayor frecuencia se requiere es algo así como "El intervalo de confianza del número promedio [valor en un problema particular] es de [valor menor] a [valor mayor]". Utilizando un intervalo de confianza, es posible evaluar no solo los valores promedio, sino también la proporción de una característica particular de la población general. Promedios, varianza, Desviación Estándar y los errores a través de los cuales llegaremos a nuevas definiciones y fórmulas se discuten en la lección Características de la muestra y la población. .

Estimaciones puntuales y de intervalo de la media.

Si el valor promedio de la población se estima mediante un número (punto), entonces se toma como estimación del valor promedio desconocido de la población un promedio específico, que se calcula a partir de una muestra de observaciones. En este caso, el valor de la media muestral (una variable aleatoria) no coincide con el valor medio de la población general. Por lo tanto, al indicar la media muestral, se debe indicar simultáneamente el error muestral. La medida del error muestral es el error estándar, que se expresa en las mismas unidades que la media. Por lo tanto, se suele utilizar la siguiente notación: .

Si es necesario asociar la estimación del promedio con una cierta probabilidad, entonces el parámetro de interés en la población debe evaluarse no mediante un número, sino mediante un intervalo. Un intervalo de confianza es un intervalo en el que, con una cierta probabilidad PAG Se encuentra el valor del indicador de población estimada. Intervalo de confianza en el que es probable PAG = 1 - α Se encuentra la variable aleatoria, calculada de la siguiente manera:

,

α = 1 - PAG, que se puede encontrar en el apéndice de casi cualquier libro sobre estadística.

En la práctica, la media poblacional y la varianza no se conocen, por lo que la varianza poblacional se reemplaza por la varianza muestral y la media poblacional por la media muestral. Por tanto, el intervalo de confianza en la mayoría de los casos se calcula de la siguiente manera:

.

La fórmula del intervalo de confianza se puede utilizar para estimar la media poblacional si

  • se conoce la desviación estándar de la población;
  • o se desconoce la desviación estándar de la población, pero el tamaño de la muestra es mayor que 30.

La media muestral es una estimación insesgada de la media poblacional. A su vez, la varianza muestral no es una estimación insesgada de la varianza poblacional. Para obtener una estimación insesgada de la varianza poblacional en la fórmula de varianza muestral, el tamaño de la muestra norte debe ser reemplazado por norte-1.

Ejemplo 1. Se recopiló información de 100 cafés seleccionados al azar en una determinada ciudad de que el número promedio de empleados en ellos es 10,5 con una desviación estándar de 4,6. Determine el intervalo de confianza del 95% para el número de empleados de una cafetería.

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Así, el intervalo de confianza del 95% para el número medio de empleados de cafeterías osciló entre 9,6 y 11,4.

Ejemplo 2. Para una muestra aleatoria de una población de 64 observaciones, se calcularon los siguientes valores totales:

suma de valores en observaciones,

suma de desviaciones al cuadrado de valores del promedio .

Calcule el intervalo de confianza del 95% para la expectativa matemática.

Calculemos la desviación estándar:

,

Calculemos el valor medio:

.

Sustituimos los valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

Así, el intervalo de confianza del 95% para la expectativa matemática de esta muestra osciló entre 7,484 y 11,266.

Ejemplo 3. Para una muestra de población aleatoria de 100 observaciones, la media calculada es 15,2 y la desviación estándar es 3,2. Calcule el intervalo de confianza del 95% para el valor esperado y luego el intervalo de confianza del 99%. Si el poder de la muestra y su variación permanecen sin cambios y el coeficiente de confianza aumenta, ¿se estrechará o ampliará el intervalo de confianza?

Sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

.

Así, el intervalo de confianza del 95% para la media de esta muestra osciló entre 14,57 y 15,82.

Nuevamente sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,01 .

Obtenemos:

.

Así, el intervalo de confianza del 99% para la media de esta muestra osciló entre 14,37 y 16,02.

Como vemos, a medida que aumenta el coeficiente de confianza, el valor crítico de la distribución normal estándar también aumenta y, en consecuencia, los puntos inicial y final del intervalo se ubican más lejos de la media y, por lo tanto, aumenta el intervalo de confianza para la expectativa matemática. .

Estimaciones puntuales y de intervalo de gravedad específica.

La proporción de algún atributo de la muestra se puede interpretar como una estimación puntual. Gravedad específica pag de la misma característica en la población general. Si es necesario asociar este valor con la probabilidad, entonces se debe calcular el intervalo de confianza de la gravedad específica. pag característica en la población con probabilidad PAG = 1 - α :

.

Ejemplo 4. En alguna ciudad hay dos candidatos. A Y B se postulan para alcalde. Se encuestó aleatoriamente a 200 vecinos de la ciudad, de los cuales el 46% respondió que votaría por el candidato A, 26% - para el candidato B y el 28% no sabe por quién votará. Determine el intervalo de confianza del 95% para la proporción de residentes de la ciudad que apoyan al candidato. A.



Nuevo en el sitio

>

Más popular