Hogar Cavidad oral Intervalo de confianza para la expectativa matemática de una distribución normal con una varianza conocida. Intervalo de confianza para la expectativa matemática

Intervalo de confianza para la expectativa matemática de una distribución normal con una varianza conocida. Intervalo de confianza para la expectativa matemática

Construyamos en MS EXCEL intervalo de confianza estimar el valor medio de la distribución en el caso valor conocido variaciones.

Por supuesto la elección nivel de confianza Depende completamente del problema que se resuelva. Por tanto, el grado de confianza de un pasajero aéreo en la fiabilidad de un avión debería ser sin duda mayor que el grado de confianza de un comprador en la fiabilidad de una bombilla eléctrica.

Formulación del problema

Supongamos que desde población habiendo sido tomado muestra tamaño n. Se asume que Desviación Estándar esta distribución es conocida. Es necesario en base a esto muestras evaluar lo desconocido media de distribución(μ, ) y construir el correspondiente doble cara intervalo de confianza.

Punto estimado

Como se sabe de Estadísticas(denotémoslo X promedio) es estimación insesgada de la media este población y tiene una distribución N(μ;σ 2 /n).

Nota: Qué hacer si necesitas construir intervalo de confianza en el caso de una distribución que no es ¿normal? En este caso, viene al rescate quien dice que con suficiente talla grande muestras n de distribución no ser normal, distribución muestral de estadísticas X promedio voluntad aproximadamente corresponder distribución normal con parámetros N(μ;σ 2 /n).

Entonces, punto estimado promedio valores de distribución tenemos - esto muestra promedio, es decir. X promedio. Ahora comencemos intervalo de confianza.

Construyendo un intervalo de confianza

Normalmente, conociendo la distribución y sus parámetros, podemos calcular la probabilidad de que la variable aleatoria tome un valor del intervalo que especificamos. Ahora hagamos lo contrario: encuentre el intervalo en el que caerá la variable aleatoria con una probabilidad dada. Por ejemplo, de las propiedades distribución normal Se sabe que con una probabilidad del 95%, una variable aleatoria distribuida sobre ley normal, estará dentro del rango de aproximadamente +/- 2 desde valor promedio(ver artículo sobre). Este intervalo nos servirá de prototipo. intervalo de confianza.

Ahora veamos si conocemos la distribución. , calcular este intervalo? Para responder a la pregunta, debemos indicar la forma de la distribución y sus parámetros.

Conocemos la forma de distribución: esto es distribución normal (recuerda que estamos hablando de distribución muestral Estadísticas X promedio).

El parámetro μ nos es desconocido (solo es necesario estimarlo usando intervalo de confianza), pero tenemos una estimación del mismo X promedio, calculado en base a muestras, que se puede utilizar.

Segundo parámetro - desviación estándar de la media muestral lo daremos por conocido, es igual a σ/√n.

Porque no sabemos μ, entonces construiremos el intervalo +/- 2 desviaciones estandar no de valor promedio, y de su estimación conocida X promedio. Aquellos. al calcular intervalo de confianza NO asumiremos que X promedio cae dentro del rango +/- 2 desviaciones estandar de μ con una probabilidad del 95%, y asumiremos que el intervalo es +/- 2 desviaciones estandar de X promedio con 95% de probabilidad cubrirá μ – promedio de la población general, de donde se toma muestra. Estas dos afirmaciones son equivalentes, pero la segunda nos permite construir intervalo de confianza.

Además, aclaremos el intervalo: una variable aleatoria distribuida sobre ley normal, con un 95% de probabilidad cae dentro del intervalo +/- 1,960 desviaciones estandar, no +/- 2 desviaciones estandar. Esto se puede calcular usando la fórmula =REV.EST.NORM((1+0.95)/2), cm. archivo de ejemplo Intervalo de hoja.

Ahora podemos formular un enunciado probabilístico que nos servirá para formar intervalo de confianza:
"La probabilidad de que media poblacional ubicado desde promedio de la muestra dentro de 1.960 " desviaciones estándar de la media muestral", igual al 95%".

El valor de probabilidad mencionado en la declaración tiene un nombre especial. , que está asociado con nivel de significancia α (alfa) mediante una expresión simple nivel de confianza =1 . En nuestro caso Nivel significativo α =1-0,95=0,05 .

Ahora, basándonos en este enunciado probabilístico, escribimos una expresión para calcular intervalo de confianza:

donde Z α/2 estándar distribución normal(este valor de la variable aleatoria z, Qué PAG(z>=Zα/2 )=α/2).

Nota: Cuantil α/2 superior define el ancho intervalo de confianza V desviaciones estandar muestra promedio. Cuantil α/2 superior estándar distribución normal siempre mayor que 0, lo cual es muy conveniente.

En nuestro caso, con α=0,05, cuantil α/2 superior es igual a 1,960. Para otros niveles de significancia α (10%; 1%) cuantil α/2 superior Zα/2 se puede calcular usando la fórmula =NORM.ST.REV(1-α/2) o, si se conoce nivel de confianza, =NORM.ST.OBR((1+nivel de confianza)/2).

Generalmente al construir intervalos de confianza para estimar la media Usar unicamente α superior/2-cuantil y no usar α inferior/2-cuantil. Esto es posible porque estándar distribución normal simétricamente respecto al eje x ( su densidad de distribución simétrico sobre promedio, es decir 0). Por lo tanto, no es necesario calcular cuantil α/2 inferior(simplemente se llama α /2-cuantil), porque es igual α superior/2-cuantil con un signo menos.

Recordemos que, a pesar de la forma de la distribución del valor x, la variable aleatoria correspondiente X promedio repartido aproximadamente Bien N(μ;σ 2 /n) (ver artículo sobre). Por lo tanto, en caso general, la expresión anterior para intervalo de confianza es sólo una aproximación. Si el valor x se distribuye entre ley normal N(μ;σ 2 /n), entonces la expresión para intervalo de confianza es preciso.

Cálculo del intervalo de confianza en MS EXCEL.

Resolvamos el problema.
El tiempo de respuesta de un componente electrónico a una señal de entrada es característica importante dispositivos. Un ingeniero quiere construir un intervalo de confianza para el tiempo de respuesta promedio con un nivel de confianza del 95%. Por experiencia previa, el ingeniero sabe que la desviación estándar del tiempo de respuesta es de 8 ms. Se sabe que para evaluar el tiempo de respuesta el ingeniero realizó 25 mediciones, el valor promedio fue de 78 ms.

Solución: El ingeniero quiere saber el tiempo de respuesta. dispositivo electronico, pero entiende que el tiempo de respuesta no es un valor fijo, sino una variable aleatoria que tiene su propia distribución. Entonces, lo mejor que puede esperar es determinar los parámetros y la forma de esta distribución.

Desafortunadamente, a partir de las condiciones del problema no conocemos la forma de la distribución del tiempo de respuesta (no tiene por qué ser así). normal). , esta distribución también se desconoce. solo el es conocido Desviación Estándarσ=8. Por lo tanto, si bien no podemos calcular las probabilidades y construir intervalo de confianza.

Sin embargo, a pesar de que desconocemos la distribución tiempo respuesta separada, sabemos que según CPT, distribución muestral tiempo promedio de respuesta es aproximadamente normal(asumiremos que las condiciones CPT se llevan a cabo, porque tamaño muestras bastante grande (n=25)) .

Además, promedio esta distribución es igual a valor promedio distribución de una única respuesta, es decir µ. A Desviación Estándar de esta distribución (σ/√n) se puede calcular usando la fórmula =8/ROOT(25) .

También se sabe que el ingeniero recibió punto estimado parámetro μ igual a 78 ms (X avg). Por lo tanto, ahora podemos calcular probabilidades, porque conocemos la forma de distribución ( normal) y sus parámetros (X avg y σ/√n).

El ingeniero quiere saber valor esperado Distribuciones de tiempo de respuesta μ. Como se indicó anteriormente, este μ es igual a expectativa matemática de la distribución muestral del tiempo de respuesta promedio. si usamos distribución normal N(X avg; σ/√n), entonces el μ deseado estará en el rango +/-2*σ/√n con una probabilidad de aproximadamente el 95%.

Nivel significativo es igual a 1-0,95=0,05.

Finalmente, busquemos el borde izquierdo y derecho. intervalo de confianza.
Borde izquierdo: =78-REV.ST.NORM(1-0.05/2)*8/RAÍZ(25) = 74,864
borde derecho: =78+INV.EST.NORM.(1-0.05/2)*8/RAÍZ(25)=81.136

Borde izquierdo: =REV.NORM(0.05/2; 78; 8/RAÍZ(25))
Borde derecho: =REV.NORM(1-0.05/2; 78; 8/RAÍZ(25))

Respuesta: intervalo de confianza en Nivel de confianza del 95% y σ=8mseg es igual 78+/-3,136 ms.

EN archivo de ejemplo en la hoja Sigma conocido, creó un formulario para el cálculo y la construcción. doble cara intervalo de confianza por arbitrario muestras con σ dado y nivel de significancia.

Función CONFIANZA.NORM()

Si los valores muestras están en el rango B20:B79 , A Nivel significativo igual a 0,05; luego la fórmula de MS EXCEL:
=PROMEDIO(B20:B79)-CONFIANZA.NORM(0.05;σ; CONTAR(B20:B79))
devolverá el borde izquierdo intervalo de confianza.

El mismo límite se puede calcular mediante la fórmula:
=PROMEDIO(B20:B79)-NORM.ST.REV(1-0.05/2)*σ/RAÍZ(COUNT(B20:B79))

Nota: La función CONFIDENCE.NORM() apareció en MS EXCEL 2010. En versiones anteriores de MS EXCEL, se utilizaba la función TRUST().

Intervalo de confianza para la expectativa matemática - este es un intervalo calculado a partir de datos que, con una probabilidad conocida, contiene la expectativa matemática de la población general. Una estimación natural de la expectativa matemática es la media aritmética de sus valores observados. Por lo tanto, a lo largo de la lección usaremos los términos “promedio” y “valor promedio”. En los problemas de cálculo de un intervalo de confianza, la respuesta que con mayor frecuencia se requiere es algo así como "El intervalo de confianza del número promedio [valor en un problema particular] es de [valor menor] a [valor mayor]". Utilizando un intervalo de confianza, es posible evaluar no solo los valores promedio, sino también la proporción de una característica particular de la población general. En la lección se analizan los valores medios, la dispersión, la desviación estándar y el error, a través de los cuales llegaremos a nuevas definiciones y fórmulas. Características de la muestra y la población. .

Estimaciones puntuales y de intervalo de la media.

Si el valor promedio de la población se estima mediante un número (punto), entonces se toma como estimación del valor promedio desconocido de la población un promedio específico, que se calcula a partir de una muestra de observaciones. En este caso, el valor de la media muestral (una variable aleatoria) no coincide con el valor medio de la población general. Por lo tanto, al indicar la media muestral, se debe indicar simultáneamente el error muestral. La medida del error muestral es el error estándar, que se expresa en las mismas unidades que la media. Por lo tanto, se suele utilizar la siguiente notación: .

Si es necesario asociar la estimación del promedio con una cierta probabilidad, entonces el parámetro de interés en la población debe evaluarse no mediante un número, sino mediante un intervalo. Un intervalo de confianza es un intervalo en el que, con una cierta probabilidad PAG Se encuentra el valor del indicador de población estimada. Intervalo de confianza en el que es probable PAG = 1 - α Se encuentra la variable aleatoria, calculada de la siguiente manera:

,

α = 1 - PAG, que se puede encontrar en el apéndice de casi cualquier libro sobre estadística.

En la práctica, la media poblacional y la varianza no se conocen, por lo que la varianza poblacional se reemplaza por la varianza muestral y la media poblacional por la media muestral. Por tanto, el intervalo de confianza en la mayoría de los casos se calcula de la siguiente manera:

.

La fórmula del intervalo de confianza se puede utilizar para estimar la media poblacional si

  • se conoce la desviación estándar de la población;
  • o se desconoce la desviación estándar de la población, pero el tamaño de la muestra es mayor que 30.

La media muestral es una estimación insesgada de la media poblacional. A su vez, la varianza muestral no es una estimación insesgada de la varianza poblacional. Para obtener una estimación insesgada de la varianza poblacional en la fórmula de varianza muestral, el tamaño de la muestra norte debe ser reemplazado por norte-1.

Ejemplo 1. Se recopiló información de 100 cafés seleccionados al azar en una determinada ciudad de que el número promedio de empleados en ellos es 10,5 con una desviación estándar de 4,6. Determine el intervalo de confianza del 95% para el número de empleados de una cafetería.

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Así, el intervalo de confianza del 95% para el número medio de empleados de cafeterías osciló entre 9,6 y 11,4.

Ejemplo 2. Para una muestra aleatoria de una población de 64 observaciones, se calcularon los siguientes valores totales:

suma de valores en observaciones,

suma de desviaciones al cuadrado de valores del promedio .

Calcule el intervalo de confianza del 95% para la expectativa matemática.

Calculemos la desviación estándar:

,

Calculemos el valor medio:

.

Sustituimos los valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

Así, el intervalo de confianza del 95% para la expectativa matemática de esta muestra osciló entre 7,484 y 11,266.

Ejemplo 3. Para una muestra de población aleatoria de 100 observaciones, la media calculada es 15,2 y la desviación estándar es 3,2. Calcule el intervalo de confianza del 95% para el valor esperado y luego el intervalo de confianza del 99%. Si el poder de la muestra y su variación permanecen sin cambios y el coeficiente de confianza aumenta, ¿se estrechará o ampliará el intervalo de confianza?

Sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,05 .

Obtenemos:

.

Así, el intervalo de confianza del 95% para la media de esta muestra osciló entre 14,57 y 15,82.

Nuevamente sustituimos estos valores en la expresión del intervalo de confianza:

¿Dónde está el valor crítico de la distribución normal estándar para el nivel de significancia? α = 0,01 .

Obtenemos:

.

Así, el intervalo de confianza del 99% para la media de esta muestra osciló entre 14,37 y 16,02.

Como vemos, a medida que aumenta el coeficiente de confianza, el valor crítico de la distribución normal estándar también aumenta y, en consecuencia, los puntos inicial y final del intervalo se ubican más lejos de la media y, por lo tanto, aumenta el intervalo de confianza para la expectativa matemática. .

Estimaciones puntuales y de intervalo de gravedad específica.

La proporción de alguna característica de la muestra se puede interpretar como punto estimado Gravedad específica pag de la misma característica en la población general. Si es necesario asociar este valor con la probabilidad, entonces se debe calcular el intervalo de confianza de la gravedad específica. pag característica en la población con probabilidad PAG = 1 - α :

.

Ejemplo 4. En alguna ciudad hay dos candidatos. A Y B se postulan para alcalde. Se encuestó aleatoriamente a 200 vecinos de la ciudad, de los cuales el 46% respondió que votaría por el candidato A, 26% - para el candidato B y el 28% no sabe por quién votará. Determine el intervalo de confianza del 95% para la proporción de residentes de la ciudad que apoyan al candidato. A.

Para empezar, recordemos la siguiente definición:

Consideremos la siguiente situación. Sea que las variantes de la población tengan una distribución normal con expectativa matemática $a$ y desviación estándar $\sigma$. Media muestral en en este caso será tratada como una variable aleatoria. Cuando la cantidad $X$ se distribuye normalmente, la media muestral también se distribuirá normalmente con los parámetros

Encontremos un intervalo de confianza que cubra el valor $a$ con una confiabilidad de $\gamma $.

Para ello necesitamos la igualdad.

De ello obtenemos

Desde aquí podemos encontrar fácilmente $t$ en la tabla de valores de funciones $Ф\left(t\right)$ y, como consecuencia, encontrar $\delta $.

Recordemos la tabla de valores de la función $Ф\left(t\right)$:

Figura 1. Tabla de valores de funciones $Ф\left(t\right).$

Integral de confianza para estimar la expectativa matemática para una cantidad desconocida $(\mathbf \sigma )$

En este caso, usaremos el valor de varianza corregido $S^2$. Reemplazando $\sigma $ con $S$ en la fórmula anterior, obtenemos:

Problemas de ejemplo para encontrar un intervalo de confianza

Ejemplo 1

Sea la cantidad $X$ tener una distribución normal con varianza $\sigma =4$. Sea el tamaño de la muestra $n=64$ y la confiabilidad $\gamma =0.95$. Encuentre el intervalo de confianza para estimar la expectativa matemática de esta distribución.

Necesitamos encontrar el intervalo ($\overline(x)-\delta ,\overline(x)+\delta)$.

Como vimos arriba

\[\delta =\frac(\sigma t)(\sqrt(n))=\frac(4t)(\sqrt(64))=\frac(\t)(2)\]

El parámetro $t$ se puede encontrar en la fórmula

\[Ф\left(t\right)=\frac(\gamma )(2)=\frac(0.95)(2)=0.475\]

En la Tabla 1 encontramos que $t=1,96$.

Sea CB X una población general y sea β el parámetro desconocido CB X. Si la estimación estadística en * es consistente, cuanto mayor sea el tamaño de la muestra, con mayor precisión obtendremos el valor de β. Sin embargo, en la práctica no disponemos de muestras muy grandes, por lo que no podemos garantizar una mayor precisión.

Sea b* una estimación estadística de c. Valor |pulg* - pulg| se llama precisión de la estimación. Está claro que la precisión es CB, ya que β* es una variable aleatoria. Especifiquemos un pequeño número positivo 8 y exijamos que la precisión de la estimación |в* - в| era menor que 8, es decir | en* - en |< 8.

Fiabilidad g o probabilidad de confianza estimaciones en por en * es la probabilidad g con la que se cumple la desigualdad |en * - en|< 8, т. е.

Normalmente, la confiabilidad g se especifica de antemano y se considera que g es un número cercano a 1 (0,9; 0,95; 0,99; ...).

Dado que la desigualdad |en * - en|< S равносильно двойному неравенству в* - S < в < в* + 8, то получаем:

El intervalo (en * - 8, en * + 5) se llama intervalo de confianza, es decir, el intervalo de confianza cubre el parámetro desconocido en con probabilidad y. Tenga en cuenta que los extremos del intervalo de confianza son aleatorios y varían de una muestra a otra, por lo que es más exacto decir que el intervalo (en * - 8, en * + 8) cubre el parámetro desconocido en, en lugar de en pertenece a este intervalo.

Dejar población está dada por una variable aleatoria X, distribuida según una ley normal, y se conoce la desviación estándar a. La incógnita es la expectativa matemática a = M (X). Se requiere encontrar el intervalo de confianza para a para una confiabilidad dada y.

Muestra promedio

es una estimación estadística para xr = a.

Teorema. Valor aleatorio xB tiene una distribución normal si X tiene una distribución normal y M(XB) = a,

A (XB) = a, donde a = y/B (X), a = M (X). l/yo

El intervalo de confianza para a tiene la forma:

Encontramos 8.

Usando la proporción

donde Ф(r) es la función de Laplace, tenemos:

P ( | XB - a |<8} = 2Ф

tabla de valores de la función de Laplace encontramos el valor de t.

habiendo designado

T, obtenemos F(t) = g Dado que g está dado, entonces por

De la igualdad encontramos que la estimación es exacta.

Esto significa que el intervalo de confianza para a tiene la forma:

Dada una muestra de la población X

ng A" X2 xm
norte. n1 n2 Nuevo Méjico

n = U1 + ... + nm, entonces el intervalo de confianza será:

Ejemplo 6.35. Encuentre el intervalo de confianza para estimar la expectativa matemática a de la distribución normal con una confiabilidad de 0.95, conociendo la media muestral Xb = 10.43, el tamaño de la muestra n = 100 y la desviación estándar s = 5.

Usemos la fórmula

Sea la variable aleatoria X de la población una distribución normal, teniendo en cuenta que se conocen la varianza y la desviación estándar s de esta distribución. Se requiere estimar la expectativa matemática desconocida utilizando la media muestral. En este caso, la tarea se reduce a encontrar un intervalo de confianza para la expectativa matemática con confiabilidad b. Si especifica el valor de la probabilidad de confianza (confiabilidad) b, entonces puede encontrar la probabilidad de caer en el intervalo para la expectativa matemática desconocida usando la fórmula (6.9a):

donde Ф(t) es la función de Laplace (5.17a).

Como resultado, podemos formular un algoritmo para encontrar los límites del intervalo de confianza de la expectativa matemática si se conoce la varianza D = s 2:

  1. Establezca el valor de confiabilidad – b.
  2. De (6.14) exprese Ф(t) = 0,5× b. Seleccione el valor de t de la tabla para la función de Laplace basándose en el valor Ф(t) (ver Apéndice 1).
  3. Calcule la desviación e usando la fórmula (6.10).
  4. Escriba un intervalo de confianza usando la fórmula (6.12) tal que con probabilidad b la desigualdad se cumpla:

.

Ejemplo 5.

La variable aleatoria X tiene una distribución normal. Encuentre intervalos de confianza para una estimación con confiabilidad b = 0,96 de la expectativa matemática desconocida a, si se da:

1) desviación estándar general s = 5;

2) promedio muestral;

3) tamaño de muestra n = 49.

En la fórmula (6.15) de la estimación de intervalo de la expectativa matemática A con confiabilidad b se conocen todas las cantidades excepto t. El valor de t se puede encontrar usando (6.14): b = 2Ф(t) = 0,96. Ф(t) = 0,48.

Usando la tabla del Apéndice 1 para la función de Laplace Ф(t) = 0,48, encuentre el valor correspondiente t = 2,06. Por eso, . Al sustituir el valor calculado de e en la fórmula (6.12), puede obtener un intervalo de confianza: 30-1,47< a < 30+1,47.

El intervalo de confianza requerido para una estimación con confiabilidad b = 0,96 de la expectativa matemática desconocida es igual a: 28,53< a < 31,47.



Nuevo en el sitio

>

Más popular