Hogar Ortopedía Ejemplo de serie de variación discreta. Construcción de una serie de variación discreta.

Ejemplo de serie de variación discreta. Construcción de una serie de variación discreta.

Posicionando los datos observación estadística, caracterizando tal o cual fenómeno, en primer lugar es necesario ordenarlos, es decir darle un carácter sistemático

Estadístico inglés. UJReichman dijo en sentido figurado sobre las colecciones desordenadas que encontrarse con una masa de datos no generalizados equivale a una situación en la que una persona es arrojada a un matorral sin brújula. ¿Qué es la sistematización de datos estadísticos en forma de series de distribución?

Las series estadísticas de distribuciones son agregados estadísticos ordenados (Cuadro 17). El tipo más simple de serie de distribución estadística es una serie clasificada, es decir una serie de números en orden ascendente o descendente, variando las características. Tal serie no nos permite juzgar los patrones inherentes a los datos distribuidos: en qué valor se agrupan la mayoría de los indicadores, qué desviaciones hay de este valor; así como el panorama general de distribución. Para ello, los datos se agrupan, mostrando con qué frecuencia ocurren observaciones individuales en su número total (Esquema 1a 1).

. Tabla 17

. forma general serie estadística distribución

. Esquema 1. Esquema estadístico serie de distribución

La distribución de unidades de población según características que no tienen expresión cuantitativa se llama serie atributiva(por ejemplo, distribución de empresas por su área de producción)

Las series de distribución de unidades de población según características, tienen expresión cuantitativa, se denominan serie de variación. En dicha serie, el valor de la característica (opciones) está en orden ascendente o descendente.

En la serie de distribución variacional se distinguen dos elementos: variante y frecuencia. . Opción- este es un significado separado de las características de agrupación frecuencia- un número que muestra cuántas veces aparece cada opción

Otro elemento se calcula en estadística matemática. serie de variación -parcialmente. Este último se define como la relación entre la frecuencia de casos de un intervalo dado y cantidad total La parte de frecuencia se determina en fracciones de una unidad, porcentaje (%) en ppm (% o)

Así, una serie de distribución de variaciones es una serie en la que las opciones se disponen en orden ascendente o descendente, y se indican sus frecuencias o frecuencias. Las series de variación son discretas (intervalos) y otros intervalos (continuas).

. Serie de variación discreta- Se trata de series de distribución en las que la variante como valor de una característica cuantitativa sólo puede adquirir un valor determinado. Las opciones se diferencian entre sí en una o más unidades.

Por tanto, el número de piezas producidas por turno por un trabajador específico sólo puede expresarse mediante un número específico (6, 10, 12, etc.). Un ejemplo de una serie de variación discreta podría ser la distribución de trabajadores por el número de piezas producidas (Tabla 18 18).

. Tabla 18

. Distribución en series discretas _

. Serie de variación de intervalo (continua)- series de distribución en las que el valor de las opciones se da en forma de intervalos, es decir los valores de las características pueden diferir entre sí en una cantidad arbitrariamente pequeña. Al construir una serie de variaciones de características perivariantes de NEP, es imposible indicar cada valor de la variante, por lo que la población se distribuye en intervalos. Estos últimos pueden ser iguales o desiguales. Para cada uno de ellos se indican frecuencias o frecuencias (Tabla 1 9 19).

En series de distribución de intervalos con intervalos desiguales, se calculan características matemáticas como la densidad de distribución y la densidad de distribución relativa en un intervalo determinado. La primera característica está determinada por la relación entre la frecuencia y el valor del mismo intervalo, la segunda, por la relación entre la frecuencia y el valor del mismo intervalo. Para el ejemplo anterior, la densidad de distribución en el primer intervalo será 3: 5 = 0,6 y la densidad relativa en este intervalo será 7,5: 5 = 1,55%.

. Tabla 19

. Serie de distribución de intervalos _

Enviar su buen trabajo en la base de conocimientos es sencillo. Utilice el siguiente formulario

Buen trabajo al sitio">

Los estudiantes, estudiantes de posgrado y jóvenes científicos que utilicen la base de conocimientos en sus estudios y trabajos le estarán muy agradecidos.

Publicado en http://www.allbest.ru/

TAREA1

Se dispone de los siguientes datos sobre los salarios de los empleados de la empresa:

Tabla 1.1

Tamaño salarios en convencional guarida. unidades

Se requiere construir una serie de distribución de intervalos para encontrar;

1) salario medio;

2) desviación lineal promedio;

4) desviación estándar;

5) rango de variación;

6) coeficiente de oscilación;

7) coeficiente lineal variaciones;

8) coeficiente de variación simple;

10) mediana;

11) coeficiente de asimetría;

12) índice de asimetría de Pearson;

13) coeficiente de curtosis.

Solución

Como usted sabe, las opciones (valores reconocidos) están dispuestas en orden ascendente para formar series de variación discreta. Con un gran número opción (más de 10), incluso en el caso de variación discreta, se construyen series de intervalos.

Si una serie de intervalos se compila con intervalos pares, entonces el rango de variación se divide por el número especificado de intervalos. Además, si el valor resultante es un número entero e inequívoco (lo cual es raro), se supone que la longitud del intervalo es igual a este número. En otros casos producido redondeo Necesariamente V lado aumentar, Entonces a el último dígito que quedaba era par. Obviamente, a medida que aumenta la duración del intervalo, la rango de variación por una cantidad igual al producto del número de intervalos: por la diferencia entre la duración calculada y la inicial del intervalo

A) Si la magnitud de la expansión del rango de variación es insignificante, entonces se suma al valor más grande o se resta del valor más pequeño de la característica;

b) Si la magnitud de la expansión del rango de variación es notable, entonces, para que el centro del rango no se desplace, se divide aproximadamente por la mitad, sumando simultáneamente al mayor y restando de valores más bajos firmar.

Si se compila una serie de intervalos con intervalos desiguales, entonces el proceso se simplifica, pero aún así la longitud de los intervalos debe expresarse como un número con el último dígito par, lo que simplifica enormemente los cálculos posteriores de características numéricas.

30 es el tamaño de la muestra.

Creemos una serie de distribución de intervalos usando la fórmula de Sturges:

K = 1 + 3,32*log norte,

K - número de grupos;

K = 1 + 3,32*lg 30 = 5,91=6

Encontramos el rango del atributo - salarios de los trabajadores de la empresa - (x) usando la fórmula

R= xmax - xmin y dividir por 6; R= 195-112=83

Entonces la duración del intervalo será yo carril=83:6=13.83

El comienzo del primer intervalo será 112. Sumando a 112 yo ras = 13,83, obtenemos su valor final 125,83, que también es el comienzo del segundo intervalo, etc. final del quinto intervalo - 195.

Al encontrar frecuencias, uno debe guiarse por la regla: "si el valor de una característica coincide con el límite del intervalo interno, entonces debe atribuirse al intervalo anterior".

Obtenemos una serie de intervalos de frecuencias y frecuencias acumuladas.

Tabla 1.2

Por tanto, 3 empleados tienen un salario. tarifa de 112 a 125,83 unidades monetarias convencionales. salario más alto tarifa de 181,15 a 195 unidades monetarias convencionales. sólo 6 empleados.

Para calcular las características numéricas, transformamos la serie de intervalos en una serie discreta, tomando como opción la mitad de los intervalos:

Tabla 1.3

14131,83

Usando la fórmula de la media aritmética ponderada

unidades monetarias convencionales

Desviación lineal promedio:

donde xi es el valor de la característica en estudio para la i-ésima unidad de la población,

Valor medio del rasgo estudiado.

Publicado en http://www.allbest.ru/

LPublicado el http://www.allbest.ru/

Unidades monetarias convencionales

Desviación Estándar:

Dispersión:

Rango relativo de variación (coeficiente de oscilación): c= R:,

Desviación lineal relativa: q = L:

El coeficiente de variación: V = y:

El coeficiente de oscilación muestra la fluctuación relativa de los valores extremos de una característica alrededor de la media aritmética, y el coeficiente de variación caracteriza el grado y la homogeneidad de la población.

c= R: = 83 / 159,485*100% = 52,043%

Así, la diferencia entre los valores extremos es un 5,16% (=94,84%-100%) menor que el salario medio de los empleados de la empresa.

q = L: = 17,765/ 159,485*100% = 11,139%

V = y: = 21,704/ 159,485*100% = 13,609%

El coeficiente de variación es inferior al 33%, lo que indica una variación débil de los salarios de los trabajadores de la empresa, es decir. que el valor medio es una característica típica de los salarios de los trabajadores (la población es homogénea).

En series de distribución de intervalos moda determinado por la fórmula -

Frecuencia del intervalo modal, es decir, el intervalo que contiene el mayor número de opciones;

Frecuencia del intervalo que precede al modal;

Frecuencia del intervalo que sigue al modal;

Longitud del intervalo modal;

El límite inferior del intervalo modal.

Para determinar medianas en la serie de intervalos usamos la fórmula

¿Dónde está la frecuencia acumulada (acumulada) del intervalo anterior a la mediana?

Límite inferior del intervalo mediano;

Frecuencia del intervalo mediano;

Longitud del intervalo mediano.

Intervalo mediano- un intervalo cuya frecuencia acumulada (=3+3+5+7) excede la mitad de la suma de frecuencias - (153,49; 167,32).

Calculemos la asimetría y la curtosis, para lo cual crearemos una nueva hoja de trabajo:

Tabla 1.4

Datos fácticos

Datos calculados

Calculemos el momento de tercer orden.

Por lo tanto, la asimetría es igual a

Dado que 0,3553 · 0,25, la asimetría se considera significativa.

Calculemos el momento de cuarto orden.

Por tanto, la curtosis es igual a

Porque< 0, то эксцесс является плосковершинным.

El grado de asimetría se puede determinar utilizando el coeficiente de asimetría de Pearson (As): oscilación valor de muestra rotación

¿Dónde está la media aritmética de la serie de distribución? -- moda; -- Desviación Estándar.

Con una distribución simétrica (normal) = Mo, por lo tanto, el coeficiente de asimetría es cero. Si As > 0, entonces hay más moda, por lo tanto, hay asimetría hacia la derecha.

Como si< 0, то menos moda Por tanto, existe asimetría por el lado izquierdo. El coeficiente de asimetría puede variar de -3 a +3.

La distribución no es simétrica, sino que tiene asimetría hacia la izquierda.

TAREA 2

¿Cuál debe ser el tamaño de la muestra para que con probabilidad 0.954 el error muestral no supere 0.04 si con base en encuestas anteriores se sabe que la varianza es 0.24?

Solución

El tamaño de la muestra para el muestreo no repetitivo se calcula mediante la fórmula:

t - coeficiente de confianza (con una probabilidad de 0,954 es igual a 2,0; determinado a partir de tablas de integrales de probabilidad),

y2=0,24 - desviación estándar;

10.000 personas - tamaño de la muestra;

Dx =0,04 - error máximo de la media muestral.

Con una probabilidad del 95,4%, se puede afirmar que el tamaño de la muestra, asegurando un error relativo no superior a 0,04, debe ser de al menos 566 familias.

TAREA3

Se dispone de los siguientes datos sobre los ingresos de las principales actividades de la empresa, en millones de rublos.

Para analizar una serie de dinámicas, determine los siguientes indicadores:

1) cadena y básico:

Aumentos absolutos;

Tasas de crecimiento;

Tasa de crecimiento;

2) promedio

Nivel de fila dinámica;

Aumento absoluto;

Tasa de crecimiento;

Tasa de incremento;

3) valor absoluto de aumento del 1%.

Solución

1. Aumento absoluto (Dy)- esta es la diferencia entre el siguiente nivel de la serie y el anterior (o básico):

cadena: DN = yi - yi-1,

básico: DN = yi - y0,

уi - nivel de fila,

i - número de nivel de fila,

y0 - nivel del año base.

2. Tasa de crecimiento (Tu) es la relación entre el nivel posterior de la serie y el anterior (o año base 2001):

cadena: Tu = ;

básico: Tu =

3. Tasa de crecimiento (TD) es la relación entre el crecimiento absoluto y el nivel anterior, expresada en %.

cadena: Tu = ;

básico: Tu =

4. Valor absoluto 1% de aumento (A)- esta es la relación entre el crecimiento absoluto de la cadena y la tasa de crecimiento, expresada en%.

A =

Nivel de fila promedio calculado utilizando la fórmula de la media aritmética.

Nivel medio de ingresos de las actividades principales durante 4 años:

Incremento absoluto promedio calculado por la fórmula:

donde n es el número de niveles de la serie.

En promedio, durante el año, los ingresos de las actividades principales aumentaron en 3,333 millones de rublos.

Tasa media de crecimiento anual calculado usando la fórmula de la media geométrica:

уn es el nivel final de la fila,

y0- Primer nivel fila.

Tu = 100% = 102,174%

Tasa media de crecimiento anual calculado por la fórmula:

¿T? = Tu - 100% = 102,74% - 100% = 2,74%.

Así, en promedio durante el año, los ingresos de las principales actividades de la empresa aumentaron un 2,74%.

TAREASA4

Calcular:

1. Índices de precios individuales;

2. Índice general de volumen de negocios comercial;

3. Índice de precios agregados;

4. Índice agregado del volumen físico de ventas de bienes;

5. Desglosar el aumento absoluto en el valor del volumen de negocios comercial por factores (debido a cambios en los precios y el número de bienes vendidos);

6. Sacar breves conclusiones sobre todos los indicadores obtenidos.

Solución

1. Según la condición, los índices de precios individuales de los productos A, B, C ascendieron a -

ipA=1,20; iрБ=1,15; iрВ=1,00.

2. Calcularemos el índice general de facturación comercial mediante la fórmula:

Yo w = = 1470/1045*100% = 140,67%

El volumen de negocios comercial aumentó un 40,67% (140,67%-100%).

En promedio, los precios de las materias primas aumentaron un 10,24%.

El monto de los costos adicionales para los compradores por los aumentos de precios:

w(p) = ? p1q1-? p0q1 = 1470 - 1333,478 = 136,522 millones de rublos.

Como resultado del aumento de los precios, los compradores tuvieron que gastar 136,522 millones de rublos adicionales.

4. Índice general de volumen físico de facturación comercial:

El volumen físico del volumen de negocios comercial aumentó un 27,61%.

5. Determinemos el cambio general en el volumen de negocios comercial en el segundo período en comparación con el primero:

w = 1470-1045 = 425 millones de rublos.

debido a cambios de precios:

W(p) = 1470 - 1333,478 = 136,522 millones de rublos.

debido a cambios en el volumen físico:

w(q) = 1333,478 - 1045 = 288,478 millones de rublos.

La facturación de mercancías aumentó un 40,67%. Los precios promedio de tres bienes aumentaron un 10,24%. El volumen físico del volumen de negocios comercial aumentó un 27,61%.

En general, el volumen de ventas aumentó en 425 millones de rublos, incluso debido al aumento de los precios en 136,522 millones de rublos y debido al aumento en el volumen de ventas en 288,478 millones de rublos.

TAREA5

Los siguientes datos están disponibles para 10 fábricas en una industria.

Número de planta

Producción de producto, miles de unidades. (X)

Basado en los datos dados:

I) confirmar las disposiciones del análisis lógico sobre la presencia de una correlación lineal entre la característica del factor (volumen de producción) y la característica resultante (consumo de electricidad), trazar los datos iniciales en el gráfico del campo de correlación y sacar conclusiones sobre la forma de la relación, indicar su fórmula;

2) determinar los parámetros de la ecuación de conexión y trazar la línea teórica resultante en la gráfica del campo de correlación;

3) calcular el coeficiente de correlación lineal,

4) explicar el significado de los indicadores obtenidos en los párrafos 2) y 3);

5) utilizando el modelo resultante, hacer un pronóstico sobre el posible consumo de energía en una planta con un volumen de producción de 4,5 mil unidades.

Solución

Los datos del atributo, el volumen de producción (factor), se denotarán por xi; signo - consumo de electricidad (resultado) a través de yi; Los puntos con coordenadas (x, y) se trazan en el campo de correlación OXY.

Los puntos del campo de correlación están ubicados a lo largo de una determinada línea recta. Por tanto, la relación es lineal buscaremos una ecuación de regresión en forma de recta Уx=ax+b. Para encontrarlo utilizamos el sistema de ecuaciones normales:

Creemos una tabla de cálculo.

Usando los promedios encontrados, componemos un sistema y lo resolvemos con respecto a los parámetros a y b:

Entonces, obtenemos la ecuación de regresión para y sobre x: = 3,57692 x + 3,19231

Construimos una línea de regresión en el campo de correlación.

Sustituyendo los valores de x de la columna 2 en la ecuación de regresión, obtenemos los calculados (columna 7) y los comparamos con los datos de y, que se reflejan en la columna 8. Por cierto, la exactitud de los cálculos se confirma mediante la coincidencia de los valores medios de y y.

Coeficientecorrelación lineal evalúa la cercanía de la relación entre las características x e y y se calcula utilizando la fórmula

El coeficiente angular de regresión directa a (en x) caracteriza la dirección del identificadodependenciassignos: para a>0 son iguales, para a<0- противоположны. es absoluto valor: una medida del cambio en la característica resultante cuando la característica del factor cambia en una unidad de medida.

El término libre de la regresión directa revela la dirección y su valor absoluto es una medida cuantitativa de la influencia de todos los demás factores sobre el signo resultante.

Si< 0, entonces el recurso del factor característico de un objeto individual se utiliza con menos, y cuando>0 Conmayor eficiencia que el promedio para todo el conjunto de objetos.

Realicemos un análisis posterior a la regresión.

El coeficiente en x de la regresión directa es igual a 3.57692 >0, por lo tanto, con un aumento (disminución) en la producción, el consumo de electricidad aumenta (disminuye). Aumento de la producción en mil unidades. da un aumento medio en el consumo de electricidad de 3.57692 mil kWh.

2. El término libre de la regresión directa es igual a 3,19231, por lo tanto, la influencia de otros factores aumenta la fuerza del impacto de la producción del producto sobre el consumo de electricidad en medida absoluta en 3.19231 mil kWh.

3. El coeficiente de correlación de 0,8235 revela una dependencia muy estrecha del consumo de electricidad de la producción del producto.

Según la ecuación. Modelo de regresión fácil hacer predicciones. Para ello, se sustituyen los valores de x (el volumen de producción) en la ecuación de regresión y se predice el consumo de electricidad. En este caso, los valores de x se pueden tomar no solo dentro de un rango determinado, sino también fuera de él.

Hagamos una previsión sobre el posible consumo de energía en una planta con un volumen de producción de 4,5 mil unidades.

3,57692*4,5 + 3,19231= 19,288 45 mil kWh.

LISTA DE FUENTES UTILIZADAS

1. Zakharenkov S.N. Estadísticas socioeconómicas: libro de texto y guía práctica. -Mn.: BSEU, 2002.

2. Efimova M.R., Petrova E.V., Rumyantsev V.N. Teoría general de la estadística. - M.: INFRA - M., 2000.

3. Eliseeva I.I. Estadísticas. - M.: Prospect, 2002.

4. Teoría general de la estadística / En general. ed. Equipo original Bashina, A.A. Espirina. - M.: Finanzas y Estadística, 2000.

5. Estadísticas socioeconómicas: educativas y prácticas. subsidio / Zakharenkov S.N. y otros - Mn.: Universidad Estatal de Ereván, 2004.

6. Estadísticas socioeconómicas: libro de texto. prestación. / Ed. Nesterovich S.R. - Manganeso: BSEU, 2003.

7. Teslyuk I.E., Tarlovskaya V.A., Terlizhenko N. Estadísticas - Minsk, 2000.

8. Kharchenko L.P. Estadísticas. - M.: INFRA-M, 2002.

9. Kharchenko L.P., Dolzhenkova V.G., Ionin V.G. Estadísticas. - M.: INFRA-M, 1999.

10. Estadísticas económicas / Ed. Yu.N. Ivanov - M., 2000.

Publicado en Allbest.ru

...

Documentos similares

    Cálculo de la media aritmética para serie de intervalos distribuciones. Definición índice general volumen físico del volumen de negocios comercial. Análisis del cambio absoluto en el costo total de producción debido a cambios en el volumen físico. Cálculo del coeficiente de variación.

    prueba, agregada el 19/07/2010

    La esencia del comercio mayorista, minorista y público. Fórmulas para el cálculo de índices de facturación individuales y agregados. Cálculo de las características de una serie de distribución de intervalos: media aritmética, moda y mediana, coeficiente de variación.

    trabajo del curso, añadido el 10/05/2013

    Cálculo del volumen de ventas planificado y real, porcentaje de cumplimiento del plan, cambio absoluto en la facturación. Determinación del crecimiento absoluto, tasas de crecimiento promedio y aumento de los ingresos en efectivo. Cálculo de medias estructurales: modas, medianas, cuartiles.

    prueba, agregada el 24/02/2012

    Serie de intervalos de distribución de bancos por volumen de beneficios. Encontrar la moda y la mediana de la serie de distribución de intervalos resultante mediante un método gráfico y mediante cálculos. Cálculo de características de series de distribución de intervalos. Cálculo de la media aritmética.

    prueba, agregada el 15/12/2010

    Fórmulas para determinar los valores promedio de una serie de intervalos: modas, medianas, dispersión. Cálculo de indicadores analíticos de series dinámicas utilizando esquemas básicos y encadenados, tasas de crecimiento e incrementos. El concepto de índice consolidado de costes, precios, gastos y facturación.

    trabajo del curso, añadido el 27/02/2011

    Concepto y finalidad, orden y reglas para la construcción de una serie de variaciones. Análisis de homogeneidad de datos en grupos. Indicadores de variación (fluctuación) de un rasgo. Determinación de desviación lineal y cuadrática promedio, coeficiente de oscilación y variación.

    prueba, agregada el 26/04/2010

    El concepto de moda y mediana como características típicas, el procedimiento y criterios para su determinación. Encontrar la moda y la mediana en series de variación discretas y de intervalo. Cuartiles y deciles como características adicionales de una serie estadística de variación.

    prueba, añadido el 11/09/2010

    Construcción de una serie de distribución de intervalos basada en características de agrupación. Características de la desviación de la distribución de frecuencias de una forma simétrica, cálculo de curtosis e indicadores de asimetría. Análisis de indicadores hoja de balance o declaración de resultados.

    prueba, agregada el 19/10/2014

    Conversión de series empíricas en discretas y de intervalo. Determinación del valor medio de una serie discreta utilizando sus propiedades. Cálculo utilizando una serie discreta de indicadores de moda, mediana y variación (dispersión, desviación, coeficiente de oscilación).

    prueba, agregada el 17/04/2011

    Construcción de una serie estadística de distribución de organizaciones. Determinación gráfica de la moda y los valores medianos. Cercanía conexión de correlación utilizando el coeficiente de determinación. Determinación del error muestral del número medio de empleados.

La forma más sencilla de resumir el material estadístico es construir series. Resultado resumido investigación estadística puede haber series de distribución. Una serie de distribución en estadística es una distribución ordenada de unidades de población en grupos según cualquier característica: cualitativa o cuantitativa. Si una serie se construye sobre una base cualitativa, se llama atributiva, y si es cuantitativa, se llama variacional.

Una serie de variación se caracteriza por dos elementos: variante (X) y frecuencia (f). Una variante es un valor separado de una característica de una unidad individual o grupo de una población. Un número que muestra cuántas veces ocurre un valor de atributo determinado se llama frecuencia. Si la frecuencia se expresa como un número relativo, entonces se llama frecuencia. Una serie de variación puede ser interválica, cuando se definen los límites "desde" y "hasta", o puede ser discreta, cuando la característica en estudio se caracteriza por un número determinado.

Veamos la construcción de series de variaciones usando ejemplos.

Ejemplo. y hay datos sobre las categorías arancelarias de 60 trabajadores en uno de los talleres de la planta.

Distribuya a los trabajadores según categoría arancelaria, construya una serie de variaciones.

Para ello anotamos todos los valores de la característica en orden ascendente y contamos el número de trabajadores de cada grupo.

Tabla 1.4

Distribución de trabajadores por categoría

Rango de trabajador (X)

Numero de trabajadores

persona (f)

en % del total (particularmente)

Recibimos una serie discreta variacional en la que la característica que se estudia (el rango del trabajador) está representada por un número determinado. Para mayor claridad, las series de variaciones se representan gráficamente. A partir de esta serie de distribución se construyó una superficie de distribución.

Arroz. 1.1. Polígono de distribución de trabajadores por categoría arancelaria

Consideraremos la construcción de una serie de intervalos con intervalos iguales usando el siguiente ejemplo.

Ejemplo. Se conocen datos sobre el valor del capital fijo de 50 empresas en millones de rublos. Se requiere mostrar la distribución de las empresas por costo de capital fijo.

Para mostrar la distribución de empresas por valor de capital fijo, primero resolvemos la cuestión del número de grupos que queremos resaltar. Supongamos que decidimos identificar 5 grupos de empresas. Luego determinamos el tamaño del intervalo en el grupo. Para ello utilizamos la fórmula

Según nuestro ejemplo.

Sumando el valor del intervalo al valor mínimo del atributo, obtenemos grupos de empresas por costo de capital fijo.

Una unidad con valor doble pertenece al grupo donde actúa como límite superior (es decir, el valor del atributo 17 irá al primer grupo, 24 al segundo, etc.).

Contemos el número de fábricas en cada grupo.

Tabla 1.5

Distribución de empresas por valor de capital fijo (millones de rublos)

Costo del capital fijo
en millones de rublos (X)

Número de empresas
(frecuencia) (f)

Frecuencias acumuladas
(acumulativo)

Según esta distribución se obtuvo una serie de intervalos de variación, de la que se deduce que 36 empresas tienen un capital fijo por valor de 10 a 24 millones de rublos. etc.

Las series de distribución de intervalos se pueden representar gráficamente en forma de histograma.

Los resultados del procesamiento de datos se documentan en tablas estadisticas. Las tablas estadísticas contienen su propio sujeto y predicado.

El sujeto es la totalidad o parte de la totalidad que se está caracterizando.

Los predicados son indicadores que caracterizan al sujeto.

Se distinguen tablas: simples y grupales, combinacionales, con desarrollo simple y complejo del predicado.

Una tabla simple en el tema contiene una lista de unidades individuales.

Si el tema contiene una agrupación de unidades, entonces dicha tabla se llama tabla de grupo. Por ejemplo, un grupo de empresas por número de trabajadores, grupos de población por género.

El tema de la tabla de combinación contiene agrupaciones según dos o más características. Por ejemplo, la población se divide por género en grupos por educación, edad, etc.

Las tablas combinadas contienen información que permite identificar y caracterizar la relación de una serie de indicadores y el patrón de sus cambios tanto en el espacio como en el tiempo. Para que la tabla quede clara a la hora de desarrollar su tema, limítate a dos o tres características, formando un número limitado de grupos para cada una de ellas.

El predicado en tablas se puede desarrollar de diferentes formas. Con un simple desarrollo del predicado, todos sus indicadores se ubican independientemente unos de otros.

Con un desarrollo complejo del predicado, los indicadores se combinan entre sí.

Al construir cualquier tabla, se debe partir de los propósitos del estudio y del contenido del material procesado.

Además de tablas, las estadísticas también utilizan gráficos y diagramas. Gráfico: los datos estadísticos se representan utilizando formas geométricas. Los gráficos se dividen en gráficos de líneas y de barras, pero también pueden haber gráficos figurados (dibujos y símbolos), gráficos circulares (el círculo se toma como el valor de toda la población y se muestran las áreas de sectores individuales). Gravedad específica o una parte de ella componentes), diagramas radiales (construidos a partir de ordenadas polares). El cartograma es una combinación. mapa de contorno o un plano del sitio con un diagrama.

2. El concepto de serie de distribución. Series de distribución discretas e interválicas.

Filas de distribución Se denominan agrupaciones de tipo especial en las que para cada característica, grupo de características o clase de características se conoce el número de unidades del grupo o la proporción de este número en el total. Aquellos. serie de distribución– un conjunto ordenado de valores de atributos, dispuestos en orden ascendente o descendente con sus correspondientes ponderaciones. Las series de distribución se pueden construir mediante características cuantitativas o de atributos.

Las series de distribución construidas sobre una base cuantitativa se denominan series de variación. Ellos son discreto y de intervalo. Se puede construir una serie de distribución basándose en una característica que varía continuamente (cuando la característica puede tomar cualquier valor dentro de cualquier intervalo) y en una característica que varía discretamente (toma valores enteros estrictamente definidos).

Discreto Una serie de variación de una distribución es un conjunto clasificado de opciones con sus correspondientes frecuencias o detalles. Las variantes de una serie discreta son valores de una característica que cambian de forma discreta y continua, generalmente como resultado de un recuento.

Discreto

Las series de variación generalmente se construyen si los valores de la característica en estudio pueden diferir entre sí en al menos una cierta cantidad finita. En series discretas, se especifican valores puntuales de una característica. Ejemplo : Distribución de trajes de hombre vendidos por tiendas al mes por talla.

Intervalo

una serie de variación es un conjunto ordenado de intervalos de valores variables variable aleatoria con las correspondientes frecuencias o frecuencias de ocurrencia de valores de valor en cada uno de ellos. Las series de intervalos están diseñadas para analizar la distribución de una característica que cambia continuamente, cuyo valor se registra con mayor frecuencia mediante medición o pesaje. Las variantes de tal serie son agrupaciones.

Ejemplo : Distribución de compras en una tienda de alimentación por importe.

Si en las series de variación discreta la respuesta en frecuencia se relaciona directamente con una variante de la serie, entonces en las series de intervalo se refiere a un grupo de variantes.

Es conveniente analizar series de distribución utilizando su representación gráfica, lo que permite juzgar la forma de la distribución y los patrones. Una serie discreta se representa en un gráfico como una línea discontinua: polígono de distribución. Para construirlo, en un sistema de coordenadas rectangular, los valores clasificados (ordenados) de la característica variable se trazan a lo largo del eje x en la misma escala, y a lo largo del eje de ordenadas se traza una escala para expresar frecuencias.

Las series de intervalos se representan como histogramas de distribución(es decir, gráficos de barras).

Al construir un histograma, los valores de los intervalos se trazan en el eje de abscisas y las frecuencias se representan mediante rectángulos construidos en los intervalos correspondientes. La altura de las columnas en caso intervalos iguales debe ser proporcional a las frecuencias.

Cualquier histograma se puede convertir en un polígono de distribución; para ello es necesario conectar los vértices de sus rectángulos con segmentos rectos.

2. Método de índice para analizar el impacto de la producción promedio y la plantilla promedio sobre los cambios en el volumen de producción

método de índice se utiliza para analizar la dinámica y comparar indicadores generales, así como los factores que influyen en los cambios en los niveles de estos indicadores. Utilizando índices, es posible identificar la influencia de la producción promedio y la plantilla promedio en los cambios en el volumen de producción. Este problema se resuelve construyendo un sistema de índices analíticos.

El índice de volumen de producción está relacionado con el número promedio de empleados y el índice de producción promedio de la misma manera que el volumen de producción (Q) está relacionado con la producción ( w) y números ( r) .

Podemos concluir que el volumen de producción será igual al producto de la producción promedio y la plantilla promedio:

Q = w r, donde Q es el volumen de producción,

w - producción promedio,

r – número medio de empleados.

Como puede ver, estamos hablando de la relación de los fenómenos en estática: el producto de dos factores da el volumen total del fenómeno resultante. También es obvio que esta conexión es funcional, por lo que la dinámica de esta conexión se estudia mediante índices. Para el ejemplo dado, este es el siguiente sistema:

Jw × Jr = Jwr.

Por ejemplo, el índice de volumen de producción Jwr, como índice de un fenómeno productivo, se puede descomponer en dos índices de factores: el índice de producción promedio (Jw) y el índice de plantilla promedio (Jr):

Índice Índice Índice

volumen de nómina promedio

número de producción

Dónde j w- índice de productividad laboral calculado según la fórmula de Laspeyres;

jr.- índice del número de empleados, calculado según la fórmula de Paasche.

Los sistemas de índices se utilizan para determinar la influencia de factores individuales en la formación del nivel de un indicador de desempeño, lo que permite 2 valores conocidosíndices para determinar el valor de la incógnita.

Con base en el sistema de índices anterior, también se puede encontrar el aumento absoluto en el volumen de producción, descompuesto en la influencia de factores.

1. Aumento general del volumen de producción:

∆wr = ∑w 1 r 1 - ∑w 0 r 0 .

2. Incremento por acción del indicador de producción media:

∆wr/w = ∑w 1 r 1 - ∑w 0 r 1 .

3. Incremento por acción del indicador de plantilla media:

∆wr/r = ∑w 0 r 1 - ∑w 0 r 0

∆wr = ∆wr/w + ∆wr/r.

Ejemplo. Se conocen los siguientes datos

Podemos determinar cómo ha cambiado el volumen de producción en términos relativos y absolutos y cómo los factores individuales influyeron en este cambio.

El volumen de producción fue:

en el periodo base

w 0 * r 0 = 2000 * 90 = 180000,

y en los informes

w 1 * r 1 = 2100 * 100 = 210000.

En consecuencia, el volumen de producción aumentó en 30.000 unidades o un 1,16%.

∆wr=∑w 1 r 1 -∑w 0 r 0= (210000-180000)=30000

o (210000:180000)*100%=1,16%.

Este cambio en el volumen de producción se debió a:

1) un aumento de la plantilla media de 10 personas o 111,1%

r 1 / r 0 = 100/90 = 1,11 o 111,1%.

En términos absolutos, debido a este factor, el volumen de producción aumentó en 20.000:

w 0 r 1 – w 0 r 0 = w 0 (r 1 -r 0) = 2000 (100-90) = 20000.

2) un aumento de la producción media del 105% o 10.000:

w 1 r 1 /w 0 r 1 = 2100*100/2000*100 = 1,05 o 105%.

En términos absolutos, el aumento es:

w 1 r 1 – w 0 r 1 = (w 1 -w 0)r 1 = (2100-2000)*100 = 10000.

Por tanto, la influencia combinada de los factores fue:

1. En términos absolutos

10000 + 20000 = 30000

2. En términos relativos

1,11 * 1,05 = 1,16 (116%)

Por tanto, el incremento es del 1,16%. Ambos resultados se obtuvieron previamente.

La palabra "índice" traducida significa puntero, indicador. En estadística, un índice se interpreta como un indicador relativo que caracteriza un cambio en un fenómeno en el tiempo, el espacio o en comparación con un plan. Dado que el índice es un valor relativo, los nombres de los índices están en consonancia con los nombres de los valores relativos.

En los casos en que analizamos los cambios en el tiempo de los productos comparados, podemos plantearnos la pregunta de cómo cambian los componentes del índice (precio, volumen físico, estructura de producción o ventas) en diferentes condiciones (en diferentes áreas). especies individuales productos). En este sentido, se construyen índices de composición constante, composición variable y cambios estructurales.

Índice de composición permanente (fija) – se trata de un índice que caracteriza la dinámica del valor medio para una misma estructura fija de la población.

El principio de construir un índice de composición constante es eliminar el impacto de los cambios en la estructura de ponderaciones sobre el valor indexado calculando el nivel promedio ponderado del indicador indexado con las mismas ponderaciones.

El índice de composición constante es idéntico en forma al índice agregado. La forma agregada es la más común.

El índice de composición constante se calcula con ponderaciones fijadas al nivel de un período y muestra el cambio únicamente en el valor indexado. El índice de composición constante elimina el impacto de los cambios en la estructura de ponderaciones sobre el valor indexado calculando el nivel promedio ponderado del indicador indexado con las mismas ponderaciones. Los índices de composición constante comparan indicadores calculados sobre la base de una estructura de fenómenos sin cambios.

La descripción de los cambios en una característica variable se realiza mediante series de distribución.

Serie de distribución estadística- se trata de una distribución ordenada de unidades de una población estadística en grupos separados según una determinada característica variable.

Las series estadísticas construidas sobre una base cualitativa se denominan atributivo. Si una serie de distribución se basa en una característica cuantitativa, entonces la serie es variacional.

A su vez, las series de variación se dividen en discretas y de intervalo. En el núcleo discreto fila de la distribución se encuentra un signo discreto (discontinuo) que toma valores numéricos(número de infracciones, número de recursos de los ciudadanos por asistencia legal). Intervalo La serie de distribución se construye a partir de un atributo continuo, que puede tomar cualquier valor de un rango determinado (edad del condenado, pena de prisión, etc.)

Cualquier serie de distribución estadística contiene dos elementos obligatorios: opciones de serie y frecuencia. Opciones (xyo) – valores individuales de la característica que toma en la serie de distribución. Frecuencias (f yo) son valores numéricos que muestran cuántas veces ocurren ciertas opciones en la serie de distribución. La suma de todas las frecuencias se llama volumen de la población.

Las frecuencias expresadas en unidades relativas (fracciones o porcentajes) se denominan frecuencias ( yo). La suma de las frecuencias es igual a uno si las Frecuencias se expresan como fracciones de unidad, o 100 si se expresan como porcentaje. El uso de frecuencias permite comparar series de variación con diferentes tamaños de población. Las frecuencias están determinadas por la siguiente fórmula:

Para construir una serie discreta, se clasifican todos los valores individuales de una característica que aparece en la serie y luego se calcula la frecuencia de repeticiones de cada valor. La serie de distribución se elabora en la idea de una tabla que consta de dos filas y columnas, una de las cuales contiene los valores de las variantes de la serie. xyo, en el segundo – valores de frecuencia fi.

Consideremos un ejemplo de construcción de una serie variacional discreta.

Ejemplo 3.1 . Según el Ministerio del Interior, se han registrado delitos cometidos en la ciudad de N por menores.

17 13 15 16 17 15 15 14 16 13 14 17 14 15 15 16 16 15 14 15 15 14 16 16 14 17 16 15 16 15 13 15 15 13 15 14 15 13 17 14.

Construya una serie de distribución discreta.

Solución .

En primer lugar, es necesario clasificar los datos sobre la edad de los menores, es decir, escríbalos en orden ascendente.

13 13 13 13 13 14 14 14 14 14 14 14 14 15 15 15 15 15 15 15 15 15 15 15 15 15 15 16 16 16 16 16 16 16 16 17 17 17 17 17



Tabla 3.1

Así, las frecuencias reflejan el número de personas de una determinada edad, por ejemplo, 5 personas tienen 13 años, 8 personas tienen 14 años, etc.

Construcción intervalo Las series de distribución se llevan a cabo de manera similar a la agrupación de intervalos iguales según un criterio cuantitativo, es decir, primero se determina el número óptimo de grupos en los que se dividirá la población, se establecen los límites de los intervalos por grupo y se calculan las frecuencias. .

Ilustremos la construcción de una serie de distribución de intervalos utilizando el siguiente ejemplo.

Ejemplo 3.2 .

Construya una serie de intervalos basada en el siguiente agregado estadístico: el salario de un abogado en una oficina, miles de rublos:

16,0 22,2 25,1 24,3 30,5 32,0 17,0 23,0 19,8 27,5 22,0 18,9 31,0 21,5 26,0 27,4

Solución.

Consideremos que el número óptimo de grupos de intervalos iguales para una población estadística determinada es 4 (tenemos 16 opciones). Por tanto, el tamaño de cada grupo es igual a:

y el valor de cada intervalo será igual a:

Los límites de los intervalos están determinados por las fórmulas:

,

¿Dónde están los límites inferior y superior del i-ésimo intervalo, respectivamente?

Omitiendo los cálculos intermedios de los límites de los intervalos, ingresamos sus valores (opciones) y el número de abogados (frecuencias) con salarios dentro de cada intervalo en la Tabla 3.2, que ilustra la serie de intervalos resultante.

Tabla 3.2

El análisis de series de distribución estadística se puede realizar utilizando método gráfico. La representación gráfica de las series de distribución le permite ilustrar claramente los patrones de distribución de la población en estudio representándola en forma de polígono, histograma y acumulado. Veamos cada uno de los gráficos enumerados.

Polígono– una línea discontinua, cuyos segmentos conectan puntos con coordenadas ( xyo;f yo). Generalmente se utiliza un polígono para una imagen. serie discreta distribuciones. Para construirlo, los valores individuales clasificados del atributo se trazan en el eje x. xyo, en ordenadas: las frecuencias correspondientes a estos valores. Como resultado, al conectar los puntos correspondientes a los datos marcados a lo largo de los ejes de abscisas y ordenadas con segmentos, se obtiene una línea discontinua, llamada polígono. Pongamos un ejemplo de construcción de un polígono de frecuencia.

Para ilustrar la construcción del polígono, tomemos el resultado de resolver el ejemplo 3.1 para construir una serie discreta: Figura 1. La edad de los convictos se representa a lo largo del eje de abscisas y el número de convictos juveniles de una edad determinada se representa a lo largo del eje de abscisas. el eje de ordenadas. Analizando este sitio de prueba, podemos decir que el mayor número de condenados, 14 personas, tienen 15 años.

Figura 3.1 – Rango de frecuencia de una serie discreta.

También se puede construir un polígono para una serie de intervalos; en este caso, los puntos medios de los intervalos se trazan a lo largo del eje de abscisas y las frecuencias correspondientes se trazan a lo largo del eje de ordenadas.

gráfico de barras– una figura escalonada que consta de rectángulos, cuyas bases son los intervalos del valor del atributo y las alturas son iguales a las frecuencias correspondientes. El histograma se utiliza únicamente para mostrar series de distribución de intervalos. Si los intervalos son desiguales, entonces para construir un histograma, no son las frecuencias las que se trazan en la ordenada, sino la relación entre la frecuencia y el ancho del intervalo correspondiente. Un histograma se puede convertir en un polígono de distribución si los puntos medios de sus barras están conectados entre sí mediante segmentos.

Para ilustrar la construcción de un histograma, tomemos los resultados de la construcción de una serie de intervalos del ejemplo 3.2 – Figura 3.2.

Figura 3.2 – Histograma de distribución de los salarios de los abogados.

Para la representación gráfica de series de variaciones, también se utiliza la acumulación. Acumula– una curva que representa una serie de frecuencias acumuladas y que conecta puntos con coordenadas ( xyo;Estoy desnudo). Las frecuencias acumuladas se calculan sumando secuencialmente todas las frecuencias de una serie de distribución y muestran el número de unidades de población que tienen un valor característico no mayor que el especificado. Ilustremos el cálculo de frecuencias acumuladas para la serie de intervalos variacionales presentada en el ejemplo 3.2 - tabla 3.3.

Tabla 3.3

Para construir los acumulados de una serie de distribución discreta, los valores individuales clasificados del atributo se trazan a lo largo del eje de abscisas y las frecuencias acumuladas correspondientes a ellos se trazan a lo largo del eje de ordenadas. Al construir una curva acumulativa de una serie de intervalos, el primer punto tendrá una abscisa igual al límite inferior del primer intervalo y una ordenada igual a 0. Todos los puntos posteriores deben corresponder limite superior intervalos. Construyamos un acumulado usando los datos de la Tabla 3.3 - Figura 3.3.

Figura 3.3 – Curva de distribución salarial acumulada para abogados.

Preguntas de control

1. El concepto de serie de distribución estadística, sus principales elementos.

2. Tipos de series de distribución estadística. Su breve descripción.

3. Series de distribución discreta e interválica.

4. Metodología para la construcción de series de distribución discreta.

5. Metodología para la construcción de series de distribución de intervalos.

6. Representación gráfica de series de distribución discreta.

7. Representación gráfica de series de distribución de intervalos.

Tareas

Problema 1. Se dispone de los siguientes datos sobre el desempeño de 25 estudiantes del grupo TGP por sesión: 5, 4, 4, 4, 3, 2, 5, 3, 4, 4, 4, 3, 2, 5, 2, 5, 5, 2, 3 , 3, 5, 4, 2, 3, 3. Construya una serie de variación discreta de la distribución de los estudiantes según los puntos de evaluación recibidos durante la sesión. Para la serie resultante calcular las Frecuencias, Frecuencias acumuladas, frecuencias acumuladas. Sacar conclusiones.

Problema 2. Hay 1.000 presos en la colonia, su distribución por edades se presenta en la tabla:

Dibuja esta serie gráficamente. Sacar conclusiones.

Problema 3. Se dispone de los siguientes datos sobre las penas de prisión de los presos:

5; 4; 2; 1; 6; 3; 4; 3; 2; 2; 3; 1; 17; 6; 2; 8; 5; 11; 9; 3; 5; 6; 4; 3; 10; 5; 25; 1; 12; 3; 3; 4; 9; 6; 5; 3; 4; 3; 5; 12; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 13; 2; 4; 6; 4; 14; 3; 11; 5; 4; 3; 12; 6.

Construya una serie de intervalos de la distribución de prisioneros por períodos de prisión. Sacar conclusiones.

Problema 4. Se dispone de los siguientes datos sobre la distribución de los condenados en la región para el periodo de estudio según grupos de edad:

Dibuja gráficamente esta serie y saca conclusiones.



Nuevo en el sitio

>

Más popular