Hogar Cena Serie de distribución. Resumen estadístico y agrupación.

Serie de distribución. Resumen estadístico y agrupación.

La parte más importante del análisis estadístico es la construcción de series de distribución (agrupación estructural) para resaltar las propiedades y patrones característicos de la población en estudio. Dependiendo de qué característica (cuantitativa o cualitativa) se tome como base para agrupar los datos, se distinguen en consecuencia los tipos de series de distribución.

Si se toma una característica cualitativa como base para la agrupación, entonces dicha serie de distribución se llama atributivo(distribución por tipo de trabajo, por género, por profesión, por religión, nacionalidad, etc.).

Si una serie de distribución se construye sobre una base cuantitativa, entonces dicha serie se llama variacional. Construir una serie de variación significa organizar la distribución cuantitativa de unidades de población por valores característicos y luego contar el número de unidades de población con estos valores (construir una tabla de grupo).

Hay tres formas de series de variación: series clasificadas, series discretas y series de intervalos.

Serie clasificada- esta es la distribución de unidades individuales de la población en orden ascendente o descendente de la característica en estudio. La clasificación le permite dividir fácilmente los datos cuantitativos en grupos, detectar inmediatamente los más pequeños y valor más alto característica, resalte los valores que se repiten con mayor frecuencia.

Otras formas de series de variación son tablas de grupos compiladas según la naturaleza de la variación de los valores de la característica en estudio. Según la naturaleza de la variación, se distinguen características discretas (discontinuas) y continuas.

Serie discreta- Se trata de una serie de variaciones, cuya construcción se basa en características con cambio discontinuo (características discretas). Estos últimos incluyen la categoría arancelaria, el número de hijos de la familia, el número de empleados de la empresa, etc. Estas características sólo pueden tomar un número finito de valores específicos.

Una serie de variación discreta representa una tabla que consta de dos columnas. La primera columna indica el valor específico del atributo y la segunda columna indica el número de unidades en la población con un valor específico del atributo.

Si una característica cambia continuamente (cantidad de ingresos, antigüedad en el servicio, costo de los activos fijos de la empresa, etc., que dentro de ciertos límites puede tomar cualquier valor), entonces para esta característica es necesario construir serie de variación de intervalo.

La tabla de grupos aquí también tiene dos columnas. El primero indica el valor del atributo en el intervalo “de - a” (opciones), el segundo indica el número de unidades incluidas en el intervalo (frecuencia).

Frecuencia (frecuencia de repetición): el número de repeticiones de una variante particular de los valores de los atributos se denota por fi, y la suma de frecuencias igual al volumen de la población en estudio se denota

donde k es el número de opciones para los valores de los atributos

Muy a menudo, la tabla se complementa con una columna en la que se calculan las frecuencias acumuladas S, que muestran cuántas unidades de la población tienen un valor característico no mayor que este valor.

Las frecuencias de la serie f pueden sustituirse por las frecuencias w, expresadas en números relativos (fracciones o porcentajes). Representan la relación entre las frecuencias de cada intervalo y sus cantidad total, es decir.:

Al construir una serie de variación con valores de intervalo, en primer lugar es necesario establecer el valor del intervalo i, que se define como la relación entre el rango de variación R y el número de grupos m:

donde R = xmáx - xmín; m = 1 + 3,322 logn (fórmula de Sturgess); n es el número total de unidades de la población.

Para determinar la estructura de una población se utilizan indicadores promedio especiales, que incluyen la mediana y la moda, o los llamados promedios estructurales. Si la media aritmética se calcula basándose en el uso de todas las variantes de los valores de los atributos, entonces la mediana y la moda caracterizan el valor de la variante que ocupa una determinada posición promedio en el ranking. serie de variación.

Mediana (yo)- este es el valor que corresponde a la opción ubicada en el medio de la serie clasificada.

Para una serie clasificada con un número impar de valores individuales (por ejemplo, 1, 2, 3, 3, 6, 7, 9, 9, 10), la mediana será el valor que se ubica en el centro de la serie, es decir quinta magnitud.

Para una serie clasificada con un número par de valores individuales (por ejemplo, 1, 5, 7, 10, 11, 14), la mediana será la media aritmética, que se calcula a partir de dos valores adyacentes.

Es decir, para encontrar la mediana, primero debes determinarla. número de serie(su posición en la serie clasificada) según la fórmula

donde n es el número de unidades en el agregado.

El valor numérico de la mediana se determina a partir de las frecuencias acumuladas en una serie de variación discreta. Para ello, primero se debe indicar el intervalo donde se encuentra la mediana en la serie de intervalos de la distribución. La mediana es el primer intervalo donde la suma de frecuencias acumuladas excede la mitad de las observaciones del número total de todas las observaciones.

Valor numérico de la mediana.

donde xMe es el límite inferior del intervalo mediano; i - valor del intervalo; S-1 es la frecuencia acumulada del intervalo que precede a la mediana; f es la frecuencia del intervalo mediano.

Moda (lunes) Llaman al valor de una característica que ocurre con mayor frecuencia en unidades de la población. Para una serie discreta, el modo será la opción con mayor frecuencia. para determinar la moda serie de intervalos Primero, se determina el intervalo modal (el intervalo que tiene la frecuencia más alta). Luego, dentro de este intervalo, se encuentra el valor de la característica, que puede ser una moda.

Para encontrar un valor de moda específico, debe usar la fórmula

donde xMo es el límite inferior del intervalo modal; iMo es el valor del intervalo modal; fMo - frecuencia del intervalo modal; fMo-1 - frecuencia del intervalo anterior al modal; fMo+1 - frecuencia del intervalo siguiente al modal.

La moda está muy extendida en las actividades de marketing cuando se estudia la demanda de los consumidores, especialmente cuando se determinan las tallas más populares de ropa y calzado, y cuando se regulan las políticas de precios.

El objetivo principal del análisis de series de variación es identificar el patrón de distribución, excluyendo al mismo tiempo la influencia de factores aleatorios para una distribución determinada. Esto se puede lograr aumentando el volumen de la población en estudio y simultáneamente reduciendo el intervalo de la serie. Cuando intentamos representar estos datos gráficamente, obtendremos una línea curva suave, que será un cierto límite para el polígono de frecuencia. Esta línea se llama curva de distribución.

En otras palabras, curva de distribución hay una representación gráfica en forma de una línea continua de cambios de frecuencia en una serie de variación, que está funcionalmente relacionada con el cambio de opción. La curva de distribución refleja el patrón de cambios de frecuencia en ausencia de factores aleatorios. La representación gráfica facilita el análisis de series de distribución.

Se conocen bastantes formas de curvas de distribución a lo largo de las cuales se puede alinear una serie de variaciones, pero en la práctica de la investigación estadística las formas más utilizadas son la distribución normal y la distribución de Poisson.

La distribución normal depende de dos parámetros: la media aritmética y la desviación estándar. Su curva está expresada por la ecuación.

donde y es la ordenada de la curva de distribución normal; - desviaciones estandarizadas; e y π son constantes matemáticas; x - variantes de la serie de variaciones; - su valor medio; - desviación estándar.

Si necesita obtener frecuencias teóricas f" al alinear la serie de variación a lo largo de la curva de distribución normal, entonces puede usar la fórmula

¿Dónde está la suma de todas las frecuencias empíricas de la serie de variación? h - el tamaño del intervalo en grupos; - desviación estándar; - desviación normalizada de las opciones de la media aritmética; todas las demás cantidades se calculan fácilmente utilizando tablas especiales.

Usando esta fórmula obtenemos distribución teórica (de probabilidad), reemplazándolos distribución empírica (real), no deben diferir en carácter entre sí.

Sin embargo, en varios casos, si la serie de variación es una distribución según una característica discreta, donde a medida que aumentan los valores de la característica x, las frecuencias comienzan a disminuir bruscamente y la media aritmética, a su vez, es igual igual o cercano en valor a la dispersión (), dicha serie está alineada por la curva de Poisson.

curva de Poisson puede expresarse mediante la relación

donde Px es la probabilidad de que ocurran valores individuales de x; - media aritmética de la serie.

Al igualar los datos empíricos, las frecuencias teóricas se pueden determinar mediante la fórmula

donde f" son frecuencias teóricas; N es el número total de unidades de la serie.

Comparando los valores obtenidos de las frecuencias teóricas f" con las frecuencias empíricas (reales) f, estamos convencidos de que sus diferencias pueden ser muy pequeñas.

Una característica objetiva de la correspondencia entre frecuencias teóricas y empíricas se puede obtener utilizando indicadores estadísticos especiales, que se denominan criterios de concordancia.

Para evaluar la proximidad de las frecuencias empíricas y teóricas se utilizan la prueba de bondad de ajuste de Pearson, la prueba de bondad de ajuste de Romanovsky y la prueba de bondad de ajuste de Kolmogorov.

El más común es Prueba de bondad de ajuste de K. Pearson, que se puede representar como la suma de las relaciones de las diferencias al cuadrado entre f" yf con respecto a las frecuencias teóricas:

El valor calculado del criterio debe compararse con el valor tabulado (crítico). Valor de la tabla determinado por una tabla especial, depende de la probabilidad aceptada P y del número de grados de libertad k (en este caso k = m - 3, donde m es el número de grupos en la serie de distribución para la distribución normal). Al calcular la prueba de bondad de ajuste de Pearson se debe tener en cuenta lo siguiente: siguiente condición: el número de observaciones debe ser lo suficientemente grande (n 50), y si en algunos intervalos las frecuencias teóricas< 5, то интервалы объединяют для условия > 5.

Si , entonces las discrepancias entre las distribuciones de frecuencia empírica y teórica pueden ser aleatorias y no se puede rechazar el supuesto de que la distribución empírica es cercana a la normal.

En el caso de que no existan tablas para evaluar la aleatoriedad de la discrepancia entre frecuencias teóricas y empíricas, se pueden utilizar criterio de acuerdo V.I. Romanovsky KR, quien, utilizando el valor, propuso evaluar la proximidad de la distribución empírica de la curva de distribución normal utilizando la relación

donde m es el número de grupos; k = (m - 3) - el número de grados de libertad al calcular las frecuencias de una distribución normal.

Si la relación anterior< 3, то расхождения эмпирических и теоретических частот можно считать случайными, а эмпирическое распределение - соответствующим нормальному. Если отношение >3, entonces las discrepancias pueden ser bastante significativas y la hipótesis sobre distribución normal debe ser rechazado.

Criterio de acuerdo A.N. Kolmogórov utilizado para determinar la discrepancia máxima entre las frecuencias de las distribuciones empíricas y teóricas, calculada mediante la fórmula

donde D es el valor máximo de la diferencia entre las frecuencias empíricas y teóricas acumuladas; - suma de frecuencias empíricas.

Usando las tablas de valores de probabilidad, el criterio se puede utilizar para encontrar el valor correspondiente a la probabilidad P. Si el valor de probabilidad P es significativo en relación con el valor encontrado, entonces podemos suponer que las discrepancias entre las distribuciones teórica y empírica son insignificante.

Una condición necesaria al utilizar la prueba de bondad de ajuste de Kolmogorov es un número suficientemente grande de observaciones (al menos cien).

producción de papa clasificada estadísticamente

Con base en los indicadores del Cuadro 2, compilamos filas clasificadas para la producción de papa por cada 100 hectáreas de tierra cultivable; por rendimiento de patatas; al costo. Representamos gráficamente la relación entre estos indicadores.

la primera etapa estudio estadístico Las variaciones son la construcción de una serie de variaciones: una distribución ordenada de unidades de población según valores crecientes (más a menudo) o decrecientes (menos frecuentes) de una característica.

Hay tres formas de series de variación: series clasificadas, series discretas y series de intervalos. Una serie de variación a menudo se denomina serie de distribución.

Una serie clasificada es una lista de unidades individuales de una población en orden ascendente (descendente) de la característica que se está estudiando.

La clasificación es un procedimiento para ordenar objetos de estudio, que se realiza sobre la base de preferencias. El rango de variación muestra qué tan grande es la diferencia entre unidades de la población.

El rango es un número de serie de valores de atributos, ordenados en orden ascendente o descendente de sus valores. Si el valor de una característica tiene la misma valoración cuantitativa, entonces el rango de todos estos valores se considera igual a la media aritmética de los números correspondientes de lugares que se determinan. Estos rangos se llaman conectados.

Los gráficos en estadística son una forma de mostrar visualmente indicadores estadísticos en forma formas geométricas y señales, dibujos o mapas esquemáticos. Una imagen visual facilita la percepción de la información, le permite capturar un conjunto de indicadores en interrelación, identificar tendencias de desarrollo y proporciones típicas de indicadores.

Para mostrar indicadores dinámicos, es recomendable utilizar gráficos de líneas o gráficos de barras. El horario debe ser visual, comprensible, fácil de leer y, si es posible, diseñado artísticamente, que llame la atención.

Al construir diagramas de dispersión, se utiliza un conjunto de puntos como muestras gráficas; al construir lineales: líneas. Trazar gráficos es siempre un proceso creativo. Aquí se requiere algo de búsqueda. Solo después de compilar y comparar varios borradores se puede determinar la composición correcta del gráfico, establecer la escala y la ubicación de los signos en el campo del gráfico.

De la serie clasificada de producción de papa por cada 100 hectáreas de tierra cultivable, podemos sacar la siguiente conclusión: la producción más baja se observa en el distrito de Balagansky, y el distrito de Angarsky tiene la mayor productividad de papa por cada 100 hectáreas de tierra cultivable.

El rendimiento más bajo se obtuvo en el distrito de Kachugsky: 10 c/ha, y el más alto en Usolsky: 195,5 c/ha.

En la región de Chunsky, con una alta producción de patatas por cada 100 hectáreas de tierra cultivable, correspondía el coste más bajo de 1 c. El costo máximo se observa en la región de Nizhne-Ilimsky. El rango de variación del precio de coste de un quintal de patatas es muy amplio y equivale a 1.161,01 rublos.

Otras publicaciones

Análisis de la actividad económica de la empresa.
La transición a una economía de mercado requiere que la empresa aumente la eficiencia de la producción, la competitividad de los productos y servicios en función de la implementación. formas efectivas gestión y gestión de la producción, logros del progreso científico y tecnológico, activación de...

Análisis de las actividades económicas y financieras de JSC TransContainer.
El análisis financiero es un proceso basado en el estudio de datos sobre condición financiera empresa y su desempeño pasado con el fin de evaluar las condiciones y el desempeño futuros. Por tanto, la principal tarea del análisis financiero es...

Enviar su buen trabajo a la base de conocimientos es fácil. Utilice el siguiente formulario

buen trabajo al sitio">

Los estudiantes, estudiantes de posgrado y jóvenes científicos que utilicen la base de conocimientos en sus estudios y trabajos le estarán muy agradecidos.

Publicado en http:// www. todo lo mejor. ru/

Tarea número 1

Basado en datos observación estadística Como se muestra en la tabla, construya series clasificadas, de intervalo y acumuladas de distribución de empresas agrícolas según las características de los factores, y represente gráficamente.

Realizar un resumen de datos. Utilizando el método de agrupación, determine la dependencia de la característica efectiva en las empresas agrícolas del factor uno. Construir tablas y gráficas de dependencia. Conclusión.

factor de distribución de series de agrupación

Calidad del suelo, puntos (x)

(y)

Solución:

Construcciónclasificadofila La distribución asume la disposición de todas las variantes de la serie en orden creciente de la característica en estudio (calidad del suelo). La clasificación se realizó en el programa TP Excel mediante la función “Clasificación”.

Calidad del suelo

Productividad de hortalizas de campo abierto.

Representación gráfica de las series de distribución clasificadas.

La línea de la figura 1 se llama ojiva de Galton. Esta ojiva tiende a crecer suavemente con pequeños saltos en algunos puntos. Para convertir una serie clasificada en una serie de intervalos, es mejor dividirla en grupos manualmente.

Construcciónintervalofila La distribución de empresas según las características estudiadas implica determinar el número de grupos (intervalos).

Para calcular el número de grupos utilizamos la fórmula:

n=2, donde N es el número total de unidades de la población en estudio.

n=2 Ig30 = 2,95424251?3.

El valor del intervalo igual se calcula mediante la fórmula:

yo = = = 16.33333

Acumulativofila- esta es una serie en la que se calculan las frecuencias acumuladas. Muestra cuántas unidades de población tienen un valor característico no mayor que este valor y se calcula sumando secuencialmente las frecuencias de los intervalos posteriores a la frecuencia del primer intervalo.

Series de intervalo y acumuladas

frecuencia- número de empresas del grupo;

Específico peso empresas V grupo- encontrado por la fórmula:

(númeroempresasVgrupo*100%)/metro, donde m es el número de datos experimentales;

Acumulado frecuencia- encontrado por la fórmula: númeroempresasVanteriorgrupo+frecuenciadadogrupos.

Histograma de frecuencia

Acumulados de distribución de la calidad del suelo.

Indicadores resumidos

Número de grupo

Número de empresas del grupo

Productividad de hortalizas de campo abierto (total por grupo)

Calidad del suelo (total por grupo)

II 61.33333-77.33333

III 77.33333-94.1

Características promedio del grupo

Grupo No.

Productividad de hortalizas de campo abierto.

Calidad del suelo

II 61.33333-77.33333

III 77.33333-94.1

De término medio

donde, la columna “rendimiento vegetal” se encuentra según la fórmula: Ud.Ud.i(v.grupo) / númeroempresasVgrupo;

la columna "Calidad del suelo" se encuentra mediante la fórmula: Ud.incógnitai(v.grupo)/númeroempresasVgrupo.

Dependencia del rendimiento de hortalizas de campo abierto de la calidad del suelo.

En el ejemplo considerado, podemos concluir: a medida que aumenta la calidad del suelo, aumenta el rendimiento de hortalizas de campo abierto, por lo que podemos suponer que existe una conexión directa entre los parámetros considerados.

Publicado en Allbest.ru

Documentos similares

    Agrupación analítica por base factorial. Construcción de series de frecuencia variacional y distribución acumulativa basadas en agrupaciones estructurales de intervalos iguales del atributo efectivo: dividendos acumulados en función de los resultados de desempeño.

    prueba, añadido el 07/05/2009

    Principales indicadores de la población y su distribución en la región de Kaluga. Construcción de series de distribución clasificadas y de intervalo basadas en una característica de factor de agrupación. Análisis de grupos típicos en base a indicadores promedio poblacional.

    trabajo del curso, añadido el 11/10/2010

    Construcción mediante la fórmula de Sturgess. Construcción de series de distribución con intervalos arbitrarios. Construcción de series de distribución utilizando la desviación estándar. Clasificación de series de distribución. Cálculo de las principales características de variación.

    trabajo del curso, añadido el 22/11/2013

    Análisis, cálculo y construcción de inicial. serie de tiempo característica-función y característica-factor. Cálculo de indicadores de variación de series temporales. Medición cuantitativa de la cercanía de la relación entre una función rasgo y factores rasgo utilizando el método de correlación de pares.

    trabajo del curso, añadido el 24/09/2014

    Evaluación de una población por su homogeneidad. Construcción de series de distribución clasificadas y por intervalos. Análisis de series de tiempo mediante los métodos de ampliación de intervalos y medias móviles, alineación analítica mediante la ecuación de una recta y una parábola.

    trabajo del curso, añadido el 10/09/2014

    Cálculo del puntaje académico promedio con base en los resultados de la sesión, determinación del indicador de variaciones en el nivel de conocimientos y estructura del número de estudiantes por desempeño académico. Construcción de una serie de intervalos de distribución de empresas. Estimación de coeficientes de correlación.

    prueba, agregada el 21/08/2009

    Concepto y tipos agrupación estadística, realizado con el objetivo de establecer relaciones y patrones estadísticos, identificando la estructura de la población en estudio. Construcción de una serie interválica de distribución de empresas a partir del atributo “área de ventas”.

    tesis, agregada el 14/02/2016

    Principales categorías de estadísticas. La agrupación es la base del procesamiento científico de datos estadísticos. Contenido resumido y agregado estadístico. Construcción de variaciones, clasificadas y serie discreta distribuciones. Agrupación de empresas por número de trabajadores.

    prueba, agregada el 17/03/2015

    Cálculo de valores absolutos, relativos, promedio, coeficientes de regresión y elasticidad, indicadores de variación, dispersión, construcción y análisis de series de distribución. Características del alineamiento analítico de cadenas y series de dinámica básica.

    trabajo del curso, añadido el 20/05/2010

    realizando un experimento investigación estadística fenómenos y procesos socioeconómicos en la región de Smolensk sobre la base de indicadores específicos. Construcción de gráficos estadísticos, series de distribución, series de variación, su generalización y evaluación.

Se presentan en forma de series de distribución y se presentan en forma.

Una serie de distribución es uno de los tipos de agrupaciones.

Rango de distribución- representa una distribución ordenada de unidades de la población que se estudia en grupos de acuerdo con una determinada característica variable.

Dependiendo de la característica subyacente a la formación de la serie de distribución, se distinguen atributivo y variacional filas de distribución:

  • Atributivo- se denominan series de distribución construidas según características cualitativas.
  • Las series de distribución construidas en orden ascendente o descendente de valores de una característica cuantitativa se denominan variacional.
La serie de variación de la distribución consta de dos columnas:

La primera columna proporciona valores cuantitativos de la característica variable, que se denominan opciones y son designados. Opción discreta: expresada como un número entero. La opción de intervalo varía desde y hasta. Dependiendo del tipo de opciones, puede construir una serie de variación discreta o de intervalo.
La segunda columna contiene número de opción específica, expresado en términos de frecuencias o frecuencias:

Frecuencias- estos son números absolutos que muestran cuántas veces ocurre en total un valor dado de una característica, que denotan . La suma de todas las frecuencias debe ser igual al número de unidades de toda la población.

Frecuencias() son frecuencias expresadas como porcentaje del total. La suma de todas las frecuencias expresadas como porcentajes debe ser igual al 100% en fracciones de uno.

Representación gráfica de series de distribución.

Las series de distribución se presentan visualmente mediante imágenes gráficas.

Las series de distribución se representan como:
  • Polígono
  • Histogramas
  • Acumula
  • ojivas

Polígono

Al construir un polígono en eje horizontal(eje x) se trazan los valores de la característica variable, y en el eje vertical (eje y) se trazan las frecuencias o frecuencias.

El polígono de la Fig. 6.1 se basa en datos del microcenso de población de Rusia de 1994.

6.1. Distribución del tamaño del hogar

Condición: Se proporcionan datos sobre la distribución de 25 empleados de una de las empresas según categorías arancelarias:
4; 2; 4; 6; 5; 6; 4; 1; 3; 1; 2; 5; 2; 6; 3; 1; 2; 3; 4; 5; 4; 6; 2; 3; 4
Tarea: Construya una serie de variación discreta y represente gráficamente como un polígono de distribución.
Solución:
En este ejemplo, las opciones son el grado salarial del empleado. Para determinar las frecuencias es necesario calcular el número de empleados con la categoría arancelaria correspondiente.

El polígono se utiliza para series de variación discreta.

Para construir un polígono de distribución (Fig. 1), trazamos los valores cuantitativos de las características variables (opciones) en el eje de abscisas (X) y las frecuencias o frecuencias en el eje de ordenadas.

Si los valores de una característica se expresan en forma de intervalos, entonces dicha serie se llama intervalo.
Serie de intervalos Las distribuciones se representan gráficamente en forma de histograma, acumulado u ojiva.

tabla estadistica

Condición: Se dan datos sobre el tamaño de los depósitos 20 individuos en un banco (mil rublos) 60; 25; 12; 10; 68; 35; 2; 17; 51; 9; 3; 130; 24; 85; 100; 152; 6; 18; 7; 42.
Tarea: Construya una serie de variación de intervalos con intervalos iguales.
Solución:

  1. La población inicial consta de 20 unidades (N = 20).
  2. Usando la fórmula de Sturgess, determinamos el número requerido de grupos utilizados: n=1+3.322*lg20=5
  3. Calculemos el valor del intervalo igual: i=(152 - 2) /5 = 30 mil rublos
  4. Dividamos la población inicial en 5 grupos con un intervalo de 30 mil rublos.
  5. Presentamos los resultados de la agrupación en la tabla:

Con tal registro de una característica continua, cuando el mismo valor ocurre dos veces (como el límite superior de un intervalo y el límite inferior de otro intervalo), entonces este valor pertenece al grupo donde este valor actúa como el límite superior.

histograma

Para construir un histograma, los valores de los límites de los intervalos se indican en el eje de abscisas y, en base a ellos, se construyen rectángulos, cuya altura es proporcional a las frecuencias (o frecuencias).

En la figura. 6.2. muestra un histograma de la distribución de la población rusa en 1997 por grupo de edad.

Arroz. 6.2. Distribución de la población rusa por grupos de edad.

Condición: Se da la distribución de 30 empleados de la empresa por salario mensual. salarios

Tarea: Muestra gráficamente la serie de variación del intervalo en forma de histograma y acumula.
Solución:

  1. El límite desconocido del (primer) intervalo abierto está determinado por el valor del segundo intervalo: 7000 - 5000 = 2000 rublos. Con el mismo valor encontramos el límite inferior del primer intervalo: 5000 - 2000 = 3000 rublos.
  2. Para construir un histograma en un sistema de coordenadas rectangular, trazamos a lo largo del eje de abscisas los segmentos cuyos valores corresponden a los intervalos de la serie varicosa.
    Estos segmentos sirven como base inferior y la frecuencia correspondiente (frecuencia) sirve como altura de los rectángulos formados.
  3. Construyamos un histograma:

Para construir acumulados, es necesario calcular las frecuencias acumuladas (frecuencias). Se determinan sumando secuencialmente las frecuencias (frecuencias) de intervalos anteriores y se denominan S. Las frecuencias acumuladas muestran cuántas unidades de la población tienen un valor característico no mayor que el considerado.

Acumula

La distribución de una característica en una serie de variación sobre frecuencias acumuladas (frecuencias) se representa mediante un acumulado.

Acumula o una curva acumulativa, a diferencia de un polígono, se construye a partir de frecuencias o frecuencias acumuladas. En este caso, los valores de la característica se colocan en el eje de abscisas y las frecuencias o frecuencias acumuladas en el eje de ordenadas (Fig. 6.3).

Arroz. 6.3. Acumulados de distribución del tamaño de los hogares

4. Calculemos las frecuencias acumuladas:
La frecuencia acumulada del primer intervalo se calcula de la siguiente manera: 0 + 4 = 4, para el segundo: 4 + 12 = 16; para el tercero: 4 + 12 + 8 = 24, etc.

Al construir un acumulado, la frecuencia acumulada (frecuencia) del intervalo correspondiente se asigna a su límite superior:

Ogiva

Ogiva se construye de manera similar a un acumulado con la única diferencia de que las frecuencias acumuladas se colocan en el eje de abscisas y los valores característicos se colocan en el eje de ordenadas.

Un tipo de acumulación es una curva de concentración o diagrama de Lorentz. Para construir una curva de concentración, se traza una escala en porcentajes de 0 a 100 en ambos ejes del sistema de coordenadas rectangulares. Al mismo tiempo, en el eje de abscisas se indican las frecuencias acumuladas y los valores acumulados de la participación. (en porcentaje) en volumen de la característica se indican en el eje de ordenadas.

La distribución uniforme de la característica corresponde a la diagonal del cuadrado en el gráfico (Fig. 6.4). Con una distribución desigual, el gráfico representa una curva cóncava dependiendo del nivel de concentración del rasgo.

6.4. Curva de concentración

El concepto de resumen, agrupación, clasificación.

Resumen– sistematización y resumen: informes meteorológicos, informes de campo. El resumen no permite analizar la información en detalle. Cualquier resumen debe basarse en la agrupación de datos, es decir. primero agrupando y luego resumiendo los datos.

Agrupamiento– división de poblaciones en varios grupos según las características más significativas.

Hay agrupaciones cualitativas y cuantitativas. Alta calidad– atributivo, cuantitativo– variacional. A su vez, la variación se divide en estructural y analítica. . Estructural La agrupación implica calcular la gravedad específica de cada grupo. Ejemplo: en una empresa, el 80% son trabajadores, el 20% son oficinistas, de los cuales el 5% son gerentes, el 3% son oficinistas, el 12% son especialistas. Objetivo analítico agrupaciones: para identificar la relación entre características: duración del servicio e ingresos medios, duración del servicio y producción, etc.

Al realizar la agrupación es necesario:

Realizar un análisis integral de la naturaleza del fenómeno en estudio;

Identificación de una característica de agrupación (una o varias);

Establezca los límites de los grupos de tal manera que los grupos sean significativamente diferentes entre sí y se combinen elementos homogéneos en cada grupo.

Según el grado de complejidad, las agrupaciones pueden ser simples y combinacionales (según características).

A partir de la información inicial se distinguen grupos primarios y secundarios, primario realizado sobre la base de los datos de observación iniciales, secundario utiliza datos del grupo primario.

El número de grupos está determinado. según la fórmula de Sturgess:

Dónde norte- número de grupos, norte– población general.

Si se usa intervalos iguales, Eso valor del intervalo igual a .

Intervalos pueden ser iguales o desiguales. Estos últimos, a su vez, se dividen en aquellos que cambian según la ley de la aritmética o progresión geométrica. El primer y último intervalo pueden ser abiertos o cerrados. Los intervalos cerrados incluyen o no límites de intervalo.

Si los intervalos son cerrados y no se dice nada acerca de incluir límites superiores, entonces suponemos que límites superiores incluido.

Si los intervalos están abiertos, entonces nos centramos en el último intervalo.

La característica en estos intervalos se puede medir de forma discreta y continua (es decir, dividida). Con un signo continuo, los límites se cierran 1-10, 10-20, 20-30; si la característica cambia discretamente, entonces se puede utilizar la siguiente notación: 1 – 10, 11 – 20, 21 – 30.

Si los intervalos son abiertos, entonces el valor del último intervalo es igual al anterior y el valor del primero es igual al segundo.

Clasificación– agrupación según criterios cualitativos. Es relativamente estable, estandarizado y aprobado por los organismos estatales de estadística.


3.2. Series de distribución: tipos y características principales.

Bajo cerca de distribución Se refiere a una serie de datos que caracterizan un fenómeno socioeconómico según un criterio. Este forma más simple Agrupaciones basadas en dos características.

Las series de distribución se dividen en cualitativas y cuantitativas, clasificadas y no clasificadas, agrupadas y no agrupadas, con distribución discreta y continua de la característica.

Un ejemplo de serie salarial no agrupada ni clasificada es una nómina. Al mismo tiempo, la lista de empleados se puede clasificar alfabéticamente o por número de personal. Un ejemplo de serie clasificada es una lista de equipos, una clasificación de tenistas.

Serie clasificada distribución: una serie de datos dispuestos en orden descendente o ascendente de una característica.

Para series clasificadas agrupadas se distinguen las siguientes características: variante, frecuencia o frecuencia, acumulación y densidad de distribución.

Opción()– valor medio del intervalo de la característica. Porque Al crear una agrupación, se debe seguir el principio. distribución uniforme característica en cada intervalo, entonces la variante se puede calcular como la mitad de la suma de los límites de los intervalos.

Frecuencia() muestra cuántas veces ocurre un valor de atributo determinado. La expresión relativa de la frecuencia es frecuencia(.) , es decir. compartir, peso específico de la suma de frecuencias.

Acumula() – frecuencia o periodicidad acumulada, cálculo en régimen de devengo. El volumen, los costos y los ingresos se calculan de forma acumulativa, es decir. resultados de desempeño.

Tabla 1

Agrupación de corriente instituciones de crédito
por tamaño de matriculados capital autorizado

en 2008 en la Federación de Rusia



Nuevo en el sitio

>

Más Popular