Разница между выборочной дисперсией и популяционной дисперсией

объяснение

В статистике термин «выборка» относится к отбору части совокупных статистических данных с целью получения соответствующей информации о целом. Совокупность или вся статистическая информация о конкретном характере всех участников, охваченных расследованием, называется «популяция» или «вселенная». (Das, N.G., 2010). Выбранная часть популяции, которая используется для получения характеристик популяции или вселенной, называется «выборкой». Население считается состоящим из отдельных единиц или членов, и некоторые единицы включены в выборку. Общее количество единиц населения называется размером популяции, а количество выборки называется размером выборки. Население и выборка могут быть конечными или бесконечными, и аналогично они могут существовать или гипотетически.

Разница: Дисперсия - это числовое значение, которое показывает, насколько широко отдельные цифры в наборе данных распределяются по среднему значению. Вот как далеко каждое число от среднего и, следовательно, друг от друга. Дисперсия нулевого значения означает, что все данные идентичны. Чем больше дисперсия, тем больше значения, разбросанные по среднему, следовательно, друг от друга. Чем меньше дисперсия, тем меньше значения, разбросанные по среднему, следовательно, друг от друга, и дисперсия не может быть отрицательной.

Разница между популяционной дисперсией и выборочной дисперсией

Основное различие между популяционной дисперсией и выборочной дисперсией относится к расчету дисперсии. Дисперсия рассчитывается в пять шагов. Сначала вычисляется среднее значение, затем мы вычисляем отклонения от среднего значения, и в-третьих, отклонения возводятся в квадрат, в-четвертых возводятся в квадрат отклонения, и, наконец, эта сумма делится на число элементов, для которых вычисляется дисперсия. Таким образом, дисперсия = Σ (xi-x -) / n. Где xi = ит. Число, х- = среднее и п = количество предметов ...

Теперь, когда дисперсия рассчитывается на основе данных о населении, n равно количеству элементов. Таким образом, если дисперсия артериального давления всех 1000 человек должна быть рассчитана на основе данных о артериальном давлении всех 1000 человек, то n = 1000. Однако, когда дисперсия рассчитывается на основе данных выборки 1, ее следует вычесть из n до деления сумма квадратов отклонений. Таким образом, в приведенном выше примере, если выборочные данные имеют 100 элементов, знаменатель будет 100 - 1 = 99.

Вследствие этого значение дисперсии, рассчитанное по выборочным данным, выше, чем значение, которое можно было бы определить с помощью данных о населении. Логика этого заключается в том, чтобы компенсировать недостаток информации о населении. Невозможно обнаружить разницу высот в людях, потому что у нас абсолютная нехватка информации о высотах всех живых людей, не говоря уже о будущем. Даже если мы возьмем один умеренный пример, такой как данные о населении по высоте всех живых людей в США, это физически возможно, но затраты и время, затрачиваемые на это, нанесут ущерб цели его расчета. Это является причиной того, что выборочные данные взяты для большинства статистических целей, и это сопровождается отсутствием информации о большинстве данных. Чтобы компенсировать это, значение дисперсии и стандартное отклонение, которое является квадратным корнем дисперсии, выше в случае выборочных данных, чем отклонение от данных о населении..

Это действует как автоматический щит для аналитиков и лиц, принимающих решения. Эта логика применяется для принятия решений о капитальном бюджете, личных и коммерческих финансах, строительстве, управлении дорожным движением и во многих применимых областях. Это помогает заинтересованному лицу быть в безопасности при принятии решения или для других выводов.

Резюме: Дисперсионная дисперсия относится к значению дисперсии, которое рассчитывается по данным популяции, а выборочная дисперсия представляет собой дисперсию, рассчитанную по выборочным данным. В связи с этим значение знаменателя в формуле для дисперсии в случае выборочных данных равно «n-1», а для данных популяции - «n». В результате как дисперсия, так и стандартное отклонение, полученные из выборочных данных, больше, чем те, которые получены из популяционных данных..