Изчисляване на отклонение в Excel: Ръководство с примери
Дисперсията е статистическа мярка, която ни казва колко е разпръснат набор от числа. Това е ключова концепция във финансите, науката и много други области, която ни помага да разберем променливостта или дисперсията в нашите набори от данни. Excel предоставя лесен начин за изчисляване на дисперсията, което го прави достъпен както за начинаещи, така и за напреднали потребители. В тази статия ще проучим как да направите това с ясни примери.
Какво е дисперсия?
Въведение в дисперсионните функции на Excel
Как да изчислим дисперсията в Excel?
- VAR.S срещу VAR.P – Изчислете дисперсията от извадка или популация
- VAR.S срещу VARA – Изчислете дисперсията, включително или изключвайки текстове и логически текстове
Дисперсия срещу стандартно отклонение
Какво е дисперсия?
Дисперсията е статистически термин, който описва степента, в която числата в набор от данни се различават от средната или средната стойност на числата. По същество той измерва колко разпръснати са числата. Ключов момент в разбирането на вариацията е признаването, че тя определя количествено степента на вариация или дисперсия в рамките на набор от стойности. Високата дисперсия показва, че числата са разпръснати; ниска дисперсия предполага, че те са групирани тясно около средната стойност.
Прост пример за илюстриране на дисперсията:
Сценарий: Помислете за клас с пет ученика и техните резултати на тест по математика от 100. Резултатите са 90, 92, 88, 91 и 89.
Изчислете средната стойност: Първо намираме средния (среден) резултат. Средното е
Изчислете дисперсията: След това изчисляваме дисперсията. Това включва изваждане на средната стойност от всеки резултат, повдигане на квадрат на резултата и след това усредняване на тези квадратни разлики.
= [0 + 4 + 4 + 1 + 1] / 5
= 10/5
= 2
Диаграма показва разпространението на резултата:
Разбиране на резултата:
Ниска вариация: В този пример дисперсията е 2. Това е относително ниско, което показва, че повечето резултати са близки до средната (90). Колкото по-ниска е дисперсията, толкова по-близо до средната стойност са отделните числа в набора.
Нулева вариация: Ако всички ученици са получили точно 90, дисперсията ще бъде 0, което означава, че изобщо няма променливост. Всеки резултат ще бъде еднакъв.
Висока вариация: Обратно, по-висока дисперсия би означавала, че резултатите са по-разпръснати от средната стойност, което показва по-голяма променливост в представянето на учениците.
В обобщение, дисперсията ни дава числена стойност, която помага да определим количествено доколко резултатите (или който и да е набор от числа) се отклоняват от средната стойност, предоставяйки представа за последователността или променливостта на данните.
Въведение в дисперсионните функции на Excel
Excel предоставя няколко функции за изчисляване на дисперсията, всяка от които е предназначена за различни сценарии с данни.
Разбирането на тези функции е от решаващо значение за точния статистически анализ
ВАР.С (Примерно отклонение, включващо само числа):
- Изчислява дисперсията въз основа на извадка от популация.
- Използва се най-добре, когато се анализира подмножество от данни, за да се направи заключение за цялото.
ВАР.П (Отклонение на населението, включително само числа):
- Изчислява дисперсията за цялата съвкупност.
- Идеален, когато имате пълни данни, а не само извадка.
ВАРА (Примерно отклонение, включително текст и логика):
- Подобно на VAR.S, но включва текст и логически стойности в изчислението (текстът се третира като 0, TRUE като 1, FALSE като 0).
- Полезно, когато вашият набор от данни съдържа смесени типове (числа, текст и логически стойности).
ВАРПА (Разлика в популацията, включително текст и логика):
- Вариантът на дисперсията на популацията на VARA.
- Включва всички видове данни в изчислението на дисперсията за цялата съвкупност.
VAR (Отклонение от наследена извадка):
- По-стара версия на VAR.S, използвана предимно в Excel 2007 и по-стари.
- Препоръчително е да използвате VAR.S в по-новите версии за последователност и яснота.
VARP (Наследена вариация на населението):
- По-старата версия на VAR.P.
- Подобно на VAR, препоръчително е да използвате VAR.P в по-новите версии на Excel.
Разлики и сравнения:
- Извадка срещу популация: VAR.S и VARA са за проби, докато VAR.P и VARPA са за цялата популация.
- Разглеждане на типа данни: VARA и VARPA включват текст и логически стойности в изчислението, за разлика от VAR.S и VAR.P.
- Наследени срещу съвременни функции: VAR и VARP са по-стари функции и могат да бъдат заменени от VAR.S и VAR.P за по-добра съвместимост с текущите версии на Excel.
Таблица за сравнение:
функция | Разгледан тип данни | Популация или извадка | Използвайте делото |
ВАР.С | Само числа | Проба | Примерна дисперсия за числени данни |
ВАР.П | Само числа | Население | Дисперсия на населението за числа |
ВАРА | Числа, текст, логика | Проба | Дисперсия на извадката за смесени данни |
ВАРПА | Числа, текст, логика | Население | Дисперсия на популацията за смесени данни |
VAR | Само числа | Проба | Наследена функция за дисперсия на извадката |
VARP | Само числа | Население | Наследена функция за популярни |
Как да изчислим дисперсията в Excel?
В този раздел ще предоставим два примера, за да демонстрираме как се изчислява дисперсия в Excel и ще обясним разликите между различните функции на дисперсията. В резултат на това ще видите, че различните функции на дисперсията дават напълно различни резултати за едни и същи примерни данни.
VAR.S срещу VAR.P – Изчислете дисперсията от извадка или популация
Сценарий: Изчисляване на дисперсия за малка извадка от популация спрямо цялата популация.
Пример: Изчислете дисперсията за стойностите в колона A2:A12.
Формула: Изберете празна клетка и въведете една от формулите по-долу, както ви трябва, след което натиснете Enter ключ.
-
Получаване на вариациите за извадка от голям набор от данни (да приемем, че стойностите в A2:A12 са части от голям набор от данни)
=VAR.S(A2:A12)
-
Получаване на дисперсията за цялата съвкупност (да приемем, че стойностите в A2:A12 са целия набор от данни)
=VAR.P(A2:A12)
Както виждате, едни и същи стойности, но използват различни функции за дисперсия, ще получат различни резултати.
Защо резултатите от VAR.S и VAR.P са различни?
- ВАР.С: Тази функция се използва, когато вашият набор от данни представлява извадка от по-голяма популация. Той изчислява дисперсията въз основа на метода "n-1", където "n" е броят точки от данни в извадката. Използването на "n-1" вместо "n" като знаменател коригира отклонението в извадката, което я прави безпристрастен оценител на дисперсията на популацията. Той предоставя оценка за това как данните в извадката варират около средната стойност на извадката.
- ВАР.П: Тази функция се използва, когато вашият набор от данни представлява цяла популация, а не само извадка от нея. Той изчислява дисперсията въз основа на метода "n", където "n" е броят точки от данни в популацията. Предполага се, че наборът от данни обхваща цялата съвкупност, така че няма нужда да се коригира за отклонение, както във VAR.S.
- В обобщение, ключовата разлика е в знаменателя на формулата. VAR.S използва "n-1", за да отчете естеството на извадката на данните, докато VAR.P използва "n" за данни за популацията, където не е включена извадка. В зависимост от вашия набор от данни и дали е извадка или пълна популация, трябва да изберете подходящата функция за изчисляване на дисперсията.
VAR.S срещу VAR.P – Изчислете дисперсията от извадка или популация
Сценарий: Вземане на решение дали да се включат логически стойности и текстове в изчислението на дисперсията.
Пример: Изчислете дисперсията за стойностите в колона A2:A12.
Формула: Изберете празна клетка и въведете една от формулите по-долу, както ви трябва, след което натиснете Enter ключ.
-
Получаване на вариациите за извадка от голям набор от данни, като се игнорират текстове и логически стойности.
=VAR.S(A2:A12)
-
Получаване на дисперсията за извадка от голям набор от данни, включително текстове и логически стойности.
=VARA(A2:A12)
Направете изчисляването на дата и час летящо
Kutools за Excel's Помощник за дата и час е невероятно ефективен инструмент, предназначен да опрости сложни изчисления на дата и час. Опитайте го и вижте как трансформира вашето изживяване при управление на данни!
Дисперсия срещу стандартно отклонение
прилики:
-
Мярка за разпространение:
Както дисперсията, така и стандартното отклонение са статистически мерки, използвани за описание на разпространението или дисперсията в рамките на набор от данни. Те определят количествено доколко отделните числа в набора се отклоняват от средната (средната).
-
Анализ на данни:
И двете се използват често в статистическия анализ за разбиране на променливостта на данните. Те са от съществено значение в области като финанси, изследвания, контрол на качеството и др.
-
Изчислено от средната стойност:
Изчисляването както на дисперсията, така и на стандартното отклонение започва със средната стойност на набора от данни. Те оценяват променливостта по отношение на тази централна стойност.
разлики:
-
Мерни единици:
-
Дисперсия: Единици на квадрат от оригиналните данни. Например, ако данните са в метри, дисперсията ще бъде в квадратни метри.
-
Стандартно отклонение: Същите единици като оригиналните данни. Продължавайки примера, ако данните са в метри, стандартното отклонение също ще бъде в метри.
-
-
Тълкуване:
-
Дисперсия: Предоставя прогноза на квадрат, която може да бъде по-малко интуитивна за тълкуване, тъй като не е в същия мащаб като оригиналните данни.
-
Стандартно отклонение: По-разбираемо, тъй като е в същите единици като данните. Той показва средното разстояние на точките от данни от средната стойност.
-
-
Математическо определение:
-
Дисперсия: Средната стойност на разликите на квадрат от средната стойност.
-
Стандартно отклонение: корен квадратен от дисперсията.
-
-
Чувствителност към екстремни стойности:
-
Вариантност: По-чувствителен към отклонения, защото повдига на квадрат разликите.
-
Стандартно отклонение: Въпреки че е засегнато от отклонения, то е по-малко чувствително в сравнение с дисперсията поради квадратния корен.
-
-
Приложения:
-
отклонение:
Използва се, когато фокусът е върху квадрата на големината на дисперсията.
Полезен при статистически модели и изчисления, където е необходимо повдигане на квадрат за нулиране на отрицателните стойности.
Често се използва във финансовите модели за оценка на риска, тъй като измерва волатилността.
-
Стандартно отклонение:
По-често се използва в отчети и ежедневни приложения поради пряката си връзка с мащаба на данните.
От съществено значение в емпиричните изследвания за разбиране на променливостта.
Често се използва при контрол на качеството, прогнози за времето и стандартни резултати в тестове.
-
Заключение:
Докато дисперсията и стандартното отклонение служат за измерване на разпространението на набор от данни, техните приложения се различават поради тяхната единица за измерване и интерпретируемост. Стандартното отклонение, с пряката си връзка с мащаба на данните, има тенденция да бъде по-удобно за потребителя, особено в практически, ежедневни контексти. Дисперсията, от друга страна, често е по-подходяща за математически и статистически модели.
Този преглед и сравнение трябва да осигурят ясно разбиране кога и защо да се използва всяка функция за отклонение в Excel, позволявайки по-точен и смислен анализ на данните. За повече променящи играта стратегии на Excel, които могат да подобрят управлението на вашите данни, проучете повече тук..
Най-добрите инструменти за производителност в офиса
Kutools за Excel - помага ви да се откроите от тълпата
Kutools за Excel разполага с над 300 функции, Гарантираме, че това, от което се нуждаете, е само на един клик разстояние...
Раздел Office - Активиране на четене и редактиране с раздели в Microsoft Office (включително Excel)
- Една секунда за превключване между десетки отворени документи!
- Намалете стотиците кликвания на мишката за вас всеки ден, кажете сбогом на ръката на мишката.
- Увеличава продуктивността ви с 50% при преглеждане и редактиране на множество документи.
- Внася ефективни раздели в Office (включително Excel), точно като Chrome, Edge и Firefox.
Съдържание
- Какво е дисперсия?
- Въведение в дисперсионните функции на Excel
- Как да изчислим дисперсията в Excel?
- VAR.S срещу VAR.P – Изчислете дисперсията от извадка или популация
- VAR.S срещу VARA – Изчислете дисперсията, включително или изключвайки текстове и логически текстове
- Дисперсия срещу стандартно отклонение
- Свързани статии
- Най-добрите инструменти за продуктивност в офиса
- Коментари