Электронный учебник справочник по SPSS

       

Статистики по переменной V - "Душевой доход", выданные командой FREQUENCIES



Таблица 3.2. Статистики по переменной V14 - "Душевой доход", выданные командой FREQUENCIES

N

Valid

673

Missing



48

Mean

229.11

Std. Error of Mean

5.83

Median

200

Mode

200

Std. Deviation

151.342

Variance

22904.531

Skewness

3.035

Std. Error of Skewness

0.094

Kurtosis

15.080

Std. Error of Kurtosis

0.188

Range

1479

Minimum

21

Maximum

1500

Sum

154190

Percentiles

10

100

25

140

50

200

75

280

90

400

Чем больше четвертый момент, тем больше пикообразность распределения; нулевое значение KURTOSIS означает, что пикообразность распределения совпадает с пикообразностью нормального распределения. Существенность отклонений статистик от теоретических можно проверить, используя стандартные ошибки этих статистик (в основе лежит факт, что отношение статистики к ее стандартной ошибке имеет распределение, близкое к нормальному).

Перечисленные статистики играют в анализе данных особую роль - они позволяют провести первый этап статистических исследований выборки, проверить нормальность ее распределения. Ниже приведен пример описательных статистик, полученных для переменной "Среднемесячный душевой доход в семье", построенной по ответам на 14-й вопрос анкеты "Курильские острова" командой

FREQUENCIES VARIABLES=V14 /NTILES=4 /PERCENTILES= 10 90

/STATISTICS=STDDEV VARIANCE RANGE MINIMUM MAXIMUM SEMEAN MEAN MEDIAN MODE SUM SKEWNESS SESKEW KURTOSIS SEKURT .

которая вычисляет, также, n-тили и процентили.

Анализируя полученные данные (таблица 3.2), видим, что доход в семьях меняется в диапазоне от 21 рубля до 1500 рублей (разброс равен 1479). При этом средний доход составил около 230 рублей. Приближенными границами пятипроцентного доверительного интервала для истинного среднего будут значения: 229.11± 1.96*5.83, где 1.96 - критическое значение нормального распределения для p=0.05/2=0.025. Скошенность skewness=3.035 Пикообразность kurtosis=15.080 и пикообразность kurtosis=15.080 значительно больше нуля (их стандартные ошибки, 0.094 и 0.188, свидетельствуют о статистической значимости такого отличия).

Результатом задания процентилей и n-тилей являются выданные в таблице процентили (у 10% выборки доход меньше 100 руб., у 90% - меньше 400; имеются также 25%, 50%, 75% процентили).



Содержание раздела