Во-первых, заметно, постепенная смена знака взаимосвязи для алкоголя и продуктов, а также – алкоголя и расходов на питание вне дома. Хотя связи достаточно слабые, напрашивается интерпретация, что для малоресурсных домохозяйств приобретение алкогольных напитков, отчасти, конкурирует с приобретением основных продуктов питания, а также – питанием в столовых и кафе, а для более состоятельных граждан больший процент затрат на питание оборачивается и большим процентом затрат на приобретение алкоголя. При этом заметно усиливается отрицательная корреляция статей алкоголя и непродовольственных расходов с ростом номера децильной группы, что, вероятно, объясняется тем, что для более состоятельных децилей непродовольственные товары могут быть достаточно дороги, на фоне которых затраты на алкоголь сильно «мельчают». И наоборот, в случае отсутствия крупных покупок (ТДП, акций, недвижимости) стабильно высокие затраты на качественный алкоголь также поддерживают отрицательную корреляцию с непродовольственными расходами.
Проведём теперь кластерный анализ с целью выявить возможные типологии домохозяйств по структуре потребления. Нас особенно интересует участие в данной типологии расходов на приобретение алкогольной продукции. Однако, из табл. 4 видно, что долевые показатели вкладов статей расходов в общую сумму потребительских издержек имеют не только существенно различные средние значения (что естественно объясняется разной важностью указанных статей для ежедневного функционирования домохозяйства), но и значительно различные между собой стандартные отклонения. Попытка кластеризации в исходных показателях, таким образом, не позволит должным образом учесть дифференциацию потребления алкогольных напитков в домохозяйствах. Поэтому перед кластерным анализом была выполнена стандартизация переменных и кластерный анализ далее выполнялся в пространстве стандартизированных показателей.
Таблица 4.
Описательная статистика потребительских расходов домохозяйств в долях от общей суммы потребительских расходов |
N |
Минимум |
Максимум |
Среднее |
Станд. отклонение |
Расходы на покупку продуктов питания |
53159 |
.00 |
1.00 |
.4965 |
.18269 |
Расходы на питание вне дома |
53159 |
.00 |
.92 |
.0140 |
.04080 |
Расходы на покупку алкогольных напитков |
53159 |
.00 |
.75 |
.0198 |
.03787 |
Расходы на покупку непродовольственных товаров |
53159 |
.00 |
1.00 |
.2718 |
.17375 |
Расходы на оплату услуг |
53159 |
.00 |
1.00 |
.1978 |
.12458 |
Итого |
53159 | | | | |
Отметим, что для нахождения конечного решения по алгоритму k-средних потребовалось провести 71 итерацию: такое большое их количество естественно обусловлено большим количеством наблюдений в файле данных. Центры кластеров в стандартизированных показателя представлены в табл. 5, а в исходных – в табл. 6.
Таблица 5.
|