На основе изучения соотношений расстояний в табл. 7 и 8 можно назвать решение с 4 кластерами приемлемым, так как средние расстояния до центра своего кластера в полученных кластерах не превосходят расстояния между кластерными центрами. Вместе с тем, на основе стандартного отклонения из табл. 8 можно судить, что самый большой (третий) кластер является, в то же время, самым компактным (наименьшее среднее расстояние до центра при наименьшем стандартном отклонении), а наименьший кластер (4-й) является одновременно и самым разнородным. Таким образом, потенциально можно было бы попробовать кластерное решение с большим числом кластеров, однако в данном эссе мы остановимся на четырёхкластерном решении.
Размеры кластеров 1–4 получены, соответственно, следующие: 5106, 18021, 26856, 3176, или, в процентах от общей выборки: 9,6%, 33,9%, 50,5%, 5,9%. Содержательную интерпретацию построим, прежде всего, на основе табл. 6.
Итак, кластерный анализ выделяет большую (половина выборки) группу домохозяйств с типичным для России характером потребительских расходов (кластер №3): около 60% составляют потребительские расходы, расходы на питание вне дома практически отсутствуют, уровень трат на непродовольственные товары достаточно низок, значительна доля платных услуг; на спиртные напитки отводится примерно 1% потребительских расходов (чуть ниже среднероссийского показателя). Сюда устойчиво попадают более половины домохозяйств из первых четырёх децилей по располагаемым ресурсам (табл. 9).
Близок к кластеру №3 как по размерам, так и по расстоянию между кластерными центрами, кластер №2. Эту группу домохозяйств тоже можно назвать типичной, однако модель потребления здесь иная: только треть потребительских расходов идёт на покупку продуктов питания, тогда как немногим меньше половины расходов приходится на непродовольственные товары. Различий в доле затрат на алкогольную продукцию с третьим кластером не наблюдается. Можно предполагать, что подобная модель потребления в большей степени характерна для более состоятельных домохозяйств, что и подтверждается данными табл. 9.
Первый и четвёртый кластеры невелики по объёму (9,6 и 5,9% выборки, соответственно) и отличаются от «основных» групп домохозяйств выраженным преобладанием незначительных в среднем расходных статей бюджетов: алкогольных напитков и питания вне дома. Эти статьи не получили бы сколько-нибудь значимого проявления, если бы исходные данные не были бы стандартизированы. Кластер №4 характеризуется весьма высокими расходами на питание вне дома, тогда как доли расходов на продукты питания и непродовольственные товары опускаются чуть ниже средневыборочного уровня. Кластер №1, вероятно, объединяет активных потребителей алкоголя, доля расходов на который здесь составляет более 10%, что делает её сопоставимой с расходами на непродовольственные товары и услуги в этом же кластере. Доля же расходов на продукты питания также значительна: более половины потребительского бюджета, что приближает эту группу домохозяйств к третьему кластеру.
Если судить по расстояниям между кластерными центрами, наиболее обособленным является четвёртый кластер (удалён от всех прочих, а в особенности от кластера №1).
Рассмотрим распределение по кластерам домохозяйств различной численности, разного числа детей, разной ресурсной обеспеченности (по децильным группам), а также – разной местности проживания (город/село) и проживающих на разных территориях (в разных регионах). Согласно критерию хи-квадрат независимости признаков в таблицах сопряжённости, на уровне значимости p<0,001 можно говорить о наличии зависимости всех исследованных переменных и номера кластера. Таким образом, построенная на основе долей расходов потребительского бюджета 4-кластерная группировка отчасти объясняется учётом перечисленных признаков домохозяйств, определяющих характер потребления.
В распределении децильных групп по кластерам, очевидная связь отмечается для второго и третьего кластеров. Во второй кластер входит значительная часть обеспеченных домохозяйств (начиная с 8 дециля – более половины всех домохозяйств), третий же кластер, преимущественно, объединяет низкодоходные домохозяйства: туда попадают ¾ представителей первого дециля, 2/3 – второго и т.д. Вместе с тем, из-за значительного размера третьего кластера, сюда же относится примерно четверть домохозяйств-представителей верхнего дециля (с наибольшими располагаемыми ресурсами). Вероятность попадания в первый кластер также несколько выше для высокоресурсных домохозяйств. Сюда попадают примерно 10% домохозяйств из 5-го дециля и выше, и примерно 7-8% домохозяйств ниже 5-го дециля. Взаимосвязь доходов и вероятности попадания домохозяйства в кластер №4 практически не прослеживается, за исключением относительно низких процентов попадания в данный кластер для первых 2-3 децилей. Таким образом, второй кластер можно коротко охарактеризовать как «зажиточные домохозяйства», третий – «малоресурсные», первый кластер тяготеет к зажиточным, но все децили представлены в нём более или менее ровно, а четвёртый кластер практически иррелевантен к переменной дохода (дециля располагаемых ресурсов).
|