Инфляция – показатель средневзвешенного роста цен на товары потребительской корзины, является основополагающим индикатором при принятии решений для центральных банков, осуществляющих политику инфляционного таргетирования. Устойчиво низкие темпы инфляции способствуют расширению горизонта планирования и росту инвестиций, что приводит к расширению экономической активности и улучшению благосостояния населения.
Сохранению устойчиво низких темпов роста цен на товары потребительской корзины способствует проведение последовательной денежно-кредитной политики.
В периоды различных кризисов в целях сдерживания инфляционных процессов монетарному регулятору необходимо действенно реагировать на происходящие и ожидаемые макропроцессы, а также при необходимости своевременно корректировать денежно-кредитную политику. Наличие оперативной информации об изменении потребительских цен дает возможность принимать более качественные решения.
На текущий момент сдерживающим фактором оперативного анализа изменения цен на товары потребительской корзины в Казахстане является ограниченная частотность публикаций официальной статистики. В этой связи особое значение приобретает вопрос построения косвенных высокочастотных прокси-индикаторов инфляции.
В последние годы среди статистических органов и центральных банков многих стран особую популярность приобретают системы сбора ценовых изменений, основанные на «сканировании» цен и веб-скрепинге интернет-ресурсов, которые позволяют получать высокочастотную информацию в большом объеме.
В широком смысле «сканирование» цен подразумевает использование данных ретейлеров о транзакциях, в которых содержится информация о цене и обороте товаров, идентифицируемым по бар-кодам. Использование данной технологии подразумевает тесное сотрудничество с магазинами, которые предоставляют данную информацию.
Технология веб-скрепинга различных сайтов позволяет провести сбор ценовых данных в структурированном виде для дальнейшей обработки и получения ценной высокочастотной информации об изменении потребительских цен. Технология получила свое развитие ввиду того, что интернет-покупки становятся все более популярными, и многие вендоры переходят к онлайн-продажам, открывая свои официальные сайты с ценами на всю товарную продукцию.
Данный вид сбора ценовых изменений набирает большую популярность как в государственных учреждениях (статистические органы, центральные банки), так и в частных организациях различных стран, ввиду экономии времени, человеческих ресурсов и минимизации расходов. Получение данных об изменении уровня цен посредством веб-скрепинга стало особенно актуальным в 2020 году, когда на фоне пандемии коронавируса COVID-19 многие торговые точки были вынуждены приостановить свою деятельность в условиях карантинных ограничений, что усложняло сбор ценовых изменений классическим методом.
В настоящее время статистические органы таких стран как Италия, Австралия, Бельгия, Германия, Нидерланды, Венгрия, Великобритания, Канада начали осваивать и внедрять системы веб-скрепинга в своей операционной деятельности.
Примеры использования данной технологии неофициальными органами – проекты “The Billion Prices Project” и “PriceStats”. Проект “The Billion Prices Project” – академическая инициатива американских экономистов Альберто Кавалло и Роберто Ригобона, в рамках которой с 2008 года ведется ежедневный сбор цен у сотен интернет-магазинов по всему миру с дальнейшим предоставлением оценки инфляции в реальном времени. В 2011 году на основе “The Billion Prices Project” был создан коммерческий проект “PriceStats”, который собирает данные и, используя их, строит высокочастотные индексы для центральных банков и финансового сектора.
Национальный Банк Казахстана приступил к изучению вопроса сбора данных с интернет-ресурсов в 2018 году, когда была разработана система сбора и анализа динамики потребительских цен, названная Galymzhan.
Galymzhan – это аналитическая программа, созданная и совершенствуемая специалистами Национального банка. Этот инструмент, в первую очередь, используется для анализа текущей, ежедневной ситуации на рынке потребительских цен путем построения прокси-индикатора инфляции.
С технической точки зрения Galymzhan представляет собой алгоритм, написанный на языке программирования R. Интеграция данного кода в систему Windows позволила добиться автономности данной программы. Так, ежедневно, включая праздничные и выходные дни, в одно и тоже время система запускает алгоритм сбора и обработки данных. Результатом работы системы является построение ежедневного прокси-индикатора инфляции.
Описание системы Galymzhan
Процесс развития и становления в Национальном Банке Казахстана системы Galymzhan можно разделить на два периода. С начала 2018 года по октябрь 2020 года использовалась первая версия системы Galymzhan 1.0. В октябре 2020 года система была существенно усовершенствована. Так, во второй версии увеличилось количество отслеживаемых товаров, расширилась географическая представленность и повысилась автономность системы.
Открытие большого количества новых интернет-площадок не только в крупных городах, но и в региональных центрах Казахстана, катализатором чего выступила пандемия коронавируса COVID-19, а также улучшение и накопление навыков сбора и обработки данных аналитиков, работающих над системой Galymzhan, позволили провести существенное развитие в данном направлении деятельности.
Помимо того, что веб-скрепинг является довольно сложным с технической точки зрения процессом, который требует определенного перечня навыков в программировании, выбор подхода к расчету индекса также является нетривиальной проблемой.
Традиционный сбор ценовых изменений, осуществляемый Бюро Национальной Статистики Агентства стратегического планирования и реформ Казахстана (далее – БНС), основан на целевой выборке, которая предполагает наличие заранее выбранного по сегментам потребления списка репрезентативных товаров и услуг. В данный список попадают товары и услуги, потребляемые домохозяйствами, веса которых определяются по доле их затрат на приобретение данных товаров и услуг.
Далее обследование цен осуществляется инспекторами локально в различных торговых точках. Методология, используемая БНС и системой Galymzhan, основана на восходящем подходе, при котором сначала централизованно определяются товары, а далее происходит сам процесс сбора цен.
Цель системы Galymzhan – построение прокси-индикатора инфляции, а не сбор всей имеющейся информации по динамике цен. Использование аналогичного с БНС подхода позволяет сохранить интерпретируемость полученных индексов и использовать их в качестве прокси-оценки потребительской инфляции в Казахстане.
При этом данные системы Galymzhan в определенной степени отражают динамику инфляционных процессов в Казахстане, но не заменяют собой официальные данные, предоставляемые БНС. Собранные данные позволяют использовать их в качестве опережающего прогноза потребительской инфляции в Казахстане. Galymzhan 1.0, запущенный в начале 2018 года, проводит ежедневный сбор цен на 395 видов продовольственных и непродовольственных товаров – по одному наименованию на каждую категорию товара потребительской корзины в 13 магазинах по заранее указанным HTML-ссылкам.
Фиксирование ценовых изменений ведется в двух крупных городах: Нур-Султане и Алматы. Узкая географическая представленность первой версии системы была связана с ограниченным количеством интернет-площадок в крупных городах Казахстана и их отсутствием в регионах. По этой причине при построении сводного индекса допускается, что изменение цены на определенный товар в одном из двух городов будет восприниматься системой как общереспубликанское изменение цены на данную категорию товара, что репрезентативно для всей генеральной совокупности товара.
В настоящее время Galymzhan 2.0 функционирует в тестовом режиме, и сбор ценовых изменений производится по группе социально-значимых продовольственных товаров (далее – СЗПТ) из 19 продовольственных категорий продуктов.
Galymzhan 2.0. обрабатывает 16 официальных интернет-ресурсов различных торговых марок в шести городах Казахстана и собирает ежедневную информацию по ценам на около 5000 продовольственных товаров-представителей. В среднем на одну категорию товара потребительской корзины приходится около 263 товаров-представителей, тогда как в первой версии системы на одну категорию товара потребительской корзины – один товар-представитель. Использование большего количества товаров-представителей позволило повысить репрезентативность выборки и одновременно снизить волатильность индекса.
Полное соблюдение методологии БНС предполагает сбор цен на заранее отобранные товары в течение года. Однако в отличие от физического обследования сбор цен в интернете имеет ряд особенностей. К одной из таких особенностей следует отнести частую смену ссылок на товары, из-за чего решили увеличить частоту фиксирования отслеживаемых товаров и ссылок на них.
Так, каждые две недели система производит полное «сканирование» магазинов со сбором всех продуктов в наличии и их метаданных. Записываются все ссылки на товары, их принадлежность к категориям, название магазина и его месторасположение. В общей сложности собирается информация по 140 000 товаров. Затем система проводит классификацию продукции, используя категоризацию БНС, и отбирает необходимые товары путем использования простейших алгоритмов обработки естественного языка. Характеристики отобранных товаров записываются в отдельную базу.
В течение двух последующих недель выборка продуктов остается неизменной, исходя из этого рассчитывается прокси-показатель инфляции. По истечении двух недель процесс повторяется. Используемая процедура автоматизирует этап определения необходимых товаров-представителей и их характеристик, уменьшая временные затраты. Такой подход также позволяет снизить нагрузку на вычислительную мощность используемого компьютера и проводить сбор ежедневно.
Процесс обработки полученных данных начинается с определения дневного изменения цен на все товары-представители. Далее изменение цен на товары-представители, относящиеся к одному товару потребительской корзины в каждом регионе, группируются путем расчета общего среднегеометрического показателя. Затем полученные ценовые изменения агрегируются в инфляцию СЗПТ по регионам и республике, а также общереспубликанское изменение цен на все 19 товаров.
Помимо ежедневной прокси-инфляции система рассчитывает два дополнительных показателя – еженедельную инфляцию и накопленную месячную инфляцию. Для сравнения с еженедельно публикуемой инфляцией на СЗПТ ежедневный прокси-показатель инфляции трансформируется в показатель недельной частотности путем накопления предыдущих дневных изменений. Накопленный месячный показатель используется для дополнительного анализа и сравнения с официальными данными по итогам месяца. Анализ полученных индексов позволяет корректировать текущие прогнозы инфляции и глубже изучать, анализировать инфляционные процессы в стране.
Результаты визуализируются в виде дашбордов в Tableau – системе интерактивной аналитики, которая позволяет анализировать динамику каждой из 19 категорий товаров во всех регионах максимально быстро и удобно.
Полученные результаты
Конечным результатом деятельности системы Galymzhan является построение агрегированного прокси-индикатора инфляции, в данном случае инфляции СЗПТ.
Для иллюстрации текущих результатов системы Galymzhan на рисунке 1 представлены официальная недельная динамика цен на 19 социально-значимых товаров, публикуемая БНС, и еженедельная прокси-инфляция, рассчитанная на основе данных, полученных технологией веб-скрепинга.
В целом несмотря на высокий размах расчетных значений прокси-инфляции, она в большинстве случаев конвергируется с фактической недельной инфляцией СЗПТ.
В ходе анализа определено: данные с онлайн-магазинов в сравнении с ценами, фиксируемыми классическим методом обследования, имеют тенденцию к более быстрому изменению, что, возможно, связано с высокой оборачиваемостью товаров и отсутствием явных издержек на обновление ценника. Подобное явление в макроэкономике называется «эффектом меню».
При этом темпы роста онлайн-цен в большинстве случаев ниже темпов роста офлайн-цен. Вероятно, это связано с тем, что наличие собственного онлайн-магазина в основном – прерогатива крупных продовольственных сетей, где стоимость конечных продуктов может быть ниже в сравнении с единичными торговыми точками за счет эффекта масштаба. Наличие временного лага между онлайн-ценами и ценами, фиксируемыми классическим методом обследования, предоставляет основания использовать показатель, рассчитанный системой Galymzhan 2.0 в качестве опережающего индикатора официальных данных об изменении цен на социально-значимые продукты.
На рисунке 2 представлена еженедельная прокси-инфляция с 10-дневным лагом и индекс цен на СЗПТ. Дополнительно для снижения визуального шума онлайн-индекс был сглажен семидневной скользящей средней.
В качестве примеров региональной разбивки были выбраны города Нур-Султан и Алматы, как города с наибольшим количеством онлайн-магазинов (4 и 8 онлайн-площадок, соответственно). При этом в Нур-Султане наблюдается сильная зависимость между данными системы Galymzhan и официальными показателями БНС (рисунок 4).
В отличие от Нур-Султана в Алматы наблюдается повышенная волатильность. Так, в предновогодний период (26-27 декабря 2020 года) было зафиксировано резкое повышение цен на большинство продуктов питания.
Возможным объяснением данного повышения цен является возросший спрос вследствие новогодних праздников. Рост цен отмечается в крупных торговых сетях, в то время как цены на локальных рынках практически не изменились.
Таким образом, преимуществом данной системы также является возможность проведения глубокого анализа ценовой динамики в периоды аномального поведения рынков.
В настоящее время Galymzhan позволяет отслеживать динамику цен определенных товаров-представителей на полках различных торговых точек.
Выявленные аналитические данные демонстрируют, что преимуществом системы Galymzhan 2.0 является возможность проведения глубокого анализа ценовой динамики в периоды аномального поведения рынков. В дальнейшем по мере улучшения системы, а именно расширения географической представленности, добавления новых товаров-представителей и увеличения общего количества категорий товаров потребительской корзины ожидается, что конвергенция между индексом, рассчитываемым системой Galymzhan, и официальными данными будет сокращаться, а расширенный индекс будет максимально приближен по товарной и региональной представленности к индексу потребительских цен и будет использоваться при построении краткосрочных прогнозов, для целей анализа и принятия решений по денежно-кредитной политике.
Выводы
Полученные результаты свидетельствуют о наличии корреляции между официальными данными и построенным индексом. При этом цены в онлайн-магазинах меняются быстрее, чем в офлайн торговых точках, и темпы роста цен в реальных магазинах несколько выше.
Отметим, что система Galymzhan 2.0 в настоящее время функционирует в тестовом режиме. В целях дальнейшего развития системы планируется проведение работ по расширению географического охвата и добавления большего количества магазинов, категорий товаров потребительской корзины и товаров-представителей. Потенциал дальнейшего развития процесса визуализации связан с включением в дашборд возможности отслеживания ценовых корректировок не только в регионах и магазинах, но и конкретных товаров-представителей на онлайн-полках определенных магазинов.
Дальнейшее расширение системы позволит максимально приблизиться по географическому и товарному охвату к индексу потребительских цен, что позволит реплицировать его в полной мере, а также использовать результаты системы Galymzhan 2.0 в качестве инструмента при построении краткосрочных прогнозов и анализа монетарной политики.
Для экономических агентов наличие подобной системы, которая в законченной форме будет способна «расщеплять» общий показатель прокси-инфляции вплоть до товарных цен на полках конкретных магазинов городов Казахстана, позволит повысить доверие бизнеса и населения к официальным показателям инфляции в стране.
Это в конечном итоге может эффективно заякорить инфляционные ожидания, и тем самым повысить действенность проводимой денежно-кредитной политики Национального банка в рамках режима инфляционного таргетирования.
В свою очередь для экспертной, академической среды и участников финансового рынка результаты работы системы могут стать важным источником информации, на основе которой появится возможность проводить важные и детализированные научно-прикладные исследования по инфляционным процессам.