Выступление состоялось в рамках прошедшей 21-22 марта 2024 г. VI-й Всероссийской научно-практической конференции по межотраслевому и региональному анализу и прогнозированию, организованной ИНП РАН и ИЭОПП СО РАН.
Презентация
Тезисы
Опубликованы в сборнике Экономическая политика России в межотраслевом и пространственном измерении : материалы VI Всероссийской научно-практической конференции ИНП РАН и ИЭОПП СО РАН (Россия, г. Томск, 21–22 марта 2024 г.). Том 6
Пространственный анализ с использованием Базы Знаний ИЭОПП СО РАН
Для решения задач анализа социально-экономического развития Азиатской России на основе синергии транспортной доступности и системных знаний о природно-ресурсном и промышленном потенциалах возникает необходимость расширения традиционного инструментария и создания единой Базы Знаний (БЗ). Такая БЗ разрабатывается в Институте экономики и организации промышленного производства Сибирского отделения Российской академии наук.
Создание БЗ проходит в несколько этапов:
- определение целей и задач ее формирования,
- выстраивания архитектуры БЗ,
- создания Базы Данных (БД) и настройка ее автоматического пополнения,
- формирование инструментария и модельного аппарата, для создания новых знаний с последующим их сохранением в системы БЗ,
- разработка веб-интерфейса.
Последующее расширение БЗ проходит в рамках развития последних трех направлений. Текущее наполнение БД является интенсивным и возникают проблемы, связанные с обработкой больших данных. Очистка данных и их привязка к ГИС-координатам, позволяют нам решать задачи проведения аналитических срезов не только в разрезе регионов, но и в разрезе выделенного пользователем пространства. С использованием дискриминаций данных о компаниях, инвестиционных проектах и таможенной статистики можно проводить аналитические срезы как со стороны определенных регионов или их групп, так и анализировать распределение базовых показателей по регионам. Например, можно выделить компании по группам ОКВЭД и оценить их распределение в разрезе выбранного пользователем пространства по суммарным показателям количества, выручки, расходов или прибыли (рис.1–2).
Рис. 1. Пример интерфейса пользователя по выделению пространства для анализа компаний или инвестиционных проектов
Рис. 2. Пример аналитического дашборда по выручке компаний на выбранной пользователем территории
Использование всех данных о компаниях позволяет делать пространственно-временной анализ по появлению и уходу компаний с территории за выбранный период. Так, анализ Томской области с 2020 по 2022 год показал, что количество закрытых компаний за период: 7887, количество открытых компаний: 3777, выручка закрытых компаний: 117 млрд руб., выручка открытых компаний: 43 млрд руб. и отношение выручки закрытых компаний к выручке открытых компаний составляет 2,74. По анализу изменения выручки компаний по ОКВЭД (рис. 3) видно, что основной отраслью выбытия компаний является торговля и реклама, а точкой роста является производство нефтепродукта. Подобный инструмент позволит в дальнейшем создавать модели выживания компаний и оценивать влияние различных факторов или инвестиционных проектов на этот показатель.
Рис. 3. Прирост выручки компаний Томской области по ОКВЭД с 2020 по 2022 год
Рис. 4. Пример аналитического дашборда по инвестиционным проектам на выбранной пользователем территории
Привязка данных инвестиционных проектов к ГИС-координатам, позволяет создавать аналитические дашборды по объему или количеству реализующихся инвестиционных проектов на выбранной пользователем территории (рис 4.). С добавлением информации об инфраструктуре, в виде железных и автомобильных дорог, газо- и нефтепроводов, линий электропередач, аэропортов и портов, а также данных о месторождениях сырья возможно решение задачи первичной оценки инвестиционных проектов, а также изучение их цепочек добавленных стоимостей.
Применение методов машинного обучения и нейронных сетей в разрезе привязанных к пространству данных, а также использование разработанных в ИЭОПП СО РАН прогнозно-аналитических моделей ОМММ и КАМИН, позволит решать задачи пространственной кластеризации территорий по выбранным признакам, и прогнозирования развития территорий на мезо-, микро- и макроуровнях.
Все рассматриваемые модули направлены на преодоление проблем анализа больших данных и являются вспомогательными инструментами исследователя.