Выступление состоялось в рамках прошедшей 21-22 марта 2024 г. VI-й Всероссийской научно-практической конференции по межотраслевому и региональному анализу и прогнозированию, организованной ИНП РАН и ИЭОПП СО РАН.
Презентация
Тезисы
Опубликованы в сборнике Экономическая политика России в межотраслевом и пространственном измерении : материалы VI Всероссийской научно-практической конференции ИНП РАН и ИЭОПП СО РАН (Россия, г. Томск, 21–22 марта 2024 г.). Том 6
Регрессионный анализ в экономических исследованиях: мейнстримный и невероятностный подходы
Регрессионный анализ – один из основных, если не основной, инструмент экономиста. В большинстве случаев он используется в сочетании с математико-статистическими методами – даже тогда, когда особенности экономических данных усложняют их корректное применение. В результате возникает риск того, что исследователь изначально решает неверно поставленную задачу. И одновременно теряются из вида некоторые задачи, которые могут быть решены посредством регрессионного анализа.
Мейнстримная эконометрика выстроена вокруг регрессионного анализа и математико-статистических понятий и процедур: статистической значимости регрессионных коэффициентов; критериев Стьюдента, Фишера, Дарбина-Уотсона; состоятельности, несмещенности, эффективности оценок; многих других. В результате может сложиться ложное впечатление, что прикладная работа экономиста практически полностью состоит из построения регрессионных уравнений и проверки на них математико-статистических гипотез.
Все перечисленные понятия и процедуры базируются на предположениях о природе рассматриваемых данных. Но эти предположения, как правило, не выполняются при работе с экономической статистикой.
Возьмем в качестве примера t-критерий (критерий Стьюдента), повсеместно используемый для проверки статистической значимости регрессионных коэффициентов. Он требует выполнения двух предположений:
- существования истинного вектора коэффициентов независимых переменных;
- присутствия в регрессионном уравнении случайной величины с заданным вероятностным распределением.
«Истинность» коэффициентов здесь не философский вопрос, а явно прописанное в алгоритме t-критерия требование: утверждение о статистической значимости коэффициента условно-вероятностное, а условие в нем – нулевая гипотеза о равенстве нулю истинного коэффициента. Но то, что такой истинный коэффициент существует, требует обоснования. Условия, при которых он может быть найден, рассмотрены Дж. Праттом и Р. Шлейфером [1] – они практически невыполнимы при работе с неэкспериментальными данными.
Присутствие случайной величины – даже если не учитывать дополнительные требования к форме и параметрам ее распределения – тоже требует обоснования. Подробно эта проблема описана Д. Фридманом и др. [2]. В случае работы со случайной в строгом техническом смысле выборкой наличие случайной величины очевидно. Но экономисты почти всегда работают с детерминированными величинами: с неслучайными выборками вместо случайных, с генеральными совокупностями вместо выборочных.
Без выполнения двух этих предположений t-статистика технически может быть рассчитана, но теряет содержательную (условно-вероятностную) интерпретацию. Ситуация с другими математико-статистическими методами, когда они применяются к экономическим данным, – аналогична.
Критику мейнстримной эконометрики нельзя назвать чем-то новым. В течение десятилетий многие математики и экономисты пишут о необходимости изменения сложившихся практик:
- Д. Фридман [3] приводит обзор основных направлений критики;
- С. Зильяк и Д. Макклоски [4] описывают историю эконометрики;
- Хиршауэр и др. [5] и Дж. Тьюки [6] рассуждают о проблемах некорректного применения математической статистики;
- Р. Вассерштейн и др. [7] дают обзор предложений по изменению мейнстримных практик.
Помимо мейнстримных подходов, уже длительное время развиваются «невероятностные» школы анализа данных в целом и регрессионного анализа в частности. Выделим три такие школы:
- Эксплораторный анализ данных (позиция этой школы изложена Ф. Мостеллером и Дж. Тьюки [8]);
- Алгоритмический анализ данных (состоит из множества направлений, некоторые из них описаны Л. Брейманом [9]);
- Научная группа «Инфорум» (базовые подходы представлены в учебнике К. Алмона [10]).
Представители невероятностных школ анализа данных выступают не против математико-статистических методов как таковых, а за особое внимание к их предпосылкам, без выполнения которых мейнстримные подходы работать не могут. Но, поскольку экономические данные почти всегда этим предпосылкам не удовлетворяют, фактически речь идет о невероятностной эконометрике.
Сложность или даже невозможность применения в какой-то области знаний математической статистики не говорит о том, что эффективная работы с данными в ней невозможна. Например, регрессионный анализ позволяет решать три широкие категории задач разной сложности (табл.).
Мейнстримная эконометрика неявно предполагает, что регрессионный анализ всегда нужно начинать с самой сложной из этих задач – оценки параметров законов (аналогичных физическим) с использованием математической статистики. Невероятностные школы, напротив, исходят из того, что в экономической области эта задача нерешаема, поэтому пытаются в явном виде решать более простые задачи – описание и прогнозирование.
Таблица
Решаемые при помощи регрессионного анализа задачи
ghfghfhfh
* В рамках задачи «Прогнозирование» в таблице объединены два разных типа прогнозирования – подробно они рассмотрены Дж. Боксом [11].
Источник: составлено автором по [8-10].
Литература и информационные источники
- Pratt J.W., Schlaifer R. On the Interpretation and Observation of Laws // Journal of Econometrics. – 1988. – 39. – Pp. 23–52.
- Freedman D., Collier D., Sekhon J., Stark P. (Eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences / Cambridge University Press, 2011, 416 p.
- Freedman D. Limits of Econometrics // International Econometric Review. – 2009. – 1. – Pp. – 5–17.
- Ziliak S., McCloskey D. The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives / University of Michigan Press, 2008, 352 p.
- Hirschauer N., Grüner S., Musshoff O., Becker C., Jantsch A. Can p-values be meaningfully interpreted without random sampling? // Statistics Surveys. – 2020. – 14. – Pp. 71–91.
- Tukey J. More honest foundations for data analysis // Journal of Statistical Planning and Inference. – 1997. – 57(1). – Pp. 21–28.
- Wasserstein R., Schirm A., Lazar N. Moving to a World Beyond “p<0.05” // The American Statistician. – 2019. – 73 – Pp. 1–19.
- Mosteller F., Tukey J. Data Analysis and Regression: A Second Course in Statistics / Pearson, 1977. – 588 p.
- Breiman L. Statistical Modeling: The Two Cultures // Statistical Science. – 2001. – Vol. 16. – No. 3. – Pp. 199–215.
- Almon C. The Craft of Economic Modeling / CreateSpace Independent Publ., 2017, 458 p.
- Box G. Use and Abuse of Regression // Technometrcs. – 1966. – Vol. 8. – No. 4. – Pp. 625–629.