Выступление: “Элементы математической статистики в экономических исследованиях”

Выступление состоялось в рамках прошедшей 21-22 марта 2024 г. VI-й Всероссийской научно-практической конференции по межотраслевому и региональному анализу и прогнозированию, организованной ИНП РАН и ИЭОПП СО РАН.

Презентация

Тезисы

Опубликованы в сборнике Экономическая политика России в межотраслевом и пространственном измерении : материалы VI Всероссийской научно-практической конференции ИНП РАН и ИЭОПП СО РАН (Россия, г. Томск, 21–22 марта 2024 г.). Том 6

Регрессионный анализ в экономических исследованиях: мейнстримный и невероятностный подходы

Регрессионный анализ – один из основных, если не основной, инструмент экономиста. В большинстве случаев он используется в сочетании с математико-статистическими методами – даже тогда, когда особенности экономических данных усложняют их корректное применение. В результате возникает риск того, что исследователь изначально решает неверно поставленную задачу. И одновременно теряются из вида некоторые задачи, которые могут быть решены посредством регрессионного анализа.

Мейнстримная эконометрика выстроена вокруг регрессионного анализа и математико-статистических понятий и процедур: статистической значимости регрессионных коэффициентов; критериев Стьюдента, Фишера, Дарбина-Уотсона; состоятельности, несмещенности, эффективности оценок; многих других. В результате может сложиться ложное впечатление, что прикладная работа экономиста практически полностью состоит из построения регрессионных уравнений и проверки на них математико-статистических гипотез.

Все перечисленные понятия и процедуры базируются на предположениях о природе рассматриваемых данных. Но эти предположения, как правило, не выполняются при работе с экономической статистикой.

Возьмем в качестве примера t-критерий (критерий Стьюдента), повсеместно используемый для проверки статистической значимости регрессионных коэффициентов. Он требует выполнения двух предположений:

  1. существования истинного вектора коэффициентов независимых переменных;
  2. присутствия в регрессионном уравнении случайной величины с заданным вероятностным распределением.

«Истинность» коэффициентов здесь не философский вопрос, а явно прописанное в алгоритме t-критерия требование: утверждение о статистической значимости коэффициента условно-вероятностное, а условие в нем – нулевая гипотеза о равенстве нулю истинного коэффициента. Но то, что такой истинный коэффициент существует, требует обоснования. Условия, при которых он может быть найден, рассмотрены Дж. Праттом и Р. Шлейфером [1] – они практически невыполнимы при работе с неэкспериментальными данными.

Присутствие случайной величины – даже если не учитывать дополнительные требования к форме и параметрам ее распределения – тоже требует обоснования. Подробно эта проблема описана Д. Фридманом и др. [2]. В случае работы со случайной в строгом техническом смысле выборкой наличие случайной величины очевидно. Но экономисты почти всегда работают с детерминированными величинами: с неслучайными выборками вместо случайных, с генеральными совокупностями вместо выборочных.

Без выполнения двух этих предположений t-статистика технически может быть рассчитана, но теряет содержательную (условно-вероятностную) интерпретацию. Ситуация с другими математико-статистическими методами, когда они применяются к экономическим данным, – аналогична.

Критику мейнстримной эконометрики нельзя назвать чем-то новым. В течение десятилетий многие математики и экономисты пишут о необходимости изменения сложившихся практик:

  • Д. Фридман [3] приводит обзор основных направлений критики;
  • С. Зильяк и Д. Макклоски [4] описывают историю эконометрики;
  • Хиршауэр и др. [5] и Дж. Тьюки [6] рассуждают о проблемах некорректного применения математической статистики;
  • Р. Вассерштейн и др. [7] дают обзор предложений по изменению мейнстримных практик.

Помимо мейнстримных подходов, уже длительное время развиваются «невероятностные» школы анализа данных в целом и регрессионного анализа в частности. Выделим три такие школы:

  1. Эксплораторный анализ данных (позиция этой школы изложена Ф. Мостеллером и Дж. Тьюки [8]);
  2. Алгоритмический анализ данных (состоит из множества направлений, некоторые из них описаны Л. Брейманом [9]);
  3. Научная группа «Инфорум» (базовые подходы представлены в учебнике К. Алмона [10]).

Представители невероятностных школ анализа данных выступают не против математико-статистических методов как таковых, а за особое внимание к их предпосылкам, без выполнения которых мейнстримные подходы работать не могут. Но, поскольку экономические данные почти всегда этим предпосылкам не удовлетворяют, фактически речь идет о невероятностной эконометрике.

Сложность или даже невозможность применения в какой-то области знаний математической статистики не говорит о том, что эффективная работы с данными в ней невозможна. Например, регрессионный анализ позволяет решать три широкие категории задач разной сложности (табл.).

Мейнстримная эконометрика неявно предполагает, что регрессионный анализ всегда нужно начинать с самой сложной из этих задач – оценки параметров законов (аналогичных физическим) с использованием математической статистики. Невероятностные школы, напротив, исходят из того, что в экономической области эта задача нерешаема, поэтому пытаются в явном виде решать более простые задачи – описание и прогнозирование.

Таблица

Решаемые при помощи регрессионного анализа задачи

ghfghfhfh
* В рамках задачи «Прогнозирование» в таблице объединены два разных типа прогнозирования – подробно они рассмотрены Дж. Боксом [11].

Источник: составлено автором по [8-10].

Литература и информационные источники

  1. Pratt J.W., Schlaifer R. On the Interpretation and Observation of Laws // Journal of Econometrics. – 1988. – 39. – Pp. 23–52.
  2. Freedman D., Collier D., Sekhon J., Stark P. (Eds.). Statistical Models and Causal Inference: A Dialogue with the Social Sciences / Cambridge University Press, 2011, 416 p.
  3. Freedman D. Limits of Econometrics // International Econometric Review. – 2009. – 1. – Pp. – 5–17.
  4. Ziliak S., McCloskey D. The Cult of Statistical Significance: How the Standard Error Costs Us Jobs, Justice, and Lives / University of Michigan Press, 2008, 352 p.
  5. Hirschauer N., Grüner S., Musshoff O., Becker C., Jantsch A. Can p-values be meaningfully interpreted without random sampling? // Statistics Surveys. – 2020. – 14. – Pp. 71–91.
  6. Tukey J. More honest foundations for data analysis // Journal of Statistical Planning and Inference. – 1997. – 57(1). – Pp. 21–28.
  7. Wasserstein R., Schirm A., Lazar N. Moving to a World Beyond “p<0.05” // The American Statistician. – 2019. – 73 – Pp. 1–19.
  8. Mosteller F., Tukey J. Data Analysis and Regression: A Second Course in Statistics / Pearson, 1977. – 588 p.
  9. Breiman L. Statistical Modeling: The Two Cultures // Statistical Science. – 2001. – Vol. 16. – No. 3. – Pp. 199–215.
  10. Almon C. The Craft of Economic Modeling / CreateSpace Independent Publ., 2017, 458 p.
  11. Box G. Use and Abuse of Regression // Technometrcs. – 1966. – Vol. 8. – No. 4. – Pp. 625–629.

Комментарии:

Ещё на сайте: