Множественная регрессия

Экономические явления, как правило, определяются большим числом одновременно и совокупно действующих факторов. В связи с этим часто возникает задача исследования зависимости одной зависимой переменной clip_image002 от нескольких объясняющих переменных clip_image004,clip_image006,…,clip_image008. Эта задача решается с помощью множественного регрессионного анализа. Модель множественной линейной регрессии, в которой зависимая переменная, возмущения и объясняющие переменные удовлетворяют приведенным выше предпосылкам регрессионного анализа и, кроме того, предпосылке о невырожденности матрицы (независимости столбцов) значений объясняющей переменной (см. далее) называется классической нормальной линейной моделью множественной регрессии. Предполагается, что объясняющие переменные некоррелированы друг с другом. На основе clip_image010 наблюдений получают выборочное уравнение множественной линейной ре­грессии: clip_image012, где clip_image014 — оценки параметров уравнения множественной регрессии clip_image016. Для оценки параметров уравнения множественной регрессии используется метод наимень­ших квадратов (МНК). Любая сумма квадратов связана с числом степеней свободы — с числом независимого варьирования пере­менных. Введение в модель каждого нового параметра уменьшает на 1 число степеней свободы. Необходимым условием минимума суммы квадратов остатков является равенство нулю всех ее частных производных по коэф­фициентам уравнения регрессии clip_image018. Такое условие приходит к системе из (clip_image020) линейного урав­нения с (clip_image020[1]) неизвестным, называемой системой нормальных уравнений. Ее решение обычно записывается в матричной форме. Стандартной ошибкой регрессии, несмещенной оценкой дисперсии модели является величина S2 (остаточная дисперсия): clip_image023 Если условия Гаусса-Маркова, определяющие воз­можность применения МНК, выполняются, то оценки параметров множественной регрессии являются несмещенными, состоятель­ными и эффективными. Пусть в уравнении регрессии содержится k объясняющих переменных. Дисперсию зависимой переменной можно разло­жить на объясненную и необъясненную составляющие: clip_image025 где clip_image027— остаток в i-м варианте реализации событий; clip_image029 — значение зависимой переменной в i-м варианте реали­зации событий; clip_image031— среднее значение зависимой переменной; clip_image033— расчетное значение зависимой переменной в i-м вари­анте реализации событий, определяемое уравнением регрессии; clip_image010[1] — число вариантов реализации событий, в каждом из ко­торых при сочетании значений независимых переменных было получено значение зависимой переменной. Значимость коэффициентов уравнения регрессии clip_image036 оце­нивается с помощью t-критерия. Порядок оценки по критерию Стьюдента следующий. Вычисляется наблюдаемое зна­чение критерия clip_image038. По таблице распределения Стьюдента по задан­ному уровню значимости и числу степеней свободы clip_image040 находят критическое значение clip_image042. Вычисленные критерии clip_image044 и clip_image046сравниваются с критическим значением clip_image042[1]. Если clip_image049, то соответствующий коэффициент уравнения ре­грессии значим и принимается. Если clip_image051, то соответствующий коэффициент уравнения регрессии незначим, не отличается от нуля и не принимается. В эконометрике проверку гипотез осуществляют при 5%-м, реже на 10%-м уровне значимости. В первом случае стандартная ошибка коэффициента регрессии составляет примерно до половины его величины. Последовательный отсев несущественных факторов — переменных, коэффициенты при которых оказались незначимы, составляет основу многошагового регрессионного анализа. Для определения статисти­ческой значимости коэффициента детерминации clip_image053 использу­ется F-статистика, рассчитываемая по формуле: clip_image055clip_image057, где clip_image010[2] — число пар данных в выборке, использованных для полу­чения уравнения регрессии; clip_image060 — количество коэффициентов в уравнении регрессии. Величина clip_image062 имеет распределение Фишера c clip_image064 степенями свободы. Вычисленный критерий clip_image062[1]сравнивается с кри­тическим значением следующим образом: если clip_image067, то clip_image053[1] считается незначимым, он не отличим от нуля; если clip_image070, то clip_image053[2] считается значимым, и уравнение регрес­сии может использоваться для объяснения изменения переменной clip_image002[1] под влиянием изменения переменных clip_image074. Величины критических значений критериев оценки значимости принимаются при 5%-м, реже 10%-м уровне значимости. Указан­ные уровни значимости соответствуют 95%-му и 90%-му довери­тельным интервалам соответственно. Мультиколлинеарность – это коррелированность двух или нескольких объясняющих переменных в уравнении регрессии. При наличии мультиколлинеарности оценки, полученные методом наименьших квадратов (МНК), формально существуют, но обладают рядом недостатков: 1) небольшое изменение исходных данных приводит к суще­ственному изменению оценок регрессии; 2) оценки имеют большие стандартные ошибки, малую значи­мость, в то время как модель в целом является значимой (высо­кое значение коэффициента детерминацииclip_image053[3]). Если при оценке уравнения регрессии несколько факторов оказались незначимыми, то нужно выяснить, нет ли среди них сильно коррелированных между собой. При наличии корреляции один из пары связанных между собой факторов исключается. Если статистически незначим лишь один фактор, то он должен быть исключен или заменен другим показателем. В модель регрессии включаются те факторы, которые более сильно связаны с зависи­мой переменной, но слабо связаны с другими факторами. Построение эконометрической модели включает выбор объясняющих переменных — составление их спецификации. Свойства оценок коэффициентов регрессии в значительной мере зависят от правильной спецификации модели. Предположим, что переменная y зависит от двух переменных. Однако в модель включили только одну незави­симую переменную clip_image004[1]: clip_image078. В этом случае не включения в модель переменной, которая должна быть включена, оценка clip_image080 и ее дисперсия являются смещенны­ми. Смещенность оценки связана с тем, что если не учесть вторую переменную clip_image006[1] в регрессии, то переменная clip_image083, будет играть двой­ную роль: отражать свое прямое влияние и заменять переменную clip_image004[2] в описании ее влияния. Коэффициент детерминации clip_image053[4] для данной регрессии отра­жает общую объясняющую способность переменной х1 в обеих ролях и является завышенной оценкой. При включении в модель переменной, которая не должна быть включена, оценки коэффициентов регрессии и их дисперсии в этом случае являются несмещенными, но неэффек­тивными. Практически обнаруживается, что коэффициенты при излишних переменных статистически незначимы, и эти перемен­ные исключаются из модели. При исследовании влияния качественных признаков в модель следует вводить фиктивные переменные, принимающие, как правило, два значения: 1, если данный признак присутствует в наблюдении; 0 — при его отсутствии. Если испытываете трудности в написании курсовой работы по эконометрике, оформите заявку и Вы узнаете сроки и стоимость работы. Цена - от 99 рублей.
Мы принимаем