![]() |
|||||||||||||||||||
Главная Рефераты по рекламе Рефераты по физике Рефераты по философии Рефераты по финансам Рефераты по химии Рефераты по хозяйственному праву Рефераты по цифровым устройствам Рефераты по экологическому праву Рефераты по экономико-математическому моделированию Рефераты по экономической географии Рефераты по экономической теории Рефераты по этике Рефераты по юриспруденции Рефераты по языковедению Рефераты по юридическим наукам Рефераты по истории Рефераты по компьютерным наукам Рефераты по медицинским наукам Рефераты по финансовым наукам Рефераты по управленческим наукам психология педагогика Промышленность производство Биология и химия Языкознание филология Издательское дело и полиграфия Рефераты по краеведению и этнографии Рефераты по религии и мифологии Рефераты по медицине |
Шпаргалка: Множественная регрессия и корреляцияШпаргалка: Множественная регрессия и корреляцияСправочный материал к теме: Множественная регрессия – уравнение связи с несколькими независимыми переменными: где
Для построения уравнения множественной регрессии чаще используются следующие функции:
Можно использовать и другие функции, приводимые к линейному виду. Для оценки параметров уравнения множественной регрессии применяют метод наименьших квадратов (МНК). Для линейных уравнений и нелинейных уравнений, приводимых к линейным, строится следующая система нормальных уравнений, решение которой позволяет получить оценки параметров регрессии: Для ее решения может быть применен метод определителей:
где
Другой вид уравнения множественной регрессии – уравнение регрессии в стандартизированном масштабе: где
К
уравнению множественной регрессии в стандартизированном масштабе применим МНК.
Стандартизированные коэффициенты регрессии (
Связь
коэффициентов множественной регрессии Параметр
Средние коэффициенты эластичности для линейной регрессии рассчитываются по формуле Для расчета частных коэффициентов эластичности применяется следующая формула:
Тесноту совместного влияния факторов на результат оценивает индекс множественной корреляции: Значение индекса множественной корреляции лежит в пределах от 0 до 1 и должно быть больше или равно максимальному парному индексу корреляции:
Индекс множественной корреляции для уравнения в стандартизированном масштабе можно записать в виде При линейной зависимости коэффициент множественной корреляции можно определить через матрицу парных коэффициентов корреляции:
Частные
коэффициенты (или индексы) корреляции, измеряющие влияние на y фактора или по рекуррентной формуле:
Частные коэффициенты корреляции изменяются в пределах от –1 до 1. Качество построенной модели в целом оценивает коэффициент (индекс) детерминации. Коэффициент множественной детерминации рассчитывается как квадрат индекса множественной корреляции: Скорректированный индекс множественной детерминации содержит поправку на число степеней свободы и рассчитывается по формуле: где n-число наблюдений; m число факторов. Значимость уравнения множественной регрессии в целом оценивается с помощью F-критерия Фишера: Частный
F-критерий оценивает статистическую значимость присутствия каждого факторов в
уравнении. В общем виде для фактора Оценка значимости коэффициентов чистой регрессии с помощью t-критерия Стьюдента сводится к вычислению значения где
При построении уравнения множественной регрессии может возникнуть проблема мультиколлинеарности факторов, их тесной линейной связанности. Считается,
что две переменные явно коллинеарны, т. е. находятся между собой в линейной
зависимости, если По величине парных коэффициентов корреляции обнаруживается лишь явная коллинеарность факторов. Наибольшие трудности в использовании аппарата множественной регрессии возникают при наличии мультиколлинеарности факторов. Чем сильнее мультиколлинеарность факторов, тем менее надежна оценка распределения суммы объясненной вариации по отдельным факторам с помощью метода наименьших квадратов. Для оценки мультиколлинеарности факторов может использоваться определитель матрицы парных коэффициентов корреляции между факторами. Если
бы факторы не коррелировали между собой, то матрица парных коэффициентов
корреляции между факторами была бы единичной матрицей, поскольку все
недиагональные элементы матрица коэффициентов корреляции между факторами имела бы определитель, равный 1: так
как Если же, наоборот, между факторами существует полная линейная зависимость и все коэффициенты корреляции равны 1, то определитель такой матрицы равен 0:
Чем ближе к 0 определитель матрицы межфакторной корреляции, тем сильнее мультиколлинеарность факторов и ненадежнее результаты множественной регрессии. И наоборот, чем ближе к 1 определитель матрицы межфакторной корреляции, тем меньше мультиколлинеарность факторов. Проверка
мультиколлинеарности факторов может быть проведена методом испытания гипотезы о
независимости переменных Для
применения МНК требуется, чтобы дисперсия остатков была гомоскедастичной. Это
значит, что для каждого значения фактора При нарушении гомоскедастичности мы имеем неравенства При малом объеме выборки для оценки гетероскедастичности может использоваться метод Гольдфельда-Квандта. Основная идея теста Гольдфельда-Квандта состоит в следующем: 1)
упорядочение 2)
исключение из рассмотрения
3)
разделение совокупности из 4)определение
остаточной суммы квадратов для первой При
выполнении нулевой гипотезы о гомоскедастичности отношение R будет
удовлетворять F-критерию со степенями свободы Уравнения
множественной регрессии могут включать в качестве независимых переменных
качественные признаки (например, профессия, пол, образование, климатические
условия, отдельные регионы и т. д.). Чтобы ввести такие переменные в
регрессионную модель, их необходимо упорядочить и присвоить им те или иные
значения, т. е. качественные переменные преобразовать в количественные. Такого вида сконструированные переменные принято в эконометрике называть фиктивными переменными. Например, включать в модель фактор «пол» в виде фиктивной переменной можно в следующем виде: Коэффициент регрессии при фиктивной переменной интерпретируется как среднее изменение зависимой переменной при переходе от одной категории (женский пол) к другой (мужской пол) при неизменных значениях остальных параметров. На основе t-критерия Стьюдента делается вывод о значимости влияния фиктивной переменной, существенности расхождения между категориями. Типовая задача № 1 По 30 территориям России имеются данные, представленные в табл. 1. Таблица 1
Требуется: 1. Построить уравнение множественной регрессии в стандартизованной и естественной форме; рассчитать частные коэффициенты эластичности, сравнить их с b1 и b2 , пояснить различия между ними. 2. Рассчитать линейные коэффициенты частной корреляции и коэффициент множественной корреляции, сравнить их с линейными коэффициентами парной корреляции, пояснить различия между ними. 3. Рассчитать общий и частные F-критерии Фишера. Решение 1.
Линейное уравнение множественной регрессии y от х1 и х2 имеет вид: Расчет b-коэффициентов выполним по формулам
Получим уравнение: Для
построения уравнения в естественной форме рассчитаем Значение
Для
характеристики относительной силы влияния С
увеличением средней заработной платы
Различия
в силе влияния фактора на результат, полученные при сравнении 2. Линейные коэффициенты частной корреляции здесь рассчитываются по рекуррентной формуле:
Если
сравнить значения коэффициентов парной и частной корреляции, то приходим к
выводу, что из-за слабой межфакторной связи
Расчет
линейного коэффициента множественной корреляции выполним с использованием
коэффициентов
Зависимость
3.
Общий Сравнивая
Частные
Сравнивая
Целесообразность
включения в модель фактора
Низкое
значение |
|
|||||||||||||||||
|