Корреляционный анализ — определение и вычисление с примерами решения
Содержание:
- Трехмерное представление диаграммы разброса (рассеивания)
- Выборочный коэффициент корреляции
- Диверсификация для снижения значений корреляции
- Распространенные заблуждения
- ковариации
- Как работает положительная корреляция
- Что такое корреляция?
- Бета и корреляция
- Пример применения метода корреляционного анализа
- Корреляция и взаимосвязь величин
- Понимание отрицательной корреляции
- Корреляция и диверсификация
- Коэффициент корреляции и ПАММ-счета
- Что такое положительная корреляция?
- Важность эталона для значений корреляции
- Формула для коэффициента Пирсона
- Положительные корреляции в микроэкономике
- Суть
- Положительная корреляция против обратной корреляции
Трехмерное представление диаграммы разброса (рассеивания)
Помимо традиционного 2D-представления диаграммы разброса в настоящее время используется 3D-отображение графического представления корреляционного анализа.
Также используется матрица диаграммы рассеивания, которая отображает все парные графики на одном рисунке в матричном формате. Для n переменных матрица содержит n строк и n столбцов. Диаграмма, расположенная на пересечении i-ой строки и j-ого столбца, представляет собой график переменных Xi по сравнению с Xj. Таким образом, каждая строка и столбец являются одним измерением, отдельная ячейка отображает диаграмму рассеивания двух измерений.
Выборочный коэффициент корреляции
Коэффициент корреляции обычно рассчитывают по выборке. Значит, у аналитика в распоряжении не истинное значение, а оценка, которая всегда ошибочна. Если выборка была репрезентативной, то истинное значение коэффициента корреляции находится где-то относительно недалеко от оценки. Насколько далеко, можно определить через доверительные интервалы.
Согласно Центральное Предельной Теореме распределение оценки любого показателя стремится к нормальному с ростом выборки. Но есть проблемка. Распределение коэффициента корреляции вблизи придельных значений не является симметричным. Ниже пример распределения при истинном коэффициенте корреляции ρ = 0,86.
Предельное значение не дает выйти за 1 и, как бы «поджимает» распределение справа. Симметричная ситуация наблюдается, если коэффициент корреляции близок к -1.
В общем рассчитывать на свойства нормального распределения нельзя. Поэтому Фишер предложил провести преобразование выборочного коэффициента корреляции по формуле:
Распределение z для тех же r имеет следующий вид.
Намного ближе к нормальному. Стандартная ошибка z равна:
Далее исходя из свойств нормального распределения несложно найти верхнюю и нижнюю границы доверительного интервала для z. Определим квантиль стандартного нормального распределения для заданной доверительной вероятности, т.е. количество стандартных отклонений от центра распределения.
cγ – квантиль стандартного нормального распределения;N-1 – функция обратного стандартного распределения;γ – доверительная вероятность (часто 95%).Затем рассчитаем границы доверительного интервала.
Нижняя граница z:
Верхняя граница z:
Теперь обратным преобразованием Фишера из z вернемся к r.Нижняя граница r:
Верхняя граница r:
Это была теоретическая часть. Переходим к практике расчетов.
Диверсификация для снижения значений корреляции
Как показывает практический опыт, обычно считается разумным, чтобы активы имели диапазон корреляции от -0,5 до примерно 0,5, хотя фактические числа будут варьироваться в зависимости от терпимости инвестора к риску. Например, не склонные к риску инвесторы захотят как можно меньше корреляции. Это тоже идея диверсификации.
Диверсифицированный портфель содержит активы, которые мало коррелируют друг с другом. Может быть определенное количество активов, которые действительно коррелируют, но есть также достаточно активов, которые не коррелируют, поэтому неблагоприятное движение рынка в одной области может не повлиять на другую, сводя к минимуму убытки.
Распространенные заблуждения
Корреляция и причинно-следственная связь
Традиционное изречение, что « корреляция не подразумевает причинно-следственную связь », означает, что корреляция не может использоваться сама по себе для вывода причинной связи между переменными. Это изречение не должно означать, что корреляции не могут указывать на потенциальное существование причинно-следственных связей. Однако причины, лежащие в основе корреляции, если таковые имеются, могут быть косвенными и неизвестными, а высокие корреляции также пересекаются с отношениями идентичности ( тавтологиями ), где не существует причинных процессов. Следовательно, корреляция между двумя переменными не является достаточным условием для установления причинно-следственной связи (в любом направлении).
Корреляция между возрастом и ростом у детей довольно прозрачна с точки зрения причинно-следственной связи, но корреляция между настроением и здоровьем людей менее очевидна. Приводит ли улучшение настроения к улучшению здоровья, или хорошее здоровье приводит к хорошему настроению, или и то, и другое? Или в основе обоих лежит какой-то другой фактор? Другими словами, корреляция может рассматриваться как свидетельство возможной причинной связи, но не может указывать на то, какой может быть причинная связь, если таковая имеется.
Простые линейные корреляции
Четыре набора данных с одинаковой корреляцией 0,816
Коэффициент корреляции Пирсона указывает на силу линейной связи между двумя переменными, но его значение, как правило, не полностью характеризует их взаимосвязь. В частности, если условное среднее из дано , обозначается , не является линейным в , коэффициент корреляции будет не в полной мере определить форму .
Y{\ displaystyle Y}Икс{\ displaystyle X}E(Y∣Икс){\ displaystyle \ operatorname {E} (Y \ mid X)}Икс{\ displaystyle X}E(Y∣Икс){\ displaystyle \ operatorname {E} (Y \ mid X)}
Прилегающие изображение показывает разброс участков из квартет энскомбы , набор из четырех различных пар переменных , созданный Фрэнсис Анскомбами . Четыре переменные имеют одинаковое среднее значение (7,5), дисперсию (4,12), корреляцию (0,816) и линию регрессии ( y = 3 + 0,5 x ). Однако, как видно на графиках, распределение переменных сильно отличается. Первый (вверху слева), кажется, распределен нормально и соответствует тому, что можно было бы ожидать, рассматривая две коррелированные переменные и следуя предположению о нормальности. Второй (вверху справа) не распространяется нормально; хотя можно наблюдать очевидную взаимосвязь между двумя переменными, она не является линейной. В этом случае коэффициент корреляции Пирсона не указывает на то, что существует точная функциональная связь: только степень, в которой эта связь может быть аппроксимирована линейной зависимостью. В третьем случае (внизу слева) линейная зависимость идеальна, за исключением одного выброса, который оказывает достаточное влияние, чтобы снизить коэффициент корреляции с 1 до 0,816. Наконец, четвертый пример (внизу справа) показывает другой пример, когда одного выброса достаточно для получения высокого коэффициента корреляции, даже если связь между двумя переменными не является линейной.
у{\ displaystyle y}
Эти примеры показывают, что коэффициент корреляции как сводная статистика не может заменить визуальный анализ данных. Иногда говорят, что примеры демонстрируют, что корреляция Пирсона предполагает, что данные следуют нормальному распределению , но это верно лишь отчасти. Корреляцию Пирсона можно точно рассчитать для любого распределения, имеющего конечную матрицу ковариаций , которая включает большинство распределений, встречающихся на практике. Однако коэффициент корреляции Пирсона (вместе с выборочным средним и дисперсией) является достаточной статистикой только в том случае, если данные взяты из многомерного нормального распределения. В результате коэффициент корреляции Пирсона полностью характеризует взаимосвязь между переменными тогда и только тогда, когда данные взяты из многомерного нормального распределения.
ковариации
Переменные могут быть связаны линейным отношением. Это отношение, которое последовательно аддитивно для двух выборок данных
Это соотношение можно суммировать между двумя переменными, называемыми ковариацией. Он рассчитывается как среднее произведение между значениями из каждого образца, где значения были отцентрированы (их среднее значение вычтено).
Расчет выборочной ковариации выглядит следующим образом:
Использование среднего значения в расчете указывает на необходимость того, чтобы каждая выборка данных имела гауссово или гауссовидное распределение.
Знак ковариации можно интерпретировать как изменение двух переменных в одном и том же направлении (положительное) или в разных направлениях (отрицательное). Величина ковариации не легко интерпретируется. Нулевое значение ковариации указывает, что обе переменные полностью независимы.
СОУ ()Функция NumPy может использоваться для вычисления ковариационной матрицы между двумя или более переменными.
Главная диагональ матрицы содержит ковариацию между каждой переменной и самой собой. Другие значения в матрице представляют ковариацию между двумя переменными; в этом случае два оставшихся значения одинаковы, учитывая, что мы рассчитываем ковариацию только для двух переменных.
Мы можем вычислить ковариационную матрицу для двух переменных в нашей тестовой задаче.
Полный пример приведен ниже.
Ковариационная и ковариационная матрицы широко используются в статистике и многомерном анализе для характеристики отношений между двумя или более переменными.
При выполнении примера вычисляется и печатается ковариационная матрица.
Поскольку набор данных был задуман для каждой переменной, взятой из гауссовского распределения, а переменные линейно коррелированы, ковариация является разумным методом для описания взаимосвязи.
Ковариация между двумя переменными составляет 389,75. Мы можем видеть, что это положительно, предполагая, что переменные изменяются в том же направлении, что и мы ожидаем.
Проблема с ковариацией как статистического инструмента заключается в том, что ее сложно интерпретировать. Это приводит нас к коэффициенту корреляции Пирсона дальше.
Как работает положительная корреляция
Совершенно положительная корреляция означает, что в 100% случаев рассматриваемые переменные движутся вместе в одном и том же проценте и в одном направлении. Можно увидеть положительную корреляцию между спросом на продукт и связанной с ним ценой. В ситуациях, когда доступное предложение остается неизменным, цена вырастет, если возрастет спрос.
Кроме того, прибыли или убытки на определенных рынках могут привести к аналогичным движениям на связанных рынках. По мере роста цен на топливо растут и цены на авиабилеты. Поскольку для работы самолетов требуется топливо, увеличение этой стоимости часто перекладывается на потребителя, что приводит к положительной корреляции между ценами на топливо и ценами на авиабилеты.
Положительная корреляция не гарантирует роста или выгоды. Вместо этого он используется для обозначения любых двух или более переменных, которые вместе движутся в одном направлении, поэтому, когда одна увеличивается, увеличивается и другая. Хотя корреляция существует, причинно-следственная связь может отсутствовать; таким образом, хотя некоторые переменные могут двигаться вместе, может быть неизвестно, почему это движение происходит.
Корреляция – это форма зависимости, где сдвиг в одной переменной означает, что изменение вероятно в другой, или что определенные известные переменные дают определенные результаты. Общий пример можно увидеть в спросе на дополнительные продукты. Если спрос на автомобили вырастет, возрастет и спрос на связанные с ними услуги, такие как шины. Увеличение в одной области влияет на дополнительные отрасли.
В некоторых ситуациях положительные психологические реакции могут вызвать положительные изменения в определенной области. Это можно продемонстрировать на финансовых рынках, когда общие положительные новости о компании приводят к повышению курса акций.
Ключевые моменты
- Положительная корреляция – это взаимосвязь между двумя переменными, в которой обе переменные движутся в тандеме, то есть в одном направлении.
- Положительная корреляция существует, когда одна переменная уменьшается по мере уменьшения другой переменной или когда одна переменная увеличивается, а другая увеличивается.
- Акции могут быть в некоторой степени положительно коррелированы друг с другом или с рынком в целом.
- Бета – это обычная мера того, насколько цена отдельной акции коррелирует с более широким рынком, часто с использованием индекса S&P 500 в качестве ориентира.
Что такое корреляция?
Корреляция измеряет степень, в которой движение двух разных переменных связано друг с другом. Корреляция – это статистическое измерение с использованием шкалы от -1,00 до +1,00.
-1,00 представляет собой идеальную отрицательную корреляцию, когда одна переменная падает точно на величину, на которую растет другая. Между тем корреляция +1.00 указывает на идеальную положительную корреляцию, при которой каждая переменная движется в точном тандеме. Если две переменные вообще не коррелированы (т. Е. Их движения полностью случайны или полностью не связаны друг с другом), корреляция будет в точности равна нулю.
Чтобы определить, существует ли отрицательная корреляция между двумя акциями, запустите линейную регрессию для отдельных цен акций, указав, что одна акция выступает в качестве зависимой переменной, а другая – в качестве независимой. Результат регрессии включает коэффициент корреляции и показывает, как две акции движутся по отношению друг к другу.
Бета и корреляция
Бета – это обычная мера того, насколько цена отдельной акции коррелирует с более широким рынком, часто с использованием индекса S&P 500 в качестве ориентира. Если у акции есть бета 1.0, это означает, что ее ценовая активность сильно коррелирована с рынком. Акция с бета 1,0 имеет систематический риск, но расчет бета не может обнаружить какой-либо несистематический риск. Добавление акций в портфель с бета-версией 1.0 не увеличивает риск для портфеля, но также не увеличивает вероятность того, что портфель обеспечит избыточную доходность.
Бета меньше 1,0 означает, что ценная бумага теоретически менее волатильна, чем рынок, а это означает, что портфель менее рискован с включенными акциями, чем без них. Например, акции коммунальных предприятий часто имеют низкие бета-ставки, потому что они имеют тенденцию двигаться медленнее, чем среднерыночные.
Бета, превышающая 1,0, указывает на то, что цена ценной бумаги теоретически более волатильна, чем рыночная. Например, если бета акции составляет 1,2, предполагается, что она на 20% более волатильна, чем рынок. Акции технологических компаний и компании с малой капитализацией, как правило, имеют более высокие значения бета, чем рыночный эталон. Это указывает на то, что добавление акций в портфель увеличит риск портфеля, но также увеличит его ожидаемую доходность.
У некоторых акций даже есть отрицательные беты. Бета -1,0 означает, что акции обратно коррелируют с рыночным эталоном, как если бы они были противоположным, зеркальным отображением тенденций эталонного теста. Опционы пут или обратные ETF предназначены для отрицательных бета-ставок, но есть несколько отраслевых групп, например, золотодобытчики, где отрицательная бета также является обычным явлением.
Пример применения метода корреляционного анализа
В Великобритании было предпринято любопытное исследование. Оно посвящено связи курения с раком легких, и проводилось путем корреляционного анализа. Это наблюдение представлено ниже. Исходные данные для корреляционного анализа
Профессиональная группа | курение | смертность |
Фермеры, лесники и рыбаки | 77 | 84 |
Шахтеры и работники карьеров | 137 | 116 |
Производители газа, кокса и химических веществ | 117 | 123 |
Изготовители стекла и керамики | 94 | 128 |
Работники печей, кузнечных, литейных и прокатных станов | 116 | 155 |
Работники электротехники и электроники | 102 | 101 |
Инженерные и смежные профессии | 111 | 118 |
Деревообрабатывающие производства | 93 | 113 |
Кожевенники | 88 | 104 |
Текстильные рабочие | 102 | 88 |
Изготовители рабочей одежды | 91 | 104 |
Работники пищевой, питьевой и табачной промышленности | 104 | 129 |
Производители бумаги и печати | 107 | 86 |
Производители других продуктов | 112 | 96 |
Строители | 113 | 144 |
Художники и декораторы | 110 | 139 |
Водители стационарных двигателей, кранов и т. д. | 125 | 113 |
Рабочие, не включенные в другие места | 133 | 146 |
Работники транспорта и связи | 115 | 128 |
Складские рабочие, кладовщики, упаковщики и работники разливочных машин | 105 | 115 |
Канцелярские работники | 87 | 79 |
Продавцы | 91 | 85 |
Работники службы спорта и отдыха | 100 | 120 |
Администраторы и менеджеры | 76 | 60 |
Профессионалы, технические работники и художники | 66 | 51 |
Начинаем корреляционный анализ. Решение лучше начинать для наглядности с графического метода, для чего построим диаграмму рассеивания (разброса).
Она демонстрирует прямую связь. Однако на основании только графического метода сделать однозначный вывод сложно. Поэтому продолжим выполнять корреляционный анализ. Пример расчета коэффициента корреляции представлен ниже.
С помощью программных средств (на примере MS Excel будет описано далее) определяем коэффициент корреляции, который составляет 0,716, что означает сильную связь между исследуемыми параметрами. Определим статистическую достоверность полученного значения по соответствующей таблице, для чего нам нужно вычесть из 25 пар значений 2, в результате чего получим 23 и по этой строке в таблице найдем r критическое для p=0,01 (поскольку это медицинские данные, здесь используется более строгая зависимость, в остальных случаях достаточно p=0,05), которое составляет 0,51 для данного корреляционного анализа. Пример продемонстрировал, что r расчетное больше r критического, значение коэффициента корреляции считается статистически достоверным.
Корреляция и взаимосвязь величин
Значительная корреляция между двумя случайными величинами всегда является свидетельством существования некоторой статистической связи в данной выборке, но эта связь не обязательно должна наблюдаться для другой выборки и иметь причинно-следственный характер. Часто заманчивая простота корреляционного исследования подталкивает исследователя делать ложные интуитивные выводы о наличии причинно-следственной связи между парами признаков, в то время как коэффициенты корреляции устанавливают лишь статистические взаимосвязи. Например, рассматривая пожары в конкретном городе, можно выявить весьма высокую корреляцию между ущербом, который нанёс пожар, и количеством пожарных, участвовавших в ликвидации пожара, причём эта корреляция будет положительной. Из этого, однако, не следует вывод «увеличение количества пожарных приводит к увеличению причинённого ущерба», и тем более не будет успешной попытка минимизировать ущерб от пожаров путём ликвидации пожарных бригад. Корреляция двух величин может свидетельствовать о существовании общей причины, хотя сами явления напрямую не взаимодействуют. Например, обледенение становится причиной как роста травматизма из-за падений, так и увеличения аварийности среди автотранспорта. В этом случае две величины (травматизм из-за падений пешеходов и аварийность автотранспорта) будут коррелировать, хотя они не связаны причинно-следственно друг с другом, а лишь имеют стороннюю общую причину — гололедицу.
В то же время, отсутствие корреляции между двумя величинами ещё не значит, что между ними нет никакой связи. Например, зависимость может иметь сложный нелинейный характер, который корреляция не выявляет.
Некоторые виды коэффициентов корреляции могут быть положительными или отрицательными. В первом случае предполагается, что мы можем определить только наличие или отсутствие связи, а во втором — также и её направление. Если предполагается, что на значениях переменных задано отношение строгого порядка, то отрицательная корреляция — корреляция, при которой увеличение одной переменной связано с уменьшением другой. При этом коэффициент корреляции будет отрицательным. Положительная корреляция в таких условиях — это такая связь, при которой увеличение одной переменной связано с увеличением другой переменной. Возможна также ситуация отсутствия статистической взаимосвязи — например, для независимых случайных величин.
Понимание отрицательной корреляции
Когда две переменные коррелированы, относительные изменения их значений кажутся связанными. Эта закономерность может быть результатом той же основной причины или может быть чистым совпадением
Таким образом, важно понимать пословицу «корреляция не подразумевает причинно-следственной связи». Тем не менее корреляция – важный статистический инструмент, используемый для измерения силы взаимосвязи между двумя или более переменными
Эта мера выражается численно коэффициентом корреляции, иногда обозначаемым буквой «r» или греческой буквой ро (ρ). Значения, присвоенные коэффициентам корреляции, находятся в диапазоне от -1,0 до 1,0. «Идеальная» положительная корреляция +1,0 будет означать, что две переменные движутся точно синхронно друг с другом, поэтому, если переменная A увеличивается на два, то же самое делает и переменная B. «Идеальная» отрицательная корреляция -1,0, напротив, означает что две переменные движутся в противоположных направлениях с равной величиной – если A увеличивается на два, B уменьшается на два.
В действительности, очень немногие факторы полностью коррелированы в любом случае, и коэффициент корреляции будет находиться где-то в пределах отрицательного однозначного диапазона
Обратите внимание, что корреляция, равная нулю, предполагает, что нет никакой связи между двумя переменными, и их движения совершенно не связаны или случайны друг с другом
Отрицательные корреляции возникают естественным образом во многих контекстах. Например, с увеличением количества снегопадов на дороге появляется все меньше водителей. Или, когда корова становится старше, ее молочная продуктивность падает. Чем больше вы тренируетесь, тем больше худеете. Чем больше кошек по соседству, тем меньше мышей. Отрицательные корреляции также появляются в мире экономики и финансов.
Корреляция и диверсификация
Как знания о корреляции активов могут помочь лучше вкладывать деньги? Думаю, вы все хорошо знакомы с золотым правилом инвестора — не клади все яйца в одну корзину. Речь, естественно, идёт о диверсификации, которая неразрывно связана с понятием корреляции. Это улавливается даже из названия — английское diversify означает «разнообразить», а как коэффициент корреляции как раз показывает схожесть или различие двух явлений.
Другими словами, инвестировать в финансовые инструменты с высокой корреляцией не очень хорошо. Почему? Все просто — похожие активы плохо диверсифицируются. Вот пример портфеля двух активов с корреляцией +1:
Как видите, график портфеля во всех деталях повторяет графики каждого из активов — рост и падение обоих активов синхронны. Диверсификация в теории должна снижать инвестиционные риски за счёт того, что убытки одного актива перекрываются за счёт прибыли другого, но здесь этого не происходит совершенно. Все показатели просто усредняются:
Портфель даёт небольшой выигрыш в снижении рисков — но только по сравнению с более доходным Активом 1. А так, никаких преимуществ по сути нет, нам лучше просто вложить все деньги в Актив 1 и не париться.
А вот пример портфеля двух активов с корреляцией близкой к 0:
Где-то графики следуют друг за другом, где-то в противоположных направлениях, какой-либо однозначной связи не наблюдается. И вот здесь диверсификация уже работает:
Мы видим заметное снижение СКО, а значит портфель будет менее волатильным и более стабильно расти. Также видим небольшое снижение максимальной просадки, особенно если сравнивать с Активом 1. Инвестиционные инструменты без корреляции достаточно часто встречаются и из них имеет смысл составлять портфель.
Впрочем, это не предел. Наиболее эффективный инвестиционный портфель можно получить, используя активы с корреляцией -1:
Уже знакомое вам «зеркало» позволяет довести показатели риска портфеля до минимальных:
Несмотря на то, что каждый из активов обладает определенным риском, портфель получился фактически безрисковым. Какая-то магия, не правда ли? Очень жаль, но на практике такого не бывает, иначе инвестирование было бы слишком лёгким занятием.
Коэффициент корреляции и ПАММ-счета
С расчётом корреляции я как студент экономического ВУЗа познакомился еще на втором курсе
Тем не менее, долгое время недооценивал важность расчёта корреляции именно для подбора ПАММ-портфеля. 2018 год очень четко показал, что ПАММ-счета с похожими стратегиями в случае кризиса могут вести себя очень похоже
Случилось так, что с середины года отказала не просто одна стратегия управляющего, а большинство торговых систем, завязанных на активные движения валютной пары EUR/USD:
Рынок был для каждого управляющего по-своему неблагоприятным, но присутствие их всех в портфеле привело к большой просадке. Совпадение? Не совсем, ведь это были ПАММ-счета с похожими элементами в торговых стратегиях. Без опыта торговли на рынке Форекс может быть сложно понять, как это работает, но по корреляционной таблице степень взаимосвязи видна и так:
Мы ранее рассматривали корреляцию вплоть до +1, но как видите на практике даже совпадение в районе 20-30% уже говорит о некоторой схожести ПАММ-счетов и, как следствие, результатов торговли.
Чтобы снизить шансы на повторение ситуации, как в 2018 году, я считаю в портфель стоит подбирать ПАММ-счета с низкой взаимной корреляцией. По сути, нам нужны уникальные стратегии с разными подходами и разными валютными парами для торговли. На практике, конечно, сложнее подобрать прибыльные счета с уникальными стратегиями, но если хорошо покопаться в рейтинге ПАММ-счетов, то все возможно. К тому же, низкая взаимная корреляция снижает требования для диверсификации, 5-6 счетов вполне хватит.
Пару слов о расчёте коэффициента корреляции для ПАММ-счетов. Достать сами данные относительно несложно, в Альпари прямо с сайта, для остальных площадок через сайт investflow.ru. Однако с ними нужно сделать небольшие преобразования.
Данные о прибыльности ПАММов изначально хранятся в формате накопленной доходности, нам это не подходит. Корреляция стандартных графиков доходности двух прибыльных ПАММ-счетов всегда будет очень высокой, просто потому что они все движутся в правый верхний угол:
У всех счетов положительная корреляция от 0.5 и выше за редким исключением, так мы ничего не поймем. Реальное сходство стратегий ПАММ-счетов можно увидеть только по дневным доходностям. Рассчитать их не особо сложно, если знаете нужные формулы доходности. Если прибыль или убыток двух ПАММ-счетов совпадают по дням и по процентам, высока вероятность что их стратегии имеют общие элементы — и коэффициент корреляции нам это покажет:
Как видите, некоторые корреляции стали нулевыми, а некоторые остались на высоком уровне. Мы теперь видим, какие ПАММ-счета действительно похожи между собой, а какие не имеют ничего общего.
Напоследок давайте разберёмся, что делать и как посчитать корреляцию, если у вас появилась в этом необходимость.
Что такое положительная корреляция?
Положительная корреляция – это взаимосвязь между двумя переменными, в которой обе переменные движутся в тандеме, то есть в одном направлении. Положительная корреляция существует, когда одна переменная уменьшается по мере уменьшения другой переменной или когда одна переменная увеличивается, а другая увеличивается.
Ключевые выводы
- Положительная корреляция – это взаимосвязь между двумя переменными, в которой обе переменные движутся в тандеме, то есть в одном направлении.
- Положительная корреляция существует, когда одна переменная уменьшается, когда другая переменная уменьшается, или одна переменная увеличивается, а другая увеличивается.
- Акции могут иметь определенную положительную корреляцию друг с другом или с рынком в целом.
- Бета – это обычная мера того, насколько цена отдельной акции коррелирует с более широким рынком, часто с использованием индекса S&P 500 в качестве ориентира.
Важность эталона для значений корреляции
Понимание того, как соотносятся ваши инвестиции, важно для понимания того, как управлять рисками конкретного портфеля. Если ваша инвестиционная стратегия должна соответствовать определенному эталону, например индексу, проверьте, насколько финансовые показатели в вашем портфеле сравниваются с показателями эталонного теста
Это позволит вам оценить правильность ваших инвестиций, степень риска вашего портфеля и другие важные факторы.
Контрольный показатель для значений корреляции служит ориентиром и может уведомить управляющего портфелем, если в портфеле необходимо внести какие-либо корректировки. Это также покажет, как портфель может работать в будущем, что может помочь подготовиться к любым убыткам.
Формула для коэффициента Пирсона
Формула для коэффициента корреляции между двумя переменными, которые имеютлинейное отношениеявляется:
Формула для коэффициента корреляции между переменными X и Y
Две сигмы в знаменателе являются стандартными отклонениями соответствующих переменных. Мы будем анализироватьковариациив немного.
Между тем отметим, что при расчете по приведенной выше формуле коэффициент корреляции называетсяКоэффициент корреляции Пирсона.Он представлен символом ‘р’При использовании для образца и по символурокогда используется для всей совокупности ценностей.
Если вы хотите использовать «популяционную версию» этой формулы, обязательно используйте «популяционные формулы» для ковариации и стандартного отклонения.
Положительные корреляции в микроэкономике
Микроэкономика, которая анализирует отдельных потребителей и фирмы, показывает множество примеров положительной корреляции между переменными, одним из наиболее распространенных является связь между спросом и ценой. Когда студенты изучают микроэкономику и статистику, одна из первых концепций, которые они изучают, – это закон спроса и предложения и его влияние на цену. Кривая спроса и предложения показывает, что, когда спрос увеличивается без сопутствующего увеличения предложения, происходит соответствующее увеличение цены. Точно так же, когда снижается спрос на товар или услугу, падает и их цена.
Взаимосвязь между спросом и ценой является примером причинно-следственной связи, а также положительной корреляции. Увеличение спроса вызывает соответствующее увеличение цены; цена товара или услуги увеличивается именно потому, что больше потребителей хотят их и, следовательно, готовы платить за них больше. Когда спрос снижается, это означает, что меньше людей хотят товар, и продавцы должны снижать его цену, чтобы побудить людей купить его.
Напротив, предложение отрицательно коррелирует с ценой. Когда предложение уменьшается без соответствующего уменьшения спроса, цены растут. То же количество потребителей теперь конкурирует за меньшее количество товаров, что делает каждый товар более ценным в глазах потребителя.
(См. Также: Как отрицательные корреляции используются в управлении рисками? )
Суть
Отрицательные корреляции описывают взаимосвязь между факторами, которые движутся в противоположных направлениях. Хотя отрицательные корреляции возникают в нескольких контекстах, они особенно интересны в финансовом мире, поскольку отрицательно коррелированные активы имеют фундаментальное значение для диверсификации портфеля и стратегий снижения рисков. Хотя обратные отношения могут сохраняться, корреляция не обязательно означает причинно-следственную связь. Более того, корреляции имеют тенденцию сдвигаться и меняются как по силе, так и по направлению с течением времени.
Положительная корреляция против обратной корреляции
В статистике положительная корреляция описывает взаимосвязь между двумя переменными, которые изменяются вместе, в то время как обратная корреляция описывает взаимосвязь между двумя переменными, которые изменяются в противоположных направлениях. Обратную корреляцию иногда называют отрицательной корреляцией. Примеры положительной корреляции встречаются в повседневной жизни большинства людей. Например, чем больше часов работает сотрудник, тем больше будет его зарплата в конце недели. Чем больше денег тратится на рекламу, тем больше клиентов покупают у компании.
Обратные корреляции описывают два фактора, которые колеблются относительно друг друга. Примеры включают уменьшение баланса в банке по сравнению с увеличением привычки тратить и сокращение расхода топлива по сравнению с увеличением средней скорости движения. Одним из примеров обратной корреляции в мире инвестиций является взаимосвязь между акциями и облигациями. По мере роста цен на акции рынок облигаций имеет тенденцию к снижению, так же как рынок облигаций чувствует себя хорошо, когда акции не работают.
Важно понимать, что корреляция не обязательно подразумевает причинно-следственную связь. Переменные A и B могут расти и падать вместе, или A может расти, когда B падает, но не всегда верно, что рост одного фактора напрямую влияет на рост или падение другого
И то, и другое может быть вызвано лежащим в основе третьим фактором, например ценами на сырьевые товары, или очевидная взаимосвязь между переменными может быть совпадением.
Например, количество людей, подключенных к Интернету, росло с момента его появления, и цена на нефть в целом за тот же период росла. Это положительная корреляция, но эти два фактора почти наверняка не имеют значимого отношения. То, что как количество пользователей Интернета, так и цены на нефть увеличились, можно объяснить третьим фактором, а именно общим ростом в связи с прошедшим временем.