Вы знаете, что такое корреляция. В Excel есть кнопка «CORREL». Но знаете ли вы, что, нажимая её на ценах акций, вы совершаете одну из самых дорогих ошибок в своей карьере?
Познакомьтесь с Карлом Пирсоном — математиком-бунтарём из 1890-х. Он хотел измерить танец данных. Результат — формула, которая сегодня управляет хедж-фондами, маркетингом и медицинскими исследованиями.
Но вот в чём подвох: 99% людей используют корреляцию неправильно. И расплачиваются миллионами.
Почему корреляция убивает ваш портфель, если вы не знаете этих 5 фактов
1. Корреляция не равна причинности.
Самый главный закон. Акции двух компаний могут двигаться синхронно годами (r=0,95), а потом разлететься в разные стороны. Почему? Потому что их связывал общий рынок, а не бизнес. Когда рынок падает — падают все. Но это не значит, что компании зависят друг от друга. Пример Тайлера Вигена: продажи айфонов коррелируют с безработицей во Франции (r=0,97). Серьёзно?
2. Никогда не считайте корреляцию на ценах. Только на доходностях.
Цены имеют тренд. Любые две цены с восходящим трендом дадут высокую корреляцию — даже у акций производителя пуговиц и космических спутников. Переходите на логарифмические доходности. Это убивает тренд и показывает реальную связь.
3. Один выброс меняет всё.
Представьте: 99 дней акции движутся независимо (r≈0). На 100-й день — кризис, обе падают на 10%. Одна точка. Корреляция всей выборки становится 0,6. Вы думаете: «Нашёл связь!» А это иллюзия. Всегда смотрите scatter plot. Удаляйте выбросы? Только если вы уверены, что это ошибка, а не чёрный лебедь.
4. Если связь нелинейна, Пирсон покажет ноль.
Y = X²? Идеальная зависимость. Коэффициент Пирсона? Ноль. Потому что он измеряет только линейную связь. Опционы, волатильность, кризисные хвосты — всё это нелинейно. Используйте ранговую корреляцию Спирмена.
5. p-value не делает вас богатым.
При выборке 1000 точек даже r=0,06 может быть «статистически значимым». Но можно ли на этом заработать? Нет. Сигнал утонет в шуме, комиссии съедят прибыль. Для трейдинга нужен |r| > 0,7 и стабильность во времени.
Как настоящий профи использует корреляцию?
Парный трейдинг: ищет два актива с r>0,8 и коинтеграцией (тест Энгла-Грейнджера). Торгует расхождение спреда.
Диверсификация: добавляет активы с r≈0 или отрицательной корреляцией. Но помнит: в кризис все корреляции стремятся к +1.
Хеджирование: использует отрицательную корреляцию (например, нефть и авиакомпании). Но проверяет стабильность скользящей корреляцией.
Инструменты, которые нужны каждому
Excel: =CORREL() — только для предварительного анализа, если знаете, что делаете.
Python (pandas): df.corr(), rolling().corr() — мощь скользящих окон.
R: cor.test() — сразу даёт доверительный интервал.
Главный навык XXI века — мыслить как корреляционный детектив
Не принимайте r на веру.
Всегда спрашивайте:
Посмотрел ли я scatter plot?
Это цены или доходности?
Что будет, если удалить один выброс?
Есть ли содержательный механизм связи?
Корреляция — не истина, а улика. И собирать улики нужно профессионально.
#корреляция #трейдинг #анализданных #финансы #статистика #datascience #книга #инвестиции