​Почему инвестбанки «лажают» в спортивных и финансовых прогнозах

3 сентября 2018 Банки  Нет комментариев

​Почему инвестбанки «лажают» в спортивных и финансовых прогнозах

Свои прогнозы на результаты матчей прошедшего чемпионата мира по футболу давали и футбольные эксперты, и букмекеры, и даже представители фауны. Не остались в стороне и ведущие инвестбанки, которые еще до начала первенства «определили» его победителя, применив алгоритмы анализа big data. Их выводы оказались ошибочными, что немедленно породило волну скепсиса и язвительных комментариев. Правы ли критики?

Поводом для размышлений послужил интернет-мем, ставший весьма популярным в соцсетях. Его репостило и лайкало огромное число пользователей. Привожу его без изменений: «UBS провел 10 000 симуляций по методу Монте-Карло в отношении участников чемпионата мира по футболу и предсказал победу в чемпионате мира — 2018 сборной Германии. Их коллеги из Goldman Sachs на основании 1 миллиона симуляций предсказали победу сборной Бразилии. Ни одна из этих сборных не дошла даже до полуфинала ЧМ. Оба банка используют те же технологии для аналитики финансовых рынков».

Для тех, кто не совсем понял, что именно имелось в виду, в чем проблема ошибочного прогноза (ведь, как известно, всем свойственно ошибаться), авторы мема заботливо дали пояснение: «P. S. теперь у вас есть представление о качестве прогнозов аналитических программ ведущих мировых инвестиционных банков».

С этой расшифровкой шутка стала гораздо понятнее, и многих охватила гордость за себя. Ведь так приятно убедиться в несостоятельности потенциального конкурента — искусственного интеллекта — по сравнению с Человеком.

Проблема в том, что подавляющее большинство тех, кто ставил лайки этому тексту, понятия не имеют, о чем идет речь. «Ужасные у них прогнозы! А вот я уже после группового турнира правильно назвал всех полуфиналистов!»

Попробую объяснить, что на самом деле произошло. Проще всего это сделать, прибегнув к аналогиям. Вот как звучит исходный текст в правильном переложении: «Две ведущие компании по производству хирургического оборудования приняли участие в ежегодном празднике лесорубов. Получилось у них хуже некуда. Но эти же инструменты они поставляют для проведения сложнейших операций во все ведущие клиники мира. P. S. Теперь у вас есть представление о качестве этих инструментов и оборудования».

На самом деле аналитические подразделения двух ведущих инвестбанков (их названия не столь важны, в любом крупном банке есть подобные подразделения) попытались применить свои алгоритмы анализа big data для прогноза результатов спортивного турнира. Но как раз этот турнир никак не подходит под само понятие big data. Просто потому, что отсутствует самая важная составляющая этого термина. А именно — big.

Почему одним из победителей была названа сборная Германии? Потому, что она обладает сбалансированным составом, опытными футболистами и демонстрирует стабильную игру. По всем параметрам они должны показывать игру высокого класса. И выиграть первенство. Но справедливо это только для игры вдолгую. Мундиаль же слишком скоротечен.

Фактически команды играют всего по три игры на групповом этапе, в которых исход может быть любым. Сразу после этого начинается плей-офф, «игры на выбывание». Причем значение этих игр, или их «удельный вес» (если употреблять математические термины), на порядок выше значения тех игр, которые проводились до этого. По сути, все сводится к одному матчу, результат которого невозможно предварительно описать, используя математические модели.

Применять методы анализа больших массивов данных для прогнозов коротких турниров в спорте бессмысленно. Да, попытаться можно, но попытки эти обречены на провал, что и продемонстрировали прогнозы инвестбанков.

Можно задать справедливый вопрос: а зачем тогда собирать и вести всю спортивную статистику? Количество пасов, километры пробега, удары в створ ворот? Дело в том, что существуют виды спорта, где big data и их анализ уже давно и успешно применяются. Самый яркий пример — бейсбол. Во-первых, в отличие от того же чемпионата мира по футболу бейсбольный сезон за океаном состоит из 162 матчей (!). Во-вторых, в отличие от полутора часов беспрерывного действа в футболе бейсбольный матч разбит на множество отдельных, стандартных эпизодов. И вот их уже не только можно, но и нужно обрабатывать статистически. Что и сделал в начале 2000-х Билл Джеймс, простой математик и любитель бейсбола, работавший в тот момент сторожем. Именно его идеи взял за основу Билли Бин, легендарный менеджер из Окленда, который построил новую команду, отталкиваясь от статистических данных недооцененных игроков. В 2002 году его команда установила рекорд в Главной лиге бейсбола более чем за 100 лет ее существования, выиграв подряд 20 матчей.

Справедливости ради отмечу, что Билли Бину так и не удалось выиграть Мировую серию (финальная часть Главной лиги). Но только потому, что и там есть матчи на выбывание, то есть, как мы уже знаем, с резко неоднородным весовым коэффициентом. Да и бюджета у команды было недостаточно. Зато Мировую серию позднее смог «взять» клуб из Бостона, «купивший» самого Билла Джеймса.

Я более чем уверен, что математические алгоритмы UBS и Goldman Sachs, неплохо работающие на финансовых рынках, справились бы и с бейсболом. Да и с футболом тоже, если бы, конечно, правила турнира были изменены. Но вот стоит ли? Чемпионат мира ценен именно своей непредсказуемостью и постоянным ожиданием чуда.

Иллюстрация к статье: Яндекс.Картинки
Самые оперативные новости экономики в нашей группе на Одноклассниках

Читайте также

Оставить комментарий

Вы можете использовать HTML тэги: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>