luckyea77 (luckyea77) wrote,
luckyea77
luckyea77

Category:

Как большие данные меняют большой спорт



Источник

Профессиональный спорт — серьезный бизнес, поэтому ожидаемо коммерческое применение в нем больших данных. Но, позволяя значительно улучшать спортивные результаты спортсменов и команд, они заставляют принимать во внимание и новые риски

На сегодня сегмент систем мониторинга и аналитики в спорте оценивается в $764,3 млн, а к 2023 году ему предрекают рост до $15,5 млрд. У больших данных в спорте есть серьезный потенциал, но это игра вдолгую: ценность аналитики данных растет с их накоплением.

Для игровых видов спорта лучше всего подходят системы аналитики объемных массивов статистической информации, позволяющие обнаруживать скрытые паттерны в действиях команды по ходу сезона и корректировать тактические схемы, выявлять незаметные слабые и сильные места игроков, а также разбирать игру соперника на ближайший матч.

Данные дают результаты

Практически в каждом игровом виде спорта сегодня используются свои показатели и коэффициенты эффективности действий игроков и команды в целом, которые ранее аналитики попросту не выявляли и не использовали.

Так, показатель CORSI в хоккее (соотношение бросков: в створ ворот, мимо ворот и заблокированных игроками соперника) помогает менеджменту команды выявлять наиболее эффективных игроков в составе, составляя из них оптимальные сочетания, что приводит к повышению результативности клуба. Также выявляются и самые слабые — при этом вовсе не обязательно очевидные — звенья в игровой схеме команды в перспективе будущих корректировок (перевод игрока на другую позицию, подбор новых партнеров или обмен).

Одним из адептов применения CORSI в практике управления клубом в НХЛ стала команда «Торонто Мэйпл Лифс», совсем недавно начавшая попадать в плей-офф после долгого перерыва. В этом году ее и вовсе называют одним из претендентов на победу в Кубке Стэнли.

По такому же принципу работает футбольный показатель xG — «ожидаемые голы». Это система, позволяющая оценивать каждый удар по воротам с максимальной детализацией, принимая во внимание все составляющие, которые привели к нанесению удара (позиция бьющего относительно ворот, какой частью тела бил игрок, из какой части поля он получил передачу, точность удара, результат — гол, аут, угловой, продолжение игры — и т. д.).

Анализируя xG команды по итогам игры, тренерский штаб получает максимально объективную картину действий своих игроков. Выявляются эффективные и неэффективные игровые паттерны, связки игроков, закономерности, очевидные при более «грубом» анализе, — например, «удары в створ ворот». Аналогичную роль в баскетболе играют показатели Win Shares и VORP, в бейсболе — саберметрика.

Детальный разбор игровых действий каждого игрока, различных линий (обороны, атаки) команды и коллектива в целом в сопоставлении с данными о тренировках и восстановлении открывают новые горизонты развития спорта.

Будущее, которое уже наступило

Собственно, большие данные в спорте уже используются, и большой тайны в этом нет. Все помнят полуфинал Кубка мира по футболу 2014 между Бразилией и Германией (1:7). Немецкая федерация футбола после сенсационного разгрома охотно делилась вкладом продвинутого анализа игры. Дескать, никакого чуда, мы просто их просчитали, отталкиваясь от игры.

Прежде всего, анализ игры с помощью инструментов big data позволил существенно увеличить скорость перепасовки в центре поля — по ходу турнира команда повышала этот показатель, и к полуфиналу с Бразилией со средних 3,4 с на одну передачу научилась тратить всего 1,1 с.

Воспользовавшись перекосом состава бразильцев в пользу атакующей линии в ущерб середине поля, а также рядом неочевидных кадровых решений тренерского штаба латиноамериканцев (защитник Марсело играл под нападающими), немцы буквально растерзали хозяев чемпионата мира.

Бейсбольные «Оклендс Атлетикс» в середине 2000-х показывали невероятную эффективность. С помощью глубокого анализа больших данных они собирали сверхдешевые составы из никому не известных или всеми забытых игроков и выходили в плей-офф 4 раза подряд, а всего — 5 раз за 7 сезонов.

Клуб английской футбольной Премьер-лиги «Лестер» сотворил настоящую футбольную сенсацию в 2016 году, став впервые в своей истории обладателем почетного титула. Это произошло во многом благодаря внедрению в тренировочный и игровой процесс многокомпонентной системы digital-инструментов сбора и обработки информации, описывающей различные параметры игры.

Отметим, что одним из пионеров научного data-ориентированного подхода к тренировочному процессу, развитию игроков и созданию тактического рисунка под конкретного противника был СССР, где комплексную аналитическую работу с помощью ЭВМ проводили еще на стыке 70-80-х годов прошлого века.

Большие данные решают не все

Несмотря на осязаемые результаты применения Big Data в большом спорте, а также вполне реальные перспективы их использования в новых областях, возникают и новые угрозы.

Во-первых, чем больше в профессиональном спорте зависит от данных, тем большую ценность они представляют и тем большие риски возникают при их утечках. В индустрии используются все больше датчиков и носимых устройств, данные с которых чрезвычайно важны.

Производители таких устройств пока мало заботятся о кибербезопасности, допуская риск взлома и кражи ценных сведений. Так, в 2018 году данные 150 млн пользователей фитнес-трекеров MyFitnessPal оказались скомпрометированными в результате утечки — по сути, аналогичные носимые устройства используются профессиональными командами во всех игровых видах спорта.

Ряд спортивных состязаний завязан на данных. Например, гонки «Формулы-1» — здесь ущерб от взлома, утечки или подмены информации станет катастрофическим, вплоть до летальных исходов, если исказить отчет о работе двигателя или ходовой болида.

Во-вторых, важнейший и пока еще плохо осознаваемый тип угроз от Big Data в спорте — переоценка возможностей ИИ, а также недооценка традиционных для большого спорта компонентов: психологии победителя, факторов травмы ведущих игроков по ходу турнира или матча, низкий уровень настроя фаворита в матче с аутсайдером.

Знаменитый Moneyball одного из апологетов спортивной аналитики Билли Бина в итоге не сработал. Несмотря на чудеса оптимизации соотношения «состав/результат», «Окленд» в 2000-х ни разу не выходил в финал чемпионата лиги. Победы продолжают одерживать клубы с суперзвездами за сотни миллионов долларов в составе.

Можно предположить, что в хоккейном финале Олимпиады-2018 Россия победила Германию не благодаря продвинутой системе аналитики игры и тонко продуманной тактической схеме, а в первую очередь за счет выдающейся индивидуальной игры Никиты Гусева.

Наконец, в свете успеха на чемпионате мира 2014 можно не сомневаться, что сборная Германии к первенству 2018 года в России готовилась по тем же лекалам и на основе тех же умных технологий, которые принесли ей триумф в Бразилии. Однако никакой ИИ не научил «манншафт», как не проиграть 0:2 Южной Корее в решающей игре.

Анализ Big Data в большом профессиональном спорте, скорее всего, никогда не станет волшебной палочкой, взмах которой принесет гарантированную победу в Лиге чемпионов, на Кубке мира или Олимпиаде. Спортивным менеджерам еще только предстоит понять, что именно за инструмент оказался в их руках и на что они могут рассчитывать при его применении.

Однако командам, обладающим сравнимыми ресурсами, необходимо учиться работе с большими данными: сегодняшние отличники в этой области подготовки, скорее всего, завтрашние чемпионы.

Автор: Александр Смирнов, руководитель практики Data Science Teradata Россия

Tags: спорт, технологии
Subscribe

Posts from This Journal “спорт” Tag

promo luckyea77 june 21, 2015 20:04 29
Buy for 10 tokens
В этой записи я буду давать ссылки на посты с лекциями и уроками в этом блоге: Учебные материалы и тесты: 11 ресурсов для бесплатного образования Онлайн-курсы по высоким технологиям и инновациям Дистанционное образование в России (среднее профессиональное образование, бакалавриат, магистратура,…
  • Post a new comment

    Error

    default userpic

    Your IP address will be recorded 

    When you submit the form an invisible reCAPTCHA check will be performed.
    You must follow the Privacy Policy and Google Terms of use.
  • 0 comments