ПРИМЕНЕНИЕ ДАННЫХ ДЛЯ АНАЛИЗА ТАКТИЧЕСКИХ СХЕМ
Переведено специалистами SPORTUNIVER.
Оригинальная статья доступна по ссылке:

http://eightyfivepoints.blogspot.com/2019/11/using-data-to-analyse-team-formations.html

Недавно на Конференции по спортивной аналитике ФК «Барселона» я представил свою научную работу по определению и анализу тактических схем команд, применяя данные по отслеживанию передвижения игроков (перейти по ссылке и прокрутить вниз, чтобы найти документ). Я решил, что стоит опубликовать сокращенную версию в своем блоге. Доклад, удостоенный на конференции награды «лучшая научная работа», был написан совместно с Марком Гликманом из Лаборатории спортивной аналитики Гарварда.

Нужна сокращенная версия? Плакат можно увидеть, перейдя по этой ссылке, а рисунок можно посмотреть здесь.

Введение

Одной из ключевых задач тренера по футболу является выбор тактических схем команды – расстановки игроков на поле. Выбор схемы определяет роли игроков, способ их взаимодействия, а также влияет на стиль игры обеих команд во время матча. Несмотря на главную роль в командной стратегии, описания тактических схем в большей степени зависят от классификаций, основанных на количестве защитников, центральных защитников и нападающих: предварительные схемы расстановки игроков являются существенно более гибкими, подробными и зависящими от положения в игре, чем могут предложить схемы 4-4-2 и 3-5-2. Современные тренеры часто ссылаются на необходимость применения различных тактических схем для разных этапов игры, а также на необходимость адаптироваться к конкретным обстоятельствам.

Осуществить расширенный количественный анализ тактических схем команд в профессиональном футболе было непросто из-за трудности в получении доступа к большим выборкам данных по отслеживанию передвижения игроков. В рамках предыдущей работы по данной теме [1,2,3,4] было выдвинуто предположение, что тактические схемы остаются фиксированными и неизменными на протяжении всего матча, но эта оценка не позволяет воспользоваться большим объемом ценной информации и препятствует анализу того, как тактические изменения во время матча влияют на результат.

В нашей научной работе мы описывали новый основанный на данных метод для определения и классификации тактических схем в команде, представленных в качестве функции положения в игре, для анализа расстановки при атаке и защите в каждой команде, а также для динамического определения существенных тактических изменений во время матча. Мы применили нашу методику к большой выборке данных по отслеживанию игроков, используя алгоритмы машинного обучения для определения уникального ряда шаблонов расстановки, которые применялись командами из набора данных. Мы использовали результаты для изучения переходов между защитой и атакой, а также для анализа изменений в тактических схемах во время матчей.

Методика

Наша методика подразумевает три основных этапа для изучения тактических схем. Во-первых, мы разработали простой алгоритм для определения тактических схем в команде в качестве функции времени в течение матча, определив среднее значение расстояний между ближайшими игроками в моменты владения мячом. Далее, мы определили уникальные схемы в атаке и защите, применяемые командами из крупной выборки данных по отслеживанию игроков, посредством интеграционной иерархической кластеризации. Наконец, мы включили ряд определенных блоков тактических схем в байесовскую модель алгоритма выбора в целях динамической классификации схем, что поможет осуществить систематическое определение изменений в расстановках во время матчей.

Определение тактических схем в команде

Известно, что в любой момент времени полевые игроки охватывают преимущественно лишь небольшой участок поля, при этом игроки перемещаются согласованно, чтобы сохранить расстановку на поле. Таким образом, тактические схемы для команды определяются относительным положением игроков.

Рисунок 1 отображает позиции обороняющейся команды (то есть команды, не владеющей мячом) в четырех моментах времени в течение первого тайма. Очевидно, что в то время как команда занимает разные участки поля в каждый момент времени, игроки в основном занимают свои относительные позиции, сохраняя схему 4-3-3 (четыре защитника, три центральных защитника и трое нападающих).


Рисунок 1: Позиции полевых игроков обороняющейся команды в четырех моментах времени в течение матча. Закрашенная область обозначает выпуклую оболочку множества; голубая стрелка указывает на центр массы команды по отношению к центру поля.
Тактические схемы определяются посредством вычисления расстояния между каждым игроком и другими членами команды в последующие моменты времени в течение матча, усредняя значения расстояния между каждой парой игроков спустя определенное время, чтобы получить точный показатель их установленных относительных позиций. Результаты тактических схем для защиты и атаки вычисляются отдельно, объединяя последовательное владение мячом для каждой команды в несмежные периоды времени по две минуты. Из данного процесса мы исключаем владения мячом, которые длятся менее пяти секунд, предполагая, что они слишком непродолжительные и не позволяют командам выработать наступательную или оборонительную тактику. Более того, в случае замены, которая может сопровождаться сменой тактической схемы, мы завершаем момент, оставляя его в нашем анализе, если в нем есть данные как минимум по одной минуте в игре. В каждом моменте мы определяем тактические схемы во владеющей мячом команде и в команде соперника. В среднем мы получаем десять результатов тактических схем для защиты (отсутствие владения мячом) и десять результатов тактических схем для атаки (владение мячом) для каждой команды в течение матча. На рисунке 2 представлено четыре примера отдельных результатов тактических схем.
Рисунок 2: Четыре примера тактических схем, каждая определена в суммарном 2-минутном моменте владения мячом. Два верхних изображения демонстрируют тактические схемы для защиты (отсутствие владения мячом); два нижних изображения демонстрируют тактические схемы для атаки (владение мячом).
Рисунок 3 показывает полный ряд результатов тактических схем для одной команды во время одного матча. Очевидно, что при обороне (верхняя модель) команда играла в схеме 4-1-4-1 с одним центральным полузащитником и «блуждающим» форвардом. При владении мячом (нижняя модель) крайние полузащитники продвигались вперед, образуя переднюю тройку, а крайние защитники перемещались к опорному полузащитнику. Правый полузащитник играет немного глубже, чем левый полузащитник, привнося некоторую асимметрию в команду при атаке. Взаимное расположение игроков оборонительной линии в команде четко ограничено, а расстановка нападающих, в частности центрального нападающего, сформирована более широко, как при владении мячом, так и при обороне. В целом, площадь, которую занимали полевые игроки , при атаке была в два раза больше площади при защите. Согласованность результатов указывает на то, что тренер не вносил существенного изменения в тактическую схему во время матча.
Рисунок 3: Полный ряд результатов тактических схем для одной команды в течение всего матча. Верхняя схема демонстрирует результаты тактических схем для защиты, а нижняя схема показывает результаты тактических схем для атаки. В обоих случаях игра ведется справа налево. Согласованность результатов указывает на то, что во время матча в команде не проводилось существенного изменения тактической схемы.
Определение уникальных тактических схем

Мы применили описанную выше методику к данным по отслеживанию перемещения игроков из обучающей выборки 100 матчей, получив 3 976 результатов тактических схем для атаки и защиты. В данном разделе мы описываем применение интеграционной иерархической кластеризации в целях распределения по группам сходных результатов для определения ряда уникальных типов тактических схем, используемых командами во время данных матчей.

Ключевым было определение критерия для измерения сходства двух результатов тактических схем. Описание технических характеристик данного процесса представлено в Приложении 1, но в основном мы вычисляли «издержки» перехода от одной тактической схемы к другой: чем больше отличий у тактических схем, тем больше издержки. Наша методика определяет, что схемы могут быть одной формы (4-4-2), но одна тактическая схема может быть более расширенной, а другая более компактной. Ввиду того, что мы хотим разграничить тактические схемы по их форме, а не по площади, мы изменили одну из тактических схем во время сравнения так, чтобы фактор «компактность» больше не являлся классифицирующим.

Мы применяем интеграционную иерархическую кластеризацию к результатам тактических схем, определенных из нашей обучающей выборки матчей. В результате было определено 20 уникальных шаблонов или кластеров тактических схем, применяемых командами из нашей обучающей выборки. Результаты представлены на рисунке 4.
Рисунок 4: 20 уникальных кластеров тактических схем, определенных с помощью иерархической кластеризации, основанной на обучающей выборке тактических схем из 100 профессиональных матчей. Команды играют справа налево, а тактические схемы преобразуются в целях выравнивания центра массы с центром поля. Овалы обозначают область 1-сигма (68% доверительный интервал) для положения каждого игрока, определенного в результате индивидуальных наблюдений в каждом кластере. Информация в левом нижнем углу каждой схемы указывает на соотношение тактических схем для атаки и защиты в кластере (также эта информация отражена в виде зеленых и красных столбцов).
Существует четкое распределение кластеров, которое выделяет различие между тактическими схемами для защиты и атаки. Эта особенность отсутствовала в предыдущих анализах тактических схем в футболе. Верхний ряд на рисунке 4 содержит кластеры тактических схем с пятью защитниками и с разным количеством центральных защитников и нападающих. Эти кластеры в основном состоят из тактических схем для защиты. Следующие два ряда демонстрируют варианты оборонительной четверки: кластер 6 четко демонстрирует построение полузащитников в виде ромба, кластеры 9 и 10 представляют собой вариации схемы 4-3-3, кластер 11 – это схема 4-1-4-1, а кластер 12 – это 4-4-2. Кластеры в данных рядах включают в себя как тактические схемы для атаки, так и для защиты. Например, кластер 9 в большей степени состоит из результатов тактических схем для защиты, а кластер 10 составлен в основном из результатов тактических схем для атаки.

Пятый и шестой ряды содержат кластеры, которые практически полностью состоят из результатов тактических схем для атаки. Четвертый ряд включает в себя вариации схем 3-4-3 и 3-5-2, однако стандартная классификация представляет собой приблизительное описание данных тактических схем. Пятый ряд демонстрирует кластеры, в которых обычно лишь два защитника. Во всех четырех случаях позиции защитников были существенно продвинуты вперед.

В целом, очевидно, что иерархическая кластеризация успешно разделяет результаты тактических схем для защиты и атаки, хотя и не позволяет использовать разницу в их форме или занимаемой площади в качестве отличительной характеристики (ввиду использования нами коэффициента масштабирования kk, что указано в Приложении 1).

Классификация тактических схем

Заключительный этап нашей методики – это применение байесовской модели алгоритма выбора для оценки вероятности того, что новая определенная тактическая схема относится к каждому из 20 кластеров тактических схем на рисунке 4. Расчеты представлены в Приложении 2. Определение кластера максимальной вероятности для каждого результата тактических схем позволяет нам классифицировать результаты тактических схем в течение матча, а также динамически определять тактические изменения.

Результаты и анализ

Сначала мы изучили переход между защитой и атакой, определяя кластеры тактических схем для защиты и атаки, которые наиболее часто подбираются командами из нашего набора данных. На рисунке 5 мы графически изобразили пример такой подборки, используя диаграмму Сэнки. Левая часть диаграммы соответствует кластерам схем защиты, а правая часть – кластерам схем атаки. Линии между ними указывают на тактические схемы, которые применялись вместе, когда команды атаковали или оборонялись.
Рисунок 5: Два примера стандартных пар тактических схем для защиты и атаки. Тактические схемы, отмеченные синим цветом, указывают на то, что команды, играющие по схеме для защиты из кластера 2 (см. рисунок 4), переходят к схеме для защиты из кластера 16. Тактические схемы, отмеченные красным цветом, указывают на то, что команды, играющие по схеме для защиты 9, переходят к схемам для атаки 10 или 18. Все команды ведут игру справа налево.
Пример, отмеченный синим цветом, демонстрирует, что команды из нашей выборки, обороняющиеся с помощью кластера 2 (см. рисунок 4), при владении мячом переходили к кластеру 16. Связь между двумя тактическими схемами очевидна: крайние защитники или фланговые защитники продвигаются вперед, когда команда владеет мячом, а два крайних полузащитника располагаются за двумя нападающими.

Второй пример, отмеченный красным, показывает, что команды, использующие кластер 9 (4-3-3) при защите, перейдут к кластеру 10 или 18 при атаке: две эти тактические схемы имеют различия. В кластере 10 крайние нападающие рассредоточены шире, крайние защитники продвинулись вперед, а в кластере 18 передняя тройка сосредоточена рядом, в то время как крайние защитники продвигаются выше по полю, обеспечивая большую ширину.

Из этих примеров следуют два основных вывода. Во-первых, пары тактических схем для защиты и атаки являются согласованными: очевидна связь ролей каждого игрока при защите и нападении. Это свидетельствует о достоверности нашей методики. Во-вторых, некоторые схемы защиты обеспечивают большую гибкость в выборе вариантов атаки, чем другие.

Стратегические обзоры и изменения тактических схем

Динамическое определение и классификация тактических схем дают нам возможность составлять стратегические обзоры матчей, разъясняя оборонительные и атакующие расстановки каждой команды и определяя, когда возникли существенные тактические изменения.

Рисунок 6 демонстрирует план оборонительных и атакующих тактических схем на протяжении матча между двумя командами – Красной командой и Синей командой. Кружки означают результаты тактической схемы для атаки для каждой команды, классифицированные согласно кластерам на рисунке 4. Ромбы обозначают тактическую схему для защиты. Голы отражены в виде вертикальной пунктирной линии в верхней части рисунка. Замены обозначаются в виде вертикальной пунктирной линии в нижней части рисунка.

В этом матче Красная команда проигрывала со счетом 1-0 в первом тайме. Согласно схеме, тренер сделал замену и существенно изменил тактику со схемы 3-4-3 (кластеры 3 и 15 при защите и нападении соответственно) на 4-3-3 (кластеры 9 и 10). Вскоре после перерыва команда забила гол, но в итоге проиграла матч со счетом 2-1.
Рисунок 6: Стратегический обзор матча между Красной и Синей командами. Ромбы обозначают тактические схемы для защиты; кружки обозначают тактические схемы для атаки. Отметки на оси Y соответствуют номерам кластеров на рисунке 4.
Автоматическое выявление изменений тактических схем, а также данные о событиях помогают нам понимать, почему были осуществлены определенные тактические изменения, а кроме того, мы можем оценить их влияние на исход матча. На рисунке 7 представлен простой пример (описание матча, отличного от матча на рисунке 6: та же Красная команда, но другая Синяя команда). На правой части схемы представлены результаты тактической схемы для защиты Красной команды в первом и во втором тайме. На левой части схемы отражена карта пасов и ударов команды противника (удары слева направо); стрелки означают индивидуальные пасы, точки обозначают удары, а размер точки отражает качество момента.

В первом тайме Красная команда играла по схеме 4-3-3 в защите. Карта пасов Синей команды указывает на то, что в первом тайме они старались атаковать по флангам, создавая высококачественные моменты из прострелов, в частности из правого крыла. В перерыве Красная команда перешла на оборону из 5 игроков, при этом фланговые защитники опекали крайних атакующих полузащитников команды противника. Согласно карте пасов для второго тайма, изменение тактической схемы оказалось эффективным и не позволило Синей команде создавать моменты по правому флангу, при этом цель паса сместилась ближе к центру и левой части поля.
Рисунок 7: Изображение в правой части: результаты тактической схемы защиты Красной команды (игроки перемещаются справа налево) до и после первого тайма в матче с Синей командой. Изображения в левой части: пасы (стрелки) и удары (кружки) Синей команды (игроки перемещаются слева направо) в первом и втором таймах матча. Размеры кружков указывают на качество голевого момента. Следует обратить внимание на то, что изображенный здесь матч отличается от матча на рисунке 6.
Практическое применение

Наш анализ — это шаг к использованию данных об отслеживании перемещения игроков в целях определения и оценки стратегии команды в футболе. Описанная выше методика помогает командам понять, как тренер команды противника обычно реагирует на конкретные ситуации во время матча. Например, на рисунке 6 тренер Красной команды вносил сходные изменения в тактическую схему в перерыве (или близко к нему) более чем в четверти матчей из нашей базы данных, меняя небольшое количество схем на основании качества игры соперников и обстоятельств матча. Наша методика может применяться для прогнозирования и анализа изменений тактической схемы соперника.

Кроме того, она помогает нам детально изучать факторы, которые приводят к подрыву схемы защиты команды, а также понять, как это связано с созданием голевого момента. Сочетая классификацию тактических схем с участками контроля поля [11, 12, 13], мы можем определить вероятные слабые места в защите в определенных тактических схемах, а также понять, как команды могут этим воспользоваться.

В заключении стоит отметить, что нашу методику можно сделать более расширенной, чтобы изучить тактические схемы в более конкретных моментах владения мячом, например, при переходе от обороны к атаке, при перехвате мяча, продвижении вперед и создании голевого момента, а также чтобы внедрить данные о скорости игроков в целях определения и понимания способов опеки и прессинга перед воротами соперника.

Приложение 1: Сходство тактической схемы

В рамках нашего метода результат тактической схемы — это совокупность 10 двумерных нормальных распределений (одно для каждого полевого игрока), в которой среднее значение распределения представляет собой позицию игрока в тактической схеме (следует отметить, что тактические схемы перенесены таким образом, чтобы совпадали центры масс), а ковариационная матрица представляет оценку того, насколько далеко игрок отклонился от своей позиции во время двухминутного момента владения мячом, в течение которого произошло определение схемы.

Мы используем метрику Вассерштейна [5], чтобы количественно измерить сходство результатов для двух тактических схем. В простейшем случае двух двумерных нормальных распределений μ1=N(m1,C1)μ1=N(m1,C1) и μ2=N(m2,C2)μ2=N(m2,C2), при этом mm – это среднее значение, CC – ковариационная матрица, а квадрат метрики Вассерштейна представлен в следующей формуле [6]:

W(μ1,μ2)2 = ||m1 − m2||2 + след (C1 + C2 − 2 (C1/22C1C1/22) 1/2) W (μ1,μ2) 2 = ||m1 − m2||2 + след (C1 + C2 − 2 (C21/2C1C21/2) 1/2).

В случае точечных частиц расстояние Вассерштейна это квадратный корень нормы L2 разницы между средними значениями. В целом, метрика Вассерштейна является решением проблемы оптимального переноса [7], то есть это оценка издержек на перемещение из одной расстановки в другую.

Второй этап нашего алгоритма подразумевает обнаружение пары игроков в результатах двух тактических схем, которые могут уменьшить квадрат суммы расстояний Вассерштейна, то есть:

W2всего = min∑i∑jDijXij, W2всего=min∑i∑jDijXij,

где DijDij – издержки на перемещение (квадрат расстояния Вассерштейна) соответствующего игрока ii в тактической схеме 1 до игрока jj в тактической схеме 2, XijXij – матрица размещения «игрок-игрок», в которой каждый элемент равен 1, если игрок i соответствует игроку j, а в другом случае он равен нулю. Таким образом, в каждом ряду и в каждой колонке в XijXij должно быть девять 0 и одна 1. Мы применяем алгоритм Куна-Манкреса [8, 9], чтобы определить XijXij , которая сократит общие затраты.

Мы осуществили дополнительное расширение критериев для сходства команд. Два результата для тактических схем могут быть идентичными по форме (например, традиционная схема 4-4-2), но одна схема может быть более компактной, а другая более расширенной. Ввиду того, что мы хотим определить четкие формы схем, мы вводим изменяемый коэффициент масштабирования kk, который расширяет или сокращает схему вокруг центра массы (соответствующим образом определяя ковариантность для игрока). Сравнивая два результата тактических схем, мы ищем такое значение kk, которое может сократить расстояние Вассерштейна между игроками.

Приложение 2: Алгоритм классификации тактических схем

Байесовская модель алгоритма выбора для оценки вероятности того, что новая полученная тактическая схема относится к каждому из 20 кластеров тактических схем, указанных на рисунке 4, рассчитывается по формуле:

p(o|C) ∼ argmaxk ∏p = 110∫p (y|kμp,C,k2Σp,C) p (y|μp,o,Σp,o) dy,p(o|C)∼argmaxk∏p = 110∫p (y|kμp,C,k2Σp,C) p (y|μp,o,Σp,o) dy,

где μp,Cμp,C и Σp,CΣp,C – позиция и ковариационная матрица для роли pp в кластере CC, μp,oμp,o и Σp,oΣp,o – позиция и ковариационная матрица для игрока pp из результата для тактической схемы oo, kk – коэффициент масштабирования, описанный в Приложении 1, а интеграл вычисляется для площади поля. Чтобы наделить каждого игрока из результата для тактической схемы определенной ролью в кластере, мы решаем проблему расстановки игрока, применяя алгоритм Куна-Манкреса, который описан в Приложении 1.

Еще больше полезных материалов в сообществе профессионалов спортивной индустрии!

Вступайте в программу
и получайте больше бонусов
от SPORTUNIVER.
ОСТАВИТЬ ЗАЯВКУ НА КОНСУЛЬТАЦИЮ И ПОДБОР КУРСА
Нажимая кнопку отправить, вы соглашаетесь с политикой конфиденциальности и подтверждаете, что ваш возраст 18+ лет.
Также вам может быть интересно: