Вся футбольная аналитика: объясняем современные метрики

С момента своего появления футбол был игрой чисел. Да, это жёсткое и красивое противостояние выдающихся атлетов. Но по сути это двадцать два игрока, которые пытаются набрать десять ярдов за четыре попытки, или помешать это сделать, и этот цикл повторяется раз за разом. Тачдаун всегда приносит шесть очков, филд-гол — три, сэйфти — два, а экстра-пойнт — одно.

Эта постоянная структура позволяет нам описывать происходящее на поле с помощью чисел и статистических показателей. По мере того, как тренеры, журналисты и фанаты использовали числа, эти показатели становились всё более сложными. Попробуем объяснить, что означают самые актуальные современные метрики и как их следует понимать.

EPR

Что это такое? Ожидаемый рейтинг силы. Это рейтинг силы команды, сочетающий в себе её результаты в прошлом и текущем сезонах. Он предсказывает, сколько очков наберёт команда против среднего соперника на нейтральном поле.

Как его использовать? Совокупная разница очков команды, описанная ниже, это очень полезный индикатор её силы. Фактически, разница в очках между командами в конце сезона может объяснить 17% вариантов того, какой она окажется через год, в конце следующего сезона. Однако не все варианты набора очков будут верны через год или даже в следующем матче. Драйв на 80 ярдов с тачдауном и эффективными розыгрышами на ранних даунах? Это признак сильной команды. Тачдаун на 80 ярдов после подобранного защитой фамбла? Больше результат удачи, нежели умения. Используя модель ожидаемых очков, мы можем учесть, как команда двигала мяч и получить более точную оценку её силы.

В показателе EPR есть две ключевых составляющих: предсезонный прогноз и сезонный прогноз. Первый основан на результатах предыдущего сезона, и его точность является важнейшей, так как служит основой модели в течение нескольких первых недель нового сезона. Предсезонный прогноз объясняет 21% разброса в итоговой разнице очков в новых сезонах — это значительно лучше обычной модели разницы очков команды. Рассмотрим на конкретном примере. Чикаго завершили сезон 2018 года с разницей очков +138, что стало четвёртым по величине показателем в лиге. Согласно этому показателю в 2019 году команда должна была быть четвёртой по силе, однако большинство этих очков было набрано благодаря хорошей игре защиты и потерям соперника, которые с меньшей вероятностью повторятся в следующем сезоне. Предсезонный же показатель EPR Чикаго лучше оценивал команду с учётом этого контекста и давал результат «немного лучше средней команды». В итоге Медведи закончили сезон 2019 года с результатом 8—8 и небольшой отрицательной разницей очков.

Сезонный показатель EPR команды это комбинация её текущих результатов и предсезонного прогноза, при этом больший вес приобретают именно результаты. Он является параметром, который с высокой точностью предсказывает выступление команды в оставшейся части сезона.

График ниже показывает, как работает EPR в сравнении с другими показателями, оценивающими общую силу команды. Ось Y это коэффициент детерминации R2, который можно представить как «в какой степени показатель определяет будущую эффективность выступления команды».

Модель QB с корректировкой Эло от FiveThirtyEight лучше работает в начале сезона, возможно, потому что она использует информацию с рынка букмекеров. Но уже после четырёх сыгранных матчей EPR начинает работать точнее при определении команд, у которых будет наилучшая разница очков. Общий показатель DVOA не использует предсезонную информацию. Более высокие показатели на этом графике имел бы показатель DAVE от Football Outsiders, но по нему недоступны исторические еженедельные данные. Снижение эффективности всех показателей после десяти сыгранных матчей связано с тем, что до конца сезона остаётся меньше матчей и случайность, присущая любому спорту, приобретает больший вес. Отметим, что все метрики этого графика имеют свои преимущества. Разница в очках это самых простой способ оценить силу команд. Общий DVOA легко интерпретировать, присваивая ценность каждому юниту команды. Метод QB с корректировкой Эло легко рассчитывается, его формула есть в свободном доступе. Показатель EPR менее интерпретируем, не даёт отдельной оценки нападению или защите, но он наиболее точно отражает силу команд по ходу сезона.

Ожидаемые очки (Expected Points)

Что это такое? Показатель количественно определяет две цели владения мячом: набор первых даунов и движение к зачётной зоне соперника. Игра вблизи неё будет иметь более высокий показатель ожидаемых очков, так как становится выше вероятность тачдауна. В играх, где команда владеет мячом у своей зачётной зоны, он становится отрицательным, так как вероятным будет набор очков соперником. В основе показателя лежит модель, выработанная с помощью исторических данных. Он отвечает на вопрос: «Насколько хороша моя команда прямо сейчас?»

На графике ниже отражены ожидаемые очки в зависимости от номера дауна и расстояния до зачётной зоны соперника.

Как его использовать? Очевидно, что 3-и-10 с 50-ярдовой линии это худшая позиция, чем 3-и-5 с той же отметки. Но насколько хуже? Благодаря этому показателю мы имеем модель, учитывающую контекст для присвоения ценности той или иной игровой ситуации. Это позволяет нам увидеть, улучшает или ухудшает розыгрыш ожидаемый результат команды EPA, о котором далее.

Дополнительные ожидаемые очки (EPA)

Что это такое? Показатель, отражающий изменение количества ожидаемых очков для данного розыгрыша.

Как его использовать? Показатель EPA даёт однозначную меру ценности каждому отдельному розыгрышу. Формулировка проще — как этот розыгрыш помог моей команде набрать очки? Он может быть использован для определения средней эффективности отдельных юнитов команды или результатов розыгрышей с участием определённого игрока.

DVOA

Что это такое? Ценность выше средней с поправкой на защиту. Метрика эффективности от Football Outsiders сравнивает успех в каждом розыгрыше со средним показателем в лиге и корректируется в зависимости от силы оппонента.

Как его использовать? Показатель измеряет общую эффективность команды или разбивает её на оценки для нападения, защиты и спецкоманд. Метрика DVOA более полезна при оценке продуктивности, чем простые показатели вроде количества набранных ярдов. Если вам просто хочется понять, насколько хороша или плоха команда в целом или отдельный её юнит, DVOA это отличная база для этого.

Шанс успеха

Что это такое? Это процент розыгрышей, бывших успешными для нападения. Различные источники используют разные определения для оценки степени успешности, но основными служат два варианта — на основе EPA (процент розыгрышей с положительным EPA) или на основе отсечки (например, Football Outsiders используют набор 45% ярдов, необходимых на первом дауна; 60% ярдов на втором дауне; 100% ярдов на третьем и четвёртом даунах).

Как его использовать? Метрика позволяет оценить стабильность игры команды снэп за снэпом. По сравнению с EPA показатель можно использовать для получения оценок, не столь подверженных выбросам. Но у него есть и минусы — любой успешный розыгрыш в этой интерпретации будет просто успешным, независимо от конечного результата. С его помощью нельзя оценить биг-плей или грубую ошибку обороны. Например, инкомплит или пик-сикс будут иметь одинаковое значение, хотя последний наносит куда больший урон.

Вероятность победы

Что это такое? Это вероятность того, что команда одержит победу в матче в конкретный момент времени. При расчёте учитываются счёт, номер попытки, расстояние до зачётной зоны и оставшееся время.

Как его использовать? Ответ очевиден — для того, чтобы оценить, насколько команда близка к победе или поражению на текущий момент. Также показатель может использоваться для оценки результативных действий, которые разворачивают ход матча в том или ином направлении. Ещё один вариант применения это анализ принятия решений по ходу игры, глядя на то, как изменяется вероятность победы команды. Наконец, его можно использовать как метрику, позволяющую отделить «мусорное время», чтобы не учитывать статистику за этот отрезок игры. 

Например, команды куда чаще играют вынос в конце матча, когда ведут в счёте. Исключение вероятностей победы, близких к нулю или единице, позволяет получить контекстно-нейтральный способ оценки того, как часто команда играет вынос в ситуациях, когда игра остаётся близкой.

Разница очков

Что это такое? Простая метрика, отражающая разницу между общим количеством набранных и пропущенных командой очков.

Как его использовать? Не все победы по-настоящему равны. Филд-гол на последних секундах, приносящий победу с разницей в три очка, не даёт такой же уверенности в силе команды, как уверенные 49-0. Разница очков позволяет лучше понять, насколько хорошо команда играла, и предсказать, как она будет играть в будущем. Показатель работает точнее, чем простое соотношение побед и поражений. 

Скорректированные проигранные матчи (AGL)

Что это такое? Метрика от Football Outsiders, показывающая, какие из команд больше всего пострадали от травм своих игроков.

Как его использовать? Ни одна команда лиги не способна полностью исключить травмы. С помощью этого показателя можно создать правильный контекст для сравнения общих цифр по НФЛ с данными каждой из команд. Его можно применять отдельно для защиты и нападения.

QBR

Что это такое? Метрика эффективности квотербека, разработанная каналом ESPN. В первую очередь она основана на EPA и пытается учитывать все варианты розыгрышей: вынос от квотербека, сэки, потери мяча, нарушения и, само собой, пас.

Как его использовать? Для квотербеков не существует идеального показателя, который мог бы охватить все аспекты его игры. Но QBR можно использовать совместно с другими данными, чтобы попытаться оценить их общую эффективность.

Скорректированные ярды за попытку (ANY/A)

Что это такое? Ещё одна цифра для квотербеков. Показатель учитывает пасовые ярды, попытки паса, тачдауны, перехваты и сэки. В расчёт не принимаются выносные ярды, набранные первые дауны и фамблы.

Как его использовать? Для оценки того, насколько квотербек хорош в пасовой игре. Особенно полезен показатель для игроков прошлого, так как данные для расчёта EPA доступны только начиная с сезона 1999 года.

Ожидаемый процент комплитов

Что это такое? Вероятность того, что пас окажется комплитом, с учётом дистанции до цели и некоторых других факторов: расстояния между ресивером и защитником, дистанции между ближайшим пас-рашером и квотербеком.

Как его использовать? Это способ оценить, с каким процентом комплитов пасуют квотербеки. Доступные публике модели расчёта этого показателя используют только, опять же, доступные данные. В NextGen Stats для этого используют трекеры, отслеживающие положение игроков на поле. Самым значимым фактором для любой модели этой метрики будет дистанция паса, поэтому все они дают очень близкие результаты.

Процент комплитов сверх ожидаемого

Что это такое? Разница между ожидаемым процентом комплитов и его фактическим значением.

Как его использовать? Это лучший показатель точности квотербеков в сравнении с традиционным процентом комплитов, так как он учитывает условия, в которых выполняется пас. Простой пример: чекдаун сыграть всегда проще, чем бросить мяч на 20 ярдов в узкое окно. Но есть и минус — данная метрика никак не учитывает дропы принимающих.

Ярды по воздуху

Что это такое? Оценка дистанции передачи. Расстояние измеряется по вертикали от линии скриммиджа к месту приёма или падения мяча на землю.

Как его использовать? Метод оценки стиля игры квотербека или полезности ресивера. Показатель может служить базой для других, например количества ярдов по воздуху за попытку. Квотербеки, для которых он выше, чаще других предпочитают бросать длинные передачи.

Среднее время броска

Что это такое? Среднее время между снэпом и моментом релиза мяча при пасовой попытке в секундах.

Как его использовать? Показатель даёт представление о том, кто из квотербеков быстрее избавляется от мяча. Например, в 2019 году быстрее всего это делали Дрю Бриз и Филип Риверс, тогда как Расселл Уилсон или Аарон Роджерс обычно имели больше времени для подготовки броска.

Метрика подвержена искажениям, так как время от времени случаются розыгрыши, в которых квотербек довольно долго не расстаётся с мячом. В этих случаях показатель не даёт представления о том, что происходит в конкретном розыгрыше. Чтобы устранить это влияние лучше всего использовать процентные значения, выше или ниже определённого порога: например, процент бросков, при которых квотербек расставался с мячом менее чем за две секунды.

Доля сэков

Что это такое? Количество сэков на квотербеке или для команды в целом, отнесённое к числу дропбэков.

Как его использовать? Оценка того, как часто квотербек попадает по сэк, или как часто их пропускает линия нападения. Также может применяться для оценки эффективности защитников.

Процент успешных блоков на пасе

Что это такое? Статистический показатель от ESPN, показывающий, как часто линия нападения или отдельно взятый игрок выдерживает свой блок не менее 2,5 секунд.

Как его использовать? Это показатель для измерения эффективности игры линии нападения. Такие метрики как доля сэков или процент давлений не учитывают квотербеков, подолгу держащих мяч в руках, или напротив, быстро от него избавляющихся. Отсечка в 2,5 секунды это попытка учесть при анализе разницу в стилях игры.

Процент давлений

Что это такое? Количество дропбэков, в которых нападение позволяет оказать давление квотербека или защита создаёт давление на квотербека.

Как его использовать? Довольно субъективная метрика, так как определение давления в разных источниках может варьироваться. Однако, в сочетании с другими показателями, этот параметр может быть использован для оценки блоков на пасе или эффективности пас-раша.

Процент успеха пас-раша

Что это такое? Статистический показатель от ESPN, показывающий как часто защита или конкретный игрок обыгрывает блок менее чем за 2,5 секунды.

Как его использовать? Показатель позволяет выделить игроков, которые не делают большого числа сэков, но при этом эффективно действуют против оппонента.

Ярды на маршрут

Что это такое? Отношение ярдов на приёме к числу маршрутов.

Как его использовать? Это показатель эффективности принимающих. Если два игрока набрали по 500 ярдов, но один пробежал 250 маршрутов, а второй 400, то этот показатель отразит разницу в их эффективности с учётом их использования.

Средняя глубина цели (aDOT)

Что это такое? Метрика, отражающая положение цели передачи в ярдах по воздуху: расстоянии по вертикали от линии скриммиджа до точки приёма или падения мяча на землю.

Как его использовать? Чаще всего показатель применяется по отношению к ресиверам. Например, для Майкла Томаса он равен 7 ярдам — в среднем в момент передачи он располагает на этом расстоянии от линии скриммиджа. Также метрика может использоваться для оценки того, на какое расстояние по воздуху в среднем бросает квотербек.

Доля дропов

Что это такое? Отношение числа дропов к общему числу передач, которые считаются пригодными для ловли (сумма приёмов и дропов).

Как его использовать? Для оценки того, как часто ресивер ошибается при приёме. Позволяет понять, кто из квотербеков теряет больше эффективности не по своей вине.

Скорректированные линейные ярды (ALY)

Что это такое? Попытка Football Outsiders отделить блок выноса и схему как факторы, не зависящие от раннинбека с мячом.

Как его использовать? Показатель может применяться для оценки того, как раннинбеку помогают или мешают факторы, которые он не контролирует.

Доля сброшенных захватов

Что это такое? Отношение количества сброшенных захватов к общему числу выносных попыток.

Как его использовать? Возможность оценить, насколько трудно остановить выносящего игрока.

Ярды после контакта

Что это такое? Метрика, показывающая, сколько ярдов набрал выносящий игрок после первого контакта с защитником или попытки захвата.

Как его использовать? Ещё один способ оценить, насколько количество набираемых ярдов зависит от действий бегущего, а не от игры линии нападения или схемы розыгрыша.