Почему нельзя опираться только на средние значения

Абсолютное большинство игроков опираются на статистику, где основной параметр — среднее арифметическое. Неважно будет это результативность команды, качество ее защиты, количество желтых карточек или фолов. Мы всегда опираемся на среднее, пытаясь найти преимущество над линией букмекера.  Но, если вы хотите сталь чуть сильнее, то лучше в своих подсчетах использовать такие понятия, как мода и медиана.

Почему среднее арифметическое часто обманчиво

Значительное преимущество статистических расчетов с использованием среднего значения – в простоте. Система понятна даже школьнику и легко применима к любому числовому ряду. Но многие ли задумывались о недостатках такого метода? А их, как оказывается, достаточно много.

Для примера, рассмотрим среднее арифметическое голов в футболе. Многие считают, что достаточно сложить результаты предыдущих матчей, разделить их на количество игр и вот оно – решение, которое принесет выигрыш. Но на деле все совсем не так. Такие данные дают лишь общую информацию о ситуации, но только вредят качеству ваших ставкам.

Рассмотрим на примере. Если брать результаты за сезон 20013/2014 года и сравнить Премьер Лигу с Ла Лигой, то выходит следующее:

  • В английской Premier League в среднем забивали 2,77 гола за игру;
  • В испанской La Liga — 2,75 гола.

Напрашивается, на первый взгляд, логичный вывод, что в La Liga меньше результативных матчей. Но на деле выходит иначе. Потому что в испанской лиге только 47,3% матчей заканчилось на ТМ2,5 гола, а в Премьер Лиге это показатель оказался выше – 48,4%.

Распределение голов в матчах

Среднее значение просто не отображает этот важный факт и размывает истинное положение вещей. В данном случае оно помогает получить лишь общее представление о количестве голов в лиге, но на распределение голов на одну игру оно никоим образом не влияет.

Как правильно анализировать спортивную статистику

Рассмотрим на наглядном примере из трех наборов чисел. Допустим, каждый набор – это голы одной команды в турнире. Среднее для каждого набора равняется 5, но обратите внимание на ряды чисел.

  • Первый: 4, 5, 5, 5, 6.
  • Второй: 4, 7, 4, 6, 4.
  • Третий: 3, 10, 3, 3, 6.

В первом ряду чаще выпадает число 5, во втором 4, а в третьем 3. Использовать среднестатистическое значение уместно использовать только при равномерном распределении чисел, как в первом случае. С одной стороны оно меньше, с другой стороны – больше. В результате вычисления показывают действительную картину. Если слева разместить 1, а справа 10, то это уже серьезно исказит точность и надежность ваших расчетов.

В других наборах мы видим значительные скачки и спады чисел, а также их смешивание.  Даже без калькулятора очевидно, что команды чаще заканчивают матчи с 4 и 3 голами, соответственно опираться на средний показатель в 5 голов нельзя ни в коем случае, хотя математически это абсолютно правильное значение.

Если вы обратите внимание на второй и третий ряд, то вообще не было ни одного матча с 5 голами 🙂  Для того, чтобы рассчитать более правильный показатель среднего для второй и третьей выборки нужно использовать медиану или моду.

Что такое мода и медиана?

Мода, медиана и среднее

Мода – это наиболее часто повторяющееся значение в ряде чисел. Находить его достаточно просто – обычным просматриванием ряда чисел. Например, в ряде 2, 5, 7, 2, 2 мода составит – 2. В таком случае, резкие скачки данных никак не повлияют на статистическое число.

Проверьте себя:

  • Какая мода у этого ряда чисел: 4, 3, 3, 3, 4, 2, 4, 1, 4, 3, 4?

Мода = 4, так как это число встречается 5 раз.

Медиана — это такое число выборки, что ровно половина из элементов выборки больше него, а другая половина меньше него. Например, возьмем ряд произвольных чисел 7, 4, 3, 4, 9. Для начала упорядочим ряд и получим – 3, 4, 4, 7, 9. В данном случае, медиана составит – 4. Если же в ряде нечетное количество значений, тогда медиана равняется среднему  двух чисел, находящихся в середине выборки. В выборке 2, 4, 6, 8 – она составит 5.

Проверьте себя:

  • Какая медиана у этих тоталов баскетбольных матчей: 135, 141, 142, 151, 158, 167?

Медиана в данном случае равняется 146,5 (среднее между 142 и 151) 

Следует понимать, что медиана применяется именно, как среднее число. В выборке 2, 3, 5, 6, 9 медиана равняется пяти. Но при расчете медианы, не возникнет обманчивого ощущения, что число 5 попадает в выборке намного чаще. Игрок понимает, что число 5 здесь просто промежуточное.

И так, теперь становится ясно, что в симметричном ряде чисел любой из приведенных выше способов (включая среднее арифметическое) имеет одинаковое значение. Но если в числа в ряде расположены не симметрично, то лучший выход – рассчитать моду или медиану.

В случае слишком большого разброса по тотала (как у Уникса в Евролиге 2016/17) для более точных цифр необходимо учитывать разницу между самым высоким числом и самым низким и среднеквадратическое отклонение. Но это уже более сложное занятие, о котором будет рассказано в другой статье. Среднеквадратическое отклонение помогает вычислить, насколько соблюдается баланс в той или иной команде и помогает вычислить коридор результативности более точно с учетом отклонений от среднего.

Резюме

В конце концов, видно, что применение среднего африметического не всегда показательно, как использование других методов исчисления. Для ставок в букмекерских конторах, необходимо немного глубже анализировать ситуацию. Применяя вышеупомянутые методы, игроки смогут проводить более эффективный анализ данных и улучшить качество своих ставок.

Хотите читать больше таких статей — становитесь клиентом букмекерской конторы Pinnacle. Там любят умных игроков, которые делают крупные ставки и никогда не режут максимумы.

Хотите получать больше прогнозов на баскетбол?

Подписывайтесь на платную рассылку "Баскетбольного Уголка". Больше 10 лет работы на рынке платных прогнозов. Гарантия результата на дистанции сезона и бесплатный месяц в случае минусового месяца.