Incerteza. Essa é provavelmente a palavra que melhor define o que é o Draft da NBA. Nunca sabemos o que um jogador vai se tornar na liga antes de seu recrutamento: atletas considerados escolhas certeiras ao subir no palco podem não render nada em quadra e jogadores virtualmente desconhecidos entrando no recrutamento podem se tornar lendas do esporte. Muitas variáveis influenciam no sucesso ou não de um jogador, desde seus pontos fortes e fracos em quadra a aspectos como personalidade, ética de trabalho e situação em que foi colocado.

Desse modo, é naturalmente difícil o processo das equipes definirem quem devem escolher ou não e projetar quais serão suas habilidades futuramente. Um bom scouting, seguido de entrevistas e workouts, são as principais ferramentas para responder essas perguntas, mas o analytics tem se mostrado um importante aliado nesse processo.

Diversos times  da NBA apresentam modelos estatísticos para tentar predizer qual será o  desempenho de prospectos na liga a partir de seus dados e estatísticas no College/ligas internacionais. É claro que modelos com esse não são perfeitos (nenhum modelo estatístico é) e apresentam projeções equivocadas, mas ainda assim apresentam uma precisão relevante e que ajuda a ter uma ideia do que esperar de determinado jogador.

De modo a ilustrar como esses modelos funcionam e trazer um pouco de informação do que esperar de jogadores da classe de 2020 a partir de como jogadores similares a eles se saíram no passado, nós do Layups & Threes criamos um modelo de analytics para avaliar o desempenho esperado dos prospectos a partir de seus números no basquete universitário. O nosso sistema é com certeza bem mais simples e inferior aos das franquias, mas ainda assim apresentou uma precisão interessante.

Antes de mais nada, vale dizer que com certeza diversos jogadores irão ter performances muito diferentes do que os nossos números indicam, seja para bem ou para mal. Como já falamos, fatores externos a seus números em quadra e atributos físicos (sejam associados a sua personalidade ou ao encaixe no time para onde irá) têm grande impacto no desempenho e não são considerados a partir do viés analítico. Enxergue os números que apresentaremos como o valor esperado do desempenho do jogador a partir de como prospectos similares no passado se saíram na NBA e não como uma predição de futurologia. Dito isso, vamos falar sobre nossos dados.

O escopo de nosso modelo é o basquete universitário, isto é, só estão incorporados os jogadores que atuaram no College antes de se inscreverem no Draft. Portanto, atletas como Jalen Green, Jonathan Kuminga, Josh Giddey e Alperen Sengun não farão parte desta análise. Os motivos de fazermos isso são bem pragmáticos: em primeiro lugar, obter dados de prospectos espalhados pelo mundo é extremamente difícil, e em segundo, não é justo colocar na mesma caixa ligas diferentes na hora de predizer o que a performance nela iria refletir na NBA.

Para criar esse sistema, utilizamos estatísticas de jogadores draftados  do basquete universitário para a NBA nos últimos dez anos obtidas do site barttovik.com. O nosso objetivo foi “prever” alguns números desses jogadores na liga profissional norte-americana usando as informações sobre eles.

As nossas variáveis resposta (o que tentamos prever) foram:

  • Eficiência em infiltração (Pontos por posse)
  • Eficiência finalizando no aro (FG%),
  • Eficiência na floater range (FG%),
  • Eficiência na meia distância (FG%),
  • Eficiência em Catch & Shoot Threes (FG%),
  • Eficiência em Pull Up Threes (FG%),
  • Percentual de Rebotes Defensivos,
  • Percentual de Rebotes Ofensivos,
  • Percentual de Assistências
  • Razão de Assistências para Turnovers
  • Proteção de Aro (FG% cedido no aro para adversários)

Cremos que esses números indicam bastante sobre a performance de um jogador na NBA atual (mas admito que faltaram indicadores de defesa de perímetro, que é extremamente difícil de avaliar a partir de números).

Para realizar essa difícil tarefa de projetar desempenho de prospectos, foram utilizadas variáveis específicas para cada uma das métricas em estudo. Isto é, as variáveis que usamos para predizer eficiência finalizando no aro, por exemplo, não foram as mesmas que foram consideradas para prever o desempenho em pull up threes. De qualquer modo, os atributos utilizados em ao menos um dos modelos foram:

  • Anos passados no College (Freshman, Sophomore, Junior ou Senior)
  • Altura 
  • Percentual de rebotes defensivos no College
  • Percentual de rebotes ofensivos no College
  • Percentual de assists no College
  • Percentual de turnovers no College
  • Percentual de tocos no College
  • Enterradas feitas no College
  • Volume e aproveitamento em arremessos de curta distância no College
  • Volume e aproveitamento em arremessos de média distância no College
  • Volume e aproveitamento em arremessos de três pontos no College
  • Aproveitamento em lances livres no College

Escolhemos, para cada modelo, as variáveis que, a partir de análises descritivas, demonstraram ter impacto no desempenho de prospectos. Por exemplo, para predizer o aproveitamento no aro, utilizamos quantidade de anos no college, altura, enterradas feitas, volume e aproveitamento em arremessos curtos na NCAA, enquanto para predizer o desempenho em catch & shoot threes utilizamos o tempo de College, aproveitamento e volume na mid range, aproveitamento e volume de três pontos e aproveitamento de lances livres (que foi a variável mais impactante).

Não vou entrar muito na área técnica e na metodologia estatística/computacional do nosso sistema, mas, caso interesse aos curiosos e pessoas da área, utilizamos uma técnica de modelagem chamada XGBoost, que foi implementada no software RStudio para fazer esse processo. Caso alguém deseje saber mais sobre esse lado mais teórico, pode entrar em contato que respondo sobre com o maior prazer (além disso, quem quiser os códigos ou os bancos de dados utilizados, é só pedir!).

Ao ajustarmos o modelo usando os jogadores antigos, decidimos avaliar a qualidade dele. Para isso, usamos uma estratégia de validação cruzada (utilizamos várias combinações de jogadores desse conjunto para predizer os demais do mesmo), e obtivemos estimativas de sua precisão. 

Draft 2021 Analytics

Por Layups & Threes

O MAE é, basicamente, o erro médio do modelo. Isto é, o modelo de aproveitamento de pull ups três pontos erra em média em 2.76% o aproveitamento real dos jogadores. O MAPE , por sua vez, indica  quão grande é esse número considerando a escala da variável (no caso, 0.086  indica que em geral o erro do modelo é de 8.6% da média da variável).

Veja que todos os modelos são ao menos razoáveis: especialmente os de proteção de aro e de eficiência de arremessos, que foram realmente bons, enquanto os de rebotes e assistências tiveram desempenho inferior.

É claro que poucos números preditos serão de elite, pois números altíssimos são  raros e quase sempre não são o mais provável que ocorra para um atleta específico (que é o que estamos projetando).

Sem mais delongas, vamos às predições dos prospectos da classe do Draft 2021 da NBA:

Draft 2021 Analytics

Por Layups & Threes

Draft 2021 Analytics

Por Layups & ThreesNas projeções de assistências, o modelo destaca Sharife Cooper, Jalen Suggs e Davion Mitchell. Também é notável que ele não enxerga Cade Cunningham como um distribuidor tão bom quanto a maioria dos scouts. Também gostaria de destacar Franz Wagner e Evan Mobley, que apresentam projeções enquanto passadores muito acima dos padrões de suas posições.

Em rebotes ofensivos, Mobley e Day’Ron Sharpe se destacam, enquanto nos de defesa, o modelo considera Isaiah Jackson facilmente como o melhor da classe. Em infiltrações, o maior desempenho projetado é o de Mobley, seguido por Matthew Hurt e Jeremiah Robinson-Earl.

Na bola de três, o modelo acredita que Jalen Johnson irá se desenvolver e ter sucesso (algo inesperado) e que jogadores como Miles McBride serão bons arremessadores do catch-and-shoot. Nos pull ups, o maior destaque fica para Cameron Thomas, com aproveitamento projetado acima de 37%.

Em finalizações no aro, Mobley parece ter um potencial incrível, e bigs como Kai Jones e Charles Bassey também são vistos com certa qualidade. Dentre os jogadores de perímetro, Ziaire Williams se projeta como o melhor no quesito. Em floaters, por sua vez, os destaques são Sharpe e McBride, enquanto na meia distância, o provável melhor da classe é Mitchell.

Para finalizar, todos os pivôs da classe são vistos com bastante potencial em proteção de aro, especialmente Mobley, que é previsto como um futuro jogador de elite no quesito.

Falando mais especificamente de alguns dos principais prospectos, o modelo vê Cunningham como um bom arremessador, tanto do drible quanto do catch-and-shoot, e um passador muito bom para um ala (não para armador), e acredita que terá dificuldades ao finalizar na cesta. Mobley, por sua vez, é visto como ótimo defensor, infiltrador, finalizador e reboteiro, mas não como possível arremessador. Suggs promete ser um ótimo passador, um arremessador capaz do perímetro e um finalizador competente para um guard. Scottie Barnes, por sua vez, é projetado como um bom assistente e um jogador que possivelmente será capaz de arremessar relativamente bem do catch-and-shoot.

Entre os demais prospectos de primeira rodada, Mitchell é projetado como um arremessador ineficiente enquanto profissional e James Bouknight não é visto com olhos tão bons – o modelo não acredita que ele será eficiente na NBA, semelhante ao que ocorre com Keon Johnson. Moses Moody é visto como um bom arremessador, assim como Corey Kispert e Chris Duarte, diferentemente de Franz Wagner, que tem como sua principal virtude ofensiva o passe.

Jalen Johnson se projeta como um finalizador capaz, um arremessador possível de se desenvolver (entretanto, seu alto aproveitamento do perímetro em baixo volume, no basquete universitário, pode ter distorcido essa estimativa), e um bom passador para a posição. Já Kai Jones é visto como um possível arremessador decente para um big e um bom protetor de aro. O modelo também vê potenciais de criação de arremesso em Cameron Thomas e Jaden Springer.

É claro que projeções como essas não simplesmente fazem equipes mudarem seus alvos, mas podem servir como indicadores de jogadores a se prestar mais atenção ou acender alguns sinais amarelos quanto a outros, podendo agregar informações junto a um scouting mais aprofundado em certos aspectos e ter um peso maior com relação a jogadores na segunda rodada.

O Draft da NBA é extremamente impreciso e, com certeza, ao menos um desses jogadores vai exceder muito o que projetamos para ele em alguma área. Mas isso é uma constante para scouting, entrevistas, workouts. Toda avaliação de prospectos é imprecisa. O uso de analytics é uma ferramenta que pode ser útil nesse processo. É mais uma fonte de informações que, junto a essas outras, pode ajudar os times da NBA a selecionarem melhor na noite do recrutamento.

* Por Matheus Gonzaga e Pedro Toledo (Layups & Threes)

Siga o Jumper Brasil em suas redes sociais e discuta conosco o que de melhor acontece na NBA: 

Instagram
YouTube
Twitter
Canal no Telegram
Apostas – Promocode JUMPER