Sharpe: Manual do Usuário – Parte 2

No artigo anterior desta série, apresentei o Índice de Sharpe (SR) e como ele pode ser utilizado na escolha de alternativas de investimentos. Nele, fiz a suposição de que o Sharpe calculado era o valor verdadeiro para os dois fundos e que poderiam ser comparados diretamente.

Mas será que isso é sempre verdade? Será que o Sharpe de um fundo, que eu calculei usando dados históricos, é realmente maior do que de outro? E se para um fundo eu calculei o SR usando 10 anos de dados históricos e para o outro eu calculei usando apenas 6 meses de dados, qual número é mais confiável? Intuitivamente o primeiro, certo?

Distribuição da distribuição

Um dado comum tem 6 lados, numerados de 1 a 6 e seu valor média (sua esperança, em linguagem estatística) é de 3.5. Isso pode ser interpretado como “Se eu jogar um dado infinitas vezes e tirar a média dos valores, vou obter 3.5”.

Mas isso só é verdade se o dado for lançado infinitas vezes. Se for jogado apenas algumas vezes, a média pode ser muito diferente de 3.5, posso tirar o 6 três vezes seguidas ou tirar 1, 3, 6. Se eu jogar mais vezes, é mais provável que a média fique próximo dos 3.5, isso é chamado de comportamento assimptótico, e você mesmo pode testar em casa com um dado ou no Excel. Mas não importa quantas vezes você jogue, sempre vai ter alguma variabilidade ao redor do 3.5, mais variável se jogar poucas vezes e menos variável se jogar muitas.

Quando jogamos o dado várias vezes e tiramos a média, esse valor que calculamos é chamado de “estimativa da média” e o procedimento é chamado de estimador. Indicamos isso colocando um acento circunflexo em cima da letra que indica a média.

Como dito anteriormente, se jogarmos algumas vezes e tirarmos a média, cada vez que repetirmos esse procedimento vamos ter um resultado diferente. Jogando 5 vezes e repetindo o experimento 10 mil vezes temos a seguinte distribuição.

É mais comum ter médias ao redor do 3.5 do que muito distantes.

Estimadores do risco e retorno

Assim como no caso dos dados, os retornos e volatilidades históricos são uma estimativa dos verdadeiros valores. Uma questão de premissa importante… suponhamos que há um retorno e volatilidade “real” dos fundos e que esses parâmetros são fixos ao longo do tempo. Para simplificar as contas, vamos supor, também, que os retornos seguem uma distribuição normal, com um dia independente do outro.

A variância da distribuição do estimador da média é:

Onde σ² é a variância estimada e n é a quantidade de dados utilizados. A variância estimada, por sua vez, também terá uma variabilidade com a variância da distribuição dada por:

Note que, seguindo a intuição, quanto mais dados são utilizados, menor é a incerteza.

Como o SR é simplesmente a divisão desses dois valores, é obvio que ele vai ter uma variabilidade, uma distribuição. Infelizmente, o cálculo da variância do Sharpe não é tão simples quanto dividir os dois valores acima, mas também não é nada complicado, como demonstrado em [1][2]. A fórmula fica:

Suponha que calculamos um Sharpe de 0.80 para um fundo, usando 500 dias de dados. Então, a variância desse estimador é de 0.00264. Como regra de bolso, para uma distribuição normal, 95% dos valores estão entre mais ou menos 2 desvios padrões ao redor da média (lembrando que desvio padrão é a raiz quadrada de variância). Isso significa que o verdadeiro Sharpe tem 95% de chance de estar entre 0.697 e 0.902.

Comparando dois fundos

Agora está claro que o Sharpe calculado usando dados históricos é uma estimativa e que, quanto mais dados utilizarmos, melhor é essa estimativa. Mas como podemos saber se o SR de um fundo é realmente maior do que de outro?

Vamos trocar nossa comparação direta entre dois números por uma comparação probabilística. Particularmente, eu acredito que devemos ter uma visão probabilística para tudo na hora de entender o mercado. Visões determinísticas ou binárias são uma perda de tempo.

Vamos trocar a pergunta: Qual fundo tem um Sharpe maior?”

Para: “Qual a probabilidade do Sharpe de A ser maior do que o Sharpe de B?”

Se plotássemos a distribuição de probabilidade dos SRs de dois fundos, poderíamos chegar a algo assim:

O Sharpe do fundo vermelho é estatisticamente maior que o do azul. A chance de o azul ter um SR maior é aquela pequena região por volta do 1.4, onde a cauda do azul está à frente da cauda do vermelho.

Para calcular a probabilidade exata, vamos trabalhar com um pouco da teoria das probabilidades para chegar na resposta. Queremos a probabilidade do SR de A > B, isso é equivalente à probabilidade de A-B > 0. Se o SR de A e B seguem distribuições normais com as respectivas médias e variâncias (µA, σ²B), (µB, σ²B), então a distribuição de A-B é uma Normal com média e variância:

A função de probabilidade de distribuição acumulada da distribuição normal Φ(x) nos dá a probabilidade de um número aleatório (no nosso caso, a diferença dos SRs) ser menor que um valor $x$ escolhido. Queremos o contrario, a probabilidade de ser maior, então basta fazer 1 – Φ(x). No Excel, fazemos essa conta com a função NORM.DIST, por exemplo:

Pronto, agora não iremos mais dizer que o SR de A é maior do que o de B. Vamos dizer que há x% de probabilidade do SR de A ser maior do que o de B. Isso é muito mais informativo e realista.

Relaxando os pressupostos

Neste artigo, utilizei o pressuposto simplificador de que as distribuições dos retornos são normais, independentes e estáveis ao longo do tempo. No mundo real, raramente uma dessas suposições é atendidas. Relaxar essas hipóteses, usualmente, aumenta a variabilidade do estimador do SR. Isso ocorre pois as suposições de normalidade e estabilidade reduzem a incerteza do mercado.

Apenas para ilustrar, se os retornos tiverem uma distribuição que não a Normal, o estimador do SR fica [2]:

Onde γ3 é o Skewness (assimetria) e γ4 é a curtose (grossura das caudas). O leitor que tiver interesse de ver a dedução para outras hipóteses pode ler as referências abaixo.

Pensamento probabilístico

Vimos aqui como devemos olhar o Sharpe Ratio como uma estimativa sujeita a erro, e como usar essa estimativa para comparar alternativas de investimento.

No entanto, a lição mais importante desse artigo não é essa, mas sim a ideia de ver todos os números do mercado com um olhar probabilístico, não apenas o SR. Não olhe para o preço alvo de uma ação, o retorno esperado de um ativo ou para uma métrica de risco como um número único, estático. Pergunte-se “qual é a variância desse estimador?” e “quanto ele representa do ‘verdadeiro’ número?”.

[1] LO, Andrew W. The statistics of Sharpe ratios. Financial analysts journal, 2002.

[2] BAILEY, David H.; LOPEZ DE PRADO, Marcos. The Sharpe ratio efficient frontier. Journal of Risk, 2012.