A História
É difícil apontar exatamente quando as estratégias de Long-Short (LS) começaram a serem utilizadas no mercado. Recapitulando, o Long-Short (em ações) consiste em comprar (long) as ações que o investidor acredita que irão se valorizar e vender (short), tomando emprestado ações que não possui, que acredita que vão desvalorizar. A grande sacada da estratégia é que a valorização/desvalorização não precisa ser em termos absolutos, mas relativo, um grupo contra o outro. Se o mercado como um todo cair, mas as ações compradas caírem menos do que as vendidas, a estratégia é lucrativa. Isso atrai muito interesse, uma estratégia descorrelacionada com o mercado.
Um dos primeiros a aplicar a estratégia de forma institucional foi o investidor australiano Alfred W. Jones. Jones é conhecido por ter criado o primeiro Hedge Fund, em 1949. Sua ideia é criar uma estrutura de investimento sofisticada, comprando ações de forma alavancado e fazendo o hedge do risco de mercado, vendendo outras ações. De inicio, a ideia não ganhou grande destaque, até que um artigo da Fortune de 1966 mostrou que a ‘A.W. Jones & Co.’ estava há anos batendo os melhores gestores do mercado. Nos 34 anos de existência, o primeiro Hedge Fund teve apenas três anos negativos. A ideia estava lançada.
Enquanto Jones aplicava uma analise fundamentalista na escolha de quais ações comprar e vender, estilo até hoje empregado por muitos gestores no LS, a ideia de usar estátistica e aproveitar as distorções momentâneas do mercado começa com Gerry Bamberger. Gerry trabalhava no Morgan Stanley em 1980, como o que a gente poderia chamar hoje de Quant Developer, desenvolvendo softwares para a mesa de Block Trading. Block Trading são as operações massivas no mercado, quando um investidor quer comprar um vender dezenas de milhares de ações de uma única vez. Ele reparou que quando um Block Trade acontecia, o preço da ação era muito impactado rapidamente, enquanto que o preço das ações do mesmo setor não se mexiam. Ele também reparou que esse impacto logo era revertido. Ai veio a sacada, comprar (vender) ações que haviam caído (subido) repentinamente e contrabalancear com uma posição oposta nas ações pares do setor. A ideia é um sucesso e logo Gerry está gerindo sua própria mesa dentro do Morgan.
Por algumas desavenças, a direção do Morgan passa a mesa para Nunzio Tartaglia, um PhD em astrofísica, que rebatiza a mesa de Automated Proprietary Trading. Tartaglia é creditado por automatizar o processo e desenvolver várias outras estratégias quantitativas famosas. Já Bamberger, sai do Morgan Stanley e procura uma nova casa, se juntando ao Edward Thorp (sim, sempre ele. Não tem nada na história das finanças quantitativas que em algum momento não cruze com o Thorp), fundando a BOSS Partners. Thorp já operava uma outra estratégia de LS, chamada de MIDAS, mas onde era utilizado Factor Investing na seleção dos ativos. Dois outros dissidentes da APT levaram a estratégia para fora, David Shaw funda a D.E. Shaw e Robert Frey leva a arbitragem estátistica para Renaissance Technologies. Mais para frente, Pete Muller assume a operação de Tartaglia, rebatizando de PDT, que eventualmente se torna um fundo a parte. Ken Griffin, fã de Thorp, começa a usar LS na Citadel. No começo dos anos 90, o LS havia dominado o mercado.
O Modelo
Mas o que é exatamente arbitragem estatística? Como ela funciona? Qual é matemática por trás?
Arbitragem estatística (StatArb) é quase um oximoro. Arbitragem é uma operação financeira que se baseia na diferença de preço entre ativos para travar um lucro garantido, sem risco. O StatArb tem risco, o lucro não é garantido, então juntaram a palavra “estatística” para dar uma ideia de “média”. Algumas operações ganham, outras perder, mas na média é lucrativa. A palavra “estatística” também reflete a natureza do racional das operações, que se baseiam em modelos estatísticos.
Antes de entrarmos na matemática, vamos definir alguns termos que serão úteis:
- Séries (temporais): Uma série temporal é uma sequencia de dados organizado pelo tempo. Preços, retornos, histórico de inflação etc são todas séries temporais.
- Série Estacionária: Uma série fracamente estacionária é tem a média constante ao longo do tempo. Uma série fortemente estacionária tem a distribuição de probabilidades constante ao longo do tempo. Uma sequencia de lançamentos de dados (o objeto) é fortemente estacionária. O retorno das ações é fracamente estacionário, pois fica flutuando ao redor de ~0. Já o preço não é pois o preço de amanhã não vai ser ao redor do preço de 5 anos atrás. Uma série que reverte à média pode ser fraca ou fortemente estacionária*.
- Ordem de Integração: A ordem de integração é a quantidade de vezes que precisamos diferenciar (fazer a diferença entre dois valores seguidos, Ⅹ₂ – Ⅹ
₁ ) para que a série vire estacionária. Se diferenciarmos a série de preços uma vez, temos a série de retornos, que é estacionária, logo a Ordem de Integração é 1. Escreve-se Ⅰ(1). Uma série estacionária é Ⅰ(0).
Cointegração
Quando falamos de LS é muito comum ouvirmos “LS por cointegração”, mas o que é “cointegração”. Tecnicamente, duas séries, com a mesma ordem de integração, são cointegradas se uma combinação linear (’a’ quantidades de uma série, mais ‘b’ quantidades de outra) delas tem uma ordem de integração menor do que as séries originais. Talvez você já tenha ouvido a analogia de um bêbado caminhando para representar um passeio aleatório, o bêbado é Ⅰ(1). Agora imagine que o bêbado está com o seu cachorro (também, alcoolizado) na coleira. Vistos individualmente, os dois são Ⅰ(1), mas a distancia entre eles nunca vai ficar maior que o tamanho da guia, seja para um lado ou para outro. A distancia entre eles é Ⅰ(0).

Mas e porque isso seria interessante? Ora, se temos uma série Ⅰ(0) sabemos que ela deve ficar flutuando ao redor de um valor fixo, temos uma previsibilidade aqui. Se sabemos que uma série, em algum momento, vai chegar em um determinado valor, podemos apostar nisso! A ideia do LS por cointegração está nisso, encontrar dois ativos que sejam cointegrados e especular na diferença de preço entre eles.
Caçando Cointegrações
A questão agora é encontrar pares de ações {Ⅹt} e {Yt} (o {t} indica que é uma série temporal), cuja combinação linear da série de preços formem uma série estacionária {εt}:

Jogue o bⅩt para o outro lado, passe o a dividindo e só renomeie

O termo

Não se intimide com um monte de letras gregas, são só letras. Opa, talvez você já tenha reconhecido essa fórmula. É uma regressão linear, igual a que aprendemos em qualquer curso básico de estatística. Apenas manipulando mais uma vez:

Temo que um portfólio comprado em uma ação Yt e vendido em
Podemos sair à caça.
Mas é mesmo?
“Ok. Peguei duas ações, rodei a regressão, mas e agora? Como sei se está cointegrado?
Olhe para a imagem abaixo:

E essa:

É difícil dizer se está variando ao redor de um valor apenas olhando e quants não operam com base no olhômetro. Precisamos de estatística, precisamos de um teste de hipótese.
Um teste de hipótese é um procedimento que avalia se a nossa hipótese é verdadeiro ou não de forma probabilística. Um teste sempre vai ter duas coisas: a hipótese, obviamente, e o nível de significância. Vale dizer que estatístico sempre tem as costas contra a parede, ele nunca vai dizer que uma série “É cointegrada”, ele vai dizer “não podemos rejeitar a hipótese da série se cointegrada”. O nível de significância, de forma bem simplificada, é a probabilidade de não rejeitarmos a nossa hipótese, sendo que deveríamos rejeitar. A chance dos dados nos enganarem. O leitor poderia sugerir jogar um nível de significância bem rígido, dificilmente entraríamos num trade que não é cointegrado, mas por outro lado, deixaríamos passar muitos trades bons que eram por cautela excessiva.
Os testes de hipóteses mais comuns para testar a cointegração são o Augmented Dickey-Fuller e o Teste de Johansen. Os testes baseiam-se na seguinte ideia (a explicação é na verdade do Teste de Dickey-Fuller simples, os outros dois testes são apenas extensões mais complexas):
A série do

Onde ut é um ruído branco, um número aleatório que segue uma distribuição normal com média zero. Se
Então rodamos uma nova regressão para estimar o
u
Cointegração ≠ Correlação
Atente-se que cointegração e correlação são conceitos que guardam similaridades, como pares de séries andam juntos, mas são conceitos totalmente independentes. Correlação diz respeito ao micro, ele olha a direção das variações dos movimentos. A cointegração diz respeito ao macro, ao como as séries se mantem próximas. Duas séries podem ter correlação 1 e não serem cointegradas, enquanto duas séries podem ter correlação 0 ou -1 e serem cointegradas.
Na prática do mercado, é raro encontrar casos tão extremos. Economicamente, as razões para existência de correlação e cointegração entre ativos costumam ser as mesmas ou muito próximas. Veja por exemplo o caso mais típico de LS, ações ordinárias vs ações preferencias de uma mesma empresa. Elas são correlacionadas e cointegradas por serem a mesma empresa. Ou ações do mesmo setor, os motivos que fazem elas se moverem no dia a dia são os mesmos que fazem elas se manterem próximas por longos períodos. Mas reforço, correlação e cointegração são conceitos diferentes.
Podemos aproveitar essa relação empíricas dos dois conceitos. Sempre correremos o risco de operar pares que não são cointegrados, mas que os testes indicaram que eram. Uma saída é tornar o nível de significância mais rígido, mas poderemos deixar muitos bons trades passarem. Outra saída é olhar para mais sinais indicativos. A correlação pode nos dar uma ideia de que há fatores comuns direcionando os preços dos dois ativos. Podemos olhar a ideia original do Bamberger, que notou o efeito de reversão à média nos ativos dos mesmos setores e limitar a operar ativos apenas do mesmo setor, ou aceitar um nível de significância mais relaxado quando é dentro do mesmo setor. Vale olhar para fatos relevantes dos papeis, também. Um evento relevante pode fazer com que o desvio não seja temporário, mas sim permanente, o que em estatística a gente chama de quebra estrutural.
A estratégia de LS é uma das mais tradicionais e que melhor exemplifica uma boa estratégia quantitativa. Agrega uma teoria econômica forte, com um bom modelo e uma boa estatística para explicar e prever os movimentos dos ativos.
Refêrencias
[1] Patterson, S. (2010). The quants: How a new breed of math whizzes conquered wall street and nearly destroyed it. Currency.
[2] Thorp, Edward O. A Man for All Markets: Beating the Odds, from Las Vegas to Wall Street. Simon and Schuster, 2017.
[3] Engle, R. F., & Granger, C. W. (1987). Co-integration and error correction: representation, estimation, and testing. Econometrica: journal of the Econometric Society, 251-276.
[4] Cartea, Á., Jaimungal, S., & Penalva, J. (2015). Algorithmic and high-frequency trading. Cambridge University Press.
*Pode parecer estranho dizer que um processo de reversão à média é estacionário, afinal o valor esperado de amanhã depende do valor de hoje. Se o valor está muito alto deve decair, se está muito baixo, deve subir. Mas processos de reversão à média como o O-U, admitem uma distribuição estacionária (steady-state). Partindo dessa distribuição, a série é estacionária. Existe uma definição mais precisa, vide link. Mas essa é suficiente para esse artigo.