Aqueles que consideram entregar seu dinheiro para esses programas precisam fazer perguntas difíceis sobre o que lhes dá uma “vantagem ”E – mais importante – se será sustentável. Além disso, a lei séria do comércio baseado em máquina é que há uma relação inversa entre desempenho e capacidade de um programa. As máquinas de IA sistemática estão sujeitas à mesma lei.
Para esclarecer o papel do aprendizado de máquina na previsão, é útil perguntar se treinar um sistema de IA para negociar é como treiná-lo como dirigir um carro. A resposta é não, mas examinar as diferenças é fundamental para formar expectativas realistas de IA nos mercados de capitais.
Com o carro, há realmente um código a ser decifrado. O problema envolve em grande parte a geometria e as leis imutáveis do movimento e estradas conhecidas – todos os itens fixos.
A única pequena mudança que ocorrerá gr adualmente é que a maioria, senão todos os carros, se tornarão autônomos. Mas isso só deve tornar o problema de aprendizado de máquina mais fácil por causa da redução da imprevisibilidade dos operadores humanos na estrada.
Em segundo lugar, os dados de treinamento são vastos, reunidos de muitos veículos em condições do mundo real. Em cinco anos, os carros autônomos dirigirão melhor do que agora, graças a ainda mais dados, e talvez eventualmente se tornem livres de erros. Cada avanço na navegação é construído de forma cooperativa pela comunidade de pesquisa. O alvo fixo e a densidade de dados cada vez mais alta decifrarão o código.
Os mercados financeiros não são estacionários. Eles mudam o tempo todo, impulsionados por eventos políticos, sociais, econômicos ou naturais. Os dados são limitados pela frequência e quanto tempo no futuro queremos prever. Conforme descrito eloquentemente no livro “Flash Boys”, as máquinas são capazes de aprender padrões intradiários previsíveis nos mercados financeiros que surgem das ações de humanos e máquinas. Esses dados são muito densos no sentido de que, em um dia de negociação de oito horas, a máquina tem 480 amostras de um minuto para aprender a fazer previsões de um minuto. Em um mês, ela tem mais de 10.000 observações para aprender.
Mas se você quiser aprender a fazer uma … previsões diárias, os dados são relativamente esparsos, então você precisa de histórias suficientemente longas de muitas coisas em condições variáveis para criar modelos confiáveis. A densidade desses dados aumenta muito mais lentamente com o tempo em relação aos carros sem motorista.
Igualmente o mais importante é que os mercados são altamente adversários por natureza de duas maneiras. Primeiro, qualquer novo insight ou vantagem é copiado rapidamente e eliminado pela competição. Portanto, pode-se argumentar que o papel da inteligência nos mercados financeiros não é encontrar o Santo Graal, mas ter um processo que pode reconhecer izar condições e oportunidades em mudança e adaptar-se de acordo. Isso torna o problema de previsão muito mais difícil.
A segunda fonte de adversidade é que a transação de tamanhos maiores não garante um desconto em massa, mas sim o oposto. Pode ser relativamente fácil negociar 100 ações da IBM ao preço existente na maioria das vezes, mas impossível negociar 1.000 ações a esse preço. A presença em tamanho torna o mercado adversário. Esta lei universal se aplica a todas as negociações baseadas em máquina.
A figura abaixo esboça a relação entre desempenho e capacidade, medida por milhões de dólares investidos, usando uma medida padrão de retorno ajustado ao risco de desempenho na indústria, ou seja, o Information Ratio (que é aproximadamente 0,4 para o S & P 500 no longo prazo). Quanto maior for a sustentação, mais tempo deve ser segurado. Portanto, os dados disponíveis para aprender são mais esparsos e os resultados mais incertos. O desempenho diminui rapidamente com o período de espera, especialmente se você segurar durante a noite. Não há almoço grátis.
No início dos anos 2000, executei um programa de alta frequência que raramente perdia dinheiro, mas não conseguia ultrapassar alguns milhões de dólares em capital. Uma mudança regulatória alterou a dinâmica do mercado e eliminou sua vantagem, mas deu origem a outros operadores de programa que capitalizaram os impactos da microestrutura da mudança. Atualmente, há um punhado de operadores de programas de alta frequência alimentando-se de qualquer liquidez que possam encontrar para explorar, mas o comércio de alta frequência não é um negócio viável modelo para um grande gestor de ativos ou um investidor regular. É um animal diferente.
Minha pesquisa futura quantifica a incerteza no comportamento de tomada de decisão dos sistemas de aprendizado de máquina em vários problemas.Isso explica por que uma coleção de modelos preditivos de direção autônoma treinados em variações de grandes conjuntos de dados concordarão que um objeto na frente é um pedestre e não uma árvore, enquanto uma coleção de modelos treinados em pequenas variações da história do mercado provavelmente discordar sobre a direção do mercado de amanhã.
Isso se traduz em um comportamento mais incerto dos sistemas de IA em domínios de baixa previsibilidade, como o mercado de ações, em comparação com a visão.
Se você está considerando um sistema de investimento em IA, precisará fazer um trabalho de casa sério, começando com seu histórico real. Pergunte a si mesmo se o programa se baseia em dados de treinamento suficientemente densos, considerando seu período médio de manutenção. O operador tem um processo bem especificado que segue consistentemente o método científico? O que você disse sobre a incerteza inerente aos modelos e a gama de resultados de desempenho que você deve esperar? Quanto piorará o desempenho se o operador aumentar a capacidade? Finalmente, é provável que a base para a vantagem persista no futuro ou corre o risco de ser eliminada?
Não invista a menos que tenha respostas claras para essas perguntas. Você quer investir, não jogar.
Vasant Dhar é professor da Stern School of Business da New York University e diretor do Ph.D. programa do Center for Data Science. Ele é o fundador da SCT Capital Management, um fundo de hedge sistemático baseado em aprendizado de máquina na cidade de Nova York.