Ceux qui envisagent de céder leur argent à de tels programmes doivent se poser des questions difficiles sur ce qui leur donne un «avantage» »Et – surtout – s’il sera durable. De plus, la loi qui donne à réfléchir du trading automatisé est qu’il existe une relation inverse entre les performances et la capacité d’un programme. Les machines à IA systématiques sont soumises à la même loi.
Pour clarifier le rôle de l’apprentissage automatique dans la prédiction, il est utile de se demander si entraîner un système d’IA au commerce équivaut à lui apprendre à conduire une voiture. La réponse est non, mais examiner les différences est essentiel pour former des attentes réalistes de l’IA sur les marchés financiers.
Avec la voiture, il y a vraiment un code à déchiffrer. Le problème concerne en grande partie la géométrie, les lois immuables du mouvement et routes connues – tous les articles stationnaires.
Le seul changement mineur qui se produira gr En fin de compte, la plupart des voitures, sinon toutes, deviendront autonomes. Mais cela ne devrait que faciliter le problème de l’apprentissage automatique en raison de l’imprévisibilité réduite des opérateurs humains sur la route.
Deuxièmement, les données d’entraînement sont vastes, regroupées à partir de nombreux véhicules dans des conditions réelles. Dans cinq ans, les voitures autonomes conduiront mieux qu’elles ne le font actuellement grâce à encore plus de données, et finiront peut-être par devenir sans erreur. Chaque avancée de la navigation repose sur la coopération de la communauté de recherche. La cible fixe et la densité de données de plus en plus élevée vont casser le code.
Les marchés financiers ne sont pas stationnaires. Ils changent tout le temps, poussés par des événements politiques, sociaux, économiques ou naturels. Les données sont limitées par la fréquence et la quantité que nous voulons prédire dans le futur. Comme décrit avec éloquence dans le livre « Flash Boys », les machines sont capables d’apprendre des schémas intrajournaliers prévisibles sur les marchés financiers qui résultent des actions des humains et des machines. Ces données sont très denses en ce sens qu’au cours d’une journée de négociation de huit heures, la machine dispose de 480 échantillons d’une minute à partir desquels apprendre à faire des prédictions d’une minute. En un mois, elle a plus de 10 000 observations à tirer.
Mais si vous voulez apprendre à en faire une- les prévisions journalières, les données sont relativement rares, vous avez donc besoin d’historiques suffisamment longs de nombreux éléments dans des conditions variables pour créer des modèles fiables. La densité de ces données augmente beaucoup plus lentement avec le temps par rapport aux voitures sans conducteur.
De même Il est important de noter que les marchés sont de nature très contradictoire de deux manières. Premièrement, tout nouvel aperçu ou avantage est copié rapidement et mis en concurrence. On pourrait donc affirmer que le rôle de l’intelligence sur les marchés financiers n’est pas de trouver le Saint Graal, mais d’avoir un processus qui peut reconnaître adapter les conditions et les opportunités changeantes et s’adapter en conséquence. Cela rend le problème de prédiction beaucoup plus difficile.
La deuxième source d’adversité est que les transactions de plus grandes tailles ne vous permettent pas d’obtenir une remise groupée, mais plutôt le contraire. Il peut être relativement facile d’échanger 100 actions d’IBM au prix existant la plupart du temps, mais impossible d’échanger 1 000 actions à ce prix. La présence à la taille rend le marché contradictoire. Cette loi universelle s’applique à tous les échanges basés sur des machines.
La figure ci-dessous montre la relation entre la performance et la capacité, mesurée en millions de dollars investis, en utilisant une mesure standard du rendement ajusté au risque de la performance dans l’industrie, à savoir le ratio d’information (qui est d’environ 0,4 pour le S & P 500 sur le long terme). Plus la tenue est grande, plus elle doit être tenue longtemps. Par conséquent, les données disponibles pour tirer des leçons sont plus rares et les résultats plus incertains. Les performances se dégradent rapidement avec la période de maintien, surtout si vous restez pendant la nuit. Il n’y a pas de déjeuner gratuit.
Au début des années 2000, j’ai dirigé un programme à haute fréquence qui perdait rarement de l’argent, mais il ne pouvait pas dépasser quelques millions de dollars de capital. Un changement de réglementation a modifié la dynamique du marché et éliminé son avantage, mais cela a donné naissance à d’autres opérateurs de programmes qui ont capitalisé sur les impacts microstructuraux du changement. Il existe actuellement une poignée d’opérateurs de programmes à haute fréquence qui se nourrissent de toute la liquidité qu’ils peuvent trouver à exploiter, mais le trading haute fréquence n’est pas une activité réalisable modèle pour un grand gestionnaire d’actifs ou un investisseur régulier. C’est un animal différent.
Mes recherches à venir quantifient l’incertitude dans le comportement décisionnel des systèmes d’apprentissage automatique à travers divers problèmes.Il explique pourquoi un ensemble de modèles prédictifs de conduite autonome formés sur des variations de grands ensembles de données conviendra qu’un objet en face est un piéton et non un arbre, alors qu’un ensemble de modèles formés sur de petites variations de l’histoire du marché est susceptible de en désaccord sur la direction du marché de demain.
Cela se traduit par un comportement plus incertain des systèmes d’IA dans des domaines à faible prévisibilité comme le marché boursier par rapport à la vision.
Si vous envisagez un système d’investissement dans l’IA, vous devrez faire de sérieux devoirs en commençant par ses antécédents réels. Demandez-vous si le programme est basé sur des données d’entraînement suffisamment denses compte tenu de sa durée moyenne de détention. L’exploitant dispose-t-il d’un processus bien spécifié qui suit systématiquement la méthode scientifique? Que vous dit-on de l’incertitude inhérente aux modèles et de la gamme des résultats de performance auxquels vous devez vous attendre? Dans quelle mesure les performances se dégraderont-elles si l’opérateur augmente la capacité? Enfin, la base de l’avantage est-elle susceptible de persister à l’avenir, ou risque-t-elle d’être concurrencée?
N’investissez que si vous avez des réponses claires à ces questions. Vous voulez investir, pas jouer.
Vasant Dhar est professeur à la Stern School of Business de l’Université de New York et directeur du doctorat. programme au Center for Data Science. Il est le fondateur de SCT Capital Management, un hedge fund systématique basé sur l’apprentissage automatique à New York.