De, der overvejer at aflevere deres penge til sådanne programmer, skal stille hårde spørgsmål om, hvad der giver dem en “kant” “Og – vigtigst af alt – om det vil være bæredygtigt. Derudover er den soberende lov for maskinbaseret handel, at der er et omvendt forhold mellem ydeevne og kapacitet i et program. Systematiske AI-maskiner er underlagt den samme lov.
For at afklare maskinlæringens rolle i forudsigelse er det nyttigt at spørge, om træning af et AI-system til handel er som at træne det, hvordan man kører bil. svaret er nej, men at undersøge forskellene er afgørende for at danne realistiske forventninger til AI på kapitalmarkederne.
Med bilen er der virkelig en kode, der skal knækkes. Problemet involverer stort set geometri, uforanderlige bevægelseslove og kendte vejveje – alle stationære genstande.
Den ene mindre ændring, der vil forekomme gr adually er, at de fleste, hvis ikke alle biler, bliver autonome. Men dette skulle kun gøre maskinlæringsproblemet lettere på grund af den reducerede uforudsigelighed for menneskelige operatører på vejen.
For det andet er træningsdataene enorme, samlet fra mange køretøjer under virkelige forhold. Om fem år vil autonome biler køre bedre end de gør nu takket være endnu flere data og måske i sidste ende blive fejlfri. Hvert fremskridt inden for navigation er bygget på i samarbejde af forskningsmiljøet. Det faste mål og den stadig højere datatæthed knækker koden.
Finansmarkederne er ikke stationære. De ændrer sig hele tiden drevet af politiske, sociale, økonomiske eller naturlige begivenheder. Dataene er begrænset af hvor ofte og hvor meget ind i fremtiden vi vil forudsige. Som beskrevet veltalende i bogen “Flash Boys” er maskiner i stand til at lære forudsigelige intradag-mønstre på de finansielle markeder, der opstår som følge af handlinger fra mennesker og maskiner. Sådanne data er meget tætte i den forstand, at over en otte-timers handelsdag, maskinen har 480 prøver på et minut, hvorfra de kan lære at forudsige et minuts prognoser. På en måned har den mere end 10.000 observationer at lære af.
Men hvis du vil lære at lave en- dagsprognoser, dataene er relativt sparsomme, så du har brug for tilstrækkelig lange historier om mange ting under forskellige forhold for at skabe pålidelige modeller. Tætheden af sådanne data stiger meget langsommere over tid i forhold til førerløse biler.
Lige vigtigst af alt er, at markederne er meget kontroversielle på to måder. For det første kopieres enhver ny indsigt eller kant hurtigt og konkurreres væk. Man kan derfor argumentere for, at intelligensens rolle på de finansielle markeder ikke er at finde den hellige gral, men at have en proces, der kan genkendes Ize skiftende betingelser og muligheder, og tilpasse sig i overensstemmelse hermed. Dette gør forudsigelsesproblemet meget sværere.
Den anden kilde til modgang er, at transaktion af større størrelser ikke giver dig en masserabat, men snarere tværtimod. Det kan være relativt let at handle 100 aktier i IBM til den nuværende pris på de fleste tidspunkter, men umuligt at handle 1.000 aktier til den pris. Tilstedeværelse i størrelse gør markedet kontradiktorisk. Denne universelle lov gælder for al maskinbaseret handel.
Figuren nedenfor skitserer forholdet mellem ydeevne og kapacitet målt ved millioner af investerede dollars, ved hjælp af et standardrisikokorrigeret afkastmål i branchen, nemlig informationsforholdet (som er ca. 0,4 for S & P 500 i det lange løb). Jo større bedrift, jo længere skal den holdes. Derfor er de tilgængelige data at lære af tyndere, og resultaterne mere usikre. Performance forringes hurtigt med tilbageholdelsesperioden, især hvis du holder natten over. Der er ingen gratis frokost.
I begyndelsen af 2000’erne kørte jeg et højfrekvent program, der sjældent tabte penge, men det kunne ikke gå ud over nogle få millioner dollars i kapital. En reguleringsændring ændrede markedsdynamikken og eliminerede dens kant, men det gav anledning til andre programoperatører, der udnyttede ændringens mikrostruktureffekter. Der er i øjeblikket en håndfuld operatører af højfrekvente programmer, der spiser på den likviditet, de kan finde at udnytte, men højfrekvent handel er ikke en gennemførlig forretning model for en stor aktivforvalter eller en almindelig investor. Det er et andet dyr.
Min kommende forskning kvantificerer usikkerheden i beslutningsprocessen hos maskinlæringssystemer på tværs af forskellige problemer.Det forklarer, hvorfor en samling af forudsigelige modeller til autonom kørsel, der trænes i variationer af store datasæt, er enige om, at et objekt foran er en fodgænger og ikke et træ, mens en samling modeller, der er trænet i små variationer af markedets historie sandsynligvis er uenig om morgendagens markedsretning.
Dette oversættes til mere usikker opførsel af AI-systemer i domæner med lav forudsigelighed som aktiemarkedet sammenlignet med vision.
Hvis du overvejer et AI-investeringssystem, skal du lave nogle seriøse lektier, der begynder med dets faktiske track record. Spørg dig selv, om programmet er baseret på tilstrækkelig tætte træningsdata i betragtning af den gennemsnitlige holdeperiode. Har operatøren en vel specificeret proces, der konsekvent følger den videnskabelige metode? Hvad får du at vide om den iboende usikkerhed omkring modellerne og den række præstationsresultater, du kan forvente? Hvor meget vil ydelsen forringes, hvis operatøren øger kapaciteten? Endelig, er grundlaget for kanten sandsynligvis fortsat i fremtiden, eller risikerer det at blive konkurreret væk?
Invester ikke, medmindre du har klare svar på disse spørgsmål. Du vil investere, ikke spille.
Vasant Dhar er professor ved New York Universitys Stern School of Business og direktør for Ph.D. program på Center for Data Science. Han er grundlægger af SCT Capital Management, en maskinlæringsbaseret systematisk hedgefond i New York City.