De som vurderer å overlevere pengene sine til slike programmer, må stille tøffe spørsmål om hva som gir dem en «kant» «Og – viktigst av alt – om det vil være bærekraftig. I tillegg er den nøkterne loven om maskinbasert handel et omvendt forhold mellom ytelse og kapasitet til et program. Systematiske AI-maskiner er underlagt samme lov.
For å avklare hvilken rolle maskinlæring spiller i spådommer, er det nyttig å spørre om å trene et AI-system for å handle er som å trene det hvordan man skal kjøre bil. svaret er nei, men å undersøke forskjellene er avgjørende for å danne realistiske forventninger til AI i kapitalmarkedene.
Med bilen er det virkelig en kode som skal knekkes. Problemet involverer i stor grad geometri, uforanderlige bevegelseslover og kjente veier – alle stasjonære gjenstander.
En mindre endring som vil skje gr adually er at de fleste hvis ikke alle biler vil bli autonome. Men dette skal bare gjøre maskinlæringsproblemet lettere på grunn av den reduserte uforutsigbarheten til menneskelige operatører på veien.
For det andre er opplæringsdataene enorme, samlet fra mange biler under virkelige forhold. Om fem år vil autonome biler kjøre bedre enn de gjør nå takket være enda mer data, og kanskje til slutt bli feilfrie. Hvert fremskritt innen navigering er bygget på i samarbeid av forskningsmiljøet. Det faste målet og stadig høyere datatetthet vil knekke koden.
Finansmarkedene er ikke stasjonære. De endrer seg hele tiden, drevet av politiske, sosiale, økonomiske eller naturlige hendelser. Dataene er begrenset av hvor ofte og hvor mye inn i fremtiden vi vil forutsi. Som beskrevet veltalende i boken «Flash Boys», er maskiner i stand til å lære forutsigbare intradagmønstre i finansmarkedene som oppstår fra handlinger fra mennesker og maskiner. Slike data er veldig tette i den forstand at over en åtte timers handelsdag, maskinen har 480 eksemplarer på ett minutt å lære å beregne ett minutt. I løpet av en måned har den mer enn 10 000 observasjoner å lære av.
Men hvis du vil lære å lage en- dagspådommer, dataene er relativt sparsomme, så du trenger tilstrekkelig lange historier om mange ting over forskjellige forhold for å skape pålitelige modeller. Tettheten av slike data øker mye saktere over tid i forhold til førerløse biler.
Like viktigere er at markedene er svært motstridende på to måter. For det første blir enhver ny innsikt eller kant kopiert raskt og konkurrert bort. Man kan derfor hevde at intelligensens rolle i finansmarkedene ikke er å finne den hellige gral, men å ha en prosess som kan gjenkjenne ize skiftende forhold og muligheter, og tilpasse seg deretter. Dette gjør prediksjonsproblemet mye vanskeligere.
Den andre kilden til motgang er at transaksjoner med større størrelser ikke gir deg masserabatt, men snarere tvert om. Det kan være relativt enkelt å handle 100 aksjer i IBM til den eksisterende prisen på det meste, men umulig å handle 1000 aksjer til den prisen. Tilstedeværelse i størrelse gjør markedet motstandig. Denne universelle loven gjelder all maskinbasert handel.
Figuren nedenfor skisserer forholdet mellom ytelse og kapasitet, målt med millioner av investerte dollar, ved å bruke et standard risikojustert avkastningsmål for ytelsen i bransjen, nemlig informasjonsforholdet (som er omtrent 0,4 for S & P 500 på sikt). Jo større beholdning, jo lenger må den holdes. Derfor er dataene som er tilgjengelige å lære av, sparsommere, og resultatene mer usikre. Ytelsen forringes raskt med holdeperioden, spesielt hvis du holder over natten. Det er ingen gratis lunsj.
På begynnelsen av 2000-tallet kjørte jeg et høyfrekvent program som sjelden tapte penger, men det kunne ikke bli større enn noen få millioner dollar i kapital. En regulatorisk endring endret markedsdynamikken og eliminerte kanten, men det ga opphav til andre programoperatører som utnyttet endringens mikrostruktureffekter. Det er for tiden en håndfull operatører av høyfrekvente programmer som spiser på den likviditeten de kan finne for å utnytte, men høyfrekvent handel er ikke mulig. modell for en stor kapitalforvalter eller en vanlig investor. Det er et annet dyr.
Min forestående forskning kvantifiserer usikkerheten i maskinens læringssystemers beslutningstferd på tvers av ulike problemer.Det forklarer hvorfor en samling prediktive modeller for autonom kjøring som er trent på variasjoner av store datasett, vil være enige om at et objekt foran er en fotgjenger og ikke et tre, mens en samling modeller trent på små variasjoner av markedets historie sannsynligvis vil er uenig om morgendagens markedsretning.
Dette betyr mer usikker oppførsel av AI-systemer i domener med lav forutsigbarhet som aksjemarkedet sammenlignet med visjon.
Hvis du vurderer et AI-investeringssystem, må du gjøre noen seriøse lekser fra og med den faktiske track record. Spør deg selv om programmet er basert på tilstrekkelig tette treningsdata gitt den gjennomsnittlige holdeperioden. Har operatøren en vel spesifisert prosess som konsekvent følger den vitenskapelige metoden? Hva blir du fortalt om den iboende usikkerheten rundt modellene og omfanget av ytelsesresultater du kan forvente? Hvor mye vil ytelsen forringes hvis operatøren øker kapasiteten? Til slutt, er det sannsynlig at grunnlaget for kanten vil fortsette i fremtiden, eller risikerer det å bli konkurrert bort?
Ikke invester med mindre du har klare svar på disse spørsmålene. Du vil investere, ikke gamble.
Vasant Dhar er professor ved Stern School of Business i New York University og direktør for Ph.D. program ved Center for Data Science. Han er grunnlegger av SCT Capital Management, et maskinlæringsbasert systematisk hedgefond i New York City.