De som överväger att överlämna sina pengar till sådana program måste ställa tuffa frågor om vad som ger dem en ”kant” ”Och – viktigast av allt – om det kommer att vara hållbart. Dessutom är den nykterande lagen om maskinbaserad handel att det finns ett omvänt förhållande mellan prestanda och kapacitet för ett program. Systematiska AI-maskiner är underkastade samma lag.
För att klargöra maskininlärningens roll i förutsägelse är det bra att fråga om att utbilda ett AI-system för handel är som att träna hur man kör bil. svaret är nej, men att undersöka skillnaderna är avgörande för att skapa realistiska förväntningar på AI på kapitalmarknaderna.
Med bilen finns det verkligen en kod att knäcka. Problemet handlar till stor del om geometri, oföränderliga rörelselagar. och kända vägar – alla stationära föremål.
Den enda förändring som kommer att inträffa gr det är att de flesta om inte alla bilar blir autonoma. Men detta bör bara göra maskininlärningsproblemet lättare på grund av minskad oförutsägbarhet hos mänskliga operatörer på vägen.
För det andra är träningsuppgifterna stora, samlade från många fordon under verkliga förhållanden. Om fem år kommer autonoma bilar att köra bättre än de gör nu tack vare ännu mer data och kanske så småningom bli felfria. Varje framsteg inom navigering bygger på samarbete av forskarsamhället. Det fasta målet och allt högre datatäthet kommer att knäcka koden.
Finansmarknaderna är inte stilla. De förändras hela tiden, drivna av politiska, sociala, ekonomiska eller naturliga händelser. Uppgifterna begränsas av hur ofta och hur mycket in i framtiden vi vill förutsäga. Som beskrivs vältaligt i boken ”Flash Boys” kan maskiner lära sig förutsägbara intradagmönster på de finansiella marknaderna som härrör från människors och maskiners handlingar. Sådana uppgifter är mycket täta i den meningen att över en åtta timmars handelsdag, maskinen har 480 prover på en minut att lära sig att göra förutsägelser på en minut. På en månad har den mer än 10 000 observationer att lära av.
Men om du vill lära dig att göra en- dagsprognoser är uppgifterna relativt glesa, så du behöver tillräckligt långa historier om många saker under olika förhållanden för att skapa pålitliga modeller. Tätheten hos sådana data ökar mycket långsammare över tiden i förhållande till förarlösa bilar.
Lika viktigt är att marknaderna är mycket kontroversiella på två sätt: För det första kopieras varje ny insikt eller kant snabbt och tävlas bort. Man kan därför argumentera för att intelligensens roll på finansmarknaderna inte är att hitta den heliga gralen utan att ha en process som kan känna igen att ändra förändrade förutsättningar och möjligheter och anpassa sig därefter Detta gör prognosproblemet mycket svårare.
Den andra källan till motgång är att transaktioner med större storlekar inte ger dig massrabatt, utan snarare tvärtom. Det kan vara relativt enkelt att handla 100 aktier av IBM till det befintliga priset högst, men omöjligt att handla 1000 aktier till det priset. Närvaro i storlek gör marknaden kontroversiell. Denna universella lag gäller all maskinbaserad handel.
Figuren nedan skissar förhållandet mellan prestanda och kapacitet, mätt med miljoner investerade dollar, med hjälp av ett standardriskjusterat avkastningsmått för branschen, nämligen informationsförhållandet (vilket är ungefär 0,4 för S & P 500 på lång sikt). Ju större innehav, desto längre måste det hållas. Därför är de tillgängliga uppgifterna att lära sig mer sparsamma och resultaten mer osäkra. Prestanda försämras snabbt med innehavsperioden, särskilt om du håller över natten. Det finns ingen gratis lunch.
I början av 2000-talet drev jag ett högfrekvent program som sällan förlorade pengar, men det kunde inte gå utöver några miljoner dollar i kapital. En förändring i regleringen förändrade marknadsdynamiken och eliminerade dess fördelar. men det gav upphov till andra programoperatörer som utnyttjade förändringarnas mikrostruktureffekter. Det finns för närvarande en handfull operatörer av högfrekventa program som matar på vilken likviditet de kan hitta för att utnyttja, men högfrekvent handel är inte en genomförbar affär modell för en stor kapitalförvaltare eller en vanlig investerare. Det är ett annat djur.
Min kommande forskning kvantifierar osäkerheten i maskinens inlärningssystems beslutsbeteende över olika problem.Det förklarar varför en samling prediktiva modeller för autonom körning som tränas på variationer av stora datamängder kommer att vara överens om att ett objekt framför är en fotgängare och inte ett träd, medan en samling modeller som tränats i små variationer av marknadens historia sannolikt håller inte med om morgondagens marknadsinriktning.
Detta översätts till mer osäkert beteende hos AI-system på domäner med låg förutsägbarhet som aktiemarknaden jämfört med vision.
Om du överväger ett AI-investeringssystem måste du göra några allvarliga läxor som börjar med dess faktiska meritlista. Fråga dig själv om programmet är baserat på tillräckligt täta träningsdata med tanke på dess genomsnittliga innehavstid. Har operatören en väl specificerad process som konsekvent följer den vetenskapliga metoden? Vad får du veta om den inneboende osäkerheten kring modellerna och utbudet av prestationsresultat du kan förvänta dig? Hur mycket kommer prestandan att försämras om operatören ökar kapaciteten? Slutligen, är grunden för kanten sannolikt att bestå i framtiden, eller riskerar den att tävlas bort?
Investera inte om du inte har tydliga svar på dessa frågor. Du vill investera, inte spela.
Vasant Dhar är professor vid Stern School of Business i New York University och chef för doktorsexamen. program vid Center for Data Science. Han är grundaren av SCT Capital Management, en maskininlärningsbaserad systematisk hedgefond i New York City.