Osoby rozważające przekazanie pieniędzy na takie programy muszą zadawać trudne pytania o to, co daje im przewagę ”I – co najważniejsze – czy będzie trwała. Dodatkowo, otrzeźwiającym prawem handlu opartego na maszynach jest odwrotna zależność między wydajnością a pojemnością programu. Systematyczne maszyny AI podlegają temu samemu prawu.
Aby wyjaśnić rolę uczenia maszynowego w prognozowaniu, warto zapytać, czy szkolenie systemu sztucznej inteligencji w celu handlu jest jak szkolenie go, jak prowadzić samochód. odpowiedź brzmi nie, ale zbadanie różnic ma kluczowe znaczenie dla sformułowania realistycznych oczekiwań dotyczących sztucznej inteligencji na rynkach kapitałowych.
W przypadku samochodu naprawdę istnieje kod do złamania. Problem w dużej mierze dotyczy geometrii, niezmiennych praw ruchu i znane drogi – wszystkie elementy stacjonarne.
Jedna drobna zmiana, która nastąpi gr stopniowo wynika, że większość, jeśli nie wszystkie samochody, staną się autonomiczne. Ale to powinno tylko ułatwić problem uczenia maszynowego ze względu na zmniejszoną nieprzewidywalność ludzkich operatorów na drogach.
Po drugie, dane treningowe są ogromne, zebrane z wielu pojazdów w rzeczywistych warunkach. Za pięć lat samochody autonomiczne będą jeździć lepiej niż obecnie dzięki jeszcze większej ilości danych i być może ostatecznie staną się wolne od błędów. Każdy postęp w nawigacji jest oparty na współpracy społeczności naukowej. Ustalony cel i coraz większa gęstość danych złamają kod.
Rynki finansowe nie są stacjonarne. Zmieniają się cały czas, napędzane wydarzeniami politycznymi, społecznymi, gospodarczymi lub naturalnymi. Dane są ograniczone przez to, jak często i jak bardzo chcemy przewidzieć przyszłość. Jak wymownie opisano w książce „Flash Boys”, maszyny są w stanie uczyć się przewidywalnych wzorców dnia na rynkach finansowych, które wynikają z działań ludzi i maszyn. Takie dane są bardzo gęste w tym sensie, że w ciągu ośmiogodzinnego dnia handlowego maszyna ma 480 jednominutowych próbek, na podstawie których można się nauczyć wykonywania jednominutowych prognoz. W ciągu miesiąca ma ponad 10 000 obserwacji, z których można się uczyć.
Ale jeśli chcesz nauczyć się robić jedno- dni, dane są stosunkowo rzadkie, więc aby stworzyć wiarygodne modele, potrzebujesz wystarczająco długich historii wielu rzeczy w różnych warunkach. Gęstość takich danych rośnie z czasem znacznie wolniej w porównaniu z samochodami bez kierowcy.
Równie dobrze co ważne, rynki są z natury wysoce kontrowersyjne na dwa sposoby. Po pierwsze, każdy nowy wgląd lub przewaga jest szybko kopiowany i eliminowany. Można zatem argumentować, że rolą inteligencji na rynkach finansowych nie jest znalezienie Świętego Graala, ale proces, który można rozpoznać zmieniaj warunki i możliwości i odpowiednio się dostosowuj. To znacznie utrudnia przewidywanie.
Drugim źródłem przeciwności jest to, że transakcje na większe rozmiary nie dają masowego rabatu, a wręcz przeciwnie. W większości przypadków może być stosunkowo łatwo handlować 100 akcjami IBM po obecnej cenie, ale niemożliwe jest handlowanie 1000 akcji po tej cenie. Obecność na dużą skalę sprawia, że rynek jest przeciwny. To uniwersalne prawo ma zastosowanie do wszystkich transakcji opartych na maszynach.
Poniższy rysunek przedstawia zależność między wydajnością a pojemnością mierzoną milionami zainwestowanych dolarów, przy użyciu standardowej miary rentowności w branży skorygowanej o ryzyko, a mianowicie wskaźnika informacji (który wynosi w przybliżeniu 0,4 dla S & P 500 w długim okresie). Im większe gospodarstwo, tym dłużej należy je trzymać. Dlatego dostępne dane, z których można się uczyć, są skąpe, a wyniki bardziej niepewne. Wydajność gwałtownie spada wraz z upływem czasu, zwłaszcza jeśli trzymasz w nocy. Nie ma darmowego lunchu.
Na początku XXI wieku prowadziłem program o wysokiej częstotliwości, który rzadko tracił pieniądze, ale nie mógł przekroczyć kilku milionów dolarów kapitału. Zmiana regulacyjna zmieniła dynamikę rynku i wyeliminowała jego przewagę, ale dało początek innym operatorom programów, którzy wykorzystali wpływ zmiany na mikrostrukturę. Obecnie garstka operatorów programów o wysokiej częstotliwości zasila się dowolną płynnością, jaką mogą znaleźć do wykorzystania, ale handel o wysokiej częstotliwości nie jest możliwy do zrealizowania model dla dużego zarządzającego aktywami lub zwykłego inwestora. To inne zwierzę.
Moje nadchodzące badanie pozwala oszacować niepewność w podejmowaniu decyzji przez systemy uczenia maszynowego w różnych problemach.Wyjaśnia, dlaczego zbiór modeli predykcyjnych dla autonomicznej jazdy, które są wyszkolone na różnych odmianach dużych zbiorów danych, pozwoli zgodzić się, że obiekt z przodu to pieszy, a nie drzewo, podczas gdy zbiór modeli wyszkolonych w zakresie małych zmian w historii rynku prawdopodobnie nie zgadzam się co do przyszłego kierunku rynku.
Przekłada się to na bardziej niepewne zachowanie systemów sztucznej inteligencji w dziedzinach o niskiej przewidywalności, takich jak giełda, w porównaniu z wizją.
Jeśli rozważasz system inwestowania w sztuczną inteligencję, będziesz musiał odrobić poważną pracę domową, zaczynając od jego faktycznych osiągnięć. Zadaj sobie pytanie, czy program jest oparty na wystarczająco obszernych danych szkoleniowych, biorąc pod uwagę jego średni okres utrzymywania. Czy operator ma dobrze określony proces, który konsekwentnie jest zgodny z metodą naukową? Co powiedziano ci o nieodłącznej niepewności związanej z modelami i zakresem wyników, których powinieneś się spodziewać? Jak bardzo pogorszy się wydajność, jeśli operator zwiększy pojemność? Wreszcie, czy podstawa przewagi może się utrzymać w przyszłości, czy też istnieje ryzyko, że zostanie ona pokonana?
Nie inwestuj, jeśli nie masz jasnych odpowiedzi na te pytania. Chcesz inwestować, a nie grać.
Vasant Dhar jest profesorem w Stern School of Business na Uniwersytecie Nowojorskim i dyrektorem Ph.D. program w Centrum Nauki o Danych. Jest założycielem SCT Capital Management, opartego na uczeniu maszynowym systematycznego funduszu hedgingowego w Nowym Jorku.