이러한 프로그램에 돈을 넘기는 것을 고려하는 사람들은 무엇이 “우위를 제공하는지에 대해 어려운 질문을해야합니다 ”그리고 가장 중요한 것은 지속 가능한지 여부입니다. 또한 기계 기반 거래의 냉정한 법칙은 프로그램의 성능과 용량간에 반비례 관계가 있다는 것입니다. 체계적인 AI 기계에는 동일한 법이 적용됩니다.
예측에서 기계 학습의 역할을 명확히하기 위해, 거래를 위해 AI 시스템을 훈련하는 것이 자동차 운전 방법을 훈련하는 것과 같은지 묻는 것이 유용합니다. 대답은 ‘아니요’입니다.하지만 자본 시장에서 AI에 대한 현실적인 기대치를 형성하려면 차이점을 조사하는 것이 중요합니다.
자동차에는 실제로 해독해야 할 코드가 있습니다. 문제는 주로 기하학, 불변의 운동 법칙과 관련이 있습니다. 및 알려진 도로-모든 고정 된 품목.
발생할 사소한 변경 사항 대부분의 자동차는 자율 주행이 될 것입니다. 그러나 이것은 도로에서 인간 운영자의 예측 불가능 성이 감소했기 때문에 기계 학습 문제를 더 쉽게 만들 것입니다.
둘째, 훈련 데이터는 방대하며 실제 조건에서 많은 차량에서 수집됩니다. 5 년 안에 자율 주행 차는 더 많은 데이터 덕분에 지금보다 더 잘 운전할 것이며 결국 오류가 없을 것입니다. 탐색의 각 발전은 연구 커뮤니티가 협력하여 구축합니다. 고정 된 목표와 점점 더 높은 데이터 밀도로 인해 코드가 깨질 것입니다.
금융 시장은 고정되어 있지 않습니다. 그들은 정치적, 사회적, 경제적 또는 자연적인 사건에 의해 항상 변합니다. 데이터는 예측하려는 빈도와 미래에 따라 제한됩니다. “Flash Boys”라는 책에서 잘 설명했듯이 기계는 인간과 기계의 행동으로 인해 발생하는 금융 시장에서 예측 가능한 일중 패턴을 학습 할 수 있습니다. 이러한 데이터는 하루 8 시간 거래에 걸쳐 매우 밀집되어 있습니다. 기계에는 1 분 예측을하는 방법을 배울 수있는 480 개의 1 분 샘플이 있습니다. 한 달에 학습 할 관측치가 10,000 개 이상입니다.
하지만 1 분을 만드는 방법을 배우려면 데이터가 상대적으로 희박하므로 신뢰할 수있는 모델을 만들려면 다양한 조건에 대해 충분히 긴 기록이 필요합니다. 이러한 데이터의 밀도는 무인 자동차에 비해 시간이 지남에 따라 훨씬 느리게 증가합니다.
동일하게 중요한 것은 시장이 본질적으로 두 가지 측면에서 매우 적대적이라는 것입니다. 첫째, 새로운 통찰력이나 우위가 빠르게 복사되고 경쟁합니다. 따라서 금융 시장에서 지능의 역할은 성배를 찾는 것이 아니라 인식 할 수있는 과정 변화하는 조건과 기회를 파악하고 그에 따라 적응합니다. 이것은 예측 문제를 훨씬 더 어렵게 만듭니다.
두 번째 역경의 원인은 더 큰 크기를 거래하면 대량 할인을받는 것이 아니라 그 반대입니다. 대부분의 경우 기존 가격으로 IBM 100 주를 거래하는 것은 비교적 쉬울 수 있지만 그 가격으로 1,000 주를 거래하는 것은 불가능합니다. 규모의 존재는 시장을 적대적으로 만듭니다. 이 보편적 법칙은 모든 기계 기반 거래에 적용됩니다.
아래 그림은 투자 된 수백만 달러로 측정 된 성능과 용량 간의 관계를 나타냅니다. 업계에서 표준 위험 조정 수익률 측정, 즉 정보 비율 (장기적으로 S & P 500의 경우 약 0.4 임)을 사용합니다. 보유량이 클수록 보유 시간이 길어집니다. 따라서 학습 할 수있는 데이터가 희박하고 결과가 더 불확실합니다. 특히 밤새 유지하는 경우 유지 기간에 따라 성능이 빠르게 저하됩니다. 공짜 점심이 없습니다.
2000 년대 초에 저는 거의 손실되지 않는 고주파 프로그램을 실행했지만 자본에서 수백만 달러 이상으로 확장 할 수 없었습니다. 규제 변화는 시장 역학을 바꾸고 그 우위를 제거했습니다. 그러나 이는 변화의 미세 구조 영향을 활용 한 다른 프로그램 운영자를 낳았습니다. 현재 소수의 고주파 프로그램 운영자가 이용할 수있는 유동성을 제공하지만 고주파 거래는 실행 가능한 비즈니스가 아닙니다. 대규모 자산 관리자 또는 일반 투자자를위한 모델입니다. 다른 동물입니다.
다음 연구에서는 다양한 문제에 대한 머신 러닝 시스템의 의사 결정 행동의 불확실성을 정량화합니다.이는 대규모 데이터 세트의 변형에 대해 훈련 된 자율 주행 예측 모델 모음이 앞에있는 객체가 나무가 아니라 보행자라는 데 동의하는 반면, 시장 역사의 작은 변형에 대해 훈련 된 모델 모음이 동의하는 이유를 설명합니다. 내일의 시장 방향에 대해 동의하지 않습니다.
이것은 비전에 비해 주식 시장과 같이 예측 가능성이 낮은 영역에서 AI 시스템의 더 불확실한 동작으로 변환됩니다.
AI 투자 시스템을 고려하고 있다면 실제 실적부터 시작하여 심각한 숙제를해야합니다. 프로그램이 평균 보유 기간을 고려할 때 충분히 밀집된 훈련 데이터를 기반으로하고 있는지 스스로에게 물어보십시오. 운영자가 과학적 방법을 지속적으로 따르는 잘 지정된 프로세스를 가지고 있습니까? 모델에 대한 내재 된 불확실성과 기대해야하는 성능 결과 범위에 대해 무엇을 들었습니까? 운영자가 용량을 늘리면 성능이 얼마나 저하됩니까? 마지막으로, 엣지의 기반이 미래에 지속될 가능성이 있습니까, 아니면 경쟁을 할 위험이 있습니까?
이러한 질문에 대한 명확한 답변이 없으면 투자하지 마십시오. 도박이 아닌 투자를 원합니다.
Vasant Dhar는 뉴욕 대학교 Stern School of Business의 교수이자 Ph.D. 데이터 과학 센터의 프로그램. 그는 뉴욕시에있는 기계 학습 기반의 체계적인 헤지 펀드 인 SCT Capital Management의 창립자입니다.