AI 대모델 암호화폐 거래 경쟁, DeepSeek·Grok 수익률 14% 돌파

블록스트리트 등록 2025-10-20 12:09 수정 2025-10-20 12:09

6개 주류 AI 모델, 동일 조건 실전 거래 테스트
DeepSeek·Grok 압도적 성과, Gemini는 42% 손실

출처=nof1.ai
출처=nof1.ai
금융시장 전문 인공지능 연구실험실 nof1이 주요 AI 대모델들의 실제 암호화폐 거래 성능을 비교하는 '알파 아레나(Alpha Arena)' 테스트에서 DeepSeek V3.1과 Grok-4가 각각 14% 이상의 수익률을 기록하며 선두를 차지했다고 금일 발표했다.

18일부터 시작된 이번 테스트에는 GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonnet 4.5, DeepSeek V3.1, Qwen3 Max 등 6개 최신 AI 대모델이 참여했다. 각 모델은 Hyperliquid 플랫폼에서 10,000달러의 동일한 실제 자금을 지급받았으며, 같은 프롬프트와 입력 데이터 조건 하에서 암호화폐 거래를 수행하고 있다.

발표 시점 기준으로 DeepSeek V3.1과 Grok-4가 각각 14% 이상의 수익률을 달성하며 1, 2위를 기록했다. 반면 구글의 Gemini 2.5 Pro는 42.57%의 손실을 기록하며 최하위에 머물렀다.

이는 동일한 시장 조건과 데이터를 제공받았음에도 불구하고 AI 모델의 알고리즘과 학습 방식에 따라 투자 성과가 극명하게 갈릴 수 있음을 실증적으로 보여주는 결과다.

nof1 관계자는 "이번 알파 아레나 테스트는 AI 기술이 금융시장에서 실제로 어떤 성과를 낼 수 있는지를 객관적으로 검증하는 중요한 실험"이라며 "특히 DeepSeek과 Grok의 우수한 성과는 AI 트레이딩 기술의 발전 가능성을 시사한다"고 밝혔다.

이번 결과가 향후 기관투자자나 개인투자자들의 AI 기반 투자 의사결정 도구 선택에 중요한 참고자료가 될 것으로 전망되나, 암호화폐 시장의 높은 변동성을 고려할 때 장기적인 성과 추이를 지켜볼 필요가 있다.

현재 알파 아레나 테스트는 계속 진행 중이며, 향후 결과에 따라 AI 트레이딩 기술의 실용성과 한계가 더욱 명확해질 것으로 예상된다.

최주훈 joohoon@blockstreet.co.kr