'새 시대의 석유' 데이터를 정제하는 법

입력 2025-10-09 17:18
수정 2025-10-10 00:18
‘데이터는 새로운 시대의 석유’라는 말이 매력적으로 들리지만 현실은 더 복잡하다. 원본 데이터는 노이즈로 가득하며, 이를 정제해 ‘통찰’을 추출하지 않으면 투자에 활용하기 어렵다. 바로 이 지점에서 대규모언어모델(LLM)이 등장했고, 게임 체인저로 부상했다. LLM은 방대한 비정형 데이터를 신속히 분석해 투자자가 시장을 선도하는 통찰을 얻도록 돕는다.

LLM의 위력을 가장 잘 보여주는 분야 중 하나는 기업 콘퍼런스콜(실적 발표) 분석이다. 런던증권거래소그룹(LSEG)의 ‘트랜스크립트 애널리틱스(Transcript Analytics)’는 LLM으로 경영진 발언의 감정과 톤을 정량화한다. LSEG에 따르면 긍정적 톤이 두드러진 상위 10% 기업은 그다음 달 주가가 우수했다. 미국 UC어바인 연구 결과도 유사했다. LLM을 적극 활용한 헤지펀드의 연간 수익률이 2~4%포인트 더 높았다. LLM이 전통적인 투자 분석으로 잡아내지 못한, 미묘한 신호까지 포착하기 때문이다.

또 다른 적용 분야는 소셜미디어 데이터 분석이다. 뉴욕증권거래소의 모회사 인터콘티넨털익스체인지(ICE)는 레딧과 협업해 게시판 데이터를 LLM으로 분석해 트레이딩 신호로 활용하는 지표를 개발 중이다. LLM은 단순 키워드 분석을 넘어 문맥을 이해하고 허위 정보를 걸러내 지표의 신뢰성을 높일 것으로 기대된다. 실시간으로 형성되는 대중 심리를 단기 시장 모멘텀과 연계할 수 있다.

마지막으로 주목할 영역은 방대한 문서 처리다. 일부 크레디트 전문 헤지펀드는 수천 건의 회사채 관련 계약서와 사업보고서를 LLM으로 요약·정리해 애널리스트와 운용역이 리스크 요인 등을 신속히 찾아볼 수 있도록 하고 있다. RAG(Retrieval-Augmented Generation·검색증강생성) 같은 기술은 특정 주제와 수치가 결합된 복잡한 질문에 즉각적인 답변을 제공한다. 투자자의 의사 결정 속도와 정확성을 높일 수 있다.

머서 조사에 따르면 세계 자산운용사의 91%가 인공지능(AI)·LLM을 도입했거나 검토 중이다. 새로운 시대의 투자 성패는 데이터의 양과 질, 그리고 이를 활용하는 기술에 달렸다.

홍세화 한경에이셀 리서치 총괄