알고리즘의 편향

YouTube 검색의 특징은 같은 키워드를 검색해도 이용자마다 각기 다른 영상을 추천한다는 것입니다. 과거 검색 이력에 기반한 개인화 데이터를 알고리즘에 활용하기 때문입니다.

필터 버블(filter bubble)은 알고리즘에 의해 필터링 된 정보 속에만 매몰되는 현상을 의미합니다. 편리함의 이면에는 정보 편식에 따른 확증 편향 위험도 존재합니다.

블룸버그는 Text-to-Image AI 서비스를 제공하는 스테이블 디퓨전(Stable Diffusion)의 편향에 관한 기사를 다룬 적 있습니다. 패스트푸드 직원이라는 키워드를 입력하면 70% 이상 유색인종으로 묘사되는데, 실제 미국 패스트푸드점 종사자의 70%가 백인임에도 현실을 왜곡한다는 지적입니다.

지난해 오픈 AI의 혁신만큼이나 자주 언급된 이슈는 Chat GPT의 편향과 신뢰도였습니다.

데이터 편향

알고리즘 편향은 데이터 편향에서 비롯됩니다.

문제는 알고리즘에 활용되는 데이터의 양과 종류가 방대해 사전에 편향성을 발견하기 어렵다는 점입니다.

시행착오를 통해 후행적으로 편향을 발견하고 정제 작업을 반복하는 것이 완성도를 높이는 유일한 길입니다.

2023년 VOYDA의 편향

2023년 VOYDA1호 성과는 +43.3%를 달성했지만 9월 이후 줄곧 성과가 부진했습니다. 실적 데이터 편향의 단점이 극명하게 드러났습니다.

주식 시장은 실적 외에도 글로벌 매크로, 투자 심리, 테마, 이벤트 등 다양한 요인이 불규칙적으로 상호 작용합니다. 기업 실적에만 편향된 알고리즘이 실적 팩터가 유효하지 않은 국면에서 부진할 수밖에 없는 약점을 고스란히 노출했습니다. 실적 팩터가 작동하지 않는 구간에서도 기존 운용 방식을 반복한 것도 지나고 보면 잘못된 선택이었습니다.

하지만 이에 대한 대응은 여전히 시간이 지나고 나서야 후행적으로 확인할 수 있는 영역이라고 생각합니다. 시장 국면을 선제적으로 예측하여 운용 방식을 임의 변경하는 것은 지속 가능한 방식이 아니므로 장기적으로 득보다 실이 더 크다는 판단입니다.

2024년 VOYDA

투자심리를 반영하는 데이터들을 알고리즘에 접목했습니다. 네이버 종목 토론실 데이터를 기존 펀더멘털 데이터들과 결합한 전략입니다.

종목별 토론실 조회수, 포스팅수, 좋아요, 싫어요 등 대화 데이터를 제외한 정량 데이터들을 결합해 알파를 추출하는 전략입니다. 커버리지 확장과 포트폴리오 변동성 축소 효과가 유효하다고 판단합니다.

기업별 수주잔고와 공시 데이터를 결합한 전략을 개발하고 있습니다. 현재 유니버스에 포함되지 않는 하드웨어/소프트웨어 수주산업에서의 알파를 추출하는 전략입니다. 빠르면 2월 중으로 기존 전략에 결합할 예정입니다.

VOYDA 3호 개발을 진행하고 있습니다. 100% 주식 비중을 가져가는 1호와 현금 비중을 결합한 전략입니다. 고객별 위험 성향에 더 특화된 서비스를 제공할 목적이며 1분기 중 런칭 예정입니다. 전략 상세는 백테스트 확정 후 재차 안내 말씀 드리겠습니다.

한국에서 신뢰할 만한 제대로 된 대체 데이터 운용사를 만들겠다는 목표로 솔루션퀀트를 설립하고 운용을 시작한 지 이제 1년이 지났습니다.

이제껏 만들어 놓은 것보다 앞으로 풀어나가야 할 난제들이 훨씬 더 많을 것입니다. 부족한 점들을 끊임없이 복기하며 알고리즘을 고도화하기 위해 전력을 다하고 있습니다.

2024년에도 여전히 많이 부족하겠지만, 성과를 통해 증명해 나가겠습니다.
올 한해 건강과 행운이 가득하시길 진심으로 기원하겠습니다.
새해 복 많이 받으세요. 감사합니다.

-솔루션퀀트 대표이사 김윤서 올림