개인 투자자들이 SNS 상에서 나누는 대화들은 경우에 따라 개별 주가에 막대한 영향을 미치기도 한다. 2021년 미국의 게임스탑(이하 GME)이 대표 사례다.

Fig. 01. 게임스탑(GME) 주가 추이 (2021년 1~2월) (출처=Bloomberg)

당시 레딧(Reddit)[1] 유저들이 집단으로 GME에 대해 어떻게 인식하고 있었으며, 어떤 방식으로 GME 시세에 배팅 했는지에 대한 사례는 연구 가치가 충분하다. 온라인 개인 방송으로 Meme[2] 트렌드를 주도했던 케이스 길(Keith Gil)은 커뮤니티 내 토론과 센티먼트 변화에 주목했다. 그는 개인투자자들이 월가의 탐욕에 대한 적대심[3]과 전통 게임샵에 대한 향수가 맞물려 GME 주식을 더욱 열심히 사게 만들고 있다고 판단했다. 그리고 이에 대한 베팅으로 Gil은 약$5,000만의 시세 차익을 거뒀다.


  1. 소셜 웹사이트로 자신의 글을 등록하고 다른 사용자들의 투표를 통해 ‘up’ 혹은 ‘down’을 선택해 순위에 따라 섹션이나 메인 페이지에 올라가게 되는 플랫폼이다 ↩︎

  2. 온라인에서 입소문을 타 개인투자자들이 몰리는 주식 ↩︎

  3. 당시 GME는 대형 헤지펀드들이 대규모 숏 포지션을 취하고 있었다 ↩︎

Fig. 02. GME Meme 트렌드를 주도했던 케이스 길(Keith Gil) 인터넷 방송

반면 게임스탑 주가 하락에 크게 베팅했던 월가의 헤지펀드들은 막대한 손실을 입었다. 패키지 게임의 온라인 판매 비중이 빠르게 늘면서, 오프라인 게임 유통사인 게임스탑의 이익 전망은 줄곧 하향 조정 중이었다. GME는 헤지펀드들의 공매도 타겟이 되었고 그 중에서도 유명 헤지펀드 멜빈 캐피탈(Melvin Capital)의 공매도 포지션은 5천만주에 육박했다.

암울한 이익 전망과 헤지펀드들의 매도 공세에도 불구하고 Meme 트렌드에 편승한 개인 투자자들의 매수 주문이 더 우세해지면서 주가는 계속 상승했다. 주가 상승에 따른 손실 폭 확대로 헤지펀드들의 공매도는 더욱 거세졌고 공매도 수량이 총 발생주식수를 초과하기에 이르렀다.

월가의 대형 헤지펀드와 개인투자자들 간의 수급 전쟁이 고조되면서 미국 SNS 상에서 시작된 Meme 트렌드가 세계적으로 확산됐다. 세계 각국의 개인투자자들이 GME 매수 운동에 동참하면서 주가 상승 기울기는 더 가팔라졌고 더 이상의 손실을 감내하기 어려워진 헤지펀드들은 숏-스퀴즈(GME 주식을 장내 매수하여 공매도 포지션 청산)로 대규모 손실을 입었다.

Fig. 03.GME 대차 잔고 비율 (출처=IHS Markit)
Fig. 04. 이벤트별 GME 주가 변동 (출처=Bloomberg)
Fig. 05. GME 거래량과 미국 Big-Tech, 비트코인 거래량 비교 (출처=Bloomberg)

GME의 역사적 상승 랠리를 만들어 낸 근간은 ‘SNS 상에서의 개인 투자자들의 의견 합치’였으며, Meme 주식이라는 새로운 트렌드를 만들었다. SNS상에서 개인 투자자들이 강력한 여론을 만들고 실행하면 주가에 지대한 영향을 미칠 수도 있다는 선례를 보여줬다.

개인 투자자들의 결집력을 간과했던 헤지펀드들 중 가장 큰 피해를 본 회사는 멜빈 캐피탈(Melvin Capital)이었다. GME 공매도 포지션으로 68억 달러의 손실을 기록했고 그 후폭풍으로 펀드는 결국 청산됐다.

GME 사태 이후 월스트리트에서는 같은 과오를 반복하지 않기 위해 SNS 상에서 개인 투자자들의 대화 내용들을 적극적으로 분석하고 모니터링하고 있다. 대표적으로 레딧의 주식 커뮤니티 WSB( WallStreetBets, 이하 WSB)를 분석하는 방법론을 소개한다.

Step 1. 특정 종목의 일별 언급 횟수와 거래량 집계

WSB에서는 개별 종목에 대한 의견이 공유되고 다양한 컨센서스가 형성된다. WSB 토론 데이터를 크롤링해 종목별 언급 횟수를 일별로 집계하고 개인 투자자의 거래량과 비교하기 위해 증감률 데이터를 활용한다. 증감률 데이터로 비교하는 이유는 절대값보다 데이터 해석이 왜곡될 확률이 낮기 때문이다.

Fig. 06. WSB 일별 종목 언급횟수와 개인 투자자 거래량 (출처=quiverquant.com)
Fig. 07. WSB 일별 종목 언급횟수 (전 종목, 주간 이동평균) (출처=quiverquant.com)

Step 2. 일별 언급 횟수와 거래량 간의 상관계수 산출

집계된 일별 언급 횟수와 개인투자자 거래량 증감률 간의 상관계수를 산출한다. 종목별 상관계수 편차는 상이하다. WSB에서 언급된 전 종목들의 평균 상관계수는 0.23으로 설명력이 높지 않지만, 특정 종목들은 0.7 이상의 높은 상관계수를 나타내기도 한다.

증감률 간 단순 상관계수 값을 활용하면 이상치(outlier)에 의해 결과값이 왜곡되는 현상이 발생한다. SNRE(Sorrento Therapeutics)는 outlier의 영향으로 상관계수가 거의 완벽(0.99)하게 나타난다(2020년 5월 15일 기준).

Fig. 08. WSB 종목 언급횟수와 개인 투자자 거래량 증감률 상관계수 (출처=quiverquant.com)

Step 3. 이상치(Outlier) 제거

Outlier에 의한 데이터 해석의 왜곡을 피하기 위해 거래량 증가율 10,000% 이상인 경우를 제외한다. 극단에 위치한 소수 데이터는 전체 상관계수에 큰 영향을 미치는 요소가 아니다. 왜곡 요소를 보정한 후 상관계수가 높은 상위 종목군을 추출한다. 상관계수가 높은 종목군들은 실시간으로 집계되는 토론 데이터를 통해 개인투자자 거래 데이터를 예측할 수 있다.

Fig. 09. WSB 종목 언급횟수와 개인 투자자 거래량 증감률 상관계수(Outlier 보정) (출처=quiverquant.com)

Step 4. 회귀분석

개인투자자 거래량을 종속 변수로, WSB 토론 데이터를 독립 변수로 회귀분석을 실시한다. 120개 기업에 대한 회귀분석 결과, 102개 기업이 통계적으로 매우 유의미하다는 결론(P<0.001)을 도출했다.

WSB 토론 데이터가 거래량 변화에 얼마나 영향을 주는지를 분석하고, 언급횟수가 +1% 증가시 개인투자자 거래량을 얼만큼 증가시키는지에 대한 계수를 종목별로 산출한다.

상위 5개 종목의 경우 WSB 코멘트가 1% 증가하면 개인투자자 거래량은 0.5%~1.0% 수준으로 증가한다고 볼 수 있다.

(출처=quiverquant.com)

솔루션퀀트는 SNS 데이터를 분석해 투자 보조 지표로 활용하고 있다. 네이버 종목토론실이나 텔레그램 채널, 인스타그램 등의 커뮤니티에서 개인 투자자들이 특정 종목 혹은 브랜드에 얼마나 관심을 갖는지 모니터링한다. 애널리스트들의 보고서 발간 내역과 기업 코멘트도 분석 대상에 포함한다. 기업 실적을 추정하는 데이터들과 접목해 투자 심리와 버즈량, 관심도 등을 스코어링하는 목적으로 활용 가치가 높다. 아직까지 국내 증시에서 SNS 데이터가 주가에 절대적인 영향을 주는 변수는 아니지만, 개인 투자 인구 증가 및 SNS 정보 파급력을 감안하면 막대한 잠재 가치가 내재된 데이터임에 틀림없다.