Article Review

[정치학/LLM] Kistner et al (2025) 미국 국회의원들의 SNS, 점점 더 '극단적'이 되고 있다?

Dr. Julia 2025. 4. 2. 08:18


📱 미국 국회의원들의 SNS, 점점 더 '극단적'이 되고 있다?

요즘 정치인들이 SNS에서 많이 보이죠? 트위터(X), 페이스북, 뉴스레터 같은 온라인 공간은 이제 정치 커뮤니케이션의 필수 수단이 되었습니다. 그런데 그 속 내용을 찬찬히 뜯어보면, 점점 더 극단적이고 부정적인 언어들이 늘어나고 있다면 어떨까요?

오늘 소개할 논문은 바로 그 점을 아주 정밀하게 분석한 최신 연구입니다. 무려 2009년부터 2022년까지 14년치 미국 연방의회 의원들의 트윗, 페이스북 글, 뉴스레터 총 780만 개를 모아서 분석했어요.


🧠 이 논문이 말하는 핵심 요약

  • 의원들의 온라인 메시지, 점점 더 정당 편향적(partisan)이고 부정적인 톤으로 변하고 있음
  • 이런 극단적이고 부정적인 메시지일수록 SNS에서는 인기 (좋아요와 리트윗 많음)
  • 하지만 유권자들은 이런 메시지를 싫어함 (오히려 실질적 성과를 강조하는 메시지를 더 선호)
  • 즉, SNS에서의 긍정적 반응이 정치인의 착각을 불러일으킬 수 있음 → 이것을 연구진은 “Social Media Feedback Mirage(소셜 미디어 환상)”라 부름

 


1. 📚 기존 연구가 뭐라고 했나?

사실 정치인이 유권자들에게 보내는 메시지를 연구하는 건 새롭지 않아요. 이미 1970~80년대부터 학자들은 이 주제를 깊이 들여다봤습니다. 지금은 너무 당연하게 느껴지는 정치인의 ‘SNS 활동’도, 당시엔 뉴스레터나 지역 행사 참석처럼 훨씬 아날로그적인 방식으로 이뤄졌죠.

🎓 고전 연구: 광고, 입장표명, 성과 자랑

대표적인 고전 연구자는 David Mayhew(1974)와 Richard Fenno(1978)입니다.

  • Mayhew는 정치인이 재선을 위해 하는 대표적인 행동을 세 가지로 정리했어요:
    1. 광고(Advertising): “내가 누군지 알아요?” → 이름 알리기!
    2. 성과 과시(Credit-Claiming): “이거 제가 했습니다!” → 내가 이 정책 만들었어요!
    3. 입장 표명(Position-Taking): “저는 이 법안 찬성입니다” → 이슈에 대한 내 입장 밝혀요!
  • Fenno는 이걸 좀 더 사람 중심으로 설명했어요. 의원들은 자신만의 스타일, 즉 '홈스타일(homestyle)'을 만들어서, 지역구 유권자에게 신뢰를 쌓고, “이 사람은 우리 편이야”라고 느끼게 만든다는 거예요.

요약하면, 정치인은 단순히 법안만 만드는 사람이 아니라, 이미지 전략가이자 커뮤니케이터라는 관점이에요.


💻 그런데 시대가 변했죠? → SNS 시대의 정치

하지만 2000년대 후반부터 SNS가 등장하면서 게임이 완전히 바뀌었습니다.

  • 예전엔 뉴스레터 보내고 지역신문 인터뷰하는 정도였지만,
  • 지금은 트위터 한 줄이면 전국 뉴스에 오르고,
  • 누구나 실시간으로 정치인의 말에 좋아요/리트윗/댓글로 반응할 수 있죠.

이건 정치인들에게 완전 새로운 기회를 주었습니다.

  • 예전보다 훨씬 넓은 사람들에게, 빠르게, 직접 메시지를 보낼 수 있게 되었고,
  • 중간에 기자나 방송국 같은 중개자 없이 직접 말할 수 있는 창구가 생긴 거예요.

그러면서 정치인의 ‘대표 이미지’나 ‘메시지 스타일’도 확 바뀌기 시작했습니다.


🔎 최근 연구의 주요 관심사 ①: 누가 어떤 방식으로 SNS를 쓰나?

최근 연구들은 이런 질문에 집중해왔습니다.

  • 어떤 의원이 트위터를 더 자주 쓰는가?
  • 광고보다 정책 성과를 더 강조하는가?
  • 지역구 유권자 수나 소속 정당에 따라 메시지 전략이 다를까?

예를 들어, 안정적인 지지기반이 있는 의원은 더 자신 있게 논쟁적인 이슈(예: 트럼프 스캔들)에 대해 ‘입장 표명’을 하는 경향이 있어요. 반면에 경합지 의원은 위험을 피하고 ‘성과 자랑’ 위주로 소통하는 경향이 있죠.

결국, SNS를 통해서도 재선 전략을 세밀하게 조정한다는 겁니다.


🔎 최근 연구의 주요 관심사 ②: 언어가 점점 더 극단적이 되는가?

또 다른 흐름은, 정치인들이 SNS에서 어떤 톤의 언어를 쓰는지를 분석하는 연구예요.

  • “내가 이렇게 잘했어요!”라는 온건한 언어보다,
  • “상대 정당이 나라 망치고 있어요!”라는 부정적이고 정당 공격적인 말이 훨씬 많이 등장한다는 거죠.

특히 최근엔 ‘정당 혐오적 언어(negative partisanship)’가 크게 증가하고 있다는 연구들이 많아요. 예를 들어,

  • 민주당 의원들이 트럼프를 강하게 비판하거나,
  • 공화당 의원들이 바이든 정부를 맹공격하는 글을 자주 올리는 식입니다.

이런 메시지는 논쟁적이지만, SNS에선 굉장히 잘 먹혀요. 사람들이 더 많이 공유하고, 더 자주 반응하거든요.


📌 그런데 기존 연구엔 한계가 많았어요!

지금까지 소개한 연구들은 중요한 인사이트를 주긴 했지만, 몇 가지 공통적인 한계점이 있었어요.

  1. 짧은 시기만 분석
    대부분 1~2년 정도 데이터만 가지고 분석함 → 장기적인 변화 추적은 어려움
  2. 한 플랫폼만 분석
    트위터만 보거나, 페이스북만 봄 → 다양한 플랫폼 간 차이를 비교하기 어려움
  3. 메시지의 ‘내용 목적’과 ‘언어 톤’을 따로 분석
    예: 어떤 메시지가 ‘성과 자랑’인지는 분석해도, 그 메시지가 동시에 얼마나 극단적인 언어를 썼는지는 별도로 다룸
  4. 데이터 정제가 연구자마다 다름
    연구자마다 수집·정제 방식이 달라서 서로 다른 연구 결과를 비교하기가 힘듦

👉 그래서! 이번 논문은 이런 기존 연구의 한계를 보완해서

  • 장기간(14년),
  • 멀티 플랫폼(SNS + 뉴스레터),
  • 메시지 목적 + 언어 톤을 동시에 분석,
  • 공통의 기준으로 통일된 데이터셋을 만든 겁니다.

한마디로, 지금까지는 작은 창문으로 각자 보던 SNS 정치 언어를,
이제는 넓은 창으로 시계열로, 입체적으로 볼 수 있게 만든 연구예요.

 


2. 🧪 이 논문이 개발한 방법론

— 정치인의 SNS 글을 어떻게 ‘분석 가능한 데이터’로 만들었을까?

이 논문에서 가장 대단한 점은, 말 그대로 수백만 개의 정치인 메시지를 읽고 분석할 수 있게 체계적인 데이터셋으로 만들었다는 점이에요.

어떤 데이터를 수집했는지, 어떻게 분류하고 측정했는지 하나하나 쉽게 설명해볼게요.


📦 1) 어떤 데이터를 수집했을까?

연구팀은 2009년부터 2022년까지, 미국 연방의회 의원들이 온라인에 남긴 공식적인 커뮤니케이션 기록을 몽땅 모았어요.

📌 수집한 데이터 종류는 세 가지입니다:

유형설명수집량
트위터(X) 의원이 공식 계정으로 올린 트윗 약 580만 개
페이스북 의원이 페이지에 쓴 게시물 약 250만 개
이메일 뉴스레터 유권자에게 발송한 공식 뉴스레터 약 18만 개

총합하면 약 780만 개 메시지, 1,025명의 의원들 데이터를 다룬 겁니다.
미국 정치학계에서도 이렇게 장기·대규모·다채널 데이터는 거의 없었어요.


🧮 2) 그 많은 글을 어떻게 분류했을까?

이렇게 수백만 개의 텍스트를 그냥 "읽고 느낌"으로 볼 순 없겠죠?
연구팀은 정치인의 메시지를 정교한 기준으로 자동 분류하고, 성향을 수치화하는 방법을 사용했어요.

그 핵심이 바로 분류(classification)와 척도화(scaling)입니다.


✂️ (1) 먼저, 글의 ‘목적’을 분류합니다 (Classification)

정치인의 메시지는 목적에 따라 다릅니다. 예를 들어:

  • “제가 이런 법안을 발의했습니다!” → 성과 자랑
  • “바이든 정부의 정책은 실패입니다!” → 부정적 정당 공격
  • “저는 이 법안에 찬성합니다” → 입장 표명
  • “우리 지역구 주민들과 함께 했습니다” → 지역구 과시
  • “오늘은 독립기념일입니다 🇺🇸” → 단순 인사말

연구팀은 이런 메시지를 총 6가지 카테고리로 나눴어요.

📌 정치 커뮤니케이션 목적 6가지 분류:

  1. 광고 (Advertising)
    • 의원이 자신의 존재나 활동을 알리는 글
    • 예: "오늘 공청회에 참여했습니다!", "새 사무실 오픈했습니다!"
  2. 성과 자랑 – 정책 관련 (Policy Credit Claiming)
    • 내가 법안이나 정책을 만든 공을 드러냄
    • 예: "저는 OOO 법안을 공동 발의했습니다!"
  3. 성과 자랑 – 지역구 관련 (Constituency Credit Claiming)
    • 지역구를 위해 한 활동 강조
    • 예: "우리 지역 도로 예산을 확보했습니다"
  4. 입장 표명 (Position-Taking)
    • 정치적 사안에 대한 자신의 입장을 밝힘
    • 예: "저는 낙태권을 지지합니다", "증세는 반대합니다"
  5. 부정적 정당 공격 (Negative Partisanship)
    • 상대 정당 비난
    • 예: "공화당은 나라를 망치고 있어요", "민주당은 법과 질서를 무너뜨립니다"
  6. 초당적 협력 강조 (Bipartisanship)
    • 양당 협력 강조
    • 예: "민주-공화 의원들과 함께 일하고 있습니다"

💡 이 글 하나에 여러 목적이 섞일 수도 있어요. 예:
“저는 텍사스 지역의 학교 예산을 확보했습니다(성과 자랑) — 민주당의 방해에도 불구하고!(부정적 정당 공격)”


 

🤖 (2) 분류는 어떻게 했나?

— 사람의 손과 기계의 눈이 함께 만든 ‘의원 메시지 분류 시스템’

이 연구에서 가장 중요한 작업 중 하나는, 의원들이 남긴 수백만 개의 메시지를 ‘정치 커뮤니케이션의 목적’에 따라 분류하는 것이었습니다. 그런데 단순히 단어 몇 개 찾는 수준으로는 절대 정확한 분류가 되지 않아요.

그래서 이 작업은 다음의 세 단계를 통해 진행됩니다:


1단계. 🧑‍🏫 사람이 먼저 정답을 만든다 (수작업 라벨링)

연구팀은 먼저 총 35,000개의 트윗을 직접 사람이 읽고 분류했습니다.
이건 기계학습에 있어 ‘훈련 데이터’를 만드는 과정이에요.

💬 분류 기준은 총 6가지:

분류 카테고리의미예시
광고 의원이 자기 이름, 활동, 존재감을 알리는 글 “오늘 제 지역구에서 행사에 참여했습니다”
정책 성과 자랑 정책적으로 성과를 드러내는 글 “제가 공동 발의한 법안이 통과됐습니다”
지역구 성과 자랑 지역에 직접 이익이 되는 일을 했다는 글 “우리 지역 도로 예산을 따냈습니다”
입장 표명 특정 정책에 대한 찬반 입장을 밝힘 “저는 총기규제를 지지합니다”
부정적 정당 공격 상대 정당이나 정치인을 비판 “민주당은 미국을 망치고 있어요”
초당적 협력 강조 여야 협력을 강조하는 말 “공화당 의원들과 협력 중입니다”
  • 3,500개는 3명의 연구자가 각각 읽고 분류함 (즉, 트리플 블라인드 라벨링)
  • 라벨링 일치도: Krippendorff's alpha ≥ 0.90, 일치율 98% → 매우 신뢰도 높은 분류!

📌 이 데이터를 토대로 우리는 “이런 문장은 이런 의도구나!”라는 **정답 데이터(ground truth)**를 얻게 됩니다.


2단계. 🧠 기계 학습 모델 훈련 (Supervised Machine Learning)

사람이 만든 35,000개의 라벨링 데이터를 가지고, 이제 기계가 배울 차례입니다.

사용된 알고리즘: Random Forest (랜덤 포레스트)

  • 수십~수백 개의 ‘의사결정 나무(decision trees)’를 생성하고,
  • 각 나무가 "이 글은 광고일까 아닐까?" 판단한 뒤,
  • 다수결로 최종 분류하는 방식

왜 Random Forest를 썼을까?

  • 텍스트 분류에서 비교적 해석이 쉽고,
  • 분산 위험이 적으며,
  • 다양한 언어적 특징(단어 사용 빈도, 특정 키워드, 위치, 조합 등)을 잘 반영해줍니다.

입력 특징 (features)은 어떤 걸 썼을까?

모델은 단순히 문장 전체를 보지 않아요. 다음과 같은 다양한 텍스트 정보들을 ‘숫자화’해서 봅니다:

  • TF-IDF 벡터: 단어 빈도와 중요도를 고려한 수치 표현
  • 단어 조합(bigram), 어간 추출(stemming), 불용어 제거(stopwords)
  • 구두점, 대소문자 사용, 문장 길이 등도 추가 가능

이런 입력값을 모델이 학습해서 “광고일 가능성 78%, 성과자랑일 가능성 62%...” 같은 확률을 내놓습니다.


3단계. 🎯 똑똑한 분류 기준(임계값) 설정

보통 머신러닝에서는 확률이 0.5를 넘으면 YES라고 판단하죠?

하지만 이 연구는 더 정밀하게 접근합니다:

각 분류별로 **‘false positive’(잘못 긍정)와 ‘false negative’(잘못 부정)**가 동일한 수가 되도록 커스텀 임계값을 설정합니다.

이렇게 하면:

  • 과잉 분류로 인해 전체 분류율이 왜곡되지 않도록 조정 가능
  • 특히 의원 개인 단위의 메시지 스타일을 정확히 측정할 수 있어요

4단계. 📡 트위터뿐 아니라 페이스북, 뉴스레터까지 확장

모델은 트윗을 기준으로 훈련되었지만, 이후에는:

  • 페이스북 게시물 → 문장 단위로 나눠서 분류
  • 뉴스레터 → 문장 또는 문장 bigram 단위로 분류

물론 정확도는 플랫폼별로 조금씩 다르지만, 여전히 정치 커뮤니케이션 연구 기준에서 상당히 높은 성능입니다.


🔍 성능 요약 (Balanced Accuracy 기준)

플랫폼광고입장 표명정책 성과부정적 공격초당 협력
트위터 80% 77% 82% 82% 89%
페북 76% 80% 75% 74% 83%
뉴스레터 66% 75% 79% 64% 75%

📏 (3) 정당 성향을 수치화한다 (Scaling)

— 정치인의 말, 얼마나 편향됐는지 숫자로 보여준다

정치인의 메시지가 어느 정당에 가까운지는 직관적으로 느껴질 수 있지만, 이걸 수치화해서 측정하는 건 별개의 문제입니다.

이 논문은 텍스트 기반의 연속형 편향 지표를 만들어냅니다.


사용한 기법: Class Affinity Scaling Model (Perry & Benoit, 2017)

이건 지도학습이 아니라 **척도화(scaling)**입니다. 핵심 아이디어는 다음과 같습니다:

메시지 안의 단어들이 민주당 의원이 자주 쓰는 단어인지,
아니면 공화당 의원이 자주 쓰는 단어인지를 통계적으로 판단해서,
그 메시지가 어느 정당 성향에 가까운지 확률로 측정

 

📏 Class Affinity Scaling Model이란?

간단히 말하면,

어떤 텍스트가 ‘A 그룹’의 말투에 더 가까운지, 아니면 ‘B 그룹’의 말투에 더 가까운지를 확률적으로 측정하는 모델입니다.

이 모델의 핵심 아이디어는 다음과 같아요:

📌 “사람의 정체(소속)를 모를 때, 그가 쓴 말을 보고 어느 쪽에 더 가까운지 추정하자!”

예를 들어 누군가가 “climate crisis”, “social justice”, “common-sense gun laws” 같은 말을 자주 쓴다면…
그 사람은 공화당보다는 민주당 쪽일 가능성이 크겠죠?

반대로 “border crisis”, “illegal aliens”, “Second Amendment rights” 같은 표현을 쓰면…
공화당에 가까울 겁니다.

Class Affinity Model은 이렇게 단어 사용 패턴을 기반으로,

"이 텍스트는 공화당이 말했을 확률은 몇 %인가?"
"민주당일 확률은 몇 %인가?"
를 수학적으로 계산합니다.


⚙️ 작동 원리: 수학적으로 어떻게 계산하나?

먼저, 주요 기호 정리부터 할게요:

기호의미
Wi 메시지의 i번째 단어 (token)
Ui 그 단어의 ‘정체성’ (민주당인지, 공화당인지)
πr 메시지 전체가 공화당일 확률
P(Wi=w∣Ui=r) 공화당일 때 단어 w가 나올 확률
P(Wi=w) 단어 w가 실제로 사용된 확률 (관측값)

⚙️ Step-by-step 설명

📍 Step 1. "말하는 방식"을 정의한다

먼저, 공화당과 민주당이 각각 어떤 단어를 얼마나 자주 쓰는지 계산합니다.
이건 일종의 언어 프로필(language profile)을 만드는 작업이에요.

예를 들어:

단어민주당 빈도공화당 빈도
"gun safety" 0.07 0.01
"border crisis" 0.01 0.08
"freedom" 0.05 0.06
"childcare" 0.04 0.01

→ 이렇게 하면 각 단어에 대해 P(w | 민주당), P(w | 공화당) 확률값이 생기죠.


📍 Step 2. 실제 메시지 속 단어들을 본다

이제 특정 의원의 트윗이나 뉴스레터가 있다고 가정합시다.
그 안에 들어 있는 모든 단어 W1,W2,...,Wn을 확인합니다.

예시 텍스트:

"We must fix the border crisis and protect our freedoms."

여기 들어간 단어들을 나열하고, 각 단어가 공화당/민주당에서 얼마나 흔한지를 조사합니다.


📍 Step 3. 공화당일 확률 πr을 추정한다

이제 본격적인 핵심 수식입니다.

이 모델은 다음과 같은 혼합 확률 모델을 세웁니다:

즉, 어떤 단어 w가 나왔다는 것은

“이 사람이 공화당일 수도 있고, 민주당일 수도 있는데, 각각의 확률에 따라 이 단어가 나올 확률을 섞어서 본 것”이라는 의미예요.

모든 단어에 대해 이 수식을 적용하면, 텍스트 전체에서

공화당일 확률 πr이 무엇이면 이 문장을 가장 잘 설명할 수 있는지를 추정합니다.

→ 이 추정 작업은 일반적으로 최대우도추정(Maximum Likelihood Estimation)으로 이루어집니다.


📍 Step 4. 결과 점수 계산

계산된 πr0~1 사이의 수치입니다.

  • πr=0.90→ 공화당일 확률이 90%
  • πr=0.10 → 민주당일 확률이 90%

하지만 논문에서는 이를 더 직관적으로 보기 위해 범위를 -1에서 +1로 변환합니다:

  • -1: 가장 민주당 성향
  • 0: 중도 (양쪽 다 비슷하게 사용된 단어들)
  • +1: 가장 공화당 성향

그리고 추가로, 정당 성향의 강도만 측정하고 싶을 때는 절댓값을 씌워서:

  • 0.0 → 아주 중립적인 언어
  • 1.0 → 매우 극단적인 언어 (어느 한쪽 말만 씀)

🧪 이 모델이 다른 모델과 다른 점은?

구분일반 분류기 (SVM, Naive Bayes 등)Class Affinity Scaling
목표 A or B로 딱 잘라 분류 A에 가까운지, B에 가까운지를 연속적으로 추정
결과 0 또는 1 (이분법) 확률 또는 점수 (-1 ~ +1)
활용 문서 분류, 필터링 성향 분석, 정치적 스펙트럼 측정 등

이 모델은 정당성향이나 정치이념처럼 연속적인 특성을 가진 텍스트를 분석할 때 특히 유용합니다.


🧠 왜 이 연구에서 이 모델을 썼을까?

미국 의원들의 메시지는 대부분 "당연히 민주당/공화당 의원이 썼겠지"라고 추정 가능하지만,
실제로는 같은 민주당 안에서도 매우 온건한 말투를 쓰는 의원도 있고,
공화당 의원이지만 중도 성향으로 말하는 사람도 있죠.

이런 미묘한 차이, 말투의 정도 차이를 측정하려면
단순 이분법 분류가 아니라, 연속형 점수화 모델이 필요합니다.

Class Affinity Model은:

  • 메시지 하나하나에 대해 정당 편향 점수를 줄 수 있고
  • 의원 단위로 평균 점수를 내면 “이 의원은 말투는 진보적이지만 행동은 보수적이다” 같은 분석도 가능하게 해줍니다.

✅ 마무리 요약

핵심 요소설명
목적 텍스트가 어느 정당 스타일에 가까운지를 확률적으로 측정
작동 방식 단어 사용 확률을 바탕으로 혼합모델 추정 (π_r)
출력값 정당 점수 (-1 = 민주당, +1 = 공화당), 극단성 점수
장점 미묘한 편향 정도까지 정량화 가능, 의원 간 스펙트럼 비교 가능
사용 이유 의원들의 ‘말투의 이념적 강도’를 정밀하게 측정할 수 있어서

수식 설명 (쉽게 풀어쓰기)

  • 메시지를 구성하는 단어 = W
  • 어떤 단어 w를 썼을 확률은 이렇게 계산:

여기서 π_r은 그 메시지가 공화당 성향일 확률입니다.

 

 

✅ 3) 검증도 철저히!

이 점수, 믿을 수 있을까?

연구진은 이 점수를 다음의 실제 정치 성향 지표들과 비교하여 검증합니다:

  1. DW-NOMINATE score: 의원의 표결 성향 (의회 투표 분석 기반)
  2. CFscore: 의원에게 기부된 정치자금의 성향 (기부자 분석)

📊 상관계수 결과:

  • 공화당 의원의 경우: 0.30~0.50 수준
  • 민주당 의원도 0.20~0.34 수준으로 꽤 높은 상관관계
  • 즉, 실제 행동과 말의 성향이 일관되게 연결되어 있다는 것!

🔎 보너스: 의원 유형별 분석도 가능

연구진은 의원의 입법 스타일(정책중심? 지역구중심? 당 중심?)과 메시지 스타일의 연관성도 함께 분석했습니다.

예시:

  • 지역구 중심 의원(District Advocates) → 지역 성과 자랑 메시지 많음
  • 정당 충성 의원(Party Soldiers) → 부정적 정당 공격 메시지 많고, 초당적 협력 거의 없음

→ 메시지 분류와 정당 점수를 조합하면 의원 개인의 전략적 커뮤니케이션 패턴까지 분석 가능!


🧠 정리 요약

작업설명사용 기법
메시지 목적 분류 정치적 커뮤니케이션의 의도 파악 (6가지 분류) 수작업 라벨링 + Random Forest
정당 성향 스케일링 문장 또는 메시지의 정당 편향 점수 계산 (-1~+1) Class Affinity Model
성능 검증 기존 이념 점수와 비교 (DW-NOMINATE, CFscore) 상관관계 분석

 

 


🧠 요약하면…

단계설명
데이터 수집 2009~2022 트윗, 페북, 뉴스레터 약 780만 개
메시지 분류 정치 커뮤니케이션 목적 6가지 카테고리 분류
정당 성향 스케일링 텍스트의 정당 편향 정도를 -1 ~ +1 점수로 수치화
기술 수작업 라벨링 + 머신러닝(Random Forest), Class Affinity Model 사용
검증 의원의 표결 성향, 후원금 성향과 비교해 신뢰도 확보

이 방법론 덕분에, 우리는 단순히 "누가 무슨 말 했는가?"가 아니라,
"정치인들이 어떤 전략으로 말하고 있는가?",
"그 말이 어느 정당 색을 띄는가?",
"그 전략이 유권자에게 먹히는가?"를 정량적으로 분석할 수 있게 되었어요.


3. 🔍 연구 결과 ①: SNS 언어, 점점 더 극단적으로 변하고 있다

— SNS는 ‘센 말’이 이기는 세계

자, 이제 본격적인 결과 이야기입니다.

이 논문에서 연구진이 가장 먼저 한 질문은 이거예요:

“정치인들이 SNS에서 쓰는 언어, 시간이 지나면서 어떻게 바뀌었을까?”

📈 분석 기간: 무려 14년!

  • 2009년부터 2022년까지
  • 트윗, 페이스북, 뉴스레터까지 모두 포함
  • 메시지 하나하나에 ‘정당 성향 점수’(민주당 -1 ~ 공화당 +1)를 매긴 후, 그 점수가 어떻게 변화했는지 추적

📊 결과 1: 시간이 지날수록 점점 더 정당색이 강해졌다

2009년에는 민주당 의원이 쓰는 언어와 공화당 의원의 언어가 꽤 비슷했어요.
그런데 2022년쯤 되면… 완전히 딴 세상 말을 쓰는 사람들처럼 변했죠.

  • 2009년: “오늘 이런 법안을 발의했습니다” (중립적 톤)
  • 2022년: “민주당은 나라를 말아먹고 있어요!” “공화당은 인간도 아냐!”

물론 이건 과장이지만, 실제로 극단적인 정당 언어가 급증한 건 사실입니다.


🔴🔵 결과 2: 공화당보다 민주당이 더 많이 바뀌었다?

흥미로운 포인트는, 이 극단화 현상이 공화당보다 민주당에서 더 두드러졌다는 점입니다.

“에이, 공화당이 더 극단적이지 않나?” 생각할 수 있지만, 데이터는 이렇게 말합니다:

  • 공화당은 2009년부터 이미 꽤 보수적인 표현을 사용하고 있었고,
  • 민주당은 점점 더 강한 표현, 당파적 표현으로 이동하는 흐름이 관측됨

예를 들어,

  • 2010년 초반: 민주당 메시지의 평균 정당 점수 → -0.01 (거의 중립)
  • 2022년 말: 민주당 메시지 평균 → -0.73 (강한 민주당 편향)

공화당도 조금 더 오른쪽으로 가긴 했지만, 민주당 쪽 변화폭이 훨씬 컸어요.


🧨 결과 3: ‘입장 표명’과 ‘정당 공격’ 메시지도 눈에 띄게 늘었다

연구팀은 메시지를 ‘목적’ 기준으로도 분류했잖아요?

그 결과, 14년 동안 다음 두 가지 유형의 메시지가 뚜렷하게 증가했습니다:

  1. 입장 표명 (Position-Taking)
    → “나는 이 법안에 찬성/반대합니다”
    → 민주당은 2010년 46% → 2022년 66%가 입장표명 메시지
    → 공화당은 47% → 60%
  2. 부정적 정당 공격 (Negative Partisanship)
    → “상대 정당이 나쁩니다”라는 메시지
    → 민주당은 9% → 19%, 공화당은 14% → 25%

반대로, 예전엔 많이 하던 ‘광고성 메시지’(나는 어디 다녀왔어요~)는 오히려 줄었어요.
이건 결국 정치인들이 점점 더 입장을 뚜렷하게 드러내고, 상대를 비판하는 쪽으로 소통 전략을 바꿔왔다는 뜻이에요.


📌 정리하면,

SNS가 본격화된 2010년대 이후, 정치인의 언어는 더 극단적이고, 더 공격적이고, 더 진영 논리에 가까워졌습니다.

이는 단순한 직감이 아니라, 수백만 개의 메시지를 수치화한 결과에서 드러난 통계적 사실입니다.


4. 🔍 연구 결과 ②: SNS 반응과 유권자 반응은 완전히 다르다

— 좋아요 많이 받았다고 표도 받는 건 아니다

정치인들이 점점 더 센 말, 당파적인 말, 공격적인 말을 SNS에 올리게 된 이유는 무엇일까요?

그 이유 중 하나는 아주 간단합니다:

그런 메시지가 SNS에서 ‘인기’ 있으니까요.

그런데 여기서 중요한 질문 하나가 생기죠.

“SNS에서 좋아요를 많이 받는 말 = 유권자들이 좋아하는 말일까?”

연구진은 여기에 대해 아주 정밀하게, 두 가지 방식으로 분석했습니다.


① SNS 반응 분석: 어떤 메시지가 좋아요와 리트윗을 더 많이 받나?

연구팀은 트윗 300만 개 이상을 분석해서
각 메시지의 유형과 SNS 반응(좋아요, 리트윗 수)의 관계를 조사했어요.

🔎 결과는 이랬습니다:

메시지 유형SNS 반응 (좋아요/리트윗)
🔥 부정적 정당 공격 👍 리트윗 +87%, 좋아요 +76%
📣 입장 표명 👍 리트윗 +38%, 좋아요 +20%
🎯 극단적인 표현 (정당 점수 극단) 리트윗 증가 (좋아요는 변화 없음)
🧸 광고 ❌ 좋아요/리트윗 모두 감소
🏛️ 지역구 성과 자랑 ❌ 좋아요/리트윗 감소

정리하면:

  • 센 말, 강한 입장, 정당 공격 → SNS에서 매우 인기
  • 잔잔한 성과 공유, 지역 활동 소개 → 관심도 낮음

② 유권자 반응 분석: 어떤 메시지가 유권자 지지율을 올리나?

이번엔 연구팀이 전국 여론조사 데이터(협동선거조사 CES)를 활용해서,
각 의원의 평균 메시지 스타일지지율(approval rating) 사이의 관계를 분석했어요.

그 결과는 놀랍게도 SNS 반응과는 정반대였습니다!

📌 결과 요약:

메시지 유형유권자 반응 (지지율 변화)
🏛️ 정책 성과 자랑 👍 지지율 가장 높아짐
🎯 극단적 언어 👎 전체 유권자·중도층 지지율 낮아짐
🔥 부정적 정당 공격 😐 효과 없음 (가끔 같은 당 지지자에겐 살짝 긍정적)
📣 입장 표명 👎 지지율 감소
🧸 광고 😐 큰 영향 없음

즉,

  • SNS에서는 ‘센 말’이 통하지만,
  • 현실 정치에서는 '차분하고 실용적인 메시지'가 표를 만든다는 결론입니다.

💡 이 괴리를 연구진은 “Social Media Feedback Mirage(소셜 미디어 환상)”라고 부름

정치인은 SNS에 글을 올리면 즉각적인 반응을 받을 수 있어요.
“이 메시지는 리트윗이 5천이야!” → “이 말이 인기 있구나!”라고 착각하게 되는 거죠.

하지만 실제로 유권자들은 그렇게 생각하지 않을 수도 있어요.
SNS 반응은 진짜 민심이 아니라, 소수의 활동적인 이용자들 반응일 수 있으니까요.

이게 바로 연구진이 말하는 **"소셜 미디어 환상"**입니다.


🎯 핵심 요약

항목SNS 반응유권자 반응
정당 공격 아주 긍정적 별로 안 좋아함
강한 입장 긍정적 오히려 지지율 낮춤
정책 성과 자랑 관심 없음 👍 지지율 증가
지역구 활동 별 반응 없음 중립적 또는 긍정적
광고성 글 좋아요도 안 받고, 지지율도 별 영향 없음  

 

5. 📝 왜 이 연구가 중요한가?

이 논문은 단순히 "SNS가 위험하다"는 수준을 넘어서,

  • 아주 정량적이고 장기적인 데이터를 바탕으로,
  • 정치인의 커뮤니케이션 전략이 어떻게 변했는지,
  • 그리고 그것이 유권자에게 어떤 영향을 미치는지 보여줍니다.

게다가, 앞으로 이 데이터셋은 다른 연구자들이 “선거 전후 메시지 변화”, “정당 내 경쟁” 등 다양한 질문을 분석하는 데 쓸 수 있는 소중한 자원이 될 거예요.


✨ 마무리 요약

  • SNS 시대, 정치인들은 점점 더 극단적이고 부정적인 언어를 사용하고 있음
  • SNS에서는 그런 메시지가 인기지만, 실제 유권자는 싫어함
  • 이런 괴리를 소셜 미디어 환상이라 부름
  • 이 논문은 장기적이고 종합적인 데이터 분석으로 이 현상을 체계적으로 보여줌