카테고리 없음

[LLM/정치학] Kittel (2025) 포퓰리스트들은 더욱 단순한 언어를 쓰는가? (G&O)

Dr. Julia 2025. 3. 30. 05:16

독일 국회에서 포퓰리스트는 더 쉬운 말을 할까?

📚 Rebecca C. Kittel (2025), Government and Opposition

포퓰리스트 정치인은 ‘보통 사람들’을 대변한다고 주장하며, 복잡한 정치 문제를 단순화해 전달하려는 경향이 있다고 알려져 있습니다. 그럼 정말 국회 연설에서 포퓰리스트는 더 쉬운 언어를 사용할까요?

Rebecca C. Kittel의 이 논문은 바로 그 질문에 답하고자 합니다. 독일 연방의회(Bundestag)의 30년치(1991~2021년) 연설문 데이터를 바탕으로, 포퓰리스트 정치인들이 비포퓰리스트보다 단순한 언어를 사용하는지, 또 좌우 이념에 따라 차이가 있는지를 실증적으로 분석합니다.

결론부터 말하면:
👉 포퓰리스트가 반드시 쉬운 말을 쓰는 건 아니다.
오히려 우파 포퓰리스트(AfD)는 국회 연설에서 가장 복잡한 언어를 사용하는 경향이 있었고, 좌파 포퓰리스트(Die Linke)는 평균 정도의 복잡도를 보였다는 결과가 나왔습니다.


언어 단순화는 왜 중요한가?

정치인의 언어 스타일은 단순히 말투나 수사 수준의 문제가 아닙니다. 언어의 복잡도는 유권자의 정치 이해도와 대표성의 문제와도 깊이 연결되어 있습니다. 예를 들어 너무 복잡한 언어는 교육 수준이 낮은 유권자를 소외시키는 반면, 단순한 언어는 더 많은 사람들에게 정치 메시지를 전달할 수 있는 통로가 됩니다. 따라서 "누가, 언제, 어떤 이슈에서 더 쉬운 언어를 쓰는가?"는 민주주의의 대표성과 포괄성 측면에서 중요한 질문입니다.

 

📊 연구 방법 요약: 데이터 + 측정 + 모델링

이번 연구는 “포퓰리스트는 정말 단순한 언어를 쓸까?”라는 질문을 실증적으로 검증하기 위해 세 가지 핵심 과정을 밟습니다.

  1. 어떤 데이터를 썼는지,
  2. 언어의 ‘복잡함’을 어떻게 수치로 측정했는지,
  3. 그 데이터를 가지고 어떤 통계적 분석을 했는지(모델링)
    이 세 가지를 하나씩 자세히 살펴볼게요.

1️⃣ 데이터: 독일 국회 연설문 13만 개 분석

연구자는 **독일 연방의회(Bundestag)**의 연설문 데이터를 사용했습니다.
이 데이터는 Open Discourse Dataset이라는 공개 자료에서 가져온 것으로, 1991년부터 2021년까지 총 30년간 국회에서 나온 연설문이 전부 포함돼 있어요.

📌 데이터 범위

  • 기간: 1991년 1월 ~ 2021년 5월
    (독일 통일 이후 제12대부터 제19대까지, 총 7개의 입법기간을 포함)
  • 총 연설문 수: 약 132,778개
  • 사용 언어: 독일어
  • 자료 단위: 개별 연설문 → 연설자(MP) → 정당

📌 데이터 전처리 과정 실제 분석 전에 아래처럼 불필요하거나 왜곡될 수 있는 자료를 걸러냈습니다.

  • 150단어 미만 연설문 제거: 짧은 질문, 야유, 방해 발언 등은 분석에서 제외
  • 국회의장 및 부의장의 발언 제외: 중립적 진행자 역할만 하므로 분석 대상 아님
  • MP 개인 정보 추가 매칭:
    • 성별
    • 나이
    • 학위 여부(‘박사’ 호칭 유무를 간접 지표로 사용)
    • 직접 선출 여부(직선 or 비례대표)
    • 소속 정당과 내각 장관 여부

이렇게 전처리를 거친 후, 실질적인 발언 내용발언자의 개인 정보를 함께 고려해서 분석할 수 있게 데이터셋을 구성했습니다.


2️⃣ 언어 복잡도 측정: 'LIX 점수'란 무엇인가?

정치인의 언어가 ‘복잡하다’ 또는 ‘쉽다’는 감각적인 표현을 숫자로 측정할 수 있을까요?
이 논문은 독일어 연설문에 가장 적합한 방법으로 **LIX 점수(Läsbarhetsindex)**를 사용합니다.

💡 LIX 점수란?

  • 원래는 스웨덴에서 개발된 읽기 난이도 지표예요.
  • 주로 문장의 길이긴 단어의 비율을 기반으로 계산됩니다.
  • LIX가 높을수록 문장이 길고 어려운 단어가 많다는 뜻이고, 따라서 더 복잡한 언어로 간주됩니다.

📐 LIX 계산 공식:

 
LIX = (총 단어 수 / 총 문장 수) + 100 × (7음절 이상 단어 수 / 전체 단어 수)

예를 들어, 문장이 길고 ‘Gesundheitsversorgung’(건강보험제도) 같은 복합 단어가 많으면 점수가 올라갑니다.

📌 참고: 평균 LIX 점수는 약 48.5

  • 30년간 모든 연설 평균: 48.5
  • 최근 19대 국회(2017~2021): 46.5 → 전반적으로 점점 단순화되는 경향

🧪 다른 복잡도 지표도 함께 비교:

연구자는 LIX 외에도 총 4가지 복잡도 측정 방법을 사용하고 상관관계를 비교했습니다.

지표 이름특징
LIX 독일어에 적합, 단어 길이 중심
Flesch Reading Ease (FRE) 영어에 적합하지만 타 언어에 적용 가능
SMOG.de 독일어 버전의 SMOG 점수
Sophistication Probability 머신러닝 기반으로 문장의 정치적 정교함 측정 (Benoit et al. 2019)

→ 네 가지 모두 높은 상관관계를 보였고, 특히 LIX와 SMOG.de는 독일어에 최적화된 도구임을 확인했어요.


3️⃣ 분석 방법(모델링): 다층모형(multilevel regression) 적용

데이터와 복잡도 측정이 끝났다면, 다음은 그 데이터를 어떻게 통계적으로 분석했는지가 중요하겠죠?

Kittel은 **다층모형(multilevel model)**을 사용해 분석합니다. 이유는 이렇습니다:

🎯 왜 다층모형?

연설문은 아래처럼 구조화돼 있어요:

하나의 연설문 → 하나의 정치인(MP) → 하나의 정당 소속

즉, 연설문은 정치인 안에 “종속되어” 있고, 정치인은 정당 안에 속해 있기 때문에 단일 회귀모형으로는 오차를 제대로 조정할 수 없습니다. 그래서 계층적 구조를 반영한 통계기법, 즉 다층모형이 적절합니다.

📌 주요 분석 요소

  • 종속변수: 언어 복잡도 (LIX 점수, 표준화 처리)
  • 1차 독립변수:
    • 포퓰리스트 여부:
      • 좌파 포퓰리스트(Die Linke),
      • 우파 포퓰리스트(AfD),
      • 비포퓰리스트(나머지)
  • 개인 특성:
    • 성별, 나이, 박사학위 여부, 내각 소속 여부, 직접선출 여부
  • 시간 효과:
    • 입법기간(제12~19대) 또는 주 단위 시간 변인(특히 19대 분석 시)
  • 임의효과(random effects):
    • 정치인(MP)별, 정당별 절편(random intercepts)
    • 시간 효과의 기울기(random slope)

🧪 추가 분석: 주제와 언어 복잡도의 관계

이슈별로 언어 복잡도가 달라지는지도 확인하기 위해, 각 연설문에 등장하는 **토픽 주제(topic)**를 분류합니다.

  • 방법: Seeded LDA (반지도학습 토픽모델)
  • 사전(dictionary): 복지, 노동, 이민, 환경 등 13개 이슈 주제
  • 주제 분류 정확도 검증: 수작업 분류와 비교해 Krippendorff’s Alpha = 0.67 확보
  • 주제별 언어 복잡도, **토픽 비중(한 달 동안 해당 이슈가 차지한 비율)**도 모델에 포함시켜서 정교한 분석 수행

이렇게, 단어 하나하나가 쌓인 국회의 연설문을
30년 동안 추적하고, 그 문장의 길이와 단어를 수학적으로 해석하고,
정당, 정치인, 시대적 맥락, 이슈까지 모두 포함해 분석한 이 연구는
‘언어의 정치’를 실증적으로 측정한 모범 사례라 할 수 있습니다.

 

 

🔍 주요 결과 요약

  1. 포퓰리스트 = 단순 언어? No.
    • 포퓰리스트라고 해서 단순한 언어를 쓰지 않음
    • 우파 포퓰리스트(AfD)는 오히려 가장 복잡한 언어 사용
    • 좌파 포퓰리스트(Die Linke)는 평균 수준
  2. 전체적으로 국회 연설은 점점 단순해지는 중
    • 1991년 → 2021년: 평균 LIX 점수 50 → 46으로 하락
    • 정당 불문하고 전체적으로 단순화 추세
  3. 정당보다 개인 차이가 더 큼
    • 같은 정당 내에서도 단어 복잡도 큰 차이
    • 학위 보유, 연령, 직접 선출 여부 등에 따라 달라질 수 있음
  4. 주제별 차이 존재
    • ‘예산과 세금’ 이슈는 가장 쉬운 언어 사용
    • ‘시민권’ 이슈는 가장 복잡한 언어 사용
    • 주제가 언론에서 더 많이 다뤄지고, 자주 토론될수록 단순한 언어 경향
  5. 포퓰리즘 점수↑ → 언어 복잡도↑
    • 포퓰리즘 어휘를 더 많이 쓸수록 연설문 복잡도도 높아짐
    • 단순한 언어와 포퓰리즘은 직접적 상관관계가 없음

✍️ 마무리: ‘단순한 언어’는 포퓰리즘의 핵심이 아니다?

Kittel은 기존의 통념에 의문을 제기합니다.
포퓰리스트가 단순한 언어로 대중을 호도한다는 일반적인 인식과 달리, 국회 연설에서는 복잡한 언어를 더 많이 사용하는 경향이 있다는 것입니다.

이는 포퓰리스트가 **‘자신들의 지지층’만을 대상으로 한 상징적 대표(symbolic representation)**를 중시하며, 오히려 언어를 복잡하게 사용해 타 집단을 배제할 수도 있다는 해석을 가능케 합니다. 단순한 언어는 모두를 포함하는(substantive or surrogate representation) 방식이기 때문에 포퓰리스트의 전략과 상충할 수 있다는 점이 흥미롭습니다.


이 논문은 정치 언어 스타일과 대표성, 그리고 포퓰리즘의 관계를 탐구하는 데 있어 훌륭한 통찰을 제공합니다. 특히 수십 년치 연설문을 기반으로 정교한 텍스트 분석 방법론을 적용했다는 점에서 방법론적으로도 매우 인상적입니다.