[논문 리뷰] Han (2021) 한국에서의 엘리트 양극화

South Korean National Assembly에서 Polarization 측정: NLP를 활용한 새로운 접근
최근 정치학 연구에서는 polarization(정치적 양극화)이 어떻게 국가의 정책 결정과 민주주의에 영향을 미치는지에 대한 논의가 활발합니다. 특히, 한국 국회에서의 polarization은 정당 간의 이념적 대립과 협상 불능을 넘어 사회적 갈등까지 확대되고 있어 주목받고 있습니다. 이번 연구는 기존의 롤콜 데이터나 설문조사를 넘어, 회의록 텍스트 데이터를 NLP(Natural Language Processing)로 분석해 South Korean National Assembly의 polarization을 새로운 방식으로 측정했다는 점에서 큰 의의가 있습니다.
1. Polarization을 언어로 측정하다
이 연구의 핵심은 NLP 모델(BERT)을 사용해 정치적 언어를 분석하고, 이를 기반으로 polarization의 정도를 수치화했다는 점입니다. 기존 연구들은 롤콜 데이터(투표 결과)나 설문조사 응답을 사용해 polarization을 측정했지만, 이 방법들은 다음과 같은 한계가 있었습니다:
- 표면적 데이터의 문제: 롤콜 데이터는 투표 결과만을 반영하며, 투표 과정에서의 논의나 설득 과정을 배제합니다.
- 응답 신뢰성 부족: 설문조사는 응답자의 자기보고에 의존하므로, 실제 행동과 괴리가 있을 수 있습니다.
이에 비해, 이 연구는 국회 법제사법위원회 제2소위원회의 회의록을 활용하여 정당 간 언어적 차이를 분석했습니다. 이는 투표 결과나 설문보다 더 생생한 정치적 상호작용을 반영합니다.
2. NLP 모델을 활용한 Polarization 측정 방법
연구는 한국어 텍스트 데이터를 분석하기 위해 BERT 모델을 사용했습니다. 핵심 과정은 다음과 같습니다:
- 훈련 데이터 준비:
- 국회 소위원회 회의록 데이터를 수집하고, 각 발언을 진보(0)와 보수(1)로 레이블링.
- NLP 모델이 정당별 언어적 특징을 학습하도록 훈련 데이터를 구성.
- Polarization 측정 논리:
- Polarization이 강하면 정당 간 언어적 차이가 커지므로, NLP 모델이 더 높은 정확도로 분류할 수 있음.
- 분류 정확도가 높을수록 (NLP 모델이 두 그룹을 쉽게 구분할만큼 논조가 엄청 다르다는 것으로 해석함) 정당 간 언어적 polarization이 심하다는 것을 의미.
- 시계열 분석:
- 법제사법위원회 제2소위원회 회의록의 분류 결과를 연도별로 집계해, 시간에 따른 polarization의 변화를 추적.
3. 결과: 2016년 이후 Polarization 급등
연구 결과에 따르면:
- 2004년부터 2016년까지는 polarization이 완만하게 증가하거나 감소를 반복했습니다.
- 2016년 이후, 특히 박근혜 전 대통령의 탄핵 사건 이후, polarization은 급격히 증가해 높은 수준을 유지했습니다.
- 이는 정당 간 언어적 대립이 심화되었음을 보여주며, 정치적 협상이 점점 어려워지고 있음을 시사합니다.
4. 의미와 한계
의미:
- 새로운 접근법: 이 연구는 NLP를 활용한 텍스트 분석으로 기존 연구가 놓친 의회 내 언어적 상호작용을 효과적으로 측정했습니다.
- 실제 행동 반영: 설문조사나 롤콜 데이터와 달리, 회의록은 정당의 실제 대화와 논쟁을 반영하므로 더 신뢰할 수 있는 결과를 제공합니다.
한계:
- 언어적 차이와 실제 이념의 차이: 언어적 polarization이 실제 이념적 polarization을 완전히 대변한다고 보기는 어려움.
- 데이터 편향: 특정 시점에서의 데이터 누락이나 레이블링 과정에서의 주관성이 결과에 영향을 미칠 수 있음.
5. 결론: Polarization 해결을 위한 새로운 통찰
이 연구는 South Korean National Assembly의 polarization이 단순히 정당 간 이념적 차이뿐만 아니라, 언어적 대립과도 깊이 연관되어 있음을 보여줍니다. 특히, 2016년 이후 극단화된 정치 언어는 국회의 생산성을 저해하고, 대화와 협상 가능성을 낮추는 주요 원인으로 작용하고 있습니다.
이 연구는 NLP와 같은 첨단 기술이 정치학 연구에 어떻게 기여할 수 있는지 보여주는 좋은 사례입니다. 앞으로도 정치적 polarization 문제를 해결하기 위해, 데이터 기반의 더 정교한 분석과 해결 방안 모색이 필요합니다.
정치와 데이터 분석에 관심 있다면 이 주제를 탐구해보세요!