[LLM 정치학] Bro (2025) 텍스트에서 정치 네트워크 추출하기?
GPT-4를 활용한 정치 네트워크 분석: 칠레 의회 사례 연구
연구 개요
최근 사회과학자들은 대형 언어 모델(LLM)의 활용 가능성을 탐색하며, 특히 정치 네트워크 분석에 대한 관심이 커지고 있어요. 이번 연구에서는 GPT-4를 이용하여 뉴스 텍스트에서 정치 네트워크를 자동으로 추출하는 방법을 소개합니다. 기존의 수작업 방식과 달리, GPT-4는 개체 인식(entity recognition), 관계 추출(relation extraction), 개체 연결(entity linking), 감성 분석(sentiment analysis)을 하나의 과정으로 통합하여 보다 효과적인 분석을 가능하게 합니다.
연구진은 2021년 11월부터 2023년 9월까지의 칠레 정치 뉴스 기사 1,009건을 분석하여, GPT-4가 추출한 네트워크를 의회 내 입법적 동의율(legislative agreement)과 비교하여 검증했어요. 연구는 크게 두 부분으로 나뉘며, 첫 번째는 회귀 분석을 통해 부정적인 관계성이 입법적 동의율 감소와 관련이 있는지 검토하고, 두 번째는 네트워크 내 거리(network distance)가 동의율에 미치는 영향을 감성 분석을 포함한 상태와 포함하지 않은 상태에서 비교하는 실험입니다.
그 결과, 감성 분석을 적용한 네트워크가 더 강한 예측력을 보이며, GPT-4의 정치 네트워크 분석 활용 가능성을 시사하는 중요한 연구라고 할 수 있어요.
연구 방법
1. 데이터 수집 및 전처리
- 뉴스 데이터셋: 연구진은 Eventregistry에서 칠레 국회의원들이 언급된 뉴스 클립 42,385건을 수집.
- 분석의 초점이 국회의원 간 관계에 있기 때문에, 최소 두 명의 국회의원이 등장하는 뉴스만을 선정하여 최종 1,009건을 데이터셋으로 구축.
- 예산과 시간 제한으로 인해 기사 길이가 10번째 백분위수 이하인 짧은 기사만 포함.
2. GPT-4를 활용한 정치 네트워크 추출
GPT-4는 뉴스 기사에서 국회의원의 관계를 다음과 같은 방식으로 분석했어요.
- 개체 인식(Entity Recognition): 기사에서 국회의원 이름을 식별
- 개체 연결(Entity Linking): "대통령 보리치"와 "가브리엘 보리치"가 동일인인지 판단
- 관계 추출(Relation Extraction): 국회의원 간 상호작용(예: 비판, 협력, 공동 발의 등) 파악
- 감성 분석(Sentiment Analysis): 관계가 긍정적(+1), 부정적(-1), 중립적(0)인지 분류
- 네트워크 구조화: JSON 포맷으로 데이터를 저장 후 NetworkX 라이브러리를 사용하여 그래프를 구성.
3. GPT-4 프롬프트 구성
이 연구에서 사용된 GPT-4 프롬프트는 다음과 같은 형식으로 작성되었어요.
시스템 역할 프롬프트:
당신은 고급 텍스트 분석 시스템으로, 칠레 의회 관련 뉴스를 분석하는 전문가입니다.
다음은 분석할 국회의원 목록입니다: {names}.
이 뉴스에서 등장하는 국회의원을 정확히 식별하고 관계를 분석하세요.
사용자 입력 프롬프트:
다음은 뉴스 클립입니다:
{text}
이 뉴스에서 국회의원들 간 관계를 추출하고, 감성을 분석하여 JSON 형식으로 제공하세요.
JSON에는 "nodes"(국회의원 개체)와 "edges"(국회의원 간 관계 및 감성 분석 결과)를 포함하세요.
4. 입법적 동의율을 활용한 검증
입법적 동의율이란?
- 두 국회의원이 동일한 방식으로 투표한 비율을 나타내며, 정치적 유사성을 측정하는 지표.
- 공식 기록된 칠레 국회의 회의록에서 2022년 3월 11일부터 2023년 9월 15일까지의 투표 데이터를 기반으로 계산.
5. 실험 1: 관계성과 입법적 동의율 분석
- H0(귀무가설): 뉴스에서 연결된 국회의원 간 입법적 동의율 차이가 없음.
- H1(대립가설): 긍정적 관계는 더 높은 입법적 동의율과, 부정적 관계는 더 낮은 동의율과 관련 있음.
- 결과:
- 두 국회의원이 뉴스에서 함께 언급될 경우 입법적 동의율이 증가 (β = 0.109, p < 0.001)
- 부정적 감성이 강할수록 입법적 동의율이 감소 (β = -0.415, p < 0.001)
- 긍정적 감성은 유의미한 효과 없음 (β = -0.060, p = 0.105)
6. 실험 2: 네트워크 거리와 입법적 동의율 분석
- H0(귀무가설): 네트워크 거리(network distance)가 입법적 동의율에 영향을 주지 않음.
- H1(대립가설): 네트워크에서 가까운 관계일수록 입법적 동의율이 높을 것.
- 결과:
- 감성 가중치를 포함한 거리 측정이 더 강한 예측력을 보임 (β = -0.211, p < 0.001)
결론
이번 연구는 GPT-4를 활용한 정치 네트워크 분석의 가능성을 탐색하고, 이를 입법적 동의율을 통해 검증했어요. 연구 결과, 뉴스 텍스트에서 추출한 감성 네트워크가 의회 내 실제 협력 관계를 반영하는 강력한 예측력을 가짐을 확인했어요. 이는 향후 정치 네트워크 연구에서 감성 분석이 중요한 도구로 활용될 수 있음을 의미해요.
앞으로, 더 다양한 국가와 정치 체제에서 연구를 확장하고, 모델의 정밀도를 향상시키는 방향으로 연구가 발전하면 더욱 의미 있는 결과를 도출할 수 있을 것으로 기대됩니다!