사회과학 7

[논문리뷰] Sermpezis et al (2025) 정치담론을 다중 annotated한 데이터셋 소개

AgoraSpeech: AI와 인간의 협업으로 만들어진 정치적 담론 분석 데이터셋정치적 연설은 지도자의 전략, 이념, 그리고 대중과의 소통 방식을 이해하는 데 중요한 단서가 됩니다. 그러나 정치 담론을 분석하기 위한 데이터셋은 종종 품질, 규모, 그리고 주석(annotation)의 일관성에서 한계를 보입니다. AgoraSpeech는 이러한 문제를 해결하기 위해 설계된 고품질 다중 주석 데이터셋으로, 2023년 그리스 총선 기간 동안의 정치 연설을 기반으로 만들어졌습니다.이 데이터셋은 AI와 인간의 협업을 통해 구성되었으며, 텍스트 분류, 주제 식별, 감정 분석, 극화(Polarization) 및 포퓰리즘 탐지, 명명 엔터티 인식(Named Entity Recognition, NER)이라는 6가지 주요 N..

Article Review 2025.01.22

[논문리뷰] Amini (2025) 전이 학습으로 서베이데이터 학습하기

전이 학습으로 사회과학을 혁신하다: 설문조사 데이터 통합의 새로운 패러다임사회과학에서 설문조사는 오래도록 중요한 연구 도구였습니다. 정치적 행동이나 사회적 태도를 분석할 때, 대규모 설문조사 데이터는 강력한 통찰을 제공합니다. 특히, American National Election Studies (ANES)와 Cooperative Election Study (CES)는 미국 정치 연구에서 핵심적인 역할을 해왔습니다. 하지만 이 설문조사들에는 중요한 한계가 있습니다. 데이터가 풍부하지만 서로 다른 설문 문항과 변수 구성 때문에 데이터 단절의 문제가 존재합니다.이러한 문제를 해결하기 위해 전이 학습(Transfer Learning)이라는 인공지능(AI) 기법을 적용한 연구가 등장했습니다. 이번 포스팅에서는 ..

Article Review 2025.01.22

[논문리뷰] Gielens et al (2025) 인간이 Annotator의 시대는 끝났는가?

요즘 연구자들 사이에서 핫한 질문 하나, "ChatGPT가 인간 코더를 대체할 수 있을까?" 이 질문에 답하기 위해 네덜란드 기본소득 논쟁 트윗 데이터와 독일 연금개혁 신문 기사 데이터를 사용해 ChatGPT의 성능을 꼼꼼히 검증한 논문이 나왔습니다. 결론부터 말하자면, 아직 인간 코더가 완전히 대체되긴 어렵지만, 가능성은 충분히 보인다! 오늘은 이 논문을 통해 ChatGPT의 정책 담론 분석 능력과 프롬프트 설계 방법을 구체적으로 소개해 드리겠습니다.ChatGPT로 콘텐츠 분석? 기존 연구들을 살펴보자!ChatGPT 같은 대형 언어 모델(LLM)이 콘텐츠 분석(content analysis)을 혁신할 수 있다는 아이디어는 최근 학계에서 큰 관심을 받고 있습니다. 그런데 이걸 진지하게 논하기 전에, 기존..

Article Review 2025.01.10

[논문리뷰] Allamong et al (2025) 개방형 응답의 설문 조사에서 측정 오류를 줄이기 위한 방법?

따끈따끈하게 Research and Politics에 최근 공개된 연구는 오픈엔드 설문 응답에서 발생하는 오타 문제를 효과적으로 해결하기 위해 OpenAI의 GPT-4o 대규모 언어 모델(LLM)을 활용한 방법론을 제시했습니다. 배경: 왜 오타 수정이 중요한가?오픈엔드 설문 응답은 응답자의 자유로운 의견을 수집할 수 있다는 점에서 유용하지만, 오타로 인해 데이터 분석 과정에서 오류가 발생할 수 있습니다. 오타는 다음과 같은 문제를 초래합니다:단어 집합의 불필요한 증가: "economey"와 "economy"가 같은 단어임에도 불구하고 별개의 단어로 처리됩니다.키워드 매칭 오류: 감정 분석이나 주제 분류를 위한 사전(dictionary)에 단어가 제대로 매칭되지 않습니다.패턴 발견 어려움: 데이터 간의 연..

Article Review 2025.01.10

[논문리뷰] Pereira et al (2024) 텍스트로 정치적 양극화를 측정하는 방법?

현대 사회의 이념적 갈등, 예를 들어 미국 국회의사당 폭동이나 영국의 브렉시트와 같은 사건들은 정치적 양극화(political polarization)의 증가를 상징적으로 보여줍니다. 이러한 양극화를 더 깊이 이해하고 측정하기 위해, Catarina Pereira, Raquel da Silva, Catarina Rosa의 논문 "How to measure political polarization in text-as-data? A scoping review of computational social science approaches"는 컴퓨테이셔널 사회 과학(CSS) 접근법을 활용하여 텍스트 데이터를 분석하는 방법론들을 체계적으로 정리합니다. 이 글에서는 해당 논문의 주요 내용을 리뷰하며, 각 방법론의 특..

Article Review 2025.01.09

[논문리뷰] Goet (2019) 텍스트 분석을 통한 편광 측정

정치적 양극화는 현대 정치에서 뜨거운 주제입니다. 정당 간 갈등이 커지면서 이를 객관적으로 측정하고 분석하는 방법이 중요한 과제가 되었죠. 최근 연구에서는 텍스트 데이터를 활용해 양극화를 측정하는 독특한 방법을 제시했습니다. 바로 의원들이 의회에서 하는 연설을 통해 그들의 정치적 입장을 분석하는 방식입니다. 이번 포스팅에서는 이 연구에서 사용된 두 가지 주요 접근법과 그 결과를 쉽고 간단하게 설명드리겠습니다.양극화를 텍스트로 측정한다?의원들은 의회에서 다양한 정책에 대해 연설합니다. 이 연설 속 단어와 표현은 그들이 속한 정당의 이념적 입장을 반영합니다. 예를 들어, 미국 의회에서는 공화당이 "death tax(사망세)"라는 표현을, 민주당은 같은 개념을 "estate tax(재산세)"라고 부르죠. 이런..

Article Review 2025.01.08

[논문 리뷰] Han (2021) 한국에서의 엘리트 양극화

South Korean National Assembly에서 Polarization 측정: NLP를 활용한 새로운 접근최근 정치학 연구에서는 polarization(정치적 양극화)이 어떻게 국가의 정책 결정과 민주주의에 영향을 미치는지에 대한 논의가 활발합니다. 특히, 한국 국회에서의 polarization은 정당 간의 이념적 대립과 협상 불능을 넘어 사회적 갈등까지 확대되고 있어 주목받고 있습니다. 이번 연구는 기존의 롤콜 데이터나 설문조사를 넘어, 회의록 텍스트 데이터를 NLP(Natural Language Processing)로 분석해 South Korean National Assembly의 polarization을 새로운 방식으로 측정했다는 점에서 큰 의의가 있습니다.1. Polarization을 ..

Article Review 2025.01.08