글의 제목이 다소 자극적이기는 하나, 더 일반적인 표현으로 바꾸자면 다음과 같다: 사회과학도는 자신의 제안에 어떻게 설득력을 부여할 수 있는가? 사회과학의 중요한 특징은 객관성과 실증성이니, 적절한 데이터를 동원할 수 있다면 설득력도 자연스럽게 부여된다. 사회과학도들의 말문이 막히는 상황은 이론이 없을 때가 아니라 데이터가 없을 때다. 설령 '한국인의 행복' 이슈에 대해서 아무런 이론적 배경을 갖고 있지 못하더라도, 광범위한 사회조사나(see 최인철 등, 2019) 국가적 통계지표가 있다면 적어도 말문은 막히지 않는다. 그런데 문제는, 데이터가 있다고 해서 아무거나 다 쓸 수 있는 게 아니고, 심지어 그나마 데이터의 총량 자체도 부족하다는 것이다.

먼저 언급할 것은 사회과학계 데이터 자체의 양적 증가가 분명히 필요하다는 것이다. 한겨레신문의 '젠더 데이터, 빈칸을 채우자' 연속보도는 데이터 생산 담당자들의 무지와 무시로 인해 데이터세트 속에 '공백' 들이 발생함을 지적한다(see 최윤아, 2021). 손해보는 것은 그 주제를 놓고 고민하려는 사회과학자들과 정책입안자들이다. 반대로, 20대의 성별 간 소득격차에 대해서 김창환, 오병돈(2019)의 문헌이 그 존재를 주장할 수 있었던 것은 기존에 접근이 제한되었던 데이터를 저자들이 획득할 수 있었기 때문이었다. 혼입변인을 예측모형에서 통제할 때에도 혼입변인에 대한 데이터가 새로 필요하다. 그 데이터가 없다면 그 변인의 혼입 문제에 대해 논문이라는 매체를 통해서 밝히기는 어렵다.

그런데 데이터는 무조건 양만 많다고 해서 좋은 것이 아니다. 군인이 참호 속에서 총만 들어올리고 무작정 쏘아댄다면 그것이 적과 싸우는 데 효과적이지는 않다. 데이터는 이론에 입각해 있어야 한다. 대개의 사회과학도들은 어떠한 사회과학적 논의의 대상이 있을 때 그것을 종속/반응변인으로 삼는 이론을 찾는다. 그리고 그 이론에서 상정하는 독립/예측변인에 해당하는 데이터가 있는지를 찾는다. 막연하고 목적성 없는 피상적 데이터는 이때 아무 도움도 주지 못한다. 이론적 목적을 갖고 수집된 데이터만이 논의의 대상을 기술·설명·예측하는 가설을 세울 수 있다. 가설 검증 결과가 이론과 합치된다면 설득력 있는 솔루션이 나오고, 이론과 불합치된다면 이로써 이론이 한 단계 발전한다.

이론에 입각한 데이터가 사회과학도들에게 풍부하게 제공될 때, 그들의 제안은 비로소 사회에서 설득력을 얻는다. 물론 한국사회과학자료원(KOSSDA)이나 한국종합사회조사(KGSS) 같은 사회과학계 전체의 노력도 소중하다. 그러나 각자의 학문분야별로 존재하는 이론에 최적화된 데이터를 축적시킬 필요도 있다. 심지어 학문 간에도 활용 가능한 데이터는 다 다르다. 가령 같은 '불평등' 키워드를 연구하더라도 사회심리학자는 소득수준이나 고용률 데이터를 직접 활용하기 쉽지 않고, 사회학자는 암묵적 연합 검사(IAT) 데이터를 막막하게 느끼게 마련이다. 이와 같은 '우리만의 데이터' 가 부족한 학문분야는 그만큼 더 시급하게 데이터를 축적시켜야 한다. 20대 남녀의 성별·세대 자기범주화 측정 데이터조차 없다면 사회심리학도가 어떻게 갈등을 치유하겠는가.


 

김창환, 오병돈 (2019). 경력단절 이전 여성은 차별받지 않는가? 대졸 20대 청년층의 졸업 직후 성별 소득격차 분석. 한국사회학, 53(1), 167-204.
최윤아 (2021.07.20.). 남성이 기본값인 사회... 무지·무시가 만든 데이터
 공백. URL:

https://www.hani.co.kr/arti/society/women/1004204.html
최인철, 최종안, 최은수, 이성하 등(2019). About H: 대한민국 행복 리포트 2019. 21세기북스.

+ Recent posts