언론 빅데이터를 활용한 건설경기체감지수(CoSI) 개발 및 활용방안
출판일 2025-11-18
연구원 유위성
연구 주요 내용
❍ 건설산업은 국가와 국민 경제에서 상당한 비중을 차지하는 산업으로, 지난 3월 본 원에서 ‘건설산업의 재탄생(Rebirth)’을 위한 미래 전략을 제시함. 건설산업이 성공적인 전략산업으로 도약하기 위한
핵심 이슈 중 하나로 빅데이터 기술이 강조됨.
❍ 건설시장 환경이 빠르게 변화하면서 산업 생태계의 구조와 연관성이 더욱 복잡해지고 있음. 이러한 변화에 신속히 대응하기 위해 건설경기에 대한 체감을 포괄적으로 파악하고, 다양한 참여 주체에 대응의
적시성을 제공하는 것은 경쟁력 강화에 필수적임.
❍ 본 고는 매일 생산되는 언론 빅데이터를 다듬고 체계적으로 정리해, 건설경기에 대한 사람들의 체감을 숫자로 나타낸 지수를 만들고자 함. 기존 설문 기반 지수로는 충분히 설명되지 않는 부분을 보완하고,
산업의 경기 변화를 일반 사용자의 시각에서 한눈에 파악할 수 있는 도구로 제시함.
- 기존 건설기업실사지수, 부동산시장 추이, 주택소비심리, 주택경기 등은 분야별 특화된 방식으로 활용되고 있지만, 사용자인 국민의 체감과 인식을 포괄적으로 반영하는 데 제한적임.
❍ 건설경기체감지수(CoSI, Construction Sentiment Index)는 언론 빅데이터에서 건설경기와 관련된 단어를 목록으로 만들고(사전화, Lexicalization), 체감 점수를 부여하여 발생 빈도와
연관규칙으로 경기를 계량화함.
- 2023년 10월부터 2025년 9월까지 건설산업과 관련된 언론기사에 포함된 약 2,300만개 단어에서 경기와 관련성이 있는 2,080개 단어를 설정함. 단어별 체감 점수(부정, 중립, 긍정) 부여한 후 특정 시점
언론기사에 노출된 단어의 빈도와 네트워크 분석으로 CoSI 도출함.
❍ 지난 12개월(2024.10.~2025.9.)간 생성된 언론기사를 분석한 결과, ‘가계 → 대출’, ‘담보 → 대출·주택’, ‘규제→대출’, ‘공급 → 주택’, ‘매매 → 아파트’ 등의 키워드 연관규칙 패턴이 반복적으로 나타났음.
- 또한, ‘인공 → 지능’, ‘자율 → 주행’ 같은 기술 규칙, ‘부과 → 관세’ 같은 대외 변수, ‘사망 → 사고’ 등의 안전 이슈도 빈번하게 발생함. 이는 금융, 주택, 정책, 기술, 안전 등이 동시적으로 건설경기 체감에 영향을
주는 복합적 구조임을 시사함.
❍ 주간별 CoSI 추이를 살펴본 결과, 평균 약 98.7로 100(=중립) 미만 구간이 지속되며, 2025년 2~3분기에도 여전히 중립선을 밑도는 흐름을 보임. CoSI 하락 구간에서는 가계부채, 금리, 규제 강화와
서울/아파트/매매 중심의 불안정이 결합해 지수를 하락시키고, 대형 사고와 정치 이슈가 추가적인 하방 압력으로 작용한 것으로 분석됨.
- CoSI는 건설경기 해석에 대한 패러다임 변화, 건설 금융 및 정책 효과 포착, 사회적 이슈와 경기의 연계성 구체화, 기술 혁신과 변화 파악 등 다양한 활용성을 제시함.
❍ CoSI는 기존 건설경기 지수의 간극을 보완하고, 건설경기 체감을 일정한 기준으로 정리해, 대외 요인과의 관계나 통계적 흐름을 보여줌. 향후 데이터 축적이 증가할수록 건설산업의 전반적인 방향과 사용자인
국민의 수요 변화를 파악할 수 있는 보조적인 도구로 활용될 수 있음.
❍ 특히, CoSI는 건설기업의 분양·착공 속도 조절, 투자 시기 결정, 금융기관은 가계대출 효과, 지역·유형별 금리 영향 분석, 정부·공공은 정책 및 규제 이행에 따른 경기 체감 변동성 분석 등 건설산업 전반에 걸친
통합 대시보드 역할을 지원할 수 있음.