기후변화로 인한 물관리 여건 변화에 대응하기 위해, 기존의 기후변화 적응 기술과 더불어 디지털 기술의 융합 등 다양한 접근이 요구되고 있다. 이러한 기술 발전과 시장의 급속한 성장은 체계적이고 전략적인 접근을 요구한다. 이에 따라 데이터 기반의 기술 정보 분석과 예측이 더욱 중요해지고 있으며, 특히 자연어처리(NLP, Natural Language Process) 기술의 도입이 주목받고 있다.
본 연구는 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링을 활용한 데이터 기반 기술 정보 분석 및 예측을 목적으로 한다. LDA는 문서가 여러 주제로 구성된 조합으로 이루어져 있다는 가정 하에, 이를 기반으로 각 주제의 분포와 주제 내 단어의 분포를 학습한다. 이를 통해 대규모 텍스트 데이터에서 핵심 주제나 패턴을 도출하여, 비정형 데이터를 체계적으로 분석하고 트렌드 파악을 가능하게 한다.
연구 대상은 기후변화 적응을 위한 수자원 관련 특허 데이터베이스(Y02A-0020)로, 17,000여 건의 대상기술의 대표 청구항을 분석하고 전처리한 후, Coherence와 Perplexity 지표를 활용해 LDA모델의 파라미터를 최적화하여 핵심 기술군 등을 추출하였다.
추가적으로 토픽 모델링의 결과를 보완하고, 보다 구체적인 대상기술 그룹화를 위해 KeyBERT 알고리즘을 활용하여 토픽 내 핵심 기술그룹을 자동으로 분류하는 실험연구도 수행하였다.
분석 결과는 pyLDAvis 및 Gephi를 이용해 기술간의 연관성과 계층 구조를 직관적으로 명확히 파악할 수 있도록 시각화하였다.
본 연구는 LDA 기반 토픽 모델링을 통해 물산업 분야 기후변화 적응 기술의 현재 트렌드와 미래 발전 방향에 대한 중요한 인사이트를 제공한다.
본 연구 성과를 통해 기후변화 적응 기술 딥