| AlphaEarth 임베딩과 머신러닝을 활용한 우리나라 하천 수질지표 추정 |
|---|
|
학술지명 GeoAI데이터학회
저자 황의호,남기범,김영준
발표일 2025-11-07
|
|
본 연구는 Google AlphaEarth embedding 을 활용하여 우리나라 주요 하천의 수질지표를 추정하고, embedding 기반 표현 학습의 성능을 검증하였다. 연구 대상 자료는 국립환경과학원 물환경정보시스템의 수질측정망(2017?2024)에서 제공된 연평균 수질 관측치이며, 8 개 지표(Chl-a, BOD, COD, DO, SS, TN, TOC, TP)를 대상으로 분석하였다. 입력 변수로는 AlphaEarth embedding 64 개 밴드와 좌표(Lat/Lon)를 사용하였으며, XGBoost 기반으로 전체 변수와 Top25(상위 25 개 변수) 시나리오를 비교하였다. 분석 결과, Top25 변수만으로도 전체변수 모델과 동등한 수준의 성능을 보였으며, SS 를 제외한 모든 수질지표에서 R²이 0.7 이상으로 나타났다. 가장 추정 성능이 좋은 지표는 TN (R²=0.888)이었고, 가장 낮았던 SS 는 R²=0.621 로 나타났다. 위성 원격탐사를 활용하여 주로 분석되는 Chl-a는 R²=0.713 수준을 기록하였다. 이를 통해 AlphaEarth embedding 자료를 활용하여 상대적으로 변화가 크고 폭이 좁은 우리나라 하천의 수질 특성을 분석할 수 있다는 가능성을 확인하였다. 또한, 변수 중요도 상위 25 개의 embedding 이 여러 수질 지표 간에 공통적으로 나타나, 수질 지표를 분석하는 데 유효한 embedding 을 도출하였다. 이들은 토지피복, 광학 반사, 식생 등과 관련된 latent 특성을 반영하는 embedding 으로 해석된다. 본 연구에서 사용한 AlphaEarth embedding 은 연평균 단위 자료로 제공되기 때문에 계절적 급변동이나 단기 이벤트를 직접 분석하는 데에는 한계가 있다. 향후 과거 및 미래 기간에 대한 AlphaEarth embedding 이 확장된다면 이를 통해 장기 추세와 변동성을 평가하거나, 분석 지역의 확장을 통한 글로벌 수질 지표 모니터링으로의 활용 가능성을 탐색할 수 있을 것이다 |