위성영상 토지 피복 분할: UNet++과 DeepLabv3+ 비교
위성영상 토지 피복 분할: UNet++과 DeepLabv3+ 비교
프로젝트 개요
2024 UNLV 빅데이터 해외 연구 프로그램을 통해 진행한 위성영상 기반 토지 피복 분할 프로젝트이다. 이 프로젝트에서는 딥러닝을 활용한 이미지 분할(Image Segmentation) 기술을 적용하여 위성영상의 토지 피복을 구분하고, 그 중에서도 UNet++과 DeepLabv3+ 모델의 성능을 비교 분석하는 실험을 진행했다.
왜 위성영상 토지 피복 분할이 필요할까?
토지 피복 분할(Land Cover Segmentation)은 위성영상을 통해 지표면의 다양한 요소(산림, 농지, 도시, 물 등)를 구분하는 작업이다. 이 작업은 환경 보호, 농업 생산성 향상, 도시 계획 및 자원 관리와 같은 여러 분야에서 필수적이다. 특히, 위성영상 데이터는 대규모 지역에서의 토지 변화를 모니터링하는 데 유용하며, 정확한 토지 피복 분할은 다음과 같은 이유로 중요하다:
- 환경 변화 모니터링:
숲의 감소, 사막화, 수자원 감소와 같은 환경 변화를 지속적으로 감시할 수 있다. 이를 통해 기후변화 대응 정책을 수립하는 데 활용할 수 있다.
- 정밀 농업 및 자원 관리:
농지와 산림지대를 정확하게 구분하여 토양 상태와 작물 생육을 예측하고 관리하는 데 도움을 줄 수 있다. 이는 생산성을 높이고, 자원을 효율적으로 사용하는 정밀농업에 기여할 수 있다.
- 도시 확장과 개발 관리:
도시화가 진행됨에따라, 위성영상을 통해 도시와 그 주변의 토지 변화를 추적하여 개발 계획을 효율적으로 수립할 수 있다. 이를 통해 지속 가능한 도시 개발을 위한 정책적 기반을 마련할 수 있다.
프로젝트 프레임워크
데이터 증강 및 데이터 분할
모델 학습을 위해 데이터 증강을 수행하고, 균형 잡힌 학습을 위해 몇 가지 전략을 사용했다.
데이터 증강
다양한 변환(회전, 좌우 반전, 밝기 조정 등)을 적용하여 학습데이터를 증강했다.
Stratified 분할과 K-fold 교차 검증
데이터셋을 Stratified 방식으로 분할하여 각 클래스가 균형 있게 포함되도록 하였으며, 학습과 검증 단계에서 성능을 보다 안정적으로 평가하기 위해 K-fold 교차 검증을 수행했다. 이를 통해 모델이 특정 데이터셋에 과적합되지 않고 일반화 성능을 확보할 수 있도록 하였다.
Segmentation Models API를 활용한 모델 학습
이 프로젝트에서는 두 가지 딥러닝 모델을 사용하여 위성영상의 토지 피복 분할을 시도했다.
UNet++
UNet++은 UNet의 업그레이드 버전으로, 네트워크 구조가 깊고 복잡해져 더욱 세밀한 분할이 가능하다. 주요 특징은 스킵 커넥션(Skip Connection)과 Nested UNet 구조를 통해 서로 다른 해상도의 정보를 결합하는 것이다. 이는 복잡한 장면의 디테일을 잘 표현하는 데 유리하다.
DeepLabv3+
DeepLabv3+은 애트로스 컨볼루션(Atrous Convolution)과 깊이별 특징 추출을 통해 고해상도 분할을 구현하는 모델이다. 이 모델은 배경과 물체 간의 경계를 더 명확히 분할할 수 있다는 장점이 있어, 넓은 범위의 데이터에서 토지 피복 정보를 잘 추출할 수 있다.
Hyperparameter
모델 학습에는 Segmentation Models API를 사용하여 파라미터를 세부적으로 설정했다.
결과 및 분석
UNet++과 DeepLabv3+ 모델을 각각 학습시키고, 두 모델의 성능을 비교했다. 전체적으로 비슷한 성능을 보였으나, 근소한 차이로 UNet++의 성능이 높게 나타났다.
추론 속도 역시 UNet++이 DeepLabv3+보다 모델이 상대적으로 가볍워, 속도면에서 효율적이었다.
두 모델 모두 위성영상의 토지 피복 분할에 적합한 모델임을 확인했다. DeepLabv3+는 넓은 범위의 토지 분류에서 뛰어난 성능을 보였고, UNet++는 복잡한 패턴과 세부적인 경계가 요구되는 상황에서 높은 성능을 보였다.