본문 바로가기
🌐 공간정보

[스페이스인] 위성영상처리 | 4. 위성영상자료의 분류방법

by 일단연 2023. 6. 7.

* 본 글은 공간정보교육포털 '스페이스인'의 [ 위성영상처리 ] 강의를 듣고 정리한 글입니다.

비교적 과거의 강의이기 때문에 현재의 기술과는 차이가 있을 수 있습니다.

 

공간정보교육포털

공지사항서버 재기동(23.04.06)에 따른 공간정보 교육포털 이용 안내 2023-03-24

www.spacein.kr

 

 4. 위성영상자료의 분류방법 

  • 예: 좌측의 경남 사천 지역에 대한 Landsat 위성영상을 우측의 토지피복 주제도로 만드는 과정

 

위성영상 분류의 필요성

        위성영상 분류의 필요성

  • 원격탐사 자료: 매우 다양한 유형의 값을 갖는 화소로 구성
    • 가능한 화소의 유형: (n의 x제곱) 개
      • n = 방사해상도 (0-255, 또는 2의 8제곱 for 8 bit)
      • x = 밴드 수 ( Landsat TM의 밴드 수: 7, AVIRIS의 밴드 수: 224)
    • Landsat TM의 예
      • 화소 수(n의 x제곱) = 7.2 x 1016
  • 많은 종류의 화소들은 색으로 표현되어 화면에 나타남
  • 많은 종류의 화소들을 눈으로 보는 데에는 무리가 없지만, 원격탐사 자료를 이용하는 데에는 매우 불편
  • 인간은 사물을 보다 단순하게 분류해 인식하고 그 정보를 관리하는 데에 익숙해져 있음
  • 지표 현상을 보여주는 지도의 경우, 제한된 수의 지형지물로 구성되어 있음
  • 위성영상 분류의 필요성: 원격탐사 자료를 제한된 수의 지형지물 유형자료로 변환해 지도 등과 같은 형태로 만들어야 함

 

        원격탐사시스템의 영상분류 능력

  • 인간은 매우 탁월한 패턴 인식 능력으로 물체를 인식하고 유형화함
    • 물체를 인식할 때 사용한 정보
      • 공간적: 모양(입체적인 것 포함), 크기, 인접한 물체와의 관계
      • 분광학적: 상대적 밝기, 색
  • 원격탐사시스템은 인간이 영상을 분석하는 것만큼의 능력을 갖추지 못함
    • 일반적으로 순수히 분광학적인 정보(상대적 밝기, 색)를 사용
      • 개개의 화소를 독립적으로 취급

 

        분광학적 특성상의 유형 vs 실제 토지피복 유형

  • 한 유형의 물체에 적용되는 분광학적 특성이 독특하고 단일하지 않음
  • 아래의 사진들 중 위의 사진 속 도로는 콘크리트, 아래 사진 속 검은 부분은 새로 포장된 아스팔트, 허연 부분은 오래된 아스팔트

  • 토지피복 유형별로는 도로로 분류되지만, 분광학적 특성별로는 다르게 분류됨
  • 이상: 하나의 유형 물체는 하나의 분광학적 특성을 가짐
  • 현실: 여러 유형 물체들이 하나의 분광학적 특성을 중복적으로 가지거나, 하나의 유형 물체가 여러 분광학적 특성을 가짐

 

위성영상 분류의 접근방법

  • 물체의 분광학적 특성을 이용해 위성영상의 화소를 유형화하는 주된 방법이 위성영상 분류
  • 영상 분류의 전통적인 방법
    • 화소 단위의 분류 방법
    • 개개의 화소를 화소가 가지고 있는 분광학적 특성을 이용해 유형을 결정하는 규칙을 만들고, 해당 규칙에 의거해 영상 내의 모든 화소별로 유형을 하나하나 결정
      • 규칙: 어떻게 가장 유사한 화소끼리 의미 있는 그룹으로 묶는가 or 확률적으로 어느 분류 항목에 배정하는 것이 가장 분류 에러 확률을 줄일 수 있는가

        위성영상 분류의 접근방법

  • 감독분류
    • 분석자가 토지피복 유형을 대표하는 트레이닝 데이터를 구축
    • 트레이닝 데이터를 이용한 유형 분류 결정 알고리즘 적용
  • 무감독분류
    • 알고리즘을 이용해 분광특성상의 유형 분류
    • 분석자가 분류된 분광특성상 유형을 토지피복 유형으로 전환
  • 주의사항
    • 분광학적 분류 방법의 결과는 한계를 가지고 있음을 유의
      • 여러 유형 물체들이 하나의 분광학적 특성을 중복적으로 가지거나, 하나의 유형 물체가 여러 분광학적 특성을 가짐

 

감독분류

        감독분류의 과정

  • 1) 분석자가 분류 유형을 정하고 유형별로 트레이닝 데이터를 구축
    • 트레이닝 데이터: 분류하려는 영상에서 각 영상 분류 유형을 대표하기 위해 선택된 화소들
  • 2) 분류 유형별로 선택된 화소에 유형분류 알고리즘을 적용해 통계치 작성
    • 통계치: 평균, 범위, 표준편차, 빈도, 변량, 공변량 등 > 영상자료의 모든 화소들을 분류하는 기준치로 사용됨
  • 3) 위성영상 내 화소 분류
  • 4) 토지피복 분류 현황도 작성

 

        주요 감독분류 방법

  • 최단거리 분류법
  • 영역법
  • 최대우도법

 

        최단거리 분류법

  • 각 토지피복 유형별로 채집된 트레이닝 데이터들의 평균과 각 화소가 만드는 스펙트럼 스페이스 상의 물리적 거리에 의해 영상을 분류하는 방법
  • 규칙: 유형별 트레이닝 데이터 평균과의 최단거리
  • 1) A, B, C의 토지피복 유형별로 채집된 트레이닝 데이터들의 평균을 모두 구함
  • 2) 분류하고자 하는 화소와 토지피복 유형별 트레이닝 데이터 평균과의, 스펙트럼 스페이스 상의 물리적 거리 산출
  • 3) 그 거리를 바탕으로 A, B, C의 토지피복 유형 간의 등거리가 되는 경계를 찾아냄
    • 유형결정 경계: 유형별 트레이닝 데이터 평균과의 거리가 동일한 점들의 연결선 > 위성영상의 각 화소가 어느 유형 분류에 속하는지를 결정
  • 4) 화소 x는 거리가 가장 가까운 유형 B에 속함
  • 요약
    • 위성영상 내의 화소 각각에 대해 거리가 가장 가까운 평균이 어느 것인지 확인하고, 분석하고 있는 화소를 가장 가까운 평균을 보이는 토지피복 유형으로 분류 > 해당 과정을 분류하고자 하는 모든 화소에 대해 수행하면 영상 분류가 끝남
  • 장점
    • 처리가 매우 단순해 용이함 > 컴퓨터가 화소의 유형 판별을 매우 신속하게 해낼 수 있음
  • 단점
    • 유형 분류에 사용된 방법이 매우 단순하여 변랑 및 공변량 등의 통계적 정보가 배제됨
    • 화소 x는 토지피복 유형 B의 트레이닝 데이터 평균과 최단 거리에 위치해 있지만, 통계적인 측면에서의 확률은 다른 토지피복 유형의 트레이닝 데이터와 더 클 수 있음
    • 토지피복 유형의 트레이닝 데이터 변량이 작은 경우 거리가 먼 유형에 유사할 확률이 큼
    • 토지피복 유형의 트레이닝 데이터 간 스펙트럼 스페이스 거리가 가깝고 변량이 큰 경우 최단거리 분류법을 사용하면 분류의 정확성을 확보하기 어려움

감독분류 - 최단거리 분류법

 

        영역법

  • 각 토지피복 유형별로 채집된 트레이닝 데이터의 최대값/최소값을 이용해 유형별 영역을 설정하고, 해당 영역 안에 포함되는 화소들을 영역의 유형으로 분류하는 방법

감독분류 - 영역법

  • 1) 유형별 영역은 토지피복 유형별로 채집된 트레이닝 데이터의 최대값/최소값을 기준으로 사각형으로 설정됨
  • 2) 3개 이상의 다중 밴드 데이터에 대해 영역법을 적용할 경우 다차원의 광역이 유형마다 설정됨 > 분류 유형별 영역이 분류 유형을 결정하는 경계가 됨
  • 3) 설정된 영역에 의해 각각의 화소들은 포함된 영역의 유형에 분류됨
  • 영역법은 절대적인 분류 방법 (상대적이지 않음)
    • 화소의 절댓값이 어디에 속하는지에 따라 결정되며, 확률과 같은 상대적인 개념이 개입되어 있지 않음
  • 장점
    • 감독분류방법 중 가장 빠름 (절대값 기반이며, 확률과 같은 상대적 통계정보 배제 때문)
  • 단점
    • 각각 다른 토지피복 유형의 영역이 중첩되는 부분에 위치하는 화소들의 분류가 어려움: 아래의 그래프에서 z
    • 트레이닝 데이터에 의해 작성된 토지피복 유형의 영역들 내에 포함되지 않는 화소들이 존재할 수 있음: 아래의 그래프에서 w
      • 미분류 상태로 두거나, 분류가 필수라면 다른 분류 방법을 적용해야 함

  • 화소 y는 가장 근접한 영역에 속해있는 유형 B에 분류됨

 

  • 영역법에서 중첩이 나타나는 경우 1
    • 토지피복 유형 자체의 분광특성치가 서로 중첩될 경우: 분류정확도 빈약
      • 도시 지역에서는 다양한 유형의 토지피복 상태가 혼재하기 때문에 다른 토지피복 유형과의 분광특성치 중첩을 야기시킬 수 있음

  • 영역법에서 중첩이 나타나는 경우 2
    • 토지피복 유형 자체의 분광특성치가 중첩되진 않지만, 서로 다른 토지피복 유형들 가운데 공변량이 예상될 경우(상관성이 높음): 분류정확도 빈약
      • 실제 유형별 분광특성치의 분포상에는 중첩되는 부분이 없으나, 최대값/최소값을 이용해 영역을 사각형으로 설정하면 중첩이 발생할 가능성이 큼
      • 해결법: 한 개의 사각형으로 토지피복 유형을 설정하지 않고, 영역을 계단식으로 적용해 중첩된 영역을 최소화

 

        최대우도 분류법

  • 확률에 의해 토지피복 유형을 분류하는 방법
  • 1) 토지피복 유형을 대표하는 트레이닝 데이터의 통계치를 바탕으로 각 토지피복 유형의 확률 밀도 함수를 생산
  • 2) 함수를 바탕으로 각 토지피복 유형별로 소속될 확률의 등치선을 작성
  • 3) 결정방식: 각각의 화소가 갖고 있는 분광특성치에 의해 위치가 x처럼 결정되면 그 위치에서 각 토지피복 유형에 속할 확률을 계산 > 가장 높은 확률을 보이는 유형에 해당 화소를 배정
  • 장점
    • 확률을 바탕으로 한 비교적 합리적인 방법
  • 단점
    • 최대우도 분류법에서 분류가 오류일 경우
      • 아래 확률 밀도 함수에서 빨간색으로 기입된 확률 b1, a2=b2, b3처럼 잘못 분류될 확률이 존재
  •  

  • 최대우도 분류법의 확률 밀도 함수 예시
    • 해당 그래프에서는 유형 i와 j의 확률밀도 함수만 보지만, 유형이 3개 이상이더라도 똑같은 개념으로 적용
    • 분광특성치가 k1, k2, k3
    • 화소 k1이 분류 유형 i에 속할 확률 a1, 분류 유형 j에 속할 확률 b1
      • a1 > b1이므로 분류 유형 i에 속할 확률이 더 큼 > i로 분류됨
    • 화소 k3이 분류 유형 i에 속할 확률 a3, 분류 유형 j에 속할 확률 b3
      • a3 < b3이므로 분류 유형 j에 속할 확률이 더 큼 > j로 분류됨
    • 화소 k2이 분류 유형 i에 속할 확률 a2, 분류 유형 j에 속할 확률 b2
      • a2 = b2이므로 분류 유형 i에 속할 확률과 j에 속할 확률이 같음 > 별도의 규칙이 없다면 분류가 곤란함

 

  • 트레이닝 데이터에 의해 작성된 각 토지피복 유형별 확률 밀도 함수를 3차원으로 나타낸 것
    • 적색선은 토지피복 유형별 확률 가운데 가장 높은 수치가 같은 점에서 나타나는 위치 중 도시지역과 관련된 점들을 연결한 것
    • 적색선의 안쪽에 위치한 화소들은 모두 도시지역일 가능성이 가장 높음
    • 같은 방법으로 다른 토지피복 유형의 결정 경계도 작성할 수 있음
    • 경계에 의해 좌표 안의 모든 점들의 토지피복 유형을 결정할 수 있음

 

무감독분류

  • 분류 대상 영상 화소들의 자연적인 그룹을 찾아내는 과정상의 특성이 클러스터링 과정과 동일하므로, 클러스터링이라고도 함

        무감독분류의 과정

  • 1) 분석자가 분류 유형 개수와, 지정된 개수만큼의 유형을 생산하는 알고리즘 선정
  • 2) 알고리즘을 적용해 모든 화소들을 분광학적 유형별로 분류
    • 적용되는 알고리즘의 종류는 다양하며 분석자가 종류를 선택
    • 분류 알고리즘의 기본적 방향: 분류된 유형 간의 차이가 가장 크도록 함
  • 3) 분광학적 유형도 작성
    • 분석자가 각각의 분류 유형이 무엇을 대표하는지 판별해 산림, 경작지, 도로 등과 같은 유형의 내용을 결정
  • 4) 분석자가 분광학적 유형을 토지피복 유형으로 전환
  • 5) 토지피복 유형 현황도 작성

 

        무감독분류의 기본 전제

  • 동일한 토지피복 유형: 유사한 분광특성치를 가지고 있는 화소의 집합
  • 토지피복 유형 간: 분광특성치의 특성이 각각 다름
  • 자동적인 유형 분류 가능
  • 토지피복 유형별로 구분되는 분광특성치의 특성을 이용해 유사한 특성을 갖는 화소들끼리 묶어내는 다양한 방법을 트레이닝 데이터 없이 수행

 

        무감독분류의 장점

  • 사전적 정보 없이 최소의 정보 투입으로 분석 가능

 

        무감독분류의 단점

  • 분류 결과가 어떤 토지피복 유형과 관련 있는지에 대한 정보를 직접적으로 제공할 수 없음
    • 분광특성치가 서로 유사한 그룹이라는 정보만을 제공
    • 묶여진 화소들에 적합한 분류 유형을 분석자가 지정하는 것
  • 분류 결과는 일종의 spectral class에 불과함

 

        토지피복분류 유형의 내용 결정

  • 분석자가 참조자료 및 지식을 바탕으로 결정
  • 무감독분류의 결과를 토지피복 유형과 연계시키기 위해서는, 분류된 그룹들을 토지피복 유형을 알 수 있는 참조자료들과 비교해 결정

 

        무감독분류와 감독분류와의 차이

  • 감독분류
    • 알고 있는 토지피복 유형을 대표하는 분광특성치를 기반으로, 유형을 알지 못하는 영상 내의 화소를 분류해 지정
  • 무감독분류
    • 먼저 유형을 분류하고 유형에 대해 토지피복 유형을 지정
      • 분광특성치 상 서로 유사한 화소들을 여러 방법을 통해 그룹으로 묶어내고 그 결과에 토지피복 유형 정보를 부여

 

        주요 무감독분류 방법

  • ISODATA 방법
  • K-means 방법
  • 히스토그램 방법

 

        ISODATA

  • 이론적으로 견고한 바탕을 가지고 있음
  • 영상 내의 분석 대상 각 화소를 최소 spectrum distance를 이용해 특정 클러스터(유형)에 배정
  • 분석자가 지정해야 할 사항
    • 반복실행
      • 최대 횟수
      • 반복실행 단계 간 변화 정도
    • 유형 수
      • 최대 유형 개수(지정된 횟수보다 작을 수 있음)
      • 유형별 최초 실행 시 중심 위치
    • 한 유형의 분리 및 두 유형의 결합 조건
      • 한 유형의 최소 소속 화소 수 (예: 전체 화소의 0.01% 미만이면 합침)
      • 최대 분산 수준 (예: 표준편차가 일정 크기 이상이면 분할)
      • 위의 두 조건을 지정하지 않으면, 다른 화소들과 분광특성치가 아주 동떨어진 한 개의 화소가 하나의 클러스터를 형성하는 문제 발생

  • ISODATA가 실행되는 과정
    • 1) 1단계 화소 분류
      • 임의로 결정되어 주어진 클러스터의 수 k의 위치가 설정됨
      • 설정된 클러스터 위치들과 각 화소의 spectrum distance를 산출해 최소의 거리를 가지는 클러스터에 화소를 분류
    • 2) 2단계 화소 분류
      • 각 클러스터에 배정된 화소의 밴드별 평균을 구하고, 그 평균을 기준으로 클러스터의 중심을 이동시킴
      • 그림에서는 이동 경로가 적색 선으로 나타나있음
      • 모든 화소에 대해 이동된 클러스터 중심과의 거리를 구하고 가까운 거리의 클러스터에 화소들을 다시 분류
    • 3) 반복
      • 평균 재산출, 화소 재분류 과정은 더 이상 클러스터별 소속 화소의 변화가 없거나, 반복 횟수가 지정된 횟수에 도달하거나, 분산의 정도가 지정된 수준보다 작을 경우가 발생할 때까지 반복됨
      • 유형 간의 소속 화소 이동이 없으면 반복이 정지됨
    •  
    • 소수의 화소들만으로 구성된 클러스터는 주어진 조건에 의해 제거되고, 이에 소속되어 있던 화소들은 다른 클러스터에 분류되기도 함 > 결과는 지정된 클러스터의 수 k보다 작을 수 있음

무감독분류 - ISODATA - 1) 임의의 유형 중심을 이용한 1단계 화소 분류
무감독분류 - ISODATA -  2) 1단계 화소 분류에 의해 이동한 유형 중심 및 이를 이용한 2단계 화소 분류
무감독분류 - ISODATA -  3) ISODATA에 의한 영상 분류 결과: 녹색 클러스터에 속한 화소 5개, 자주색 클러스터에 속한 화소 4개

 

        ISODATA vs K-means 클러스터링

  • 공통점
    • 지정된 클러스터의 수 k와 spectrum distance를 기반으로 클러스터링을 수행
  • 차이점
    • K-means 클러스터링: 클러스터링 과정에서 지정된 클러스터의 수가 꼭 유지됨
    • ISODATA: 클러스터링 과정에서 지정된 클러스터의 수가 꼭 유지되지는 않음

 

        히스토그램법

  • 히스토그램 클러스터링을 주의깊게 관찰하면 감독분류의 영역법과 비슷한, 무감독분류의 접근법이라고 할 수 있음
  • 전제
    • 동일한 토지피복 유형의 화소들은 동질적인 특성을 가짐
      • 동일한 토지피복 유형에 속한 화소들의 값으로 빈도 그래프를 만들면 정규분포곡선처럼 평균을 중심으로 집중 현상을 보일 것을 유추할 수 있음
    • 토지피복 유형은 분광특성치가 서로 다름
      • 화소 값들의 빈도 그래프를 작성하면, 빈도 그래프의 중심이 서로 겹치지 않는다는 것을 유추할 수 있음
  • 전제를 바탕으로 히스토그램을 작성하면
    • 토지피복 유형별로 최빈값의 정점이 분리되어 나타남
    • 정점과 정점 사이의 계곡부는 토지피복 유형 간의 경계가 됨
  • 현실적으로 히스토그램을 작성하면, 작은 정점들이 주요 정점과 더불어 나타남
  • 토지피복 유형의 주요 정점 및 정점 간의 거리를 검토해 유형 간의 경계를 설정해야 함

  • 토지피복 유형 A는 화소 값이 A보다는 크고 B보다는 작은 범위의 화소들의 집합으로 정의됨
  • 토지피복 유형 B는 화소 값이 B보다는 크고 C보다는 작은 범위의 화소들의 집합으로 정의됨

 

정리