본문 바로가기
🌐 공간정보

[스페이스인] 공간정보의 이해(교원연수 기초) | 4. 공간 데이터 모델 및 처리방법 - 공간 데이터 모델 - 벡터와 래스터

by 일단연 2023. 5. 31.

* 본 글은 공간정보교육포털 '스페이스인'의 [ 공간정보의 이해(교원연수 기초) ] 강의를 듣고 정리한 글입니다.

[공간정보개론]으로는 부족한 것 같아 추가적으로 수강하였습니다.

비교적 과거의 강의이기 때문에 현재의 기술과는 차이가 있을 수 있습니다.

 

공간정보교육포털

공지사항서버 재기동(23.04.06)에 따른 공간정보 교육포털 이용 안내 2023-03-24

www.spacein.kr

 

 4. 공간 데이터 모델 및 처리방법 

 

 공간 데이터 모델 

        공간 데이터 모델의 개념

  • 공간정보를 컴퓨터상에 구현하는 것
  • 벡터, 레스터, 수치표고모델, 불규칙 삼각망 등로 나눌 수 있음

 

        공간 데이터 모델의 구조

공간 데이터 모델 - 공간 데이터 모델의 구조

 


 

 벡터(vector) 데이터 모델 

        벡터 데이터 모델의 개념

  • 실세계의 대상물(공간자료)을 점, 선, 면을 이용해 위치, 길이, 차원을 가진 좌표의 형태로 표현

공간 데이터 모델 - 벡터 데이터 모델

  • 0, 1, 2차원 공간 형상으로 표현하며 크기와 방향을 가짐
  • 지구 표면의 객체나 특징을 일반화
  • 기하학정보, 위상구조정보, 메타데이터로 구성
  • 생성
    • 기존 지도 or 항공사진을 디지타이징
  • 위치 표시
    • 점, 선, 면을 기준으로 XX나 XYZ 좌표값으로 표시
    • 연속적인 좌표계의 사용을 전제
    • 정확도 있는 위치 표시가 가능
  • 정확도
    • 원시 데이터의 정확도에 좌우되며, 상대적으로 높음

공간 데이터 모델 - 벡터 데이터 모델 예시

  • 좌: 실제 공간 / 우: 벡터 데이터로 표현
    • 소축척에서는 점, 대축척에서는 면

 

        벡터 데이터 모델의 3가지 주요 그래픽 유형

  • (Points)
    • 좌표계에 의한 위도와 경도의 조합으로 구성
    • 면으로 표현되기 어려울 정도로 작을 때 사용
      • 예: 세계전도에서 대전의 위치
  • (Lines)
    • 간선으로 연결된 2개 이상의 정점으로 이루어짐
    • 자연스러운 선의 형태를 표현할 때 사용
      • 예: 대전시 지도에서 지하철 노선 표시
    • 선에서 시작점, 끝점은 node / 중간 점: vertex로 구성
      • 예: node - link(chain) - vertex - link(chain) - node
    • 2차원 상에서 교차되는 것처럼 보이는 고가도로, 지하차도 등은 교차점에 node가 없음
      • 교차점에 node가 있으면 line이 2개가 아니라 4개임
      • 교차점에 vertex가 있으면 line이 2개 (방향 전환만 하는 점이 vertex니까)
  • 다각형/면(Polygons)
    • 폐쇄된 연결 형태로 구성된 3개 이상의 정점으로 이루어짐
    • 특정 영역의 경계를 표현할 때 사용
      • 예: 한국 지도에서 대전시의 경계 표시

 

        벡터 데이터 포맷

  • 데이터 포맷: KML, GML, GeoJSON, Shapefile, WKT
  • KML(Keyhole Markup Language), GML(Geography Markup Language)
    • XML 기반으로 지리공간 데이터를 저장
    • non-GIS 사용자들과 인터넷을 통해 쉽게 지리공간 데이터를 공유하는 데에 주로 사용됨
    • KML은 OGC(Open Geospatil Consortium)의 공식 표준
  • GeoJSON
    • JSON 기반으로 간단한 지리공간 데이터와 그 외 일반 데이터를 저장
    • 인터넷으로 지리공간 & 일반 데이터를 공유하는 데에 주로 사용됨
  • Shapefile(.shp)
    • GIS 소프트웨어를 위한 지리공간 벡터 데이터
    • GIS 의 국제적인 제공사인 ESRI에서 개발하고 관리하며, GIS 소프트웨어 간의 상호운용성(interoperability)를 보장
    • 점 좌표의 나열로, 공간객체를 입력하는 대신 점(point), 폴리라인(polyline) 다각형(polygon) 등 각 객체의 좌표값을 포함한 기하학적 속성을 저장하고 이에 연결된 속성정보도 포함
    • 벡터 데이터 - 파일 포맷이 shapefiles(.shp)인 데이터의 상호 변환 가능

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 포맷 - Shapefile(.shp)

  • WKT(Well-Known Text)
    • 벡터 데이터를 표현하는 데에 텍스트 마크업 언어를 사용
    • WKB (Well-Known Binary): WKT와 같은 정보를 저장하는 데 있어 이진(binary) 포맷을 사용 > 보다 간소하고 컴퓨터가 처리하기에 편리하지만, 사람이 읽을 수는 없음

 

        벡터 데이터 간의 위상 구조

  • 위상(topology)
    • 서로 인접해있는 벡터 객체들의 공간적 관계를 나타냄
    • 위상관계가 테이블로 정리되어 있다면 “위상관계가 구축되어 있다”고 함

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 간의 위상 구조

  • 위상 구조를 통해 생성되는 관계

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 간의 위상 구조 - 위상 구조를 통해 생성되는 관계

 

        벡터 데이터 모델의 장점

  • 고해상도의 기하학적 정확도 유지 (축척과는 독립적인 해상도)
    • 대상물을 그리고자 하는 모양에 따라 정확히 그림

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 장점 - 고해상도의 기하학적 정확성

  • 복잡한 현실 세계의 묘사가 가능
  • 압축이 가능한 자료 구조의 제공 > 데이터 용량 축소에 용이
  • 정교한 속성정보의 처리
    • 속성정보 및 기타 정보시스템과 연계
    • 속성정보를 DBMS 형태로 관리할 수 있음
    • 그래픽과 관련된 속성정보의 추출, 일반화, 갱신 등이 용이
  • 위상 구조 구축으로 다양한 공간분석이 가능 (인접, 포괄 등의 연산)
    • 두 개의 Polygon이 인접해있거나, Polygon 내에 다른 Point가 포괄되어 있는 경우에도 연산이 가능

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 장점 - 위상 구조 구축으로 다양한 공간분석이 가능

  • 이해도와 시각적 효과가 높음

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 장점 - 이해도와 시각적 효과가 높음

  • 보다 꽉 짜인 데이터 구조

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 단점 - 자료 구조가 복잡

  • 공간 데이터의 특성에 적합한 점, 선, 면 형태
    • 예: 도로 - 선, 호수 - 면 형태로 저장되어야 함

 

        벡터 데이터 모델의 단점

  • 자료 구조가 복잡

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 단점 - 자료 구조가 복잡

  • 여러 레이어의 중첩이나 분석에 있어 기술적 어려움이 존재
  • 각각의 그래픽 구성요소가 각기 다른 위상 구조를 가지므로 분석이 어려움
  • 그래픽의 정확도가 높기 때문에 도식과 출력에 고가의 장비 필요
  • 보통 값비싼 하드웨어와 소프트웨어가 요구되므로 초기비용이 많이 듦
  • 위상 구조 없이는 연산시간이 길어질 수 있음

 

        벡터 데이터로 위치정보와 속성정보 저장하기

  • Polygon, Arc, Node가 위치정보를 나타냄
    • 면(Polygon): A34, A35 / 선(Arc): I, II, III, IV / 점(Node): 1, 2, 3, 4
  • Polygon, Arc, Node의 Feature Attribute는 속성정보를 나타냄

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터로 위치정보와 속성정보 저장하기 - 컴퓨터에 물리적으로 위치정보와 속성정보가 저장되는 형태
공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터로 위치정보와 속성정보 저장하기 - 컴퓨터 화면상에 나타나는 형태

 

        벡터 데이터 모델의 공간질의(spatial query)

  • 공간질의 예시: 도로에서 가까운 집 찾기, 특정 행정구역 내의 문화재 찾기
  • 속성에 의한 선택
    • 속성 데이터 중 인구 밀도가 x명 이상인 시/군을 선택하라

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 공간 질의 - 속성에 의한 선택

  • 위치에 의한 선택
    • 위치 데이터 중 XX동 안에 있는 건물을 모두 선택하라
    • 예시 1) 주택과 학교 간 거리를 이용한 공간 질의

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 공간 질의 - 위치에 의한 선택

  • 예시 2) 특정 행정동에 위치한 주택의 선택을 위한 공간 질의

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터 모델의 공간 질의 - 예시

 

        벡터 데이터 모델의 활용

  • 세분류 토지피복도

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터의 활용 - 도시기상관측망 공간정보

  • 지형 현황도

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터의 활용 - 지형 현황도

  • 도서관 공간정보

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터의 활용 - 도서관 공간정보

  • 도시기상관측망 공간정보

공간 데이터 모델 - 벡터 데이터 모델 - 벡터 데이터의 활용 - 도서관 공간정보

 


 

 래스터(raster) 데이터 모델 

        래스터 데이터 모델의 개념

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 개념

  • 실세계의 대상물(공간자료)을 픽셀의 격자(grid of pixels)로 표현
  • 넓은 지역에서 연속적으로 변화하는 지리적 현상이나 벡터 데이터로 쉽게 나눌 수 없는 정보를 표현할 때 사용
  • 레스터 데이터의 각 픽셀은 값을 가지고 있어 질문의 요소에 대한 정보를 전달 (예: 색, 측정 단위)
  • 위성영상, 항공사진, 수치표고모델(DEM, Digital Elevation Model) 등에 적합
  • 생성
    • 종이지도를 스캐닝
    • 항공사진, 인공위성 영상 등의 원영상
  • 위치 표시
    • 공간객체의 위치는 행(row)이나 열(column)로 표시
  • 정확도
    • 레스터 데이터의 품질은 해상도나 과업의 목적에 따라 다양함
    • 격자(cell, raster, pixel) 크기에 좌우됨
    • 격자의 크기가 작을수록 자세한 현실세계의 표현이 가능 But, 전체 데이터 크기 증가
    • 격자의 크기가 커지면 전체 데이터의 크기 감소 But, 정확도가 떨어짐
      • 예: 100m x 100m일 경우, 100m보다 작은 사물은 표현 불가능
  • 래스터 데이터의 자료구조
    • 규칙적으로 배열된 정사각형의 셀(cell) 격자(grid)에 기반을 두어 공간 객체를 표현
      • 자료의 저장 방식이 단순하고 효율적
    • 예시 - 좌: 실제 공간 / 우: 래스터 데이터로 표현
      • 래스터 셀에는 1, 2, 3, 4, 5 라는 값이 들어가있음

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 자료구조

  • 실 세계의 래스터 데이터 파일로의 변환

공간 데이터 모델 - 래스터 데이터 모델 - 실 세계의 래스터 데이터 파일로의 변환

  • 래스터 데이터의 지도화와 부정확성 실례

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터의 지도화와 부정확성 실례

 

        래스터 데이터 포맷

  • 컴퓨터에 저장되는 물리적 형태: ESRI Grid, GeoTIFF, ArcGRID, JPEG 2000, NITF

 

        래스터 데이터 모델의 장점

  • 자료 구조가 단순

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 장점 - 자료 구조가 단순

  • 여러 레이어의 중첩이나 분석이 용이

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 장점 - 여러 레이어의 중첩이나 분석이 용이

  • 원격탐사 자료(예: 위성영상)와의 연계처리에 용이
  • 격자의 크기가 동일하기 때문에 시뮬레이션이 용이
  • 저가의 컴퓨터 사양과 단순한 기술만 있으면 됨
  • 전체 지역에 대한 셀 단위의 연산이 가능
  • 래스터 데이터: 모든 셀에 대한 값이 있어서 모든 지역을 그림
    • 벡터 데이터: 그리고자 하는 것만 그림

 

        래스터 데이터 모델의 단점

  • 공간적 부정확성
    • 정확한 위치 파악이 어려움

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 단점 - 공간적 부정확성

  • 형상이 일반화돼버림
    • 해상도에 따라 정보가 손실될 수 있음

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 단점 - 형상의 일반화

  • 데이터 용량이 방대함
    • 격자의 크기를 늘리면 자료의 양은 줄일 수 있음 But, 정보의 손실 초래

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 단점 - 자료의 양이 방대함

  • 제한적인 속성정보의 처리
  • 위상 구조 정보의 제공이 불가능해서 관망분석과 같은 공간분석 불가능
  • 좌표 변환을 위해 많은 시간이 소요됨
  • 벡터 데이터에 비해 시각적인 효과가 떨어짐

 

        래스터 데이터로 위치정보와 속성정보 저장하기

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기

  • 격자의 크기
    • 정보의 추출과 자료의 조작과 관련
  • 격자구조의 압축
    • Run-length 코드
    • Quadtree 기법
    • 블록 코드(block code)
    • 체인 코드(chain code)
  • Run-length에 의한 압축

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - Run-length에 의한 압축

  • Quadtree 모형을 이용한 지역의 분할

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - Quadtree 모형을 이용한 지역의 분할 1
공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - Quadtree 모형을 이용한 지역의 분할 2

  • 블록 코드 기법을 이용한 단순지역의 분할

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - 블록 코드 기법을 이용한 단순지역의 분할

  • 블록 코드 기법을 이용한 데이터 압축

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - 블록 코드 기법을 이용한 데이터 압축

  • 체인 코드 기법을 이용한 경계의 분할

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터로 위치정보와 속성정보 저장하기 - 체인 코드 기법을 이용한 경계의 분할

 

        래스터 데이터 모델의 공간 질의(spatial query)

  • 래스터 데이터 모델의 공간 질의 예시

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 공간 질의 예시

 

래스터 데이터 모델과 참조 체계

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델과 참조 체계 1
공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델과 참조 체계 2

 

        2차원의 1차원화

  • 2차원 공간을 통과하는 1차원 경로 유형

공간 데이터 모델 - 래스터 데이터 모델 - 2차원의 1차원화 - 2차원 공간을 통과하는 1차원 경로 유형

 

        래스터 데이터의 연산

  • 지도대수(Map algebra)
    • 래스터 레이어와 래스터 레이어 사이를 수학적으로 관계대수식을 이용해 연산하는 것
  • 재분류(reclass)
    • 래스터 데이터가 갖고 있는 값들을 재분류

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터의 연산

 

        래스터 데이터 모델의 활용

  • 셀 기반의 구조이기 때문에 고도, 강수량, 기온 등 연속적인 공간 객체를 표현하기에 적당
  • 인공위성으로 얻는 원격탐사 영상처럼 추가적인 영상 처리 과정을 거쳐 번주형 자료로 활용
    • 셀에 입력되는 데이터는 명목, 서열, 등간, 비율 척도로 저장
  • 활용 분야: 환경, 식생, 토지 이용 등
  • 예시 1) 위성영상을 활용한 정규화 식생 지수 표현

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 활용 - 위성영상을 활용한 정규화 식생 지수 표현

  • 예시 2) 위성영상

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 활용 - 위성영상

  • 예시 3) 토지 피복 지도

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 활용 - 토지 피복 지도

  • 예시 4) 수온영상

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 활용 - 수온영상

  • 예시 5

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터 모델의 활용 예시

 

        래스터 데이터의 성질에 따른 구분

  • 명목척도 자료
    • 개체 간의 구별 > 이름을 가짐
  • 서열척도 자료
    • 개체 간의 순위를 나타냄
  • 간격척도 자료
    • 간격 간의 상대적 비교
    • 절대적인 0이 없음 (숫자로써의 0)
    • 예: 온도 > 0도는 온도가 존재하지 않는 게 아님
  • 비율척도 자료
    • 전체에 대한 상대적 비교
    • 절대적인 0이 있음
    • 예: 길이, 무게 > 0은 값이 없는 것을 의미
  • 간격척도 자료와 비율척도 자료는 숫자 값으로 지역의 값을 나타낸 것

공간 데이터 모델 - 래스터 데이터 모델 - 래스터 데이터의 성질에 따른 구분

 


 

 벡터 데이터 모델와 래스터 데이터 모델 비교  (참고)

공간 데이터 모델 - 벡터 데이터와 래스터 데이터 비교 1
공간 데이터 모델 - 벡터 데이터와 래스터 데이터 비교 2

  벡터 데이터 모델 래스터 데이터 모델
[공통점] 벡터와 래스터는 공간 데이터를 표현하는 데이터 타입임
[차이점]
개념
실 세계를 점, 선, 면의 기하학적인 형태로 표현 실 세계를 격자형의 픽셀(= cell) 형태로 표현
장점 - 고해상도의 기하학적 정확성
- 복잡한 현실 세계의 묘사가 가능
- 압축이 가능한 자료 구조의 제공 > 자료량 축소에 용이
- 정교한 속성정보의 처리
- 위상 구조 구축으로 다양한 공간분석 가능 (인접, 포괄 등의 연산)
- 그래픽과 관련된 속성정보의 추출, 일반화, 갱신 등이 용이
- 이해도와 시각적 효과가 높음
- 보다 꽉 짜인 데이터 구조
- 공간 데이터의 특성에 적합한 점, 선, 면 형태
- 자료 구조가 단순
- 여러 레이어의 중첩이나 분석이 용이
- 원격탐사 자료(예: 위성영상)와의 연계처리에 용이
- 격자의 크기가 동일하기 때문에 시뮬레이션이 용이
- 저가의 컴퓨터 사양과 단순한 기술만 있으면 됨
- 빠른 연산 속도

- 전체 지역에 대한 셀 단위의 연산이 가능
단점 - 자료 구조가 복잡
- 여러 레이어의 중첩이나 분석에 있어 기술적 어려움이 존재
- 각각의 그래픽 구성요소가 각기 다른 위상 구조를 가지므로 분석이 어려움
- 그래픽의 정확도가 높기 때문에 도식과 출력에 고가의 장비 필요
- 보통 값비싼 하드웨어와 소프트웨어가 요구되므로 초기비용이 많이 듦
- 공간적 부정확성 (정확한 위치 파악이 어려움)
- 형상의 일반화
- 자료의 양이 방대함
- 제한적인 속성정보의 처리
- 위상 구조 정보의 제공 불가능 >관망분석과 같은 공간분석 불가능
- 좌표 변환을 위해 많은 시간이 소요됨
- 벡터 데이터에 비해 시각적인 효과가 떨어짐
  • 벡터 데이터와 래스터 데이터는 GIS 소프트웨어에 의해 상호 변환될 수 있음

공간 데이터 모델 - 벡터 데이터와 래스터 데이터 상호 변환 1
공간 데이터 모델 - 벡터 데이터와 래스터 데이터 상호 변환 2


 

 공간 데이터 파일 유형 

  • 공간 데이터는 여러 소프트웨어/서비스에 의해 생성/변경/열람될 수 있음
  • 가장 많이 사용하는 유형은 ESRI사의 Shapefile
구분 확장자 설명
ESRI Shapefile .SHP
.DBF
.SHX
.prj
.sbn
.fbn
- 업계 표준처럼 사용되는 공간 데이터 파일 유형
- 대부분 상업용 / 오픈소스 GIS 소프트웨어에서 지원
- 최소 아래 3개의 파일이 조합되어야 함
   - .SHP: 도형 정보
   - .SHX: 도형 인덱스
   - DBF: 속성 정보
GeoJSON
(Geographic JSON)
.GEOJSON
.JSON
- 웹 기반의 공간 표현에 많이 이용됨
- JSON(JavaScript Object Notation) 형태로 공간정보 저장
TopoJSON
(Topology JSON)
.JSON - 토폴로지(위상)를 이용한 GeoJSON의 확장 형식
- 중복을 제거해 크기를 최소화
- PowerBI의 ‘도형맵’에서 사용
GML
(Geography Markup Language)
.GML - XML 형태로 공간정보 저장
- XML은 컴퓨터는 물론, 사람도 이해할 수 있는 텍스트 형태
KML / KMZ
(Google Keyhole Markup Language)
.KML
.KMZ
-구글에서 기본적으로 사용하는 XML 형태의 공간 데이터 유형
- WGS84 형태로 공간정보 정의
   - WGS84 타원체: 전 세계에서 사용하는 표준. 장반경이 단반경에 비해 1/300 정도 긴 타원체
   - WGS(World Geodetic System, 세계 지구 좌표 시스템)