전통문화대전망 - 전통 미덕 - 이미지 분할
이미지 분할
이미지 임계 분할은 전통적이고 가장 일반적으로 사용되는 이미지 분할 방법으로, 구현이 간단하고 계산량이 적으며 성능이 상대적으로 안정적이기 때문에 이미지 분할에서 가장 기본적이고 널리 사용되는 분할 기술이 되었습니다. . 대상과 배경이 서로 다른 회색조 범위를 차지하는 이미지에 특히 적합합니다. 데이터의 양을 크게 압축할 수 있을 뿐만 아니라 분석 및 처리 단계를 크게 단순화할 수 있으므로 많은 경우 이미지 분석, 특징 추출 및 패턴 인식 전에 필요한 이미지 전처리 과정입니다.
이미지 임계화의 목적은 회색 레벨에 따라 픽셀 집합을 나누는 것입니다. 획득된 각 하위 집합은 실제 장면에 해당하는 영역을 형성하며, 각 영역은 일관된 특성을 공유하지 않습니다. 재산. 이러한 분할은 회색 레벨에서 시작하는 하나 이상의 임계값을 선택하여 수행할 수 있습니다.
기본 원리는 다양한 기능 임계값을 설정하여 이미지 픽셀을 여러 카테고리로 나누는 것입니다.
일반적으로 사용되는 기능은 다음과 같습니다. 원본 이미지에서 직접 회색조 또는 색상 기능, 원본 회색조 또는 색상 값에서 변환된 기능.
원본 이미지를 f(x, y)로 두고, 특정 기준에 따라 f(x, y)에서 특징값 T를 찾아 이미지를 두 부분으로 나눕니다.
p>
b0=0(검은색), b1=1(흰색)을 사용하면 이를 일반적으로 이미지 이진화라고 부릅니다.
임계값 분할 방법은 실제로 입력 이미지 f에서 출력 이미지 g로 다음과 같은 변환을 수행합니다.
그 중 T는 임계값이고 객체의 이미지 요소에 대한 것입니다. g(i,j)=1 - 배경 이미지 요소의 경우 g(i,j)=0입니다.
임계값 분할 알고리즘의 핵심은 임계값을 결정하는 것임을 알 수 있습니다. 적절한 임계값을 결정할 수 있으면 이미지를 정확하게 분할할 수 있습니다. 임계값이 결정된 후 임계값과 픽셀의 회색값을 하나씩 비교하여 각 픽셀에 대해 픽셀 분할을 병렬로 수행할 수 있으며 분할 결과를 이미지 영역에 직접 제공할 수 있습니다.
임계값 분할의 장점은 간단한 계산, 높은 계산 효율성 및 빠른 속도입니다. 전역 임계값, 적응형 임계값, 최적 임계값 등 다양한 임계값 처리 기술이 있습니다.
임계값 처리 기술은 다음을 참조하세요.
영역 분할은 유사성 기준에 따라 이미지를 여러 영역으로 나누는 것을 의미하며 주로 영역 성장, 지역 분할 및 병합, 유역.
영역 성장은 연속적인 영역 분할의 이미지 분할 방법입니다. 영역 성장은 특정 픽셀부터 시작하여 특정 조건에 따라 점차적으로 이웃 픽셀을 추가하는 것을 의미합니다. 지역 성장의 질은 1. 초기 지점(시드 지점)의 선택에 따라 달라집니다. 2. 성장 기준. 3. 종료 조건. 영역 성장은 특정 픽셀 또는 특정 픽셀부터 시작하여 최종적으로 전체 영역을 획득함으로써 타겟 추출을 달성합니다.
영역 성장의 기본 아이디어는 유사한 속성을 가진 픽셀을 모아 영역을 형성하는 것입니다. 구체적으로, 먼저 성장의 시작점으로 분할되어야 하는 각 영역의 시드 픽셀을 찾은 다음, 시드 픽셀과 동일하거나 유사한 특성을 갖는 시드 픽셀 주변의 픽셀을 식별합니다(미리 정해진 기준에 따라 결정됨). 성장 또는 유사성 기준) 시드 픽셀이 위치한 영역에 병합됩니다. 이러한 새 픽셀을 새 시드 픽셀로 처리하고 조건을 충족하는 픽셀이 더 이상 포함될 수 없을 때까지 위 프로세스를 계속합니다. 그런 영역이 커졌습니다.
영역 성장을 위해서는 원하는 영역을 정확하게 표현할 수 있는 시드 픽셀 그룹을 선택하고, 성장 과정에서 유사성 기준을 결정하고, 성장을 중지하는 조건이나 기준을 공식화해야 합니다. 유사성 기준은 회색조, 색상, 질감, 그라데이션 등과 같은 특성일 수 있습니다. 선택된 시드 픽셀은 단일 픽셀일 수도 있고 여러 픽셀을 포함하는 작은 영역일 수도 있습니다. 대부분의 지역 성장 기준은 이미지의 지역 속성을 사용합니다. 성장 기준은 다양한 원리에 따라 개발될 수 있으며, 다양한 성장 기준을 사용하면 면적 성장 과정에 영향을 미칠 수 있습니다.
그림 1은 지역적 성장의 예입니다.
영역 성장은 고대 이미지 분할 방법으로 Levine 등이 제안한 최초의 영역 성장 이미지 분할 방법입니다.
이 방법에는 일반적으로 두 가지 방법이 있는데, 하나는 먼저 이미지에서 분할할 대상 객체 내에 작은 블록이나 시드 영역(시드 포인트)을 부여한 다음 시드 영역을 기준으로 주변 픽셀을 일정량으로 연속적으로 나누는 것입니다. 객체를 나타내는 모든 픽셀을 최종적으로 하나의 영역으로 결합하는 목적을 달성하기 위해 규칙이 추가되었습니다. 다른 영역은 먼저 이미지를 동일한 픽셀 회색 값을 가진 작은 영역과 같이 일관성이 강한 여러 작은 영역으로 나누는 것입니다. 그런 다음 이미지 분할 목적을 달성하기 위해 특정 규칙에 따라 작은 영역을 큰 영역으로 융합합니다. T. C. Pong et al.이 제안한 패싯 모델을 기반으로 한 영역 성장 방법과 같은 일반적인 영역 성장 방법은 다음과 같습니다. 영역 성장 방법은 종종 과도한 분할, 즉 이미지를 너무 많은 영역으로 나누는 결과를 낳습니다.
영역 성장을 구현하는 단계는 다음과 같습니다.
기본 아이디어 영역 분할 및 병합 알고리즘은 먼저 분할 및 병합 기준을 결정합니다. 이는 이미지의 특정 영역의 특징이 일치하지 않는 경우 해당 영역을 4개의 동일한 하위로 분할합니다. 인접한 하위 영역이 일관성 특성을 충족하면 모든 영역이 더 이상 분할 및 병합 조건을 충족하지 않을 때까지 하나의 큰 영역으로 결합됩니다. 분할이 더 이상 가능하지 않으면 분할이 종료됩니다. 그런 다음 인접한 영역에서 유사한 기능을 찾아 유사한 영역을 병합하고 최종적으로 분할 기능을 수행합니다. 영역 성장과 영역 분할 및 병합 알고리즘은 어느 정도 유사하며, 극단적으로 영역 분할은 단일 픽셀로 분할된 다음 특정 측정 기준에 따라 병합됩니다. 어느 정도는 단일 픽셀의 성장 방법이라고 볼 수 있습니다. 영역 분할 및 병합 방법에 비해 영역 분할 및 병합 방법은 더 큰 유사 영역을 기반으로 유사한 병합을 수행할 수 있는 반면, 영역 성장은 단일 영역에서만 성장(병합)할 수 있습니다. 픽셀.
제약조건을 만족시키기 위해 분할과 합산을 반복하는 알고리즘입니다.
R이 전체 이미지 영역을 나타내고 조건자 P를 선택한다고 가정합니다. R을 분할하는 한 가지 방법은 임의의 영역 Ri에 대해 P(Ri)=TRUE가 될 때까지 분할된 결과 이미지를 다시 4개의 영역으로 반복적으로 나누는 것입니다. 여기서는 전체 이미지부터 시작합니다. P(R)=FALSE이면 이미지가 4개 영역으로 분할됩니다. P 값이 FALSE인 경우 모든 지역에 적용됩니다. 이 4개 영역을 각각 다시 4개 영역으로 나누면 됩니다. 이 특정 분할 기술은 그림 10.42에 표시된 트리와 같이 소위 쿼드트리(즉, 리프가 아닌 각 노드가 정확히 4개의 하위 트리를 가짐)의 형태로 가장 편리하게 표현됩니다. 트리의 루트는 전체 이미지에 해당하고 각 노드는 분할된 하위 부분에 해당합니다. 현재는 R4만 더 세분화되었습니다.
분할만 사용하는 경우 최종 분할에는 동일한 성격의 인접한 영역이 포함될 수 있습니다. 이 결함은 분할을 수행하는 동시에 영역 집계를 허용함으로써 수정될 수 있습니다. 즉, 인접한 두 영역 Rj와 Rk는 P(Rj∪Rk)=TRUE인 경우에만 집계할 수 있습니다.
앞서 논의한 내용은 다음과 같은 과정으로 요약할 수 있다. 반복 작업의 각 단계에서 우리는 다음을 수행해야 합니다.
위에서 설명한 기본 아이디어에 대해 여러 가지 변형을 만들 수 있습니다. 예를 들어, 가능한 변형 중 하나는 이미지를 이미지 타일 세트로 분할하는 것부터 시작하는 것입니다. 그런 다음 각 블록은 위에서 설명한 대로 추가로 분할되지만 집계 작업은 4개의 블록만 그룹으로 병합할 수 있다는 제한으로 시작됩니다. 이 4개의 블록은 쿼드트리 표현에 있는 노드의 자손이며 모두 술어 P를 만족합니다. 더 이상 이러한 집계를 수행할 수 없으면 2단계를 만족하는 마지막 지역 집계로 프로세스가 종료됩니다. 이 경우 집계된 영역의 크기가 다를 수 있습니다. 이 접근 방식의 가장 큰 장점은 집계의 마지막 단계까지 분할과 집계에 동일한 쿼드트리가 사용된다는 것입니다.
유역 분할 방법은 위상 이론에 기초한 수학적 형태 분할 방법으로, 측지학에서 이미지를 위상학적 지형으로 간주하는 것이 기본 아이디어입니다. 이 지점의 각 지역 최소값과 영향을 받는 지역을 유역이라고 하며, 유역의 경계는 유역을 형성합니다. 유역의 개념과 형성은 침수 과정을 시뮬레이션하여 설명할 수 있습니다. 각 로컬 최소값의 표면에 작은 구멍을 뚫은 후 전체 모델을 천천히 물에 담그고 침수가 깊어짐에 따라 각 로컬 최소값의 영향 영역이 천천히 바깥쪽으로 확장되며 두 개의 물 수집물에 구축됩니다. 유역이 합류하는 지점에 있는 댐은 유역을 형성합니다.
유역 계산 과정은 반복적인 라벨링 과정입니다. 보다 고전적인 유역 계산 방법은 L. Vincent에 의해 제안되었습니다. 이 알고리즘에서 유역 계산은 두 단계로 나누어집니다. 하나는 분류 과정이고 다른 하나는 범람 과정입니다. 먼저, 각 픽셀의 계조 레벨을 낮은 것에서 높은 것으로 정렬한 후 낮은 것에서 높은 것으로 잠기는 과정에서 h-order 높이에서 각 로컬 최소값의 영향 영역을 선입선출 방식을 사용하여 처리합니다. (FIFO) 판단 및 라벨링.
워터쉐드 변환은 입력 영상의 워터쉐드 이미지를 구하며, 워터쉐드 사이의 경계점이 워터쉐드가 됩니다. 분명히 유역은 입력 이미지의 최대값 지점을 나타냅니다.
따라서 영상의 에지 정보를 얻기 위해서는 일반적으로 그라디언트 영상을 입력 영상으로 사용하는데, 즉 워터셰드 알고리즘은 영상의 약한 에지와 표면의 미묘한 계조 변화에 대해 좋은 반응을 보입니다. 개체는 모두 과다 분할 현상을 유발합니다. 그러나 동시에 유역 알고리즘은 약한 가장자리에 대해 좋은 응답을 가지며 닫힌 연속 가장자리를 보장한다는 점에 유의해야 합니다. 또한, 유역 알고리즘을 통해 획득된 폐쇄형 유역은 영상의 지역적 특성을 분석할 수 있는 가능성을 제공합니다.
유역 알고리즘으로 인한 과도한 분할을 제거하기 위해 일반적으로 두 가지 처리 방법을 채택할 수 있습니다. 하나는 관련 없는 가장자리 정보를 제거하기 위해 사전 지식을 사용하는 것입니다. 두 번째는 집수조가 감지하려는 대상에만 반응하도록 경사 함수를 수정하는 것입니다.
유역 알고리즘으로 인한 과도한 분할을 줄이기 위해 일반적으로 그라디언트 함수를 수정합니다. 간단한 방법은 그라디언트 이미지를 임계값으로 설정하여 회색조의 작은 변화로 인한 과도한 분할을 제거하는 것입니다. 즉, 프로그램은 그라디언트 이미지를 임계값으로 제한하여 회색 값의 작은 변화로 인한 과도한 분할을 제거하고 적절한 양의 영역을 얻은 다음 회색 레벨을 조정하는 방법을 사용할 수 있습니다. 낮은 것부터 높은 것까지 정렬한 다음, Sobel 연산자를 사용하여 그라디언트 이미지를 계산합니다. 그라디언트 이미지를 임계값으로 설정할 때 적절한 임계값을 선택하면 최종 분할된 이미지에 큰 영향을 미치므로 임계값 선택은 이미지 분할 품질의 핵심입니다. 단점: 실제 이미지에는 약한 가장자리가 포함될 수 있으며 회색조 변경의 수치 차이가 특히 명확하지 않습니다. 너무 큰 임계값을 선택하면 이러한 약한 가장자리가 제거될 수 있습니다.
참고 기사:
이미지 분할의 중요한 방법은 가장자리 감지, 즉 한 영역의 끝을 나타내는 회색 레벨이나 구조에 돌연변이가 있는 위치를 감지하는 것입니다. 그리고 다른 지역이 시작되는 곳. 이러한 불연속성을 모서리라고 합니다. 이미지마다 회색조가 다르며 일반적으로 경계에 뚜렷한 가장자리가 있습니다. 이 기능을 사용하여 이미지를 분할할 수 있습니다.
이미지 가장자리에 있는 픽셀의 회색 값은 불연속적입니다. 이러한 불연속성은 도함수를 취하여 감지할 수 있습니다. 계단형 모서리의 경우 해당 위치는 1차 도함수의 극점과 2차 도함수의 영교차점(영교차점)에 해당합니다. 따라서 미분 연산자는 일반적으로 가장자리 감지에 사용됩니다. 일반적으로 사용되는 1차 미분 연산자에는 Roberts 연산자, Prewitt 연산자, Sobel 연산자가 있으며, 2차 미분 연산자에는 Laplace 연산자, Kirsh 연산자가 있습니다. 실제로 다양한 미분 연산자는 작은 영역의 템플릿으로 표현되는 경우가 많으며, 미분 연산은 템플릿과 이미지 컨볼루션을 사용하여 구현됩니다. 이러한 연산자는 노이즈에 민감하며 노이즈가 적고 복잡성이 적은 이미지에만 적합합니다.
에지와 노이즈는 모두 주파수 영역에서 회색 불연속점이자 고주파 성분이므로 미분 연산을 직접적으로 사용하여 노이즈의 영향을 극복하기는 어렵습니다. 따라서 미분 연산자를 사용하여 가장자리를 감지하기 전에 이미지를 평활화하고 필터링해야 합니다. LoG 연산자와 Canny 연산자는 평활화 기능을 갖춘 2차 및 1차 미분 연산자로 모서리 감지 효과가 좋습니다.
모서리 감지 알고리즘에서는 처음 세 단계가 매우 일반적으로 사용됩니다. 대부분의 경우 에지 검출기는 이미지의 특정 픽셀 근처에 에지가 나타나는지 지적하는 데만 필요하고 에지의 정확한 위치나 방향을 지적할 필요는 없기 때문입니다. Edge 감지 오류는 일반적으로 Edge Misclassification 오류를 나타냅니다. 즉, 잘못된 Edge는 Edge로 구별되어 유지되고, 실제 Edge는 False Edge로 구별되어 제거됩니다. 가장자리 추정 오류는 확률적 통계 모델을 사용하여 가장자리 위치 및 방향 오류를 설명합니다. 에지 검출 오류와 에지 추정 오류를 구별하는 이유는 계산 방법이 완전히 다르고 오류 모델도 완전히 다르기 때문입니다.
Roberts 연산자: 가장자리 위치가 정확하지만 소음에 민감합니다. 가장자리가 뚜렷하고 노이즈가 적은 이미지 분할에 적합합니다. 로버츠 모서리 검출 연산자는 국소 차분 연산자를 사용하여 모서리를 찾는 연산자입니다. 로버트 연산자가 처리한 이미지의 모서리는 그다지 매끄럽지 않습니다. 분석 결과, 로버트 오퍼레이터는 일반적으로 이미지의 가장자리 근처 영역에서 더 넓은 응답을 생성하므로 위의 오퍼레이터가 감지한 가장자리 이미지를 정제해야 하는 경우가 많고 가장자리 위치 지정의 정확도도 그리 높지 않습니다.
Prewitt 연산자: 노이즈를 억제하는 효과가 있습니다. 노이즈를 억제하는 원리는 픽셀 평균화이지만 픽셀 평균화는 이미지의 저역 통과 필터링과 동일하므로 Prewitt 연산자는 그다지 좋지 않습니다. 로버츠 연산자로 가장자리를 지정합니다.
Sobel 연산자: Sobel 연산자와 Prewitt 연산자는 모두 가중 평균이지만 Sobel 연산자는 인근 픽셀이 현재 픽셀에 미치는 영향이 동일하지 않다고 생각하므로 거리가 다른 픽셀은 서로 다른 가중치를 갖습니다. 연산자 결과에 다른 영향을 미칩니다. 일반적으로 거리가 멀수록 충격은 작아집니다.
등방성 소벨 연산자: 가중 평균 연산자, 가중치는 인접한 점과 중심점 사이의 거리에 반비례합니다. 서로 다른 방향을 따라 가장자리를 감지할 때 일반적으로 그라디언트 진폭이 일정합니다. 등방성으로.
가장자리 감지에서 일반적으로 사용되는 템플릿은 Sobel 연산자입니다. 두 개의 Sobel 연산자가 있는데, 하나는 수평 가장자리를 감지하는 것이고, 다른 하나는 수직 평면 가장자리를 감지하는 것입니다.
Sobel 연산자의 또 다른 형태는 등방성 Sobel(Isotropic Sobel) 연산자입니다. 하나는 수평 가장자리를 감지하고 다른 하나는 수직 평면 가장자리를 감지합니다. 일반 Sobel 연산자와 비교하여 isotropic Sobel 연산자는 위치 가중치 계수가 더 정확하고 서로 다른 방향의 가장자리를 감지할 때 기울기의 크기가 일관됩니다. 이미지 구축의 특수성으로 인해 이러한 유형의 이미지 윤곽선을 처리할 때 그라데이션 방향에서 작업할 필요가 없으므로 프로그램에서 등방성 Sobel 연산자에 대한 처리 방법을 제공하지 않는다는 것을 알 수 있습니다.
1971년에 R. Kirsch[34]는 가장자리 방향을 감지할 수 있는 새로운 Kirsch 연산자 방법을 제안했습니다. 이 방법은 8개의 템플릿을 사용하여 기울기 진폭 값과 기울기 방향을 결정합니다.
이미지의 각 점은 8개의 마스크로 구성되어 있으며 각 마스크는 특정 가장자리 방향에 최대로 반응합니다. 8개 방향 모두에서 최대값이 가장자리 크기 이미지로 출력됩니다. 최대 응답 마스크의 시퀀스 번호는 가장자리 방향의 인코딩을 구성합니다.
Kirsch 연산자의 기울기 진폭 값은 다음 공식을 사용합니다.
다양한 감지 연산자 비교:
참조 기사:
Mu Yesu에서 인용된 기사
Lornatang 편집
Lornatang 보정