전통문화대전망 - 전통 미덕 - 로봇 시각 시스템의 이미지 분할 기술에 대한 전통적인 방법 소개 1

로봇 시각 시스템의 이미지 분할 기술에 대한 전통적인 방법 소개 1

이름: 코우

학번: 21011110234.

인공지능 기술이 발달하면서 지능형 로봇 분야도 전례 없는 발전을 이루었다. 특히 심도 신경망이 시각시스템에서 광범위하게 응용된 후 많은 뚜렷한 성과를 거두었다. 시각 시스템은 자율 이동 로봇에게 매우 중요한 역할을 하며, 이미지 분할 기술은 이 시스템에서 매우 중요한 역할을 합니다. 전통적인 이미지 분할 기술은 기본적으로 이미지의 전망과 배경을 분리할 수 있었지만, 최근 몇 년 동안 심도 있는 학습 알고리즘이 발전함에 따라 사람들은 이를 이미지 분할에 적용하기 시작했고, 많은 분할 네트워크를 제시했습니다. 좋은 분할 효과도 얻었다. 이미지 분할을 바탕으로, 사람들은 또한 분할을 의미 범주 및 태그, 이는 현재의 의미 분할로 만듭니다. 의미 분할을 소개하면서 새로운 작업 분할 장면, 인스턴스 분할 및 파노라마 분할을 소개했습니다. 이 문서에서는 최근 연구한 핫스팟 3D 점 구름의 의미 분할을 소개하고 구현의 필요성을 설명합니다.

내장 소코 지능 로봇, 이미지 분할, 의미 분할, 컴퓨터 시각.

젖소 문제에 내장된 이미지 분할 기술의 전통적인 일반적인 방법

상감 소 문자

I. 소개

컴퓨터 비전, 즉 컴퓨터 비전은 컴퓨터를 통해 인간의 시각의 작동 원리를 시뮬레이션하여 일련의 이미지 정보 처리를 수행하고 완료하는 기계입니다. 컴퓨터 비전은 기계 학습이 시각 분야에서 응용하는 것으로, 수학, 물리학, 생물학, 컴퓨터 공학 등의 학과를 포괄하는 연구 분야이다.

컴퓨터 비전의 주요 응용은 무인, 얼굴 인식, 무인 보안, 차량 번호판 인식, 지능형 이미지 전송, 3D 재구성, VR/AR, 스마트 사진, 의료 이미지 처리, 드론, 산업 검사 등이다. 인간의 운전은 현재 인공지능 분야의 중요한 연구 방향이며, 자동차가 자율운전이나 보조운전으로 운전작업의 안전성을 높일 수 있도록 한다. 현재 얼굴 인식 기술은 비교적 성숙해 여러 곳에서 응용이 가능하며, 얼굴 인식의 정확도는 사람의 눈보다 높다. (윌리엄 셰익스피어, 얼굴 인식, 얼굴 인식, 얼굴 인식, 얼굴 인식, 얼굴 인식, 얼굴 인식) 안전은 항상 우리나라가 매우 중시하는 문제이자 사람들이 특별히 주목하는 문제이다. 많은 중요한 위치에 순찰 순찰이 마련되어 있고, 주택단지, 회사도 치안 순찰을 배치해 안전을 확보하고 있다. 차량 번호판 인식은 현재 미성숙한 기술이다. 차량 번호판 인식은 위반 감지, 교통흐름 분석, 안전벨트 인식, 지능형 교통등 및 주차장의 차량 식별에 사용됩니다. 3D 재건에 앞서 산업 분야에 광범위하게 적용되었다. 3 차원 물체를 모델링하거나, 물체의 다양한 매개변수를 쉽게 측정하거나, 단순히 물체를 복제하는 데 사용할 수 있습니다. 컴퓨터 비전의 응용은 매우 많은데, 기술이 발전함에 따라 응용 분야가 갈수록 많아질 것이다. 공업 분야에서의 응용, 로봇 기술에서의 응용 등.

전통적인 이미지 분할 프로세스의 경우 일반적으로 피쳐 인식, 이미지 사전 처리, 피쳐 추출, 피쳐 필터링 및 추론 예측 인식의 다섯 단계로 나눌 수 있습니다. 연구에 따르면, 시각 발전의 초기에 사람들은 이미지의 특징에 충분한 주의를 기울이지 않았다. 전통적인 분할 과정은 피쳐 추출과 분류를 분리하고 결과를 출력해야 할 때 병합하는 것입니다. 실현의 어려움은 상상할 수 있습니다.

심도 있는 학습 알고리즘이 나온 후 컨볼 루션 신경망은 컴퓨터 시각 기술에서 광범위하게 응용되어 많은 연구 방향을 이끌어 냈다. 심도 있는 학습은 주로 특징을 기준으로 비교한다. 예를 들어, 얼굴 인식, 컨볼 루션 신경망을 사용 하 여 두 개의 다른 위치에서 얼굴의 특성을 추출, 다음 서로 비교, 그리고 마지막으로 비교 결과를 얻을. 현재 컴퓨터 비전의 주요 연구 방향은 이미지 분류, 대상 감지, 이미지 분할, 대상 추적, 이미지 필터 노이즈 감소, 이미지 향상, 스타일화, 3D 재구성, 이미지 검색, 간 등입니다. 이 문서에서는 주로 이미지 분할 영역에 대한 간략한 개요를 제공합니다.

이미지 분할 기술은 컴퓨터 시각 분야의 중요한 연구 방향이자 이미지 의미 이해의 중요한 부분입니다. 이미지 분할은 이미지를 유사한 속성을 가진 여러 영역으로 분할하는 프로세스입니다. 수학적으로 이미지 분할은 이미지를 교차하지 않는 영역으로 분할하는 과정입니다. 최근 몇 년 동안 심도 있는 학습 기술이 점차 깊어지면서 이미지 분할 기술이 비약적으로 발전하였다. 이 기술과 관련된 기술 (예: 장면 개체 분할, 인체 배경 분할, 얼굴 및 인체 분석, 3D 재구성 등) 은 무인 운전, 증강 현실, 보안 모니터링 등에 널리 사용되고 있습니다.

둘째, 개발 현황

최근 몇 년 동안 많은 학자들이 이미지 분할 기술을 모바일 로봇의 제어에 적용했는데, 이 기술은 로봇 움직임과 동시에 지도를 배치하고, 서로 다른 전경과 배경을 분할하여 시각 시스템이 스캔한 이미지에 의미 정보를 제공할 수 있게 해 줍니다. (존 F. 케네디, Northern Exposure (미국 TV 드라마), 과학명언) 일부 학자들은 또한 서로 다른 종류의 물체를 구분할 수 있을 뿐만 아니라, 같은 종류의 다른 물체를 분류하고, 심지어 배경을 분류할 수 있는 더 정확하고 정확한 분할을 위해 노력하고 있습니다. 우리가 살고 있는 세계는 3 차원 공간이기 때문에 일부 학자들은 이미지 장면을 3 차원으로 복원한 다음 관련 방법을 사용하여 전체 3 차원 장면을 분할합니다. 이미지 분할은 컴퓨터 시각 연구의 고전적인 문제로 점점 더 주목을 받고 있다.

-응? 첫 번째는 전통적인 이미지 분할 방법입니다. 전통적인 분할에서는 디지털 이미지 처리, 토폴로지 및 수학에 대한 지식을 사용하여 이미지를 분할합니다. 계산 능력이 점차 향상되고 심도 있는 학습도 발전하고 있지만, 일부 전통적인 분할 방법은 심도 있는 학습만큼 효과적이지는 않지만, 여전히 배울 수 있는 아이디어가 많다.

첫 번째 방법은 임계값 기반 이미지 분할입니다. 이 방법의 핵심 아이디어는 이미지의 그레이스케일 특징에 따라 하나 이상의 그레이스케일 임계값을 제공하여 이미지의 각 픽셀 점과 하나씩 비교하여 표준 값으로 사용하는 것입니다. 이러한 일대일 비교 프로세스를 통해 두 가지 결과를 얻을 수 있다고 생각하기 쉽습니다. 하나는 그레이스케일 값이 임계값보다 큰 픽셀 점 세트이고, 다른 하나는 그레이스케일 값이 임계값보다 작은 픽셀 점 세트이므로 이미지가 자연스럽게 분할됩니다. 따라서 이 방법의 가장 중요한 단계는 특정 지침 함수에 따라 최적의 그레이스케일 임계값을 얻어서 적절한 분류 결과를 얻는 것입니다. 이미지에서 분할할 대상과 배경이 서로 다른 그레이스케일 값 또는 다른 계층을 차지할 경우 이 방법이 좋은 결과를 얻을 수 있다는 점은 주목할 만하다. 또한 이미지 처리에 대한 임계값을 설정하기만 하면 단일 임계값 분할이라고 할 수 있습니다. 그러나 이미지에 대상이 두 개 이상 있는 경우, 즉 추출할 대상이 여러 개 있는 경우 단일 임계값 분할로 모두 분리할 수 없습니다. 이때 처리할 임계값을 여러 개 선택해야 합니다. 분할 프로세스는 다중 임계값 분할입니다. 전반적으로 임계값 분할법은 고유한 특징을 가지고 있으며, 계산은 간단하고 효율이 높다. 그러나 이 방법은 단일 픽셀의 그레이스케일 값과 해당 특성만 고려하므로 공간 특징을 완전히 무시하여 소음에 민감하고 노봉성이 낮습니다.

두 번째 방법은 영역 기반 이미지 분할입니다. 이 방법에는 두 가지 기본 형식이 있습니다. 하나는 영역 성장이고, 단일 픽셀부터 시작하여 유사한 영역을 점진적으로 병합하여 원하는 영역을 얻는 것입니다. 또 다른 방법은 이미지의 글로벌에서 직접 시작하여 조금씩 원하는 영역으로 잘라내는 것입니다. 영역 성장은 다른 성장 영역을 나타내는 시드 픽셀 세트를 지정한 다음 해당 시드 픽셀을 이웃 내의 적합한 픽셀 점으로 점진적으로 병합하는 것입니다. 새 픽셀을 추가하면 시드 픽셀으로도 간주됩니다.

지역 분열과 합병의 분할 과정은 지역 성장의 역과정이라고 할 수 있다. 이 방법은 이미지의 전반에서 시작하여 끊임없는 분할을 통해 각 하위 영역을 얻은 다음 대상을 추출하는 과정입니다. 또한 이 과정에서 전경 영역을 병합해야 합니다.

영역 분할 방법에는 유역 알고리즘도 있습니다. 이 분할 방법은 분수령 구도에서 영감을 받아 이미지를 측지선 토폴로지 지형으로 간주하여 이미지의 각 픽셀에 해당하는 고도를 해당 점의 그레이스케일 값으로 나타낼 수 있도록 합니다. 분수령의 형성 과정은 사실상 침수 과정을 시뮬레이션하여 실현될 수 있다. 특히 각 로컬 최소값의 표면에 작은 구멍을 뚫은 다음 모델을 천천히 물에 담그는 것입니다. 물이 천천히 스며들면서 분수령이 형성되었다.

세 번째 방법은 에지 검출에 기반한 분할 방법입니다. 가장자리 감지의 사상은 서로 다른 물체의 가장자리를 감지하여 이미지를 분할하는 것이다. 이 방법은 가장 먼저 연구하는 방법 중 하나이다. 사진을 공간 영역에서 주파수 영역으로 변환하고 개체의 가장자리 부분이 고주파 부분에 해당하면 가장자리 정보를 쉽게 찾을 수 있으므로 분할 문제가 쉬워집니다. 가장자리 감지 방법을 사용하면 빠르고 정확한 위치를 얻을 수 있지만 가장자리의 연속성과 폐쇄성을 보장할 수는 없습니다. 한 이미지에 세부 정보가 너무 많으면 가장자리에 많은 가는 가장자리가 생성되어 전체 분할 영역을 형성할 때 결함이 생길 수 있습니다.

네 번째 이미지 분할 방법은 특정 도구를 결합합니다. 여기서 말하는 구체적인 도구는 다양한 이미지 처리 도구와 알고리즘이다. 이미지 분할 연구가 진행됨에 따라 많은 학자들이 이미지 처리 도구와 알고리즘을 이 작업에 적용하여 좋은 결과를 얻기 시작했습니다. 소파 변환은 디지털 이미지 처리에서 중요한 역할을 하며 시간 영역과 주파수 영역을 통합하여 신호를 연구할 수 있습니다. 특히 이미지 가장자리 감지에서 소파 변환은 이진 함수의 로컬 돌연변이 능력을 감지할 수 있습니다. 둘째, 이미지 분할은 유전 알고리즘에 기반을 두고 있으며, 생물학에서의 자연 선택과 자연 유전 메커니즘의 무작위 검색 방법을 주로 참고한다. 유전자 서열 통제 생물 군체의 진화 과정을 시뮬레이션하여 전역 검색에 능하지만 부분 검색 능력이 부족하다. 유전 알고리즘을 이미지 처리에 적용하는 것도 현재 연구의 열점 문제이다. 여기서 이 방법을 선택하는 주된 이유는 유전 알고리즘이 문제 도메인과 무관한 빠른 무작위 검색 기능을 갖추고 있기 때문입니다.

또한 이미지 분할 기술의 연구와 혁신을 위한 이상적인 프레임워크를 제공하는 통일되고 개방적인 설명 형식을 갖춘 활성 윤곽 모델을 기반으로 하는 분할 방법도 있습니다. 이 방법은 또한 가장자리 정보를 감지하는 방법이며, 주로 곡선 진화를 사용하여 지정된 이미지에서 대상을 감지하는 것입니다.