전통문화대전망 - 전통 미덕 - 무게 | 사람과 회사? 세계 선발 3 세대 4.5K 쌍안 시각 인식 엔진의 아키텍처.

무게 | 사람과 회사? 세계 선발 3 세대 4.5K 쌍안 시각 인식 엔진의 아키텍처.

5438 년 6 월 +2020 년 10 월, 다른 회사는 회사의 회사를 공식 발표합니까? 3 세대 쌍안 시각 인식 엔진의 아키텍처는 4.5K (4608 * 2560) 해상도, 20 fps 실시간 처리를 지원합니다. 이에 앞서 세계 최고의 광학 회사인 일본 이광은 20 18 과 10 에서 4K 해상도의 쌍안 스테레오 카메라 제품을 선보였다.

회사의 이번 공고는 무엇입니까? 3 세대 아키텍처는 쌍안 시각 인식 엔진 아키텍처로 세계 최고 해상도를 지원합니다. 아키텍처의 전반적인 성능은 이전 세대보다 크게 향상되었으며 코어 매개변수의 해상도 지표로 12 배 가까이 향상되었습니다.

오랫동안 인공지능 3D 시각 인식 분야에서 쌍안 입체 시각 기술은 알고리즘의 복잡성이 높고 컴퓨팅 능력에 대한 수요가 많기 때문에 사랑과 미움을 불러일으켰습니다. 그러나 쌍안 입체 시각 기술은 3D 감지 분야의 중요한 구성 요소로서 근거리 거리 측정, 실내 실외 모두 균형 있게 활용할 수 있는 등 많은 업계 사용자들의 사랑을 받고 있다.

쌍안 입체 시각 기술은 삼각 측량 원리를 이용하여 상대 위치가 고정된 두 개의 카메라를 통해 장면을 동시에 이미지화하고, 이미징의 시차를 기준으로 깊이를 계산합니다. 일반적인 계산 방법은 다음과 같습니다.

여기서 f 는 카메라의 초점 거리, b 는 기준선, d 는 시차, z 는 깊이 값입니다. 이 이론적 틀을 토대로 쌍안 입체 시각의 측정 정확도가 측정 거리가 늘어나면서 심각하게 감소한다는 결론을 내릴 수 있다. 이는 현재 쌍안 시각 시스템의 큰 문제점 중 하나다. 또한 시스템의 적용 영역을 높이려면 카메라 뷰포트를 늘려야 합니다. 이렇게 하면 초점 거리 F 가 더 줄어들고 거리가 늘어나면서 z 방향 정밀도의 감쇠도가 더욱 증가합니다.

따라서 쌍안 스테레오 비전 시스템은 기존 메인스트림 해상도 (1280*800) 와 시스템 볼륨 (기준선은 일반적으로 12cm 이하) 에서 "멀리" 볼 수 있습니다

요약하면 쌍안 시각 시스템의 해상도를 높이는 것이 현재 기술 혁신을 실현하는 유일한 직접적인 방법이며 CMOS 이미지 센서 해상도가 높아지는 추세에 부합한다.

그러나 쌍안 해상도를 높이려면 컴퓨팅 성능 및 스토리지 대역폭에 대한 수요가 기하급수적으로 증가하여 현대 컴퓨터 스토리지 컴퓨팅 아키텍처에 큰 도전이 될 것입니다. 기존 CPU 또는 GPU 아키텍처에서 구현하는 것은 매우 비쌉니다 (KITTI 쌍안 평가 순위에서 4 코어 2.6Ghz CPU 는 일치 알고리즘 rSGM 만 실행하는 데 0.2 초 소요). 이상적인 컴퓨팅 효율성과 전력/비용 균형을 달성하기 어렵습니다.

위의 분석에 근거하여, 당신은 어떻게 생각합니까? 3 세대 쌍안 시각 인식 엔진의 아키텍처는 이전 세대의 논리 유닛 (FPGA)+ CPU 의 이기종 컴퓨팅 아키텍처를 계속 이어가고 있습니다. 새로운 아키텍처는 DDR4 64 비트 스토리지 아키텍처를 사용하여 이전 세대보다 메모리 스토리지 대역폭이 4 배 향상되었습니다. 일련의 알고리즘을 통해 설계 혁신을 가속화하고 수평 해상도는 거의 4 배, 전체 해상도는 거의 12 배 향상되었습니다.

3 세대 아키텍처는 이전 세대 논리 유닛 +CPU 의 이기종 설계 패턴을 계속 이어가고 있으며, 이전 세대에서는 메모리 대역폭의 기술적 병목 현상과 해상도 향상으로 인한 온칩 스토리지 자원의 기술적 병목 현상을 크게 극복했습니다. 폼 팩터는 다음과 같습니다.

시스템은 DDR4 를 스토리지 유닛으로 사용하여 논리 유닛과 외부 스토리지 유닛 간의 데이터 상호 작용 효율성을 높이고 16.5GB/s/s 의 대역폭을 설계하며, 시스템 코어 유닛 간에 파이프 라인 설계가 계속되어 계산으로 인한 지연을 최소화하고 데이터 입력 지연 시간을/kloc-보다 작게 유지합니다 동시에 시스템은 개별 단위의 세밀한 병렬 처리를 지원할 수 있으며 실시간 요구 사항이 높은 장면의 경우 공간 변경 시간 설계를 신속하게 지원하여 시스템 지연을 최소화할 수 있습니다.

3 세대 아키텍처의 자세한 성능 매개 변수는 다음 표에 나와 있습니다.

결국 인사는 Xilinx znq ultrascale+zcu102 평가판 플랫폼에서 이 아키텍처를 완벽하게 구현했습니다. 자원 소비는 다음 표에 나와 있습니다.

Xilinx 도구 세트 Vivado 20 18.3 의 연습은 다음 그림과 같습니다.

해상도가 크게 향상되면서 발생하는 스토리지 및 컴퓨팅 리소스 병목 현상을 극복하기 위해 인공지능 엔지니어들은 다음과 같은 세 가지 핵심 사항을 간략하게 소개하는 혁신적인 설계를 실시했습니다.

(1) 동적 보정 매개변수 압축 기술을 사용하여 메모리 대역폭 자원을 최적화합니다.

쌍안 스테레오 보정은 역매핑 및 쌍선형 보간을 사용합니다. 하나의 대상 픽셀을 생성하려면 쌍선형 보간 세트에 사용된 2D 좌표 값과 배율 값이 필요합니다. 해상도가 4608x2560@20fps 인 설계의 경우 픽셀당 4.5 바이트의 정보, DDR 읽기 속도는 1 Gb/s, 두 이미지를 동시에 교정하는 경우 전체 대역폭 점유 속도는 최대 2 Gb/s 입니다. 보정에 필요한 데이터의 분포 특성에 따라 최종적으로 채택된 압축 방법은 2: 1 의 압축비에 이를 수 있으며, 압축 해제 장치는 200 개 이상의 lut 와 0.5 BRAM 만 사용합니다. 자세한 내용은 다음과 같습니다.

(2) 동적 슬라이스 보정 기술을 사용하여 슬라이스 내 메모리 사용 공간을 1/3 으로 줄입니다.

수평 해상도가 높을수록 행 캐시의 폭이 늘어나 캐시된 이미지 데이터의 실시간 계산에 필요한 스토리지 공간 요구 사항이 이전 세대보다 거의 4 배 증가했습니다. 슬라이스에서 RAM 자원 부족 문제를 해결하기 위해 인공지능은 동적 슬라이스와 오류를 수정할 수 있는 프레임워크를 설계했다. 일반적인 설정은 이미지를 가로로 세 조각으로 나누어 슬라이스에 저장된 공간 요구 사항을 1/3 으로 줄이고 BRAM 자원이 더 부족한 장면에서 더 많은 슬라이스를 지원할 수 있습니다.

(3) 블록 대 블록 스테레오 매칭 설계.

아키텍처의 스테레오 매칭 부분은 이전 세대 SGM/BM 의 설계 알고리즘을 계속 이어가고 있습니다. 인공지능은 설계 성능을 보장하기 위해 블록 일치 사상을 채택하여 왼쪽 및 오른쪽 이미지를 두 부분으로 나누어 독립적으로 일치시키고, 설계에서 BRAM 자원 사용을 1/2 로 더 줄입니다.

쌍안 입체 시각 처리 아키텍처의 업그레이드는 현재 장면 응용 프로그램이 쌍안 시각 시스템에 더 큰 시각과 더 높은 정확도를 제시하는 이중 요구 사항으로 수행됩니다. 업그레이드 후 스마트 엔티티 소비 행동 분석 애플리케이션에 다음과 같은 이점을 제공합니다.

(1) 단일 쌍안 시각 시스템의 적용 범위가 추가되었습니다.

카메라 시야 각도를 130- 150 (이전 설계 지표는 100) 으로 높이면 단일 쌍안 시각 시스템의 적용 면적이 100 에 도달할 수 있습니다

(2) 공간 포지셔닝이 더 정확합니다.

깊이 맵 해상도가 높을수록 측정 정확도가 높아지고 공간 위치가 더 정확해집니다.

(3) 이미지 세부 사항이 풍부하고 식별이 더 정확합니다.

이번 업그레이드를 통해 인공지능 쌍안 시각 시스템은 12 만 픽셀의 원본 이미지를 제공하여 이미지 인식 및 기타 응용 프로그램의 정확도를 크게 높일 수 있습니다.

(4) 깊이 알고리즘은 반복 업그레이드 최적화를 지원하여 장면의 적응성을 높입니다.

3 세대 아키텍처는 FPGA SOC 의 설계를 확장하여 하드웨어 가속 레벨 알고리즘의 업그레이드 및 유지 관리를 실현하여 특정 시나리오에 따라 구성 및 최적화할 수 있습니다.

이와 함께 이번 업그레이드는 쌍안 입체 시각 기술을 시장에 응용할 수 있는 새로운 상상력 공간을 제공한다. 해상도가 1200 만 픽셀로 높아지면 시스템의 거리 측정 범위가 킬로미터 수준으로 높아질 수 있습니다. 자동 운전, 스마트 보안 등과 같은 대규모 측정 분야에 새로운 방안이 제공된다고 상상할 수 있습니다.

Humanplus Intelligence (WWW.Humanplus.ai) 는 지능형 시각적 감지와 인간 행동 인식을 핵심 기술로 하는 인공지능 회사입니다. 현재 소매 브랜드 및 소매업자에게 승객 흐름 분석, 판매 전환 분석, 승객 흐름 동적 분석, 인품 상호 작용 분석 등 고객 행동 분석 서비스를 제공하는 데 주력하고 있습니다. , "데이터 중심" 및 "인간-기계 협업" 을 달성하기 위해 브랜드 소매 의사 결정 및 실행 프로세스를 지원합니다.

원본 링크: /s/VFp5tZC0dTRIsot4UtTm2A

上篇: 레이저 용접 기술의 장점과 단점은 무엇입니까?

下篇: 중양절에 노인 활동 방안을 돌보다

관련 기사