전통문화대전망 - 전통 미덕 - 인공지능은 텔레비전에 어떤 응용이 있습니까?
인공지능은 텔레비전에 어떤 응용이 있습니까?
인공지능은 TV 인간상호 작용에 응용한다. < P > 기존 TV 와 스마트 TV 모두' 사용자가 쉽게 콘텐츠를 얻을 수 있도록 하는 방법' 이라는 동일한 문제를 해결해야 한다. 여기에는' 편리함' 과' 내용' 이라는 두 가지 요점이 있다. 편리함에 있어서, 전통적인 텔레비전은 인터넷 텔레비전과 비슷하며, 모두 리모콘을 기반으로 인간-컴퓨터 상호 작용을 한다. "내용" 은 전통적인 텔레비전과 인터넷 텔레비전의 가장 큰 차이점이며, 이것은 군더더기가 필요하지 않다. 인공지능 기술의 장족 발전은 이 두 가지 핵심 모두에서 사용자 사용 경험을 크게 향상시키고 있다.
키워드: 인공지능 인간-컴퓨터 상호 작용 심도 학습
원거리 음성 NLP 자연어 처리 ASR 음성 인식
' 인공지능 (AI)' 이라는 개념이 1956 년 등장했지만 당시 컴퓨터의 컴퓨팅 능력과 알고리즘 이론에 따라 실제 생활에 적용되지 않아 아는 사람이 많지 않았다
GPU 능력과 심도 있는 학습 이론이 발달하면서 인공지능 기술은 마침내 실험실 이론에서 제품화 단계로 접어들면서 각 분야에서 비약적으로 발전하기 시작했다. 인터넷 텔레비전이 그 중 하나입니다. < P > TV 응용 인공지능 기술에 대해 논의하기 전에 인공지능이란 인공기계가 나타내는 지능을 의미하는 몇 가지 기본 개념을 명확히 해야 한다. 이런 지능은 사람의 사고를 흉내낼 수도 있고, 완전히 다른 것일 수도 있다. 현재 단계 연구의 핵심은 주로' 사람처럼 자기 학습' 이다. 기계 학습은 인공지능의 한 분야이고, 심도 있는 학습은 기계 학습의 한 분야이다. 완전히 다른 사고방식의 연구는 여전히 천마천박한 철학 문제이다. < P > 기존 TV 와 인터넷 TV 모두 "사용자가 콘텐츠를 쉽게 얻을 수 있도록 하는 방법" 이라는 동일한 문제를 해결해야 합니다. 여기에는' 편리함' 과' 내용' 이라는 두 가지 요점이 있다. 편의에 있어서, 전통적인 텔레비전은 인터넷 텔레비전과 비슷하며, 모두 리모콘의 인간-컴퓨터 상호 작용을 기반으로 한다. "내용" 은 전통적인 텔레비전과 인터넷 텔레비전의 가장 큰 차이점이며, 이것은 군더더기가 필요하지 않다. 인공지능 기술의 장족 발전은 이 두 가지 핵심 모두에서 사용자 경험을 크게 향상시켰다.
먼저 편리함
인공지능은 자연어 처리 (NLP) 분야에서 9%
의 의도인식률을 9% 에 이를 수 있기 때문에 자연어로 TV 를 직접 제어하여 콘텐츠를 얻을 수 있다. 여기서 강조해야 할 것은' 자연어' 이다.' 대부' 와 같은 수준의 유럽 갱단 영화 좀 주세요' 와 같은 언어가 자연어이지, 일부 브랜드 업체들이 자주 사용하는' 음량 2% 증가' 와 같은' 기계어' 가 아니다. 자연어에 대한 이해와 피드백은 텔레비전 인공지능 수준을 측정하는 핵심 지표 중 하나이다. < P > 지난 몇 년 동안 음성으로 원격 조종한 TV 는 인공지능 TV 라고 부를 수 없었다. 가장 큰 이유는 고정적인 지시만 인식할 수 있고 인공지능 TV 는 자연어를 이해할 수 있을 뿐만 아니라 온라인 자기학습도 할 수 있기 때문이다. 더 많은 사용자의 의도를 반반반삼으로 이해하면 사용할수록 더 정확해진다.
인간은 대화 중에 자동으로 문맥을 가지고 다닌다. 예를 들어, 사용자는 첫 번째 대화에서 "어떤 멋진 영화가 있습니까?" 라고 물었고, 이어 그는 "할리우드가 아닌 것" 이나 "올해만 보는 것" 을 물어볼 수 있습니다. 이런 대화 방식은 모두 문맥을 기반으로 하는 대화입니다. 우리는 다라운드 대화라고 합니다. 다륜 대화 지원 여부도 TV 인공지능 수준을 측정하는 핵심 지표다. < P > 의미 이해 외에도 편리성은 원거리 음향 수신 능력에도 반영됩니다. 리모콘을 들고 "말을 누르고" 있는 대신 거실 어느 곳에서나 TV 를 불러 대화를 할 수 있게 해준다. (윌리엄 셰익스피어, 리모컨, 리모컨, 리모컨, 리모컨, 리모컨) 전형적인 장면은' 폭풍이 큰 귀, 요즘 어떤 멋진 영화 추천이 있나요?' ","위샹러우쓰 어떻게 만들었어요? " , "내일 아침 7 시에 공항에 가라고 일깨워주세요" < P > 그림 1 폭풍 TV 에서 음성으로 불러일으키는 서비스 < P > 원거리 수신은 마이크 어레이를 통해 이뤄졌으며 마이크 어레이는 그동안 연구실의 연구 대상이었다. 아마존이
Echo 스마트 스피커를 출시할 때까지 드디어 규모 상품화가 이뤄졌다. 마이크 어레이에는 최소 2 개의 마이크가 필요하며 현재 시중에 4Mic, 6Mic 또는 8Mic 옵션이 있습니다. < P > 어레이는 배경 소음에서 사용자가 말하는 특수 파형을 감지할 수 있으며, 빔 포밍 기술을 통해 사용자가 있는 위치의 방향으로 정확하게 사운드를 수신하고 다른 방향의 잡음을 무시할 수 있습니다. 공급업체는 장치의 특성에 따라 다른 마이크 어레이를 선택합니다. 일반적으로 TV 는 선형 마이크를 사용하고, 스마트 스피커는 링 마이크 < P > 그림 2 마이크 어레이의 두 가지 주요 레이아웃을 사용합니다. < P > 필자는 아마존
Echo
의 발전을 계속 주시하고 있습니다. 실제 체험 과정에서 순수한 음성 상호 작용이 여전히 비교적 크다는 것을 알게 되었습니다. 예를 들어, 사용자는 전혀 표시되지 않는 스마트 스피커를 마주하고 있으며, 어떻게 말해야 작동할 수 있는지 거의 모른다. 대형 스크린이 있는 텔레비전의 경우, 사용자의 긴장감이 많이 줄어든다. 스크린은 항상 사용자에게 현재 어떤 말을 할 수 있는지 알려주기 때문이다. (윌리엄 셰익스피어, TV, TV, TV, TV, TV, TV) 구글은 이런 상호 작용 방식을' 시각적 피드백' 이라고 부르며 지난 1 월 발표된 최신' 구글 < P > Assistant for < P > AndroidTV' 시스템에 이 피드백 상호 작용 패턴을 적용한다. 현재 폭풍 AI
TV 의 상호 작용도 비슷하다. 이와 함께 아마존도 이 문제를 인식하고 스크린이 있는' 에코 쇼' 를 빠르게 선보였다. < P > 그림 3 스톰 AI TV 의 시각적 피드백 팁 < P > 은 (는) 현재 음성 인식뿐 아니라 다른 사람의 음성 패턴을 구별할 수 있는 최신 기술로 쇼핑, 지불, 개인화 추천과 같은 고급 작업을 수행할 수 있습니다. 외국의 아마존과 구글, 국내의 뉴스, 로키는 모두 이 기술을 가지고 있다. 자연어 이해력과 원거리 음성 처리 능력은 결국 TV 사용자들을 리모컨에서 벗어나게 하고, 인간-컴퓨터 상호 작용에서 큰 도약을 하게 된다. 이는 그해 애플이 키보드 없이 터치스크린만 있는 < P > 아이폰을 출시한 것 못지않다. < P > 게다가 내용 < P > 자연어 이해 외에 인공지능은 개인화된 콘텐츠 추천에 더 널리 사용되고 있다. AI
는 대량의 사용자 대화와 사용자 행동에서 사용자의' 음성' 을 추상화하고, 사용자의 선호도를 파악한 다음, 이러한 특징에 따라 사용자가 좋아할 수 있는 내용을 적극적으로 추천할 수 있습니다. 때때로 시스템은 한 사용자가 한번도 접해 본 적이 없는 콘텐츠 유형을 추천하고, 사용자는 "원래 이쁘다" 고 외친다. 그는 이런 내용이 자신의 입맛에 맞을 수 있다는 것을 스스로 깨닫지 못할 수도 있다. (윌리엄 셰익스피어, 햄릿, 자기관리명언) 이런 스마트 추천은 이미 인터넷 제품에 광범위하게 적용되었는데, 전형적인 것이 바로 오늘의 헤드라인이다. 기존의 맞춤형 컨텐츠 추천은 주로 태그 시스템을 기반으로 합니다. 첫째, 운영자는 "공포", "피", "2 차원", "도시" 등과 같은 모든 내용을 "태그 지정" 해야 합니다. 작업량은 매우 크며 정확성은 전적으로 운영자의 수준에 달려 있습니다. 그런 다음 시스템은 사용자 동작에 따라 사용자를 초상화하고 레이블을 추출하여 일치시킵니다. 이 과정에서 다양한 전문 추천 알고리즘이 탄생했으며 기술자는 언제든지 매개 변수 최적화 알고리즘을 조정하여 개방률을 높였습니다. < P >
AI 기반 맞춤형 추천 시스템은 기존 추천 시스템과 구별되고 연결되어 있습니다. 가장 큰 차이점은 태그 시스템입니다. AI
추천 시스템의 "태그" 는 실제로 시스템이 컨텐츠 및 동작 로그와 같은 기록에서 자동으로 추출되며 운영자의 참여가 필요하지 않습니다. 예를 들어, 영화의 메타데이터 (주연감독 소개 등) 에서 분사하여 속성 라벨을 추출하고, 사용자의 웨이보, 콩잎평론에서 분사하여 사용자의 속성 라벨을 추출한 다음
GPU 칩에 의지하여 대규모 행렬 연산을 수행하고, 높은 차원의 벡터 데이터를 점진적으로 차원을 낮추고, 마지막으로 3 차원 공간으로 단순화하고, 3 차원 공간의 집합상황에 따라 추천을 합니다. 원리는 전통적인 추천 시스템의 "협업 필터링" 과 유사합니다. 간단히 말해서, 어떤 사람이 어떤 영화를 좋아한다고 가정하면, 그의 좋은 친구도 그 영화를 좋아할 수 있다. < P >' 천인천면' 의 개인화 추천은 오히려 TV 인터페이스의 변화를 추진했다. < P > 전통텔레비전은' 프로그램 방송표' 라는 개념으로 채널을 편성하는데, 사용자가 잘 보고 틀리지 않으면 다음 번을 기다린다. 인터넷 TV 는 완전히 주문형 모델을 기반으로 하며, 대량의 내용을 마음대로 볼 수 있게 해 주며, 나를 탓하지 마라. (윌리엄 셰익스피어, 윈스턴, 인터넷명언)
AI 를 기반으로 한 스마트 TV 는 전통적인' 사람이 콘텐츠를 찾는 것' 을' 콘텐츠를 찾는 것' 으로 바꾸는 것이고, AI
는 당신이 좋아할 수 있는 음식을 당신 앞에 내놓고, 먼저 맛보고 사겠습니다. "맛" 은 사용자에게 전체 영화의 멋진 다리 부분을 미리 볼 수 있도록 하는 것으로, 짧은 영상으로 사용자에게 긴 영화를 보여 주며, 사용자의 선택의 난이도를 줄여 사용자의 시간을 절약할 수 있습니다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 도전명언) 멋진 다리 구간은 영화의 홍보 VCR 뿐만 아니라 다리 구간을 고르는 방법도 학문이므로 또 다른 편을 만들 수 있다는 점에 유의해야 한다. (데이비드 아셀, Northern Exposure (미국 TV 드라마), 영화명언) < P > 더 큰 가능성 < P > 인공지능이 TV 응용 프로그램에 적용되는 장면은 인간-컴퓨터 상호 작용 및 영화 콘텐츠 추천뿐만 아니라 모든 콘텐츠 서비스를 추천하는 데 사용할 수 있습니다. 앞서 언급했듯이 원거리 음성을 사용하여 TV 의 인간-컴퓨터 상호 작용 모드를 변경했기 때문에 TV 인터페이스는 더 이상 기존 TV 의 트리 메뉴 구조에 얽매이지 않고 더 많은 콘텐츠 서비스를 수용할 수 있으며 사용자가 직접 서비스를 이용할 수 있습니다. < P > 인공지능의 특징을 지닌 TV, 전형적인 사용 방법은
● "8 년대의 고전 문예 영화를 찾아주세요." 입니다.
● "주걸륜 노래를 마음대로 틀어라";
● "지난번에 산 그런 삼원우유 좀 더 사세요", "네", "두 박스 더 사세요";
● "오리배 가는 법", "네, 가장 가까운 집입니다."
● "3 분 후에 불을 끄라고 상기시켜주세요."
● "안녕히 주무세요.". < P > 는 인공지능을 응용한 텔레비전이 기존 텔레비전의 사용 방법과 사용 범위를 크게 넘어섰다는 것을 알 수 있다. 텔레비전은 사용자가 콘텐츠를 선택하고, 서비스를 선택하고, 사용자가 스마트 가전제품을 제어하고, 사용자에게 메모를 상기시키고, 심지어 사용자가 일상용품을 주문하도록 도울 수 있습니다. 이런 장면들은 상상의 장면이 아니라 이미 현실이 된 장면이다. < P > 텔레비전은 여전히 텔레비전이지만, 텔레비전은 이미 텔레비전이 아니며, 이미 가정조수의 큰 화면 단말기가 되었다. 그리고이 "가족 도우미" 의 두뇌는 인공 지능입니다.