본문 바로가기

Robotics/Software Tech.

음향에 의한 위치인식


Introduction

음향에 의한 위치인식은 전방향성(Omni-directional)을 가지기 때문에 관찰 방향에 의존적이지 않은 장점이 있다. 시각 효과에 의한 위치인식은 신호의 진원지를 주시하고 있어야 하는 단점이 있어 그 범위(coverage)가 제한적인 단점이 있다. 하지만 음향효과에 의한 위치인식은 시각효과의 것 보다 불확실성(Uncertainty)이 높다. 따라서 그동안 여러가지 시도를 통하여 이를 극복하려는 연구가 진행되어 왔다. 시각효과에 비하여 음향효과는 소리의 경로(path)에 대한 지배를 강하게 받는다. 일단 지향성이 높은 시각정보(i.e., 빛)에 비하여 음향 정보는 지향성이 전방향이기 때문에 하나의 진원지(source)에서 발생한 신호라 하더라도 어느 방향에서든 관찰이 가능한 특징이 있다. 이로 인하여, 하나의 소리는 서로다른 지연(delay)과 소리 감쇄, 필터링 효과를 거쳐 관찰된다. 이러한 특징을 모델링 하여 소리의 본질적인 정보를 추정하지 못한다면 음향정보에 의한 위치인식은 실패하고 말 것이다.

Microphone Geometry

The Cocktail Party Problem

사람은 두개의 귀를 가지고 있기 때문에 음향이 발생한 위치를 추정 할 수 있다. 이러한 위치추정이 가능한 것은 한가지의 음향신호가 사람 머리의 기하학적 구조로 인하여 주파수와 도달시간차이(Time difference of arriaval) 가 발생하기 때문에 가능하다. 사람의 머리는 일종의 FIR 필터로 작용하여 왼쪽 귀와 오른쪽 귀에 유입되는 음향 신호의 주파수 성분이 달라지며, 또한 두 귀의 위치차이로 인하여 같은 음향이라도 시간차이를 두고 전달된다. 따라서 사람의 뇌는 이러한 특징을 분석하여 청취된 음향이 어느 방향에서 또는 어느정도 거리에서 발생하였는지 알 수 있다. 컴퓨터로 이와 유사한 기능을 수행하고자 할 때에도 사람과 유사한 방법을 이용한다. 먼저 두개의 마이크를 일정거리로 배치하고 동시에 녹음을 수행한후, 유입된 신호의 도달시간 차이를 조사하여 기하학적 구조와 소리가 발생한곳의 주파수 응답을 분석하여 소리의 원래 위치를 알아낸다. 이러한 상황을 잘 관찰할 수 있는 곳이 바로 파티장이다. 파티장에 위치한 다수의 사람이 발생하는 음향신호에서 사람은 어려움 없이 내가 주목하고자 하는 사람의 음성을 청취할 수 있다. 이러한 과정속에는 음향의 방향인식, 청취하고자 하는 화자의 거리등이 고려된다. 주목하고자 하는 사람이 위치한 방향과 거리가 아닌 음향신호에 대해서는 인식을 수행하지 않는다.

음향 위치인식은 잘 알려진 문제이며, 여러가지 응용을 통하여 다양하게 이용될 수 있다. 동시에 녹음된 두개의 음향 신호로 부터 거리와 주파수 응답을 알아내는 것은 아직도 활발한 연구가 진행되고 있으며, 당연히 받아들여지는 이론 또한 존재하지 않는다. 본 논문에서는 기존에 존재하는 방법의 장점과 제한점들을 연구하고 이를 실제로 구현하여 두개 혹은 그 이상의 마이크로 부터 녹음된 신호를 통하여 방향과 거리를 추정하고자 한다.

C/A Code

References

Useful Links

Google Keywords

  1. time delay estimation and acoustic source localization

'Robotics > Software Tech.' 카테고리의 다른 글

프로그래머를 위한 공부론  (2) 2009.09.21
wiimote API & 데모  (0) 2009.08.22
RDTSC ;Read-time Stamp Counter  (0) 2009.06.20
Generic Image Array Library  (0) 2009.06.20
Sound Localization  (0) 2009.06.14