[3D face] Morphable Model For The Synthesis Of 3D Faces 리뷰 1편

3DMM 리뷰1

3D face reconstruction의 기초가 되는 1999년도 논문인 A Morphable Model For The Synthesis Of 3D Faces에 대한 리뷰이다.

Introduction

해당 논문은 다음 face synthesis 자동화의 한계점들을 해결하고자 하였다.

The problem of finding corresponding feature locations in all faces

The problem of separating realistic faces from faces that could never appear in the real world

첫 번째 문제는 모든 얼굴에 일치하는 feature location을 찾는 문제로, 정해놓은 feature points는 다른 얼굴에도 정확히 일치해야 한다. 하지만 개인 얼굴 간 편차 때문에 쉽지는 않다. 두 번째 문제는 실제 얼굴과는 거리가 먼 것들로부터 현실적인 얼굴을 분리해내는 문제다. 또한, 실 세계에는 없어 새롭지만 자연스러워 보이는 얼굴을 만들어내야 한다.

이 논문에서 제안하는 parametric face model이 두 문제를 도울 수 있다고 한다. 이 모델은 생성된 얼굴들의 likelihood를 제어하고 새로운 얼굴들에 대해 일치율을 계산할 수 있다. 해당 모델을 Morphable face model 이라 하고 3D face scan 데이터 셋의 선형결합을 기반으로 한 multidimensional 3D morphing 함수 라고 정의할 수 있다.

Database

앞서 말했듯 morphable model은 3D face 데이터 셋을 기반으로 만들어진다. 모델을 building하는데 사용된 데이터 셋은 200명의 머리로 구성되며, 남녀 비율이 1:1로 구성되어 있다. 모든 얼굴들은 화장, 악세서리, 머리카락 없이 스캔되었고 얼굴만 나타내도록 전처리되었다.

$r(h,Φ)$ 로 표시되고, h와 각도는 512 분할로 샘플링되었다.

Cylindrical coordinates

$r, h, Φ$ 로 나타낼 수 있고 각 성분이 의미하는 바는 다음과 같다.

r : Z축에서 점 P까지의 유클리디안 거리

h : 점 P에서 선택된 평면까지의 직선 거리

$Φ$ : 선택된 평면 위의 reference direction(X축)과 원점에서 평면 위로 사영시킨 점까지 이은 선 사이의 각도

Morphable 3D Face Model

3D Morphable model은 다음 Shape vector S와 Texture vector T로 나타낼 수 있다.

𝑺=(𝑿_𝟏,𝒀_𝟏,𝒁_𝟏,𝑿_𝟐,…,𝒀_𝒏,𝒁_𝒏 )^𝑻∈𝑹^{𝟑𝒏}

𝑻=(𝑹_𝟏,𝑮_𝟏,𝑩_𝟏,𝑹_𝟐,…,𝑮_𝒏,𝑩_𝒏 )^𝑻∈𝑹^{𝟑𝒏}

$S_i$ $T_i$ 라 하고 morphable model을 m개의 exemplar faces로 building한다고 하면 morphable model은 다음과 같이 나타낼 수 있다.

𝑺_{𝒎𝒐𝒅}=\sum_{𝒊=𝟏}^𝒎{𝒂_𝒊 𝑺_𝒊}, 𝑻_{𝒎𝒐𝒅}=\sum_{𝒊=𝟏}^𝒎{𝒃_𝒊 𝑻_𝒊}

\sum_{𝒊=𝟏}^𝒎{𝒂_𝒊} =\sum_{𝒊=𝟏}^𝒎{𝒃_𝒊} =𝟏

$a$ $b$ $a_i$ $b_i$ $a_i, b_i$ 의 likelihood를 제어하는 것을 가능하게 하며, 생성된 얼굴들의 likelihood를 규정할 수 있도록 한다. 쉽게 말하자면, 실제 얼굴의 coefficients는 어떠한 확률 분포를 따르고 이 분포에 따라 새 얼굴을 생성해내면 실제 얼굴과 비슷하게 만들어낼 수 있다는 것이다. 이 분포에서 벗어날 수록 있을 법한 얼굴과 멀어진다고 생각하면 된다.

Probability distribuion

논문에서 200개의 얼굴 데이터에 다변량 정규 분포를 적합시킨다(We fit a multivariate normal distribution to data set of 200 faces) 라고 표현하였는데 추측하기로는 PCA의 이론적 배경으로, PCA의 모형은 다변량 정규 분포를 따르는 확률 벡터이기 때문이거나 사전 확률을 예측하기 위한 것(probability distribution fitting)으로 생각된다. 이 문장이 의미하는 바를 정확히 이해하지는 못 했다. 다음은 설정된 변수를 바탕으로 확률 함수를 표현해본 것이다. 각 파라미터의 의미는 논문을 참고하자.

𝒇(𝑺_𝒊 )=\frac{𝟏}{(𝟐𝝅)^{𝟏𝟎𝟎} |𝑪_𝑺 |^{𝟏/𝟐}} 𝒆𝒙𝒑(-\frac{𝟏}{𝟐} ∆𝑺_𝒊^𝑻 𝑪_𝑺^{−𝟏}∆𝑺_𝒊 )

위에 정의한 선형 결합은 non-faces를 포함할 수 있다. 즉, coefficients에 대한 규제가 없어 이상한 얼굴이 생성될 수 있다. 그래서 coefficient vectors에 얼굴을 설명하는 확률을 할당해주는 것이 필요하다. 또한, 초기 얼굴 인식에서 PCA(Principle Component Analysis)를 사용한 것처럼 데이터를 저차원 공간으로 축소시켜야 한다. PCA를 통해 morphable model과 Shape coefficient vector의 사전 확률은 다음과 같이 나타내어진다.

𝑺_{𝒎𝒐𝒅𝒆𝒍}=\bar{𝑺} ̅+\sum_{𝒊=𝟏}^{𝒎−𝟏}{𝜶_𝒊 𝒔_𝒊}, 𝑻_{𝒎𝒐𝒅𝒆𝒍}=\bar{𝑻} ̅+\sum_{𝒊=𝟏}^{𝒎−𝟏}{𝜷_𝒊 𝒕_𝒊}

𝒑(\vec{𝜶})~𝒆𝒙𝒑[−\frac{𝟏}{𝟐}\sum_{𝒊=𝟏}^{𝒎−𝟏}(𝜶_𝒊/𝝈_𝒊 )^𝟐 ]

$𝝈_i^2$ $C_s$ 의 고유값이다.

Segmented morphable model

모델의 표현력을 높이기 위해 얼굴을 독립적인 subregions으로 나누어 독립적으로 morphing한다. 다음과 같이 총 4개의 subregions으로 나눈다.

Eyes, Nose, Mouth, Surrounding region

각 분리된 segment에 대해 선형 결합을 계산하고 이미지 결합 알고리즘 [P.J Burt et al.,1985]을 통해 다시 합쳐 3D face를 완성시킨다.

Facial Attributes

$S_{expression}$ $S_{neural}$ 이라 할 때, 이 둘을 빼면 해당 얼굴 표정에 대한 shape의 표현을 얻을 수 있다.

∆𝑺=𝑺_{𝒆𝒙𝒑𝒓𝒆𝒔𝒔𝒊𝒐𝒏}−𝑺_{𝒏𝒆𝒖𝒕𝒓𝒂𝒍}, ∆𝑻=𝑻_{𝒆𝒙𝒑𝒓𝒆𝒔𝒔𝒊𝒐𝒏}−𝑻_{𝒏𝒆𝒖𝒕𝒓𝒂𝒍}

$\mu_i$ 를 가진 face set을 기반으로 하면 다음과 같이 고유 속성을 얻을 수 있다.

∆𝑺=\sum_{𝒊=𝟏}^𝒎{𝝁_𝒊 (𝑺_𝒊−\bar{𝑺})}, ∆𝑻=\sum_{𝒊=𝟏}^𝒎{𝝁_𝒊 (𝑻_𝒊−\bar{𝑻})}

이 method에 대한 근거를 제시하기 위해, 한 얼굴에 있는 속성의 markedness를 설명하는 전반적인 함수를 다음과 같이 정의한다.

𝝁(𝑺,𝑻)

$(S, T)$ $∆\mu$ 를 성취하기 위한, 얼굴들의 전체 공간에 대한 단일 최적 방향이 존재한다. 여기서 최적 방향은 minimal variance-normalized length를 가진다. 다음은 minimal variance-normalized length의 수식이다.

‖∆𝑺‖_𝑴^𝟐=⟨∆𝑺,𝑪_𝑺^{−𝟏} ∆𝑺⟩, ‖∆𝑻‖_𝑴^𝟐=⟨∆𝑻,𝑪_𝑻^{−𝟏} ∆𝑻⟩

<>는 inner product를 의미한다.

이제 다른 종류의 얼굴 속성인 "distinctiveness"가 있다. 해당 속성은 평균 얼굴에서의 거리를 증가시킴으로써 증가될 수 있다.

다음 글에서 morphable model을 통해 생성된 얼굴과 input image 사이의 매칭에 대해 작성하겠다.

저작자표시 비영리 (새창열림)

'A·I' 카테고리의 다른 글

[3D face] Generating 3D faces using Convolutional Mesh Autoencoders (COMA) 리뷰 1편 (0)	2020.03.08
[3D face] Morphable Model For The Synthesis Of 3D Faces 리뷰 2편 (0)	2020.02.17
[object detection] YOLO에서 YOLOv2로의 변경점 (0)	2019.11.12
[object detection] Single Shot Multibox Detector (SSD) 아키텍쳐 분석 (0)	2019.08.08
[object detection] YOLO 모델의 원리 (9)	2019.07.22

Wide and Deep Programming

[3D face] Morphable Model For The Synthesis Of 3D Faces 리뷰 1편

Introduction