今回は従来の年齢推定について話します。
前書き
顔画像に基づく年齢推定とは、顔画像に基づいて、本人のおおよその年齢またはその人が属する年齢範囲(年齢範囲)を推定することを意味します。
顔画像ベースの年齢推定システムは、通常、顔の検出と位置特定、年齢特徴抽出、年齢推定、およびシステムパフォーマンス評価に分けられます。 特徴を抽出する方法によって、従来の方法とディープラーニングの方法に分けられます。
評価指標
MAE
平均絶対誤差は、推定年齢と実際の年齢との間の絶対誤差の平均であり、その式は
MAE=\frac{\sum_{K=1}^N|S_K-\widetilde{S_K}|}{N}
S_Kは実際値、\widetilde{S_K}は予測値、Nはテスト画像の枚数、MAEは小さいほど、精度が高いです。
CS
年齢推定パフォーマンス評価では、推定年齢値の絶対誤差範囲が許容範囲内であるかどうかにさらに注意が向けられます。そのため、年齢推定のパフォーマンス推定では累積分数が使用されます。累積分数の定義は次のとおりです。
CS=\frac{N_{θ<=j}}{N}*100\%
N_θ{<=j}推定年齢と実際の年齢の絶対誤差がj年を超えないテスト画像の数を表し、分母Nはすべてのテスト画像の総数です。 したがって、CSが大きいほど、推定年齢は実際の年齢に近くなり、年齢推定はより正確になります。
特徴抽出
伝統的な方法は特徴を手動で抽出することです。
従来の方法は、手動での特徴抽出と年齢推定の2つの段階に分けています。
特徴によって反映される顔情報によれば、使われている顔年齢特徴は、形状特徴、テクスチャ特徴、代数特徴、および混合特徴に分けることができます。 特徴のタイプごとに異なる角度から顔の画像を表すため、さまざまな特徴の利点を最大限に活用するために、研究者は複数の顔の特徴を統合し、異なる数学的方法を使用してそれらを処理し、 顔年齢特徴抽出モデルになります。
一般的な特徴抽出モデルには、人体測定学モデル(anthropometric models)、特徴部分空間モデル(AGES)、柔軟モデル(flexible models)、年齢マニホールド(age maniford)、および外観モデル(apperance model)などがあります。
人体測量学モデル
- 主な内容
人体測定学モデルは、年齢の分類に顔の幾何学的特徴を使用します。主に、加齢に伴う顔の全体的な輪郭の数学的ルールを記述します。顔の構造情報を測定します。 主なプロセスは、顔の輪郭の検出、顔の特徴点の位置、複数の幾何比の測定値(2つの目の間の距離、2つの目の間の距離など)として要約され、最後に幾何比を使用して年齢範囲が区別されます。 - 応用
主に未成年者の年齢分類に適しています - 制限
モデルは人間の姿勢変換に敏感であるため、主にポジティブ顔画像の年齢特徴を抽出するのに適しています
柔軟モデル
- 主な内容:
顔の形状をグレースケール/テクスチャと有組み合わせます。全体から見て、顔画像の形状情報とグローバルテクスチャ情報を完全に抽出できます。人体測定学モデルのアップグレードバージョンと見なすことができます。その典型的な代表はアクティブ形状モデル(ASM)およびアクティブ外観モデル(AAM)。 - 応用:
特徴点の位置と複雑な画像の特徴抽出によりよく適応でき、若者を分類するだけでなく、中高年者にも適しています。 - 制限:
1)年齢の増加に伴い、顔のテクスチャの変化は額、目尻、頬などの局所領域により反映されます。したがって、このモデルを特徴抽出に使用すると、多くの局所的なテクスチャ情報が失われるため、高齢者の年齢推定。
2)トレーニングプロセスでは、フレキシブルモデルは通常、形状とテクスチャ空間を別々にトレーニングします。これにより、テクスチャと形状の間の多くの有効な情報が失われます。
3)さらに、柔軟モデルの決定は、多くの顔の特徴点の正確な配置に依存します。配置に誤差があると、この誤差は後の処理で増幅されやすいです。
外観モデル
- 主な内容
外観モデルは、顔の幾何学的特徴とグローバル情報、ローカル情報(顔のテクスチャ情報、周波数情報、肌の色情報など)を組み合わせて顔を記述し、年齢を推定します。これは、柔軟なモデルのアップグレードバージョンと見なすことができます。 広い。 - 応用
顔のテクスチャ特性をよりよく説明し、多くの場合、形状の特徴と融合しており、すべての年齢の年齢推定をうまく達成できます。 - 制限
おおよその年齢範囲を示す、概算としてのみ使用できます。
年齢推定
顔画像に基づく年齢推定は、「特殊な」パターン認識問題の一種です。各年齢の値は一つのクラスと見なすことができるため、分類の問題と見なすことができます。 一方、年齢の値の増加は順序シーケンスの連続的なプロセスであるため、年齢推定も回帰問題と見なすことができます。
一部の研究者は、既存の年齢推定の作業を要約し、異なる年齢データベース、異なる年齢特性、分類モデル、および回帰モデルには独自の利点があると結論付けています。
したがって、両者の有機的な融合により、年齢推定の精度を効果的に向上させることができます。 。従来の年齢推定モデルは顔の老化のダイナミクスを無視するため、研究者は最近、ランクモデルを年齢推定方法に導入し、良い結果を達成しました。
分類モデル
各年齢の値はクラスと見なすことができるため、年齢の推定は分類の問題と見なすことができます。 分類モデルは、年齢推定を実現するためのパターン分類の概念と方法を採用しています。 これは、年齢グループの分類と特定の年齢値の分類に分けることができます。
回帰モデル
年齢の値の増加は、順序シーケンスの絶えず変化するプロセスであるため、年齢の推定も回帰問題と見なすことができます。 回帰モデルは、回帰分析を使用して、顔の年齢変化を表す関数モデルを確立することで年齢推定を実現します。
ランクモデル
人間の老化は、動的に変化する個人化されたプロセスです。分類モデルに基づく従来の年齢推定では、異なる年齢間の相関を考慮せずに年齢をいくつかの年齢グループに分割するため、多くの重要な情報が失われます。
従来の回帰モデルでは年齢間の相関が考慮されますが、しかし、人間の老化は「静的な」プロセスであると想定されています。つまり、異なる年齢の人々の老化の変化は一貫しています。また、日常生活の中で、年齢を判断する際には、その人の顔と、身近で年齢がわかっている顔画像とを常に比較し、多数の比較結果から年齢判断を行っています。
したがって、年齢推定プロセスは、大量の顔の有効な情報を比較するプロセスと見なすことができます。つまり、対応する年齢推定値は、いくつかのバイナリ分類結果のセットから取得できます。年齢タグリストにある年齢タグの相対位置を見つけることにより、年齢の値を決定します。これにより、人間の顔の老化のダイナミクス、あいまいさ、および個人化を無視することができ、従来の年齢推定方法を克服します。
混合年齢推定モデル
さまざまな推定方法には利点があるため、複数の推定方法を組み合わせて年齢を推定できます。 いわゆる混合年齢推定モデルは、年齢推定を実行するために単一の年齢推定器の代わりに複数の異なる年齢推定器を使用することです。