人工データによる2値判別器を用いた多値分類システムの評価
1) 早稲田大学
2) 理工学術院 総合研究所
3) 理工学術院 創造理工学研究科
4) データ科学総合研究教育センター
5) 理工学術院 創造理工学部
6) 青山学院大学
7) 社会情報学部
- Abstract
-
N(≥M-1)個の2値判別器を用いたM(≥3)個のカテゴリからなる多値分類のための構成方法について考察しその性能を評価する.この問題の構成方法は,M個(符号語数)の長さN(符号長)の行ベクトルを持つM行N列の行列Wをどう与えるかに帰着する.まず,与えられたカテゴリ数Mに対し,多値分類データがM次元正規分布により生成されると仮定したとき,実験により分類誤り確率Peと判別器数Nがトレードオフの関係にあることを示す.次に,この結果をシステム評価モデルに適用し,Mが大きくなる時の振舞いを明らかにする.
Performance of Multi-level classification systems constituted by a plural number of binary classifiers usually called ECOC (Error Correcting Output Codes) is discussed and evaluated, assuming the M-dimensional Normal Distribution for a classification data model with M (≥ 3) categories. First, we show that the probability of classification error Pe and the number of classifiers N are in a trade-off relationship. Next, we apply this result to the system evaluation model and clarify the behavior when M becomes large. As with the case of benchmark data (document classification task), it shows that it has also desirable properties such as "flexible" and "elastic". - Keywords
-
多値分類,ECOC,人口データ
Multi-level classification,ECOC,Artificial data model