戦略ワード抽出手法と財務特異状況抽出手法の統合による企業情報マイニングの提案
1) 東京都市大学大学院
2) 東京都市大学
Abstract | これまで,投資家に積極的に訴求したい今後の戦略や施策が含まれるIR情報から,形態素解析では抽出困難な造語やフレーズも戦略ワードとして抽出可能な階層化N-Gram手法を開発し,これに基づき企業間の相違や時間的変化も含めて戦略ワードを抽出する手法を提案した.また,一定期間にわたり業界内の他企業とは異なる特徴的な推移を示す財務指標を特定することで,特異な経営状態(例えば独特な経営施策の推進)にあったと推測される企業とその期間を抽出する手法を提案した.本稿では,これまで提案してきたこれらの手法を統合し,テキスト情報と財務情報の時系列推移から有用な情報を抽出する企業情報マイニングのコンセプトを提案する. |
---|---|
We have developed the stratified N-Gram method, which is able to extract coined words and phrases those are difficult to extract by morphological analysis. Moreover, we proposed the method to extract the strategy-words with differences among enterprises and changes in time sequence, based upon stratified N-Gram. We also proposed the method to extract companies and periods, which are presumed that they had been under characteristic business conditions (e.g. unique management policy), by identifying financial indicators that show characteristic behavior against other competitors for specific period. In this article, we propose a concept of "Enterprise Information Mining", which extract valuable information from time sequences of both text data and corporate financial data. | |
Keywords | テキストマイニング,データマイニング,企業情報 |
Text mining,Data mining,Enterprise Information |