本研究は,領域分割処理と2値化処理を用いて,雑誌の表紙のような複雑な背景を持つカラー文書画像から文字情報を抽出することを目的とする.領域分割処理では,グラデーションによる悪影響を抑制できるように改良した領域成長法を提案する.2値化処理では,文字候補抽出やストローク幅変換,連結要素解析などを組み合わせた手法を提案する.最後に,Ground Truth 画像を用いる定量的な評価法によって他手法と比較し,提案手法の有効性を検証する.
(英)
The purpose of this research is to extract the characters from color document images with complex background such as journal covers by using segmentation and binarization techniques. We propose an improved algorithm of segmentation based on region growing so that the segmentation result cannot receive bad influences from color gradation. We also propose an algorithm of binarization that is composed of edge feature, stroke width transform, and connected component analysis. To demonstrate the effectiveness of the proposed method, we perform the comparative experiments in comparison with the other methods using the quantitative evaluation with ground truth.