講演抄録/キーワード |
講演名 |
0000-00-00 00:00
複雑な背景を持つカラー文書画像からの文字抽出 ○藤崎浩太・坂元佑一郎・前田純治(室蘭工大) |
抄録 |
(和) |
本研究は,減色処理と2値化処理を用いて,雑誌の表紙のような複雑な背景を持つカラー文書画像から文字情報を抽出することを目的とする.
減色処理ではOngらによって提案された階層的SOMを改良した手法を基に,複雑な文書画像に適した前処理としてエッジ保存平滑化と局所フラクタル次元を用いるサブサンプリングを導入する.
2値化処理では減色処理によって得られた画像を文字色と背景色の2色に分離し,文字抽出を行う.
本研究では,Ground Truthを用いる評価法によって本手法と他手法を比較することにより,提案手法の有効性を検証する. |
(英) |
The purpose of this research is to extract the characters from color document images with complex background such as journal covers by using color reduction and binarization.
We proposed an improved algorithm of color reduction based on the modified version of the Ong's SOM that incorporate the edge-preserving smoothing as preprocessing and the sub-sampling using local fractal dimension.
We also propose an algorithm of binarization that enables the character extraction by separating the color of character from the color of background after color reduction.
We perform the comparative experiments of the proposed method in comparison with the other methods using the evaluation with ground truth to demonstrate the effectiveness of the proposed method. |
キーワード |
(和) |
カラー文書画像 / カラー減色 / 2値化 / 文字抽出 / 自己組織化マップ / 局所フラクタル次元 / / |
(英) |
Color document images / color reduction / binarization / text extraction / self-organizing map / local fractal dimension / / |
文献情報 |
映情学技報, vol. 35, no. 9, ME2011-51, pp. 221-226, 2011年2月. |
資料番号 |
ME2011-51 |
発行日 |
|
ISSN |
Print edition: ISSN 1342-6893 |
PDFダウンロード |
|