文字入力技術

SuperMorpho-J は日本語形態素解析のAPI (Application Programming Interface)であり、
日本語のように分かち書きがされていないテキストから、単語を抽出し品詞を同定できるソフトウェアです。

日本語文書処理をするアプリケーション等に SuperMorpho-J を組み込んだシステムを
開発することによって日本語固有の問題を解決することが可能です。

形態素解析技術とは?

Super Morpho-Jは日本語の文字列を解析し、その文字列に含まれる単語列を単語の属性とともに出力します。

■■ 解 析 例 ■■
入 力

新年度予算を使ってデジタルカメラとCD-Rを五台ずつ新規購入した。

出 力
語幹 付属語 語幹の標準形 品詞 オフセット
新年度 名詞 0
予算 名詞 6
使 って 使い ワ行五段 12
ディジタル デジタル 名詞 18
カメラ 名詞 28
CD-R cd-r 英数 36
5 数字 45
ずつ 助数詞(数字) 47
新規 形容動詞&名詞 53
購入 した。 サ行(する)&名詞 57
体言(名詞など非活用語)や活用語の活用語幹を語幹として、また、助詞や助動詞などを付属語として抽出します。
語幹のうち表記ゆれのあるものに関しては、語幹の標準形としてある1つの表記に標準化します。
オフセットは入力文字列先頭からの単語の位置で、この場合は外部EUC文字列の先頭からのバイト数を示します。

形態素解析の結果、得られる上記の情報から、

検索エンジンの場合は語幹(語幹の標準形)をキーワードにして検索します。
文字認識(OCR)の場合は、辞書と照らし合わせて正しい単語かチェック。

などの処理を行い、高度な日本語処理を行うことを可能とする技術です。

オムロンソフトウェア株式会社 モバイルソリューション事業部
〒108-0075 東京都港区港南2-3-13 品川フロントビル7F
TEL:03-6718-3712 FAX:03-6718-3713

03-6718-3712
03-6718-3713
morpho-info@oss-g.omron.co.jp