電子情報通信学会 - IEICE会誌 試し読みサイト
© Copyright IEICE. All rights reserved.
|
解説
文字工学の今とこれから
Optical Character Engineering:Present and Future
abstract
「文字工学」とは,文字に関する様々な情報工学的な取組みの総称である.これまでの文字工学の中心は文字認識であった.一方,文字には独特かつ多様な機能があり,文字認識だけではそれらを十分に活用しているとは言い難い.本稿では,これら機能について概観すると同時に,それらをより積極的に活用した試み,すなわち文字認識の先に広がる研究群について,特に筆者が関わった事例を中心として論ずる.
キーワード:文字認識,文字工学,文字の機能,文字デザイン,情景内文字
我々の日常は以前にも増して文字で満たされている.この事実は総務省が平成28年8月にまとめた「平成27年情報通信メディアの利用時間と情報行動に関する調査」からもうかがえる.同調査によれば,テキスト系メディアの全年代平均利用時間(平日)は,平成24年において,新聞,書籍・雑誌・コミック,テキスト系Webサイト,及び以上のダウンロード版(要するに電子書籍)それぞれで15.5,8.2,25.4,0.4分(合計49.5分)であった.これに対し平成27年では,11.6,7.1,39.7,0.7分(合計59.1分)と20%近く増加している.これらメディア以外にも,若年代は教育の場で,中高年代は業務の場で,それぞれ文字を読んでいるであろう.更には,看板や商品のラベルなどの環境中に遍在する文字も,生活を営む中で恒常的に読んでいる.結局日々相当量の文字を読んでいる.更に時には,おのずから文字情報を生成すらしているのである.
数千年前に発明された文字が,本質的な変化もなく,いまだに使われ続けている点は興味深い.もちろん,紙から携帯ディスプレイやディジタルサイネージへの表示媒体の変化,ペンからキーボードへの生成手段の変化はあった.しかし,そうした変化はむしろ表層的で,結局我々はいまだに知識の保存・伝達・提示の大部分を文字によっている点は不変である.これからも文字は,人類のコミュニケーション手段として利用され続けるであろう.
本稿では,文字に関する様々な情報工学的な取組みを「文字工学」と総称(注1)し,特に筆者が関わった事例を中心として議論する.一方,自然言語処理やテキスト解析技術といった言語学的情報処理については対象外とし,単語レベルでの意味情報を扱う程度にとどめる.
本章では,主として工学的研究の視点から,文字の持つ様々な性質について概観する.
文字は,「印刷された活字」と「手書き文字」に二分される.更に活字については,明確な区分はないものの,一般的な書籍や文書に使われる活字と飾り文字に区別される.以上いずれも,計算機の中では画像パターンとして扱われる.ただし,手書き文字については,タブレット等から入力されれば,ペン先の運動軌跡すなわち時系列パターンとして扱われることもある.
続きを読みたい方は、以下のリンクより電子情報通信学会の学会誌の購読もしくは学会に入会登録することで読めるようになります。 また、会員になると豊富な豪華特典が付いてきます。
電子情報通信学会 - IEICE会誌はモバイルでお読みいただけます。
電子情報通信学会 - IEICE会誌アプリをダウンロード