« 文字の「違い」とは何か(1) | Main | 文字の「違い」とは何か(3) »
2006年09月26日
…【文字の違いとは何か】
文字の「違い」とは何か(2)
手書きのユレについて
手書き文字には,かならず形状のユレが伴う。同一人が書いても,そのときの状況(たとえばゆったりした気分のとき,急いでいるとき,緊張しているとき,使い慣れた筆記具で書いているとき,不慣れな筆記具を使ったとき,などなど)で文字の形も変わってくる。書く人が違えば,その差も非常に大きいものになる。だからこそ「筆跡鑑定」が成立するのである。
手書き文字によるコミュニケーションというのは,そういうユレを前提とし,しかもその傾向が書き手と読み手でかなり異なっていても成立しなければならない。逆に言えば,さまざまな場でのコミュニケーションの経験を通じて,どこまでのユレなら理解されるのかを学んでいくということなのかもしれない。
文字には,それを特定する形状要素がかならずある。それが表現されていれば間違いなく相手に伝わるし,逆に特定される要素があいまいであれば間違って伝わる可能性がある。そういう意味で,文字を知るということはある程度その文字が含まれるカテゴリーの「文字群」を同時に理解し,その類似度を認識するということも含まれることになる。
具体的な例としてカタカナの「ソ」と「ン」,「シ」と「ツ」の外形的特徴を考えてみればよい。読み手が運筆の方向を認知できなくとも正しく読めるための特徴は何かを理解するには,これらの比較によってはじめて可能になるのである。カタカナに不慣れな外国人にはわかりにくい文字であるのも頷ける。
「田」という文字を書く場合,「由」,「甲」,「申」という文字の存在が念頭にあれば,とくに三画目の縦画が上下の横画から出ないように注意しながら運筆するに違いない。その結果,この縦画の起筆・収筆部が横画から少し離れる字形になることも往々にして起きることも想定される。それはむしろ,他の文字と間違わないための変形である。
文字の特定に対してわかりにくくするユレを「マイナスのユレ」と称するならば,上述のユレは間違いの可能性を少なくするという意味において「プラスのユレ」と言ってもよいであろう。こうした手書き文字字形のユレの特性を理解することが,字形解釈の上で非常に重要であろうと考えている。
書かれる文字字形は,あくまでもアナログである
「田」を書くとき,「由」と間違われないようにしようと思えば,中央の縦画の起筆を横画の上に出さないことである。しかしわずかに出てしまったら「由」と読まれてしまうであろうか。たぶんそんなことはあるまい。しかし,それならばどの程度までなら許されるかと言われると,なかなか答えにくい。そういう類の閾値は決めにくい,というより決められないのである。
ここに面白い資料がある。やや古い資料ではあるが山本和彦氏の論文『手書きOCR用文字の形』(明治書院刊「日本語学」1984.3所収)から2,3紹介しておきたい。
はじめにみていただくのは,あるアラビア数字字形が,次第に他の数字に似てくる変化を視覚的に表現したものである。「他の文字(ここでは他の数字)」に似ないようにという力学が働かない場合,ここにみるような変化も起こりえる。こうした連続的変化に対する閾値を設定することはムリである(ちなみに,この図は中田和男著『パターン認識とその応用』コロナ社 1978からの引用だそうである)。
この図を見ると,手書き文字の連続的変化の可能性がよくわかる。

次の図も山本和彦氏の論文からの引用である。これは電総研(当時)が延べ1,600名によって書かれた文字を集めた教育漢字データベース「ETL8」から「田」の一部を示したものである(山本和彦氏は,当時電総研主任研究員)。

本来,「田」字は四つの閉じられた四角形で成り立っているから,四つのループがある文字といえる。そこで,大部分の人は四つのループを持つ字として書き,大雑把に書いた場合にのみ,ループが足りない文字になるであろうと考えがちであるが,実際にはそうはなっていないという。
同論文から,「田」字のループ数の傾向を示すと次表のようになっている。
| ループ数 | 0 | 1 | 2 | 3 | 4 |
|---|---|---|---|---|---|
| 頻度 (%) | 34 (21.25) | 34 (21.25) | 31 (19.38) | 34 (21.25) | 27 (16.87) |
つまり四つのループをちゃんと持つ文字はもっとも少ないという結果が出ているのである。
中央の横画が外側の縦画に接していない文字も多いので,かならずしも前述の「由」,「甲」,「申」などとの差異化を意識したものだけでもなさそうであるが,いずれにしても,これらの文字は「田」と認識できるレベルであって,手書き文字として許容されるユレの範囲はかなり大きいとみて間違いないであろう。
つまり,手書き文字字形をデジタル的に判断・分析することにはかなりの無理があるということがわかる。手書き文字字形を印刷用文字の字形に置き換える場合の判断には,こうした傾向を十分に勘案する必要があるのである。
posted by gen : 2006年09月26日 23:25