点字自動翻訳システム

点字自動翻訳システム

クイックメニュー

かな→点字自動翻訳へGO! 点字自動翻訳 on the web 2004/02/12
一部の誤変換を修正し、
高速化。
点字→かな変換へGO! 点字解読 on the web  
点字はどうやって打つの?? 点字を打とう!!  
このシステムの実装について 実装の基準  
このシステムへのリンクについて リンクに対するポリシー  
開発者の独り言 開発者の雑記帳  
その他 参考文献等
システムの更新履歴
 

更新情報

点字解読 on the webが更新され、点字解読 on the web 入力方法を新たに設けました。
入力方法が変更となりましたので、ご注意ください。
詳細は更新情報を参照ください。

 

当システムでの著作物の権利等について

しばしば質問を受けますが、当システムでの翻訳結果の著作権については次の通りと考えます。

  1. 編集著作権
    当システムは機械翻訳とはいえ、当方の翻訳に関する指向性があります。ですから、編集著作権が発生しない余地はありませんが、当方はこの権利に関して一切、主張しません。
  2. 原著作権
    文芸作品等の著作物は権利関係に注意してください。当方は一切関知していません。ただし、盲人の途に供する目的の翻訳は、著作権法で認められていますので、おおむね問題にならないでしょう。

 

お願い 〜 総合的な学習の授業でご使用の場合 〜

学校の授業等で使用いただいている、との連絡を受け、大変、うれしく思っています。

点字を通じて、ハンディキャップを持つ方へどのように接するべきかを考えることは大変よいことだと思います。

授業等でご使用の場合、次の点にご注意ください。

  1. 翻訳の精度について
    当システムは、点字の知識がない方が簡単に点字に触れる機会を喚起することを目的としています。
    当方も翻訳の精度については、日々研究を重ね、向上するよう努力しておりますが、機械翻訳は万能ではありません。
    したがって、翻訳の精度については一定の限界がおのずとあります。
    もし、翻訳結果を使用する場合、相手に失礼な変換がないよう、ご留意ください。
  2. 点字について
    点字は、(誤解を恐れずに言うなら)視覚にハンディキャップのある方のためだけのものではありません。英語は特定の国のためだけのものではありませんよね?
    英語を学ぶのは、英語を話す人とのコミュニケーションの手段を得るためです。
    点字も同じです。
    点字=視覚にハンディキャップがある、という短絡的な図式で、点字を学ばせると、視覚にハンディキャップがある、というところに壁を作り、バリアフリーの目的から遠のいてしまいます。
    視覚にハンディキャップがあることは「かわいそうな」ことではありません。
    点字を習得することによって、点字を自ら利用し、自らの生活の質を高める、ということに気づかせてください。
  3. 数学的な応用
    6点式点字は、極めてデジタルな表現です。2進数置き換えなどの視点からの考察もよいと思います。
  4. 識字率
    ある方面に聞いたところ、全盲者中、点字が識字できる人は10%程度です。
    視覚にハンディキャップを持っている=点字が読めるではありません。
    最近は、成人病(特に糖尿病)による、中途失明が多く、加齢によって点字の習得が困難です。
    また、最近はパソコンの発達により、点字は必ずしも必要なものではありません。メール等を気軽に楽しんでおられます。
    そこになぜ、点字を導入するのかの意義も考えてみてください。

もし、教育の現場でお気づきの点がありましたら、ご連絡いただければ幸いです。
点字の新たな活用法も紹介可能です。

主旨

点字は心の文章です。視覚にハンディキャップをもたれた方が、音で表現された点字を読み、心で解釈します。
心で解釈できるのは、点訳という作業が大変だからです。そこに一字一字心がこもるのです。
その点訳の作業のうち、自動化できる部分を容易化すれば、心のこもった点字の文献がより多く出版できます。

開発の動機

社会でバリアフリー、ユニバーサルデザインが叫ばれる中、意識だけは先んじているものの、実際の普及の機会はなかなか得られない。
小職が実際に介護問題等で接する中、点字の導入は、非常に敷居が高いことがわかった。

一般的に点字冊子を作成する場合、「点訳」と「点字印刷」の作業が必要である。

普及してる6点式点字の場合、表現できる文字種はたかだか63文字に過ぎない。よって、漢字の表現はまったく無理で、基本的に平仮名でこれをすべて表現する必要がある。

よって、点訳とは、かな漢字交じりの文章より、63文字種で表現できるよう、平仮名に翻訳する作業となる。

また、点字における表現方法も多様で、習得がかなり難しい。

パソコンの普及によって、いくつかの問題は解決されつつあるが、パソコンを用いてもなおパソコンの性能自体に限界があり、それを人間が補うべく、点字の規則に精通している必要性がある。
これが気軽に点字を打とう、という普及の妨げになっている。

本試みにおいては、点字をまったく知らない人でも、何とか点字を導入できる環境に近づけ、その後の点訳環境へ誘導しやすくするための試みとした。

そのためには、点字の基本的な規則の解決、分かち書き、表現方法を出来る限り実装し、特に文章解析には、形態素分析と大容量辞書を導入して、一般のパソコンでは導入が困難な高度な処理を一貫して行うものとした。

このシステムの有利な点

  1. 操作が簡単
    点字の知識を導入することなく、気軽に点字に親しめます。
    点字の概念よりも何よりも、点字を打つ、という物理的行動が点字の普及のためには重要と考え、このようなシステムを作りました。
  2. 使用者の環境に依存しない
    パソコンでもPDAでもwebが表示できれば、どんな環境でも使用できます。
  3. インストールが不要
    出先のパソコンをちょっと借りて使用する、ということも可能です。
  4. 本格的な分析エンジンと大規模な辞書を持っている
    一般のパソコンでは荷が重い、形態素エンジンを導入し、23万語におよぶ大規模な辞書を搭載しています。
  5. 情報が常にup-to-dateである
    サーバー側のプログラム更新、辞書更新によって、常に最新の環境が提供されます。

このシステムの不利な点

  1. BASE等、他のソフトとの互換性が取れていない
    他の点字翻訳ソフトや編集ソフトとの互換性を取っていません。
    よい方法や運用法がないかと思案中です。
  2. 印刷がつたない
    htmlベースですから、印刷の精度がよくありません。今後はstylesheetを用いた方法等を検討しています。

現状の問題点

  1. 分かち書きはまだまだ研究中
    やっぱり難しいですね。3音以上からなる独立単語が連続すると分かち書きをする、というルールもあるようですが、まだ対応できていません。
  2. 十分な検証が出来ていない。
    概念とつたない経験だけで実装していますから、実際に読まれる方による検証が不足しています。
  3. 記号等の翻訳が不十分。
    アルファベットや数字もこれからです。
    「,.」→「、。」の変換。「。」の2マス空けなどもあります。

 

仕組み

「母は学校へ行きました」という文章が与えられた場合、点字では「ははわ がっこうへ いきました」と表現しますが、「は」を助詞と判別して、実読みである「わ」に変換するなどの機構が必要です。

この問題を解決するためには、形態素分析の理論の導入が必要です。

幸いにも、この方面でとても有名な奈良先端大学が「形態素解析システム 茶筌」を公表しております。このシステムでは、分析エンジンとして使用しています。ただし、他のエンジンも使用できる余地はあると思います。

  1. 漢字かな混じりの文章を形態素解析システムで分析。実際の発音に対応(は→わ、へ→え...など)するよう、分析中に置き換える。

    母は今日学校へ行く
    ははわ/きょーがっこうえ/いく

     

  2. 単語ごとの品詞を調査。

    はは きょー がっこー いく
    名詞-一般 助詞-係助詞 名詞-副詞可能 名詞-一般 助詞-格助詞-一般 動詞-自立

     

  3. 分かち書き処理。

    大まかには次に示す方法を使用して分かち書きを実現します。

    1. 特定の品詞の前を分かち書き
    2. 特定の品詞の後ろを分かち書き
    3. 上記2つをキャンセルする結合処理
    4. 特定の単語を強制的に分かち書き
    5. 特定の品詞の組み合わせで強制的に分かち書き

    詳細は実装の基準に書いています。

  4. かな→点字変換。

 

はは   きょー がっこー   いく

という順番で処理をしています。

知識ベース変換の導入

点字における分かち書きは、点字購読者の識字性を高めるために、日本語一般における分かち書きと若干異なるルールが導入されています。
分かち書きは基本的に文節ベースで行われますが、これに加え、例えば、点字では長い名詞が連続したりする場合においても分かち書きが行われます。

かな→点字変換

点字は、かなと点字がほぼ一対一対応しますが、中にはいくつかの例外があります。
たとえば、「きゃ」は「拗音+か」として表現します。
本システムでは、文字列を先頭よりサーチして、「きゃ」は「拗音+か」、「あ」は素文字の「あ」と、点字と一対一対応できる内部分析文字に一度変換し、それを順次、点字に置き換える処理をしています。

点字での表現

6点字の場合、6つの点で表現され、その表現の可能性は63文字です。つまり、63文字のグラフィックを用意すればよいのですが、実際には面倒です。
本システムの場合、6点を「3点+3点」に分割しています。3点であれば表現の可能性は8通りにしか過ぎませんから、処理する上での効率がよいです。
また、この方法の場合、点字につきものの鏡像化が簡単にできる、という特徴もあります。

8点字(漢点字)

一部の方から漢点字の要望が寄せられたため、少しだけ実装しました。

参考文献

本システムでは次の文献等を参考にいたしました。

点字のページ / とほほの点字入門

両方とも点字の初学者に最適です。

形態素解析システム 茶筌

本システムでは、この形態素解析システムを導入しています。

規則点字翻訳サーバ eBraille - step 1

同様のアプローチの先達様です。敬意を表します。

点字研究ページへようこそ!

横浜市立盲学校図書館によるページです。情報のリソースが豊富で、楽しく作られています。こういうのがきっと大切なんでしょうね。

Espressivo-Braille

当時、中学生だった方が、点字を通じて、視覚障碍に対して考察しています。前知識もない方が「総合的な学習の時間」でまとめたものですが、実践的で、するどい視点からの考察は一見に値します。

このサイトの統計情報

リンク情報

次のwebにご紹介/掲載いただいています。

web名
『294GOGO』 しょうがいしゃ福祉の知識データベース 
open directory project 
福祉SOHO 
Green and White (翻訳ソフトのページ) 
とほほの点字入門 
「ふくしチャンネル」 −福祉と介護の総合サイト− 
ねこの目グループ公式HP 
視覚障害に関するガイドページ 

閲覧情報

コンテンツごとの閲覧回数です。

コンテンツ名 閲覧回数

(合計=0)

集計開始は2002年11月8日です。

更新履歴(新しいものが上です)

2004.Feb.12 version 0.94

一部のかな変換で誤変換が生じていたので修正。
変換データベースを最適化し、検索速度を向上。

2003.Sep.21 version 0.93

処理の高級化に伴い、速度低下していたが、変換データベースを別サーバーのSQLで行うとともに、処理全般を見直し、約8倍の高速化を達成した。

2003.Aug.23 version 0.92

形態素解析システムが同時実行で競合することがあったので、排他処理を加えた。

2003.Feb.16 version 0.91

点字解読 on the web」の入力方法を変更した。
点字の位置とテンキー位置を合わせた。

それに伴い「点字解読 on the web 入力方法」を独立させた。

2002.Nov.7 version 0.90

漢点字を出力する機能を参考までにつけた。

2002.Nov.2 version 0.80

要望の多かった「点字解読 on the web」を作った。

2002.Oct.20 version 0.71

鏡像出力に問題があったので修正した。

2002.Oct.01 version 0.70

要望の多かったimodeに対応した。

「品詞分析結果を出力する」「鏡像出力する」を次に引き継ぐよう改善した。

2002.Sep.02 version 0.63

特殊音「フュ」「ヴュ」「テュ」「ティ」が誤っていたので、修正した。

2002.Aug.23 version 0.62

使用率が低い「モード2」を廃止した。

2002.Aug.22 version 0.61

分かち書きの空白を「□」で表現することにした。

2002.Aug.16 version 0.60

一部の非自立語が無意味に分かち書きされる点を修正した。

データベースを調整した。

2002.Aug.14 version 0.55

分かち書きのページを拡張して、実装の基準、とした。

数字の処理を実装した。4桁までは一気に書いて、それより大きい数字は、3桁で位取り符号を入れる処理としています。

アルファベットの処理を改善した。アルファベットの次に助詞、助動詞がくる場合は分かち書きをし、リーダー挿入をキャンセルする処理を入れた。

2002.Aug.13 version 0.5

要望の多かった、アルファベットの処理をリリース。

「おかあさん」→「おかーさん」となる症状を強制的に修正した。

数字の処理を先行して実装。リリースは次予定。

2002.Aug.11 (非リリース)

分かち書きの内部不具合の修正。

モード2における障害が発覚。修正中。

一部の処理を最適化。データベースを一部最適化。

2002.Aug.4 version 0.4

分かち書きの強化

  1. 前置・後置空白挿入による、分かち書き指定でも、結合度の強い品詞の組み合わせ(例:名詞+助詞)に関しては、分かち書きをキャンセルする機構を実装。
  2. 品詞の組み合わせによって、強制的に分かち書きを行う機構を実装(例:姓+名)。

点字イメージを修正。印刷したさい、点字盤におおむねあうよう調整した。

翻訳のシステムの説明を拡充した。

2002.Aug.2 version 0.3

分かち書きの強化

  1. 前置空白挿入、後置空白挿入に処理を分離した。
    自立語の空白挿入など点字独特の分かち書き処理は前者、句読点や助詞などの空白挿入の処理は後者とした。
  2. 個別辞書による分割をサポート。

鏡像出力で語が重複されて出力される点を修正。

2002.Aug.2 version 0.2

鏡像出力をサポートした。

2002.Aug.1 version 0.1

とりあえず、形として完成したので一般公開。

 

奥付

連絡先: 厨子 直人 (zushi@muzik.gr.jp)