情報量理論 一からおさらい2


 II 言語の形式
 原風景を音声ないし文字というデータに定着させたものが言語である。言語のちがいとはデータの形式のちがいである。そのむかし、一太郎というワープロソフトがあった。一太郎とWord のちがいがそのソフトの形式のちがいであるように、言語のちがいが形式のちがいである。この地球上には、アラビア語、エストニア語、シンハラ語、ケチュア語、ヨルバ語など、データの形式が無数に存在する。
 ここで、言語のちがいをデータの形式のちがいであるという認識はとても重要である。
 ここで、データ全体を情報であると勘違いするところから、語学教育も翻訳も迷走を始めることになる。
 たとえば、探し物をしていて見つかった時には日本語で「あった」と言う。それ自体がデータであるが、「あった」が過去形であることは原風景を再現するのに何の役にも立たない。それどころが、その妨げになることもある。現実には「あった」ではなく「ある」なのである。それを「あった」と言うのは形式であって、情報ではない。
 日本語のよくできるスリランカ人に「(このスリランカの衣装は)スリランカに行った時に着ようと思ってます」と言った時、その人は「え、スリランカに行ったことあるんですか」と訊き返してきた。「行った時」という形式に囚われて正確な情報の判断ができなかったのである。
 


 III 情報
そこで、もう一度、データとは何か、情報とは何かを考えてみよう。
 情報科学では、何らかの出来事を判断する材料として有用なデータのことを情報と呼んでいる。つまり、データが何もかも情報であるわけではないということである。
 ここで言う出来事がほぼ原風景に相当する。出来事というと、何か事件のようなものだけを思い浮かべる人もいるので、事象と考えてもよいし、心に浮かんだものとしてはまさに原風景と捉えてもらえればよい。また、「判断する」というと、頭で考えるようなイメージがあるので、何らかの事象や原風景を「推し量る」と思えばよく、(データから)原風景を「再現する」と考えればよい。


 月が出ている。
 猫がいる。
 酒が飲みたい。


 何でもよい。
 ここに挙げたのはいずれも言語というデータであり、原風景を再現するのに有用な情報であると思われる。「酒が飲みたい」のはいったい誰なのか、おそらく本人であることがわかる。ほかの誰かなら、「酒を飲みたがっている」、「酒飲みたそう」などとなるので、その点も有用な情報となる。


 情報とは、データのうち原風景を再現するのに有用な要素のことである。


 ここで少し整理しておきたい。データのうち原風景を再現するのに有用なデータを情報と言うのであれば、有用ではないデータはいったい何なのか。それは主として形式である。主としてと断ったのは、言語を操る個人の問題に帰せられるものがあるからである。
 情報科学の定義と情報量理路の定義との間にズレがあるわけではない。情報科学が処理するデータは、形式と情報とがほぼ完全に峻別されているが、われわれが言語を扱う場合には、往々にして形式が情報に紛れてしまう。ここに関係代名詞があると意識した瞬間、その人の注意はその関係代名詞が担う情報よりも、単に関係代名詞が使われているという形式に向けられる傾向が強い。


にほんブログ村 英語ブログ 英語 通訳・翻訳へ
にほんブログ村