関連技術の研究報告
   両津市なんでも情報館と自然言語検索エンジン
                     
株式会社東芝
1.両津市なんでも情報館の概要
(1)システム化の背景
 佐渡島の両津市は離島であり、立地的条件や地形的特徴(約100Kmに及ぶ海岸線、市の行政・経済・教育機関が市内中心部に集中)などから、特に遠隔地に居住する住民に対して市内中心部に住む住民と同様の行政サービスを提供することが困難な場合があった。
 しかし近年、デジタル技術や情報技術、インターネットの普及に伴い、情報機器やネットワークインフラを組みあわせて利用することで、容易に情報提供システムの構築が可能となった他、住民が低廉な価格で情報の受発信や多様な情報通信サービスを享受することが可能となってきている。
 このような状況において、街頭端末や家庭のパソコンなどから、行政分野をはじめとする各種サービスを受けられるような各分野の情報提供システムの構築を行い、市の活性化を図るとともに、市民生活の質的向上が求められた。
 今回、【自然言語検索エンジン】を利用することで、行政をはじめとする各分野の情報をノウハウデータベースとして蓄積し、ノウハウの共有を行うことができた。これにより、市民が必要とする情報を、自然言語(口語体=話し言葉)による質問文(例:引っ越しをするのですが、どのような手続きが必要ですか?)で入力、【自然言語検索エンジン】により検索を行うことで、該当するノウハウデータを提供するという、いわば役所の担当職員の代理機能の開発を行った。
 さらに、利用者に少しでも理解を深めてもらうため、マルチメディアデータを活用し、MPEG (注)-4によるビデオ・オン・デマンドシステムの構築もあわせて行った。

(2)システム構成
 システムの構成を図1に示す。本システムは両津市役所に、行政情報を蓄積し提供するためのサーバ群と情報登録を行うための職員端末を設置した。佐渡農業協同組合をはじめとした公的団体や、両津市役所の出先機関にも情報登録を行うための職員端末を、また市内各所に市民が自由に情報検索を行うための街頭端末を設置した。
 サーバ群は、【KIDS(注)&WWW(注)サーバ】、【VOD(注)サーバ】などにより構成され、【KIDS&WWWサーバ】にて質問文を解析し、該当するノウハウ情報をノウハウデータベースより端末に提供を行う他、職員が入力した行政等のノウハウ文書を解析ルール、解析辞書に従いノウハウデータベースに登録する機能を提供する。また、【VODサーバ】にて端末にオン・デマンドでMPEG-4動画像の提供を行う。
(注)略語の意味
  KIDS :Knowledge and Information on Demand System
  WWW:World Wide Web
  VOD :Video On Demand
  MPEG:Moving Picture coding Experts Group


(3)自然言語検索エンジンの概要
 ノウハウデータベースを構築する方法として、今回東芝製の自然言語検索エンジンを利用している。自然言語検索エンジンを利用することで、利用者はキーワードや文型を意識することなく、テキスト文書をそのまま入力・登録し、ノウハウデータベースの構築が行える。
 自然言語検索エンジンは、情報構造化処理により、入力された文書(ノウハウ)を形態素解析し、意味単位に分割、文脈推定・構造抽出を行ない、構造情報(文脈情報とキーワードのセット)をノウハウデータベースに登録する。
 例えば、『印鑑登録証明書が必要な場合、市役所市民課または各支所へ印鑑登録証を持参して…』というノウハウについて、前半の文節は、形態素パターンに合致する『場合』という単語により、文脈が「状況」であると解析し、「文脈=状況、キーワード=印鑑登録証明書」という構造情報を付加する。同様に、後半の文節は『持参』という単語により、文脈が「手続き」であると解析し、「文脈=手続き、キーワード=市役所市民課、各支所、印鑑登録証」という構造情報を付加する(図2参照)。


 情報検索時には、登録時と同様に質問文に対して情報構造化処理を行ない、ノウハウデータの構造情報とのマッチングにより情報を検索する。検索結果には類似度を表すスコアがついており、質問文との類似度が高いノウハウから順に表示される。
(注)言葉の意味
  形態素解析:形態素間の接続関係に注目した解析。日本語の場合、ベタ書きされた文からの単語の切り出し、品詞の同定、辞書に登録されていない語の発見などを行う。

(4)MPEG-4を利用した情報提供
 今回、動画情報を蓄積・配信するために、MPEG-4準拠の東芝製MobileMotionを採用した。MPEG-4は低ビットレート(注)を対象に、主に移動通信での利用を想定した符号化方式であり、イントラネットはもちろん、インターネットなどの低帯域でのネットワーク上でも動画の配信を可能としている。ただし、以後に記述しているシステム検証の際の、両津市役所とプロバイダ間の専用線の帯域が128Kbpsであったこともあり、長時間のコンテンツ(圧縮レートを64Kbpsにて作成)を作成することは、その帯域の多くを長時間占有してしまうため、数十秒程度のコンテンツを目安に作成することとした。
(注)言葉の意味
  ビットレート:単位時間あたりの情報伝達量


2.両津市でのシステム検証
(1)システム検証の内容
 システム検証では、両津市をはじめ佐渡農業協同組合や両津市観光協会などの公的機関、両津市民に協力をいただき、アンケート方式(モニタが直接記入・聞き取り調査)にて実施した。
 住民への行政サービスがいかに向上されるかの検証については、
 ・担当職員代理機能の実現(「聞きにくい質問も自由に検索できる」などのアンケート回答)
 ・時間・場所にとらわれず検索できる
 ・容易に操作できる
などの評価が得られ、住民サービス向上に大きな役割が果たせることが確認できた。

 また、窓口や電話での住民からの問い合わせに対し両津市職員にも本システムを利用いただいた。検証用のデータ登録期間が短かったこともあり、約8割程度のヒット率にとどまったが、住民からの問い合わせに対する確認(調査)方法の9割が別の担当者への問い合わせであったこともあり、知識共有データベースを構築することによる、その有効性が確認された。

(2)今後の展開
 本システムは、行政分野以外の各種団体(佐渡農業協同組合、両津市観光協会など)からの情報提供も同様の仕組みで実現可能なため、より幅広い分野での活用が期待される。
 今後の課題としては、情報機器に接したことのない高齢者などでも容易に操作できるよう、文字やボタンの配置や大きさを適宜見直しを図る他、街頭端末操作の簡易化を意識し、音声認識による質問文入力、音声合成による情報の読み上げなど、より人にやさしいインターフェースの検討を進めていきたい。


著者:高野 智幸氏(たかの ともゆき)
株式会社東芝 情報・社会システム社
官公情報システム事業部
官公情報システム技術第三部
公益システム技術担当
平成4年4月(株)東芝入社

 NMDA-Topページへ 研究成果Indexへ 研究成果目次へ