インターネットにおけるフィルタリングシステムの開発

DEVELOPMENT OF AN INTERNET FILTERING SYSTEM


国分 明男 1)清水 昇 2)
Akio KOKUBUNoboru SHIMIZU

1)
財団法人 ニューメディア開発協会 開発本部(〒108-0073 東京都港区三田1丁目4番28号 三田国際ビル23階 E-mail : kokubu@nmda.or.jp)
2)
財団法人 ニューメディア開発協会 開発本部(〒108-0073 東京都港区三田1丁目4番28号 三田国際ビル23階 E-mail : shimizu@nmda.or.jp)

ABSTRACT : The following is to describe the summary of our developing project of an internet filtering system. The project is composed of three phases, the criteria development, the software development and the experiment for the filtering system. At the criteria development phase, two rating criteria and PICS implementation specification have been developed. One of two criteria is for school use and the other is for enterprise use. At the software development phase, PICS compliant label bureau for UNIX and client software for Windows95 and Macintosh have been developed. At the experiment phase, we have rated about 13,000 webpages most of which are for Japanese, and built a label database. Then we have begun to provide the rating services, "SafetyOnline" for school use and "SafetyOnline-B" for enterprise use. Finally, we have experimented the effectiveness of the filtering system in the actual use.

1. 背景

インターネットはオープンなネットワークであり、誰でもが自由かつ簡単に情報を発信することができ、そして、誰でもが自由にインターネット上の情報を利用することができる。

インターネットは、このオープンさと自由さとによって、成功したネットワークであり、ポルノから政府文書までを含む膨大な情報と全世界で数千万人にのぼる膨大な利用者とを包含し、現在も発展を続けている。

インターネットの利用が社会の色々な局面に広がるにつれ、インターネット上の情報の内容の問題が浮かびあがってきた。

例えば、インターネットを学校の授業などで使うと、海外で作られた、生きた英語を読むことができる、世界中の生の情報を得ることができるといった、非常に有効な側面がある一方、本来、18才未満の青少年には見せてはならないアダルト情報が簡単に見えてしまうといった負の側面がある。

この様な負の側面が教育現場へのインターネットの普及の阻害要因になっているのが実状である。

また、企業において、インターネットは情報収集やコミュニケーションやマーケッティングの手段として、欠<くべからざるものとなっているが、ギャンブル情報へのアクセスなど本来の企業活動と関係ない利用により、従業員の業務効率の低下を招いたり、これらの無駄な通信トラフィックにより、ネットワーク設備が有効に活用出来ない等の問題が生じて来ている。

このインターネット上の情報の内容の問題はインターネットの利用が広がるにつれ、非常に大きな社会問題として、注目を浴びるようになった。

幾つかの国で、インターネット上を流れる情報の規制が検討されるようになった。しかし、この問題は表現の自由の大切さと市民の自由な意見交換の場の大切さと公共の利益と安全の大切さとの兼ね合いの問題であり、また、インターネットは本質的に国際的な性格を有しているため、この問題の解決を難しくしている。

米国では、幾つかのベンチャ企業がインターネット利<用者に受信する情報を選択可能にするソフトウェアを提供する事でこの問題の解決を試み、数年前から SurfWatch など幾つかのフィルタリングソフトが販売され始めた。

また、フィルタリングソフトの開発に伴い、フィルタリングするときの基準となるインターネット上の情報を如何に分類すべきかという研究が行われ、RSACi【1】などの幾つかのレイティング基準が米国で開発された。

しかし、従来の市販されたフィルタリングソフトはベンダ毎に独自のレイティング情報と独自の方式とを用いており、それらの互換性は存在しなかった。

何をフィルタリングすべきかは、利用者毎に異なるのが普通である。例えば、教育で使う場合は、アダルト情報が主に問題となり企業の中で使う場合はポルノやギャンブルの情報が問題となる。この様な場合、従来の市販のフィルタリングソフトでは利用者が当該ベンダのもの以外のレイティング情報を利用しようとしても、不可能であり柔軟な運用ができなかった。(図1参照)

従来のフィルタリングソフトの方式
図1 従来のフィルタリングソフトの方式


W3C(World Wide Web Consortium、以下“W3C”という)【2】はレイティングデータの標準化とレイティングデータのインターネット上での交換規則の標準化を行うため技術標準 PICS(Platform for Internet Content Selection)【3】を開発し、様々なレイティング基準で作成されたレイティングデータを様々なフィルタリングソフトで利用可能となるようにし、利用者が利用者のニーズに合ったレイティングデータを取捨選択可能にしようとしている。(図2参照)

PICSの方式
図2 PICSの方式


従来、フィルタリングソフトやレイティング基準は主に米国において開発され、それら開発されたものも W3C の PICS に準拠したものは極めて少なかった。

我が国の状況を見ると、我が国の事情に合ったレイティング基準が存在しない、我が国から発信されている情報のレイティングがあまりなされていない、レイティングされていたとしても適正に行われていない等の問題があり、我が国の実状に合ったレイティングサービスやフィルタリングシステムが実現されることを期待されている。

2.目的

本プロジェクトは、情報をレイティングすることにより、情報の発信を規制または制限することなく、受信者がそのレイティングを利用して、受信する情報を選択または制限できる、受信者による自主管理システムを実現することを目標とする。W3C で標準化が進められている PICS に準拠したラベルビューロ機能と、フィルタリング機能とを開発し、そしてレイティング基準を作成し、そのレイティング基準に基づいたデータベースを構築し、情報発信者及び情報受信者に利用してもらい、“フィルタリングシステムが有効であること”を実証する実証実験を行うことを目的としている。

3.プロジェクトの内容

本プロジェクトは次の3つのフェーズから構成されている。

(1)標準開発

標準開発は、インターネット上の情報をレイティングする時、基準となるレイティング基準の開発と技術開発おいて、PICSを実装する時のベースとなるPICS実装規約の開発とから構成される。

(a)レイティング基準の開発

インターネット上の情報をフィルタリングしようとする場合、予めインターネット上の情報を分類しておかなければならない。

この分類を行うことをレイティングと言う。

情報のレイティングを行うためには、レイティングを行う基準が必要であり、この基準をレイティング基準と言う。

既存のレイティング基準には米国で開発されたRSACiやSafeSurfなどがある。(図3参照)

RSACiのレイティング基準
図3 RSACiのレイティング基準


本プロジェクトでは、小中高などの学校と企業とで本プロジェクトで開発したフィルタリングシステムを使用して実験を行うことを計画していた。しかし、既存のレ イティング基準は米国で開発されたもので、必ずしも、日本の状況や実験参加者のニーズに合ったものでなかった。

この為、本プロジェクトでは日本人向けの情報(主に日本語のホームページ)をレイティングする為の新たなレイティング基準を開発することにした。

我が国の教育の場及び企業の場でフィルタリングシステムを使用する場合、レイティング基準として、どの様なものが望ましいか関係者で検討を行った。

レイティングサービスは国際的な連携が必須であるとの認識に基づき、新らたなレイティング基準の検討は海外のレイティングデータと可能な限り互換性を保つことを前提として行われた。

検討の結果、国際的にデファクト標準として認められつつあるRSACiをベースとし、RSACiの4っのレイティング項目(”ヌード”、”セックス”、”暴力”、及び”言葉”)に新たなレイティング項目を付加する事で、次の2つの新しいレイティング基準を開発した。

教育向けレイティング基準の場合、レイティング項目”その他”を追加し、レイティングレベルはRSACiと同じく0,1,2,3及び4の5段階とした。

企業向けレイティング基準の場合、レイティング項目として”ギャンブル”を追加し、レイティングレベルはRSACi程の細分化は必要がないとの判断から0と1との2レベルとした。

教育向けレイティング基準
図4 教育向けレイティング基準


(b)PICS実装規約書の開発

W3C開発の技術仕様PICS Version1.1は、ラベルの形式やインターネットを介してラベルの交換を行う場合のプロトコルなどの一般的仕様を規定しているが、必ずし も、仕様の総てをインプリメントする必要はなく、インプリメントすべきか否かについてインプリメンタに任されている部分がある。

従って、本プロジェクトのシステムでインプリメントしたPICS仕様の部分、及び、パラメータの値の取り得る範囲などを規定するPICS実装規約書を開発した。

PICS実装規約書は次の4っの実装規約書から構成されている。

(2)技術開発

a)技術開発の狙い

本技術開発は、フィルタリングシステムに関する共通プロトコルの開発とインタオペラビリティの実現とWWWの有害情報問題の解決とを主な狙いとしている。

このため、レイティングの結果であるラベル情報を蓄積したデータベース(以下、ラベルビューロという)を第三者が開発したクライアントで利用可能にしたり、本技術開発で開発するフィルタリング機能で第三者が開発したラベルビューロを利用したり、レイティング技術を応用した新しいソフトウェアの開発をし易くすることが必要である。したがって、ラベルビューロ上のラベル情報の形式と、クライアントからラベルビューロへの要求方式と、ラベルビューロからクライアントへの応答方式とは、W3C開発の次の技術仕様によって定義されるPICS Version 1.1【3】に準拠する。

本報告書におけるW3C開発の技術仕様PICS Version 1.1とは、上記技術仕様を意味する。

また、PICS準拠とは、上記技術仕様に準拠していることを意味する。

b)技術開発で確立される技術

本技術開発は、W3C開発の技術仕様PICS Version 1.1に準拠したソフトウェアを開発することにより、以下の技術を確立することを目的とする。

本プロジェクトにより確立される上記技術は新しい検索サービス、知的財産保護システム、コンピュータウイルスからの保護システム及び電子商取引などに応用できる。

c)技術開発の概要

本技術開発では、インターネットの利用拡大を受け、WWWをはじめとするインターネットを介した情報の受信の自主管理を支援するレイティングサービスを実現することを目的とし、W3C開発の技術仕様PICS Version 1.1と本システムをPICS準拠ソフトウェア作成者やWeb サイト作成者が使用するためのPICS実装規約とに基ずいて、教育向け及び企業向け各々のレイティング基準を利用したレイティングサービスを実現するために必要となるシステム開発を行った。

具体的には、ブラウザを介してラベル情報の登録や問い合わせに応じるラベルビューロ機能と、ラベルビューロから送られるラベル情報をもとに受信したホームページの表示の可否を判断するフィルタリング機能と、Webサイト作成者によるレイティングを可能とするオーサリング機能とを、有するフィルタリングシステムを開発した。(図5参照)

ラベルビューロ機能はUNIXマシン上で動作し、レイティングの結果であるラベル情報を蓄積し、管理する機能とラベルビューロ管理者がブラウザを介して効率的にレイティング作業を行ったり、ラベルビューロの管理を行ったりするための機能と本開発のフィルタリング機能を含むPICS準拠のソフトウェアからのラベル問い合わせ要求を受け付け、その要求に対応した処理を行った後、その処理の結果を応答として返す機能と一般のインターネットユーザがラベルビューロ管理者に指定したホームページのレイティングを行うよう依頼することを可能にする機能とから構成される。 インターネット上の情報は膨大であり、虱潰しにレイティング作業を行うのは非常に効率が悪い、このめ、ラベルビューロ機能は幾つかの我が国の代表的な検索サイトと連携し、レイティングの対象となる可能性を有すホームページをキーワードで絞り込む機能を実現する事で効率化を図った。

そのレイティングを行った結果であるラベル情報をデータベース化して管理するとともに、ラベルビューロ管理者向けにそのデータベースの管理機能をWebを用いて、分かり易いユーザインターフェースで実現する。

ラベルビューロ機能では、レイティング結果であるラベル情報をPICS準拠の形式にすることによりラベル情報のインタオペラビリティを実現した。

また、ラベルビューロ機能はHTTPサーバとしての機能を有し、インターネット上の任意のソフトウェアからPICS準拠のラベル問い合わせコマンドを受け付ける事が出来、問い合わせコマンドを受け取った場合、当該問い合わせコマンドに対応した処理を行った後、当該問い合わせコマンドを発行したソフトウェアにPICS準拠の応答コマンドを返す。

この様に、ラベル問い合わせに関する通信プロトコルをPICS準拠にすることによりラベルビューロ機能とフィルタリング機能との間の通信のインタオペラビリティを実現した。

フィルタリング機能は、インターネット利用者のPC上で動作する。

フィルタリング機能として、Windows95用とMacintosh 用との2種類のソフトウェアを開発した。

フィルタリング機能は、サーバとしてPICS準拠のどのラベルビューロ機能を使うかを指定する機能と、ブラウザからのホームページ表示要求が生じた時に、本開

フィルタリングシステム全体図
図5 フィルタリングシステム全体図


発のラベルビューロ機能を含むPICS準拠のサーバにラベル問い合わせ要求を行い、その結果得られたラベル情報に基づいて、当該ホームページの表示の可否を判断する機能と先生や両親を含むアクセス管理者が簡単にブラウザの利用を管理することを可能にする機能と、から構成される。(図6参照)

フィルタリング機能は、インターネットのネットワークアーキテクチャをOSI(Open Systems Interconnection)の7階層モデルで表現した場合、7階層モデルの第4層のトランスポート層に組み込まれる。

インターネット利用者がブラウザを介してインターネットにアクセスする時、アクセス場所を示すURLが上記の第4層のトランスポート層を通過する。

フィルタリング機能はこのURLをトラップし、当該URLのラベル情報とアクセス管理者の設定した閾値とを比較する事でアクセスを許すか否か決定する。

従って、第7層のアプリケーション層に位置しているブラウザの種類に影響されることなくフィルタリングを行うことが可能である。

フィルタリング機能の管理者画面
図6 フィルタリング機能の管理者画面


フィルタリングに用いられるラベル情報には、ラベルビューロから取り出されるものと、ホームページ中から取り出されるもの(セルフレイティングの場合)とが、ある。

ラベル情報をラベルビューロから取り出す場合、フィルタリング機能はアクセス管理者により予め設定されたラベルビューロに対し、PICS準拠の通信プロトコルを使って、ラベル問い合わせを行い、当該URLに対応したラベル情報を入手する。

従って、フィルタリング機能としてはPICS準拠のラベルビューロであれば如何なるラベルビューロでも利用可能である。

ラベル情報をホームページ中から取り出す場合、ラベル情報はホームページのヘッダ中にPICS準拠の形式で存在することを前提にしている。

オーサリング機能はWebサイト作成者のための機能である。

オーサリング機能として、Windows95用とMacintosh 用との2種類のソフトウェアを開発した。

オーサリング機能はWebサイト作成者によるホームページの自主的なレイティング(以下、セルフレイティングという)を行いやすくするための機能であり、指定されたホームページにPICS準拠の形式のラベル情報を挿入する機能と、当該ホームページがレイティングされたことを示すため、GIF形式の画像データを挿入する機能とから構成される。

レイティングの結果であるラベル情報は異なるレイティング基準に基づいて作成される可能性がある。

ラベルビューロ機能、フィルタリング機能及びオーサリング機能のユーザインターフェースや処理ロジックがある特定のレイティング基準にくくりつけなっていると、レイティング基準毎に各機能のソフトウェアが必要になってしまう。

この不都合さを解消するため、PICSではレイティング基準を定義するデータファイル(以下、RATファイルという)を規定している。

本技術開発の各機能は、このRATファイルの定義に従ってユーザインタフェースと処理ロジックとを動的に変えることにより、レイティング基準からの従属性を排除している。

(3)有効性検証実験

標準開発フェーズで開発したレイティング基準と技術開発フェーズで開発したフィルタリングシステムとの有効性を検証するため、インターネット利用者に本プロジェクトで開発したフィルタリングシステムを利用してもらい、有効性検証実験を行った。

実験は次の2つに分けて実施した。

以下、各実験の概要に付いて述べる。

a)教育向けレイティングサービスの有効性の検証実験

本実験は、主に財団法人コンピュータ教育開発センター(CEC)【6】の新100校プロジェクトと連携して行われた。

本実験は、新100校プロジェクトの関連校以外にフィルタリングに興味を持ち、本実験への参加要請のあった数校にも参加して頂いて平成9年10月から平成10年1月まで実施した。

本実験に先立ち、標準開発フェーズで開発した教育向けレイティング基準に基づいて約1万件のホームページをレイティングし、その結果をラベルビューロに蓄積し レイティングサービスSafetyOnlineとした。

教育向けのレイティング作業は実験期間中も随時行い最終的にレイティングされたホームページの総数は約1万3千件になっている。

本実験では、先生をアクセス管理者とし、生徒をフィルタリング機能利用者と設定した。

技術開発フェーズで開発したフィルタリング機能を実験参加校の生徒が利用するインターネットアクセス用のPCにインストールし、SafetyOnlineなどのレイティングサービスを使うフィルタリング機能を働かせながら、授業や課外活動などにそのPCを生徒に使ってもらい、その利用ログやアンケートにより実験データを採取し、次の項目について、分析と評価とを行った。

b)企業向けレイティングサービスの有効性の検証実験

本実験はインターネットを良く利用している3つの企業に参加してもらい、実務で利用しているPCを使って実施した。

本実験に先立ち、標準開発フェーズで開発した企業向けレイティング基準を使って、教育向けとほぼ同数のホームページのレイティングを行い、その結果をラベルビ ューロに蓄積し、レイティングサービスSafetyOnline-Bとした。

本実験は技術開発フェーズで開発したフィルタリング機能を実験参加者が実務で使用しているPCにインストールし、SafetyOnline-Bなどのレイティングサービスを使うフィルタリング機能を働かせながら、そのPCを使って業務を行ってもらい、その利用ログやアンケートなどで実験データを収集した。

収集した実験データを分析し、次の項目について、評価を行った。

c)実験結果

教育現場及び企業現場での実験結果の要点は以下の通りであった。

4.成果

本プロジェクトの成果には技術的成果と実験的成果とがある。

(a)技術的成果

本プロジェクトの技術的成果には次のものがある。

(b)実験的成果

本プロジェクトの実験的成果には以下のものがある。

5.今後の課題

本プロジェクトを実施したことによって、明らかになったインターネットにおけるフィルタリングシステムの課題には次のものがある。

6. 参加企業及び機関

本プロジェクトへの参加企業及び機関は以下の通りである。

7.参考文献

【1】http://www.rsac.org/homepage.asp

【2】http://www.w3.org

【3】http://www.w3.org/PICS/

【4】http://www.w3.org/TR/REC-PICS-services

【5】http://www.w3.org/TR/REC-PICS-labels

【6】http://www.cec.or.jp/CEC/

【7】http://www.nmda.or.jp/


禁無断転載
(C) NMDA. All rights reserved.