慶応義塾、日本IBMの検索エンジン連携技術を採用したシステムを稼働:ITpro

最近、非構造化データを扱うデータベースのニュースリリースが多くなりました。高度な検索エンジンが搭載されており、廉価に機関リポジトリを構築する際のデータベースとして有効かもしれません。

学校法人の慶應義塾は4月中をメドに、Webページや電子メール、Wordファイル、データベースに格納されたデータなど、様々な電子データを検索できる「デジタルドキュメント共有システム」を稼働させる。このシステムは、ある単語を検索にかけると、その単語に関連の深いキーワードを検索結果と共に表示する「関連語検索」機能を備え、探したい文書を見つけやすくした。

 デジタルドキュメント共有システムは、日本IBMの「WebSphere Information Integrator Omnifind Edition」を採用。同製品が備える「UIMA(UnstructuredInformation Management Architecture」という技術を使って構築した。UIMAは、電子メールやWordファイルなど複数の非構造化データから、検索対象の単語に関連の深いキーワードを抽出するためのインタフェースで、今年1月に日本IBMオープンソース化している。