RSSデータを活用したソリューション(RSSニュース他) | データマイニングへの適用

RSSデータを介してニュースサイトの情報を収集し市場分析を支援するソリューションに、XMLエージェントプラットフォームを適用した例です。
これは、インターネット上にある有用な情報へのナビゲーションと収集にそのまま使える製品開発の例です。IPAを通じて国の支援も得られたようで、実用性は評価されたようです。

RSSデータは、更新情報をいち早く配信することに重点が置かれており、Webサイトのトップページなど利用者がアクセスしやすいページに配置されます。これまでもニュースサイトをマイニングするソリューションは存在しましたが、サイト全体をクローリングしてデータ収集するなど、サイトにかかる処理負荷が問題とされることがありました。ここに示すソリューションのように、RSSデータを介してニュース本文にアクセスする方法であれば、サイトに無駄な負荷をかけずにデータにアクセスできます。

多くのサイトでは、一定期間を過ぎるとサイトからRSSデータは消去されます。データマイニングの多くの場合には、長期に渡るデータを対象としますが、RSSデータを扱う際には手元に保存する仕組みが必要となります。XMLエージェントプラットフォームにより、定期的にRSSデータを収集することができます。

RSSデータの関連技術は、近年普及がはじまった新しい技術ですが、個人や企業に応じて必要となるデータをWeb上から抽出する技術として注目されています。XMLエージェントプラットフォームを適用して、RSSデータを利用したソリューションの構築が実現できます。>