モノのインターネット(Internet of Things: IoT)がビッグデータに対して持つ意味

 冷蔵庫やサーモスタットから医療機器に至るまで、ネットワークに接続されたデバイスの増加は、データの洪水とでも言うべき現象を引き起こしています。このようなデバイスが生成している大量のデータを、ユーザーはいかに収集、監視、保存すべきでしょうか? Acronis の研究員(フェロー)であり、IT プロフェッショナルとして長年の経験を持つ Joel Berman が、IoT(モノのインターネット)がデータの保存に対して持つ意味を解説します。加えて、画一的なバックアップ ポリシーがうまくいかない理由、そしてコネクテッド デバイスから押し寄せる大量データをいかに管理するかについても述べています。

IoT(モノのインターネット)というトレンドについて、どう考えますか

モノのインターネットの「モノ」とは、従来の接続デバイス、たとえばタブレット、スマートフォン、デスクトップやノート型PC とは別に、最近ネットに接続されるようになった任意のエンドポイントを指すと私は考えていますが、モノのインターネットは形態も精巧さも進歩を続けています。2003 年に日立製作所が発表したチップはあまりに小さく、まるで食べ物にふりかけると人々が何を食べたかを追跡できるのではと思わせるほどでした。今日では、心臓モニターや交通監視カメラからスマート冷蔵庫に至るまで、あらゆるものがデータの収集と監視に利用できるようになっています。

大量のデータが生成されると、データの保存にはどのような影響があるでしょうか

生成されるデータをすべて追跡することは可能でしょうか?すでに現在、収集するデータが多すぎてリソースの無駄使いになっています。交通監視カメラを例にとってみましょう。1 台の交通監視カメラで撮影した動画をすべて保存することに意義があるでしょうか。世界中に何百万台もの交通監視カメラがあることを考えると、途方もない量のデータですが、それが実際に必要とは限らないわけです。

しかし、このデータを集計して分析目的で使うとすれば、意味のあるものになり、かつ保管も簡単です。コンシューマーと企業のどちらも、どのデータは細かい状態のときに最も有益となり、どのデータは集約したときにのみ有益で統計的に有用なのか自問する必要があります。心臓モニターを例にとってみましょう。患者に付けている心電図が脈が飛んだのを感知した際は、記録された個々のデータが患者と主治医にとって重要になります。しかし、ある心臓治療薬の効果を大人数の母集団を対象として調べている製薬会社がデータを監視しているのだとしたら、関心があるのは集計済み形式のデータかもしれません。

コネクテッド デバイスから収集したデータの優先順位付けはどのようにすればよいでしょうか

収集したデータを 1 週間後に削除する企業もあれば、ある年に収集したデータのうち隔週分だけを残すという体系的なプロセスを確立している企業もあるでしょう。保管する価値のあるデータはどれかという定義と、どれだけすばやくアクセスする必要があるかに基づいて、保持ポリシーを規定することがきわめて重要です。たとえば、地球温暖化について研究している企業であれば毎日の気温データを何百年分も保管する必要がありますが、電力会社であれば関心があるのは 1 時間に 1 回の気温計測値であり、10 年分もあれば十分でしょう。この電力会社が知る必要があるのは、どれだけの電力を発電するかであり、その元になるのは地域の天気予報と、さまざまな気温におけるエネルギー消費量のデータです。

IoTによってさまざまな要素が融合しますが、どのような情報が意味を持つかを決定づけるのは、特定の作業を完了するために各要素がそれぞれどのように連携するかです。