スーツケースの中にあるデータセンター ITエンジニアのレース場での1日に密着


 

あなたが行くところどこにでも持ち運べるデータセンターを想像してみてください。
「それが僕の仕事さ」
そう答えるダニエル マートランド氏は、Formula1レーシングチームのスクーデリア・トロ・ロッソのトラックサイドITエンジニアとして、毎年20カ国以上のレースに参 加しています。「それは僕にとってチャレンジな仕事だけど、それぞれのレースが終わると、大きな達成感があふれる週末になるんだよ」と彼は言います。

マレーシアF1グランプリが開催されるセパン国際サーキットに彼を訪ねました。
猛烈な暑さと息苦しい湿度のスクーデリア・トロ・ロッソのガレージの外に座って、ダニエルは、一番データが集中的し、地球上で技術的にも一番高度なスポー ツのためのネットワークを維持するために必要なものは何であるか、私に教えてくれました。

 
ダニエルマートランド氏に聞く
トラックサイドITインフラストラクチャを維持するために必要なものについて
スクーデリア・トロ・ロッソのトラックサイドITエンジニア会談

「ダニエルは、忙しいスケジュール中、今日は時間を取っ てくださってありがとうございます。F1カーを見れば、トロ・ロッソのネットワークが素晴らしいことを確信できます。IT環境をセットアップするために必 要なものをいくつかの教えていただけますか?」
「たくさんあります。メインのレースは日曜日に開催されますが、我々にとってレースは、この1週間で、もうすでにレースは始まっているんです。サーキット に着くと2日間はチームの環境を構築します。オフィス、ピットウォール、ガレージはもちろん、ローカルエリアのすべてのネットワーク環境まですべて構築し ます。他のチームも同じですが、持ち運びが可能かつ自己完結なデータセンターをコンテナに積んでサーキットに持ってきています。運んできたものはすべてこ こで開いて、それぞれを接続し、テストしなければいけません。1週間ぶりに通電するので、すべてが我々の思うとおりに完璧に動作するか確認する必要がある のです。このポータブルデータセンターは、常に搬送するユニットの中に収められています。飛行機にも乗せやすいですのでどこにでも持っていくことができま す。週末のレースで必要なサーバー機器すべてを収納しています。」

 
ポータブルデータセンターユニット内部に入るダニエル マートランド氏

ポータルデータセンターが、万が一レースに向けて機能し なかったら、どうなりますか?
今までにそのようなことは一度もありませんが、万が一そのようなことが起きた場合は、フィレンチェにあるファクトリーに予備のハードディスクが用意されて いますので、必要な場合はここから出荷の指示を出します。

ということは、レースが終わるたびにフィレンチェにポータブルデータセンターを送り返しているということですか?
はい、そうです。レースの間に十分な時間がある場合は、メンテナンスのために私たちのファクトリーがあるフィレンチェに送り返しています。もちろん、当然 のことではありますが、シーズンが終わればメンテナンスやアップグレードのために、同じように送り返しています。

今までに事故はなかったということですが、もしあった場 合どう対処するのでしょうか?
もちろん今までに小さなトラブルはありましたが大きなことはありませんでした。何かといえば、通常はUPS(無停電電源装置)のユニットです。特にマレー シアのような場所では、高温多湿な環境に非常に悩まされます。その他の問題といえば、F1特有のカーボンファイバーの埃です。これらは電子機器に影響を与 えてしまいます。高温多湿に加えカーボンファイバーの埃は、サーバーにとって決して良い組み合わせではありません。


スクーデリア・トロ・ロッソのポータブルデータセンターのサーバーラックを紹介するダニエル マートランド氏

もしUPSが故障した場合は何が起こりますか?
過去に何回かUPSのトラブルに見舞われましたが、本当の意味での問題よりもっと厄介でした。当然のことながら1台のUPSに対して信頼することはありま せん。我々はすぐに稼働できるもの、スタンバイさせておくものを含めて複数台UPSをもっています。レース中に不具合が起きれば、自動的にすべてが稼働可 能な状態になるようになっています。

UPSは電源ダウンだけではなく電力調整という意味でも 重要ということでしょうか?
はい、そうです。F1サーキットの中では、電源電圧が変動しています。我々のネットワークには常にクリーンな50Hzの電力が必要になります。

そこにはどんな種類のサーバーがありますか?
8台の物理サーバーに加え、ネットワーク機器があります。8台のうち6台は我々チームのもので、2台はエンジンのサプライヤーでもあるフェラーリの物にな ります。
我々のサーバーは、VMwareとWindowsが実装しており、それぞれは異なる目的を持っています。VMwareは、HPのストレージアレイにスト レージ・エリア・ネットワークを介して接続されたHPのサーバーを使用しています。冗長性と一部のロードバランシングのための2つのストレージアレイを所 有しています。これらのアレイはパフォーマンスのためだけではなくSSDが振動に対してより弾力的である点から、SSDを使用しています。

 
テレメトリングの解析に集中するスクーデリア・トロ・ロッソのレーストラックエンジニア

VMwareのホストは アトラスデータ・サーバーを仮想マシンとして使用していますか?
Atlasデータサーバーは数台保有しています。すべてが仮想マシンとして稼働しています。(私たちのテレメトリデータのすべてを処理するため)これらの アトラスデータ・サーバーは、我々のレースにとって極めて重要で、常にVMware耐障害性を有効にしています。これらの仮想マシンのいずれかに障害が発 生した場合でも、車がトラック上にいるときは、テレメトリング(遠隔地にある計測器などのデータを、通信回線を使って収集するシステムのこと)からはデー タが送り続けられています。

いつテレメトリングは開始されるのでしょうか?
車がスタートするとすぐに開始されます。アトラスデータ・サーバーは、自動的にデータの記録を開始します。エンジニアは一日を通していくつかのテレメトリ チェックを行い、またすべてのセンサーが機能していることを確認するために車を数回起動します。

 
コース上の車の順位を示すグラフを指さすダニエル マートランド氏

トラブルを起こしているセンサーはありますか?
考えても見てください! 200個以上の物理的なセンサーと何千ものデータもあれば、不具合を起こすセンサーもいくつかはあると想像できますよね? ただ幸いなことに我々のシステムは非常に良い状態にいます。

正常に動いていない場合はどんなことをするのですか?
スクリーンのグラフを叩いてからここから立ち去るよ(笑) でもそんな深刻じゃないよ、我々のエンジニアは何をすべきかわかっているからね。
センサーといえば、バーチャルセンサーもあります。車からデータが離れる際は、仮想ECU(電子制御ユニット)に中継されます。その仮想ECUは、車から 入手可能なテレメトリ情報を受け取り、適切なに計算します。ご想像の通り、これは場所によっては車に物理的なセンサーを取り付けることができません。だか ら我々は、実際に何が起こっているかについての予測を行う必要があります。このようなデータを処理するための仮想センサーは何千にもなります。
 

トラック上の車の順位を示すグラフ

Windowsマシンはどのような目的で使っているので しょうか?
1つはバックアップサーバーです。パートナーでもアクロニスさんなら、ここはたくさん聞きたいことがありますよね。60TBのからのディスクがここにあり ますが、それだけの容量が私たちには必要ということです。RAID構成されたHDDを使って障害時の対策をしています。

これがバックアップサーバーのすべてですか?
はい、もってきているサーバーはこれだけです。

データはオフサイトにも複製していますか?
ファクトリーに戻るとポータブルデータセンターの中にあるバックアップサーバーからファクトリーの中にあるサーバーにアーカイブされます。残念ながら生成 されるデータが膨大なため、広域ネットワークを介してオフサイトからバックアップをプッシュすることができないのです。とは言うものの、テレメトリデー タ、各レース中ファクトリーにライブで記録されています。なぜかと言うとフィレンチェのファクトリーとレーストラックを30Mbps MPLS広域ネットワークで繋がっているのです。

その帯域はだれが提供しているのでしょうか?
すべてのレースにおいて同じプロバイダーのリーデルコミュニケーションを使っています。彼らは各国の最強のサービス・レベルの接続を提供するために、現地 の通信会社に一緒に対応します。彼らはここにも実際来ているので、何かがうまくいかないときは、私たちが彼らのもとに行くと解決してくれます! (笑)

彼らがレース場にいるということは本当に素晴らしいことです。考えてみてください:もしあなたがこのネットワークを失ったら、すべての接続ができなくなる のです。メールでサポートをリクエストしようにもできないのです。なぜならメールがそこにないからです。
 

スクーデリア・トロ・ロッソのサーバーラックの一部

他にはどんなサービスを使っていますか?
唯一の標準セットでもあるFIA(フォミュラワン運営組織)が提供するGPSや気象情報です。またタイミングインフォメーション、TVフィードなどのF1 マネージメントサービスも利用しています。

レースのある週末の朝起きた際、真っ先に考えることは何 ですか?
まず朝起きたらすぐに携帯電話をチェックしています。それはFacebookのイイネの数をチェックするためではなく、サービスにトラブルがないかの確認 です。異なるサーバーから様々なステータスメールやテキストメールが送られてきます。いくつかはバックアップアラートなどのインフォメーションアラート で、他の物はもっと深刻な状況を示すアラートです。その時は飛び起きて、メールを確認して、仕事の心配をしています(笑)
日曜日はメインレースの日ですから特に神経を張っています。トラックにつくと常に緊張してますよ。
 

マレーシアF1GP メインレース本番3時間前の最終準備

モニターのスイッチをゆっくり立ち上げる際すべてが順調 だと願っていますか?
いいえ、システムは実際には本当に信頼性があります。現場につくと日々のチェックリストに目を通します。すべてが動作しているか確認し、そしてもう一回し ます☺

モニタリングの際は何を使用しますか?
メインでは、異なるプラグインを使用しながらCactiを使用しています。たくさんのカスタマイズが可能なので非常に気に入っています。他のソフトウェア も使用していますがまだお気に入りは見つけられていません。

Acronis Monitoringは試したことはありますか?
いいえ、まだです。でも、今までで見てきた中でこれが一番好きです。データバックアップ、ファイルの同期、そしてモニタリングが同じベンダーから供給され る包括的なデータ保護という考え方が私は気に入っています。アクロニスはデータバックアップの中でもNo.1だと思っていますし、サーバーモニタリングで もすぐにNo.1になると思っています。

すべてが順調であることを確認するために、仕事に来ると いうことですか?
そんなことはあまりないですよ。異常があるときだってあります。いくつかのシステムは使われていなかったり電源が入っていなかったりすることがあるからで す。いくつかのシステムはヨーロッパGPでしか使わないものもあるからです。ヨーロッパでは出荷用のトラックを使うので、空輸することはないから、他とは 少し事情が違うんです。

 

アクロニスの存在は仕事において役になっていますか?
私のようにITエンジニアにとっては稼働時間とバックアップがすべてなのです。アクロニスの新製品は本当に興奮しました。Acronis Instant Restoreのような技術は、リストアにかかる時間が義気的に早くなり、まさにこれを探していたんだと思いましたよ。物事がうまくいかない時こそ、ちゃ んとデータが保護されているとわかることがシステム管理者にとっては本当に最高の気分なんです。

今日はありがとうございました。幸運を願ってます!
ありがとうございます。