タプルは,ストリームデータを構成する,値と時刻(タイムスタンプ)を併せ持ったデータです。
例として,観測所1(観測所ID:1)と観測所2(観測所ID:2)でそれぞれ気温を観測した場合について,値だけを持つデータと,値と時刻を併せ持つタプルを比較した図を次に示します。
図2-2 値だけを持つデータと,値と時刻を併せ持つタプルの比較
この図に示すとおり,観測所ごとの温度情報だけを扱うのではなく,観測時刻というタイムスタンプをタプルに設定することで,ストリームデータ処理の対象にできます。
タプルのタイムスタンプの設定には,タプルがストリームデータ処理エンジンに到着した時刻のタイムスタンプを設定するサーバモードと,データの発生した時点の時刻でタイムスタンプを設定するデータソースモードがあります。ログ解析処理など,データソース上の時刻情報の時系列順にストリームデータ処理をしたい場合は,データソースモードを使用してください。
以降で,それぞれのモードについて説明します。
ストリームデータ処理エンジンにタプルが到着した時点で,Stream Data Platform - AFが動作するサーバのシステム時刻をタプルに設定するモードをサーバモードといいます。サーバモードによるタイムスタンプの設定を次の図に示します。
図2-3 サーバモードによるタイムスタンプの設定
サーバモードでは,入力データがタイムスタンプを持っているかどうかに関係なく,Stream Data Platform - AFが動作するサーバの時刻をタプルに設定します。
ログファイルなど,入力とするデータソース上に時刻情報がある場合に,その時刻情報をタプルに設定するモードをデータソースモードといいます。データソースモードによるタイムスタンプの設定を次の図に示します。
図2-4 データソースモードによるタイムスタンプの設定
データソースモードでは,入力データが持つタイムスタンプをタプルに設定します。
なお,データソースモードでストリームデータ処理を実行するには,ストリームデータをタイムスタンプの昇順に並べる必要があります。ストリームデータのタイムスタンプが誤差を含んでいるような場合に,タイムスタンプの昇順に並べる方法については,マニュアル「uCosminexus Stream Data Platform - Application Framework システム構築・運用ガイド」を参照してください。