#osc16ep (20161005) | 2016-10-05 11:46 |
piwik-fluentd (2.0.3) | 2015-11-12 15:22 |
Piwik patches for Japanese (20160813) | 2016-08-13 15:23 |
"settings": { "analysis": { "filter": { "pos_filter": { "type": "kuromoji_part_of_speech", "stoptags": ["助詞-格助詞-一般", "助詞-終助詞"]}, "greek_lowercase_filter": {"type": "lowercase", "language": "greek"}}, "analyzer": { "kuromoji_analyzer": { "type": "custom", "tokenizer": "kuromoji_tokenizer", "filter": ["kuromoji_baseform", "pos_filter", "greek_lowercase_filter", "cjk_width"] } } } },
"mappings": { "access_log": { "_source": { "enabled": "false" }, "_all": { "enabled": "false" },
/etc/td-agent/td-agent.conf 中 match piwiktracker.apache.access.store の type_name access_log と記述を合わせます。リレーショナルデータベースのテーブル名に相当するでしょう。
td-agent からは JSON 形式で elasticsearch にデータが渡されますが、オリジナルのデータがかきこまれるフィールドです。データ肥大を抑えるため、オリジナルのデータは蓄えないようにします。しかし副作用もあります。 Disabling the _source field
全部のフィールドの値がスペース区切りでぶち込まれます。データ肥大を抑えるため、機能を切ります。 _all field
"properties": { "@log_name": { "type": "string", "store": "true", "index": "not_analyzed" }, "@timestamp": { "type": "date", "store": "true", "format": "strict_date_optional_time||epoch_millis" },
/etc/td-agent/td-agent.conf 中 match piwiktracker.apache.access.store の tag_key の受け皿です。
/etc/td-agent/td-agent.conf 中 match piwiktracker.apache.access.store の logstash_format true とすると、@timestamp が付加され、そのための受け皿です。
"idn": { "type": "boolean", "store": "true" },
"piwikid": { "type": "string", "store": "true", "index": "not_analyzed" },
"ref": { "type": "multi_field", "fields": { "ref": { "type": "string", "index": "analyzed", "store": "true" }, "full": { "type": "string", "index": "not_analyzed", "store": "true" } } },
"action_name": { "type": "string", "analyzer": "kuromoji_analyzer", "store": "true" }
"path": { "type": "string" },
その他のフィールドは以上の説明のどこかに含まれるので省きます。