何为 painless

ElasticStack 在升级到 5.0 版本之后，带来了一个新的脚本语言，painless。这里说“新的“是相对与已经存在 groove 而言的。还记得 Groove 脚本的漏洞吧，Groove 脚本开启之后，如果被人误用可能带来各种漏洞，为什么呢，主要是这些外部的脚本引擎太过于强大，什么都能做，用不好或者设置不当就会引起安全风险，基于安全和性能方面，所以 elastic.co 开发了一个新的脚本引擎，名字就叫 Painless，顾名思义，简单安全，无痛使用，和 Groove 的沙盒机制不一样，Painless 使用白名单来限制函数与字段的访问，针对 es 的场景来进行优化，只做 es 数据的操作，更加轻量级，速度要快好几倍，并且支持 Java 静态类型，语法保持 Groove 类似，还支持 Java 的 lambda 表达式。

painless 的特性

painless可以用在所有可以使用 script 的场景下，并具有以下特性：

高性能：painless 在 es 的运行速度是其他语言的数倍。

安全：使用白名单来限制函数与字段的访问，避免了可能的安全隐患
可选类型：你可以在脚本当中使用强类型的编程方式或者动态类型的编程方式。
语法：扩展了 java 的基本语法以兼容 groove 风格的脚本语言特性，使得 plainless 易读易写
有针对的优化：这门语言是为 elasticsearch 专门定制的。

简单的例子

要了解这门东西，肯定要先看看它能做到什么才能激发起兴趣。先简单看一下例子，和各种 groove,python,js 们，没有什么区别，但要特别注意，使用强类型编程方式可以极大的加快运行速率

#动态类型的写法
def first = input.doc.first_name.0;

def last = input.doc.last_name.0;

return first + ” ” + last;

#强类型（10 倍速度于上面的动态类型）
String first = (String)((List)((Map)input.get(“doc”)).get(“first_name”)).get(0);

String last = (String)((List)((Map)input.get(“doc”)).get(“last_name”)).get(0);

return first + ” ” + last;

具体例子

初始化数据

我们先输入一串曲棍球的数据到 ES 当中。

PUT hockey/player/_bulk?refresh
{“index”:{“_id”:1}}
{“first”:”johnny”,”last”:”gaudreau”,”goals”:[9,27,1],”assists”:[17,46,0],”gp”:[26,82,1],”born”:”1993/08/13″}
{“index”:{“_id”:2}}
{“first”:”sean”,”last”:”monohan”,”goals”:[7,54,26],”assists”:[11,26,13],”gp”:[26,82,82],”born”:”1994/10/12″}
{“index”:{“_id”:3}}
{“first”:”jiri”,”last”:”hudler”,”goals”:[5,34,36],”assists”:[11,62,42],”gp”:[24,80,79],”born”:”1984/01/04″}
{“index”:{“_id”:4}}
{“first”:”micheal”,”last”:”frolik”,”goals”:[4,6,15],”assists”:[8,23,15],”gp”:[26,82,82],”born”:”1988/02/17″}
{“index”:{“_id”:5}}
{“first”:”sam”,”last”:”bennett”,”goals”:[5,0,0],”assists”:[8,1,0],”gp”:[26,1,0],”born”:”1996/06/20″}
{“index”:{“_id”:6}}
{“first”:”dennis”,”last”:”wideman”,”goals”:[0,26,15],”assists”:[11,30,24],”gp”:[26,81,82],”born”:”1983/03/20″}
{“index”:{“_id”:7}}
{“first”:”david”,”last”:”jones”,”goals”:[7,19,5],”assists”:[3,17,4],”gp”:[26,45,34],”born”:”1984/08/10″}
{“index”:{“_id”:8}}
{“first”:”tj”,”last”:”brodie”,”goals”:[2,14,7],”assists”:[8,42,30],”gp”:[26,82,82],”born”:”1990/06/07″}
{“index”:{“_id”:39}}
{“first”:”mark”,”last”:”giordano”,”goals”:[6,30,15],”assists”:[3,30,24],”gp”:[26,60,63],”born”:”1983/10/03″}
{“index”:{“_id”:10}}
{“first”:”mikael”,”last”:”backlund”,”goals”:[3,15,13],”assists”:[6,24,18],”gp”:[26,82,82],”born”:”1989/03/17″}
{“index”:{“_id”:11}}
{“first”:”joe”,”last”:”colborne”,”goals”:[3,18,13],”assists”:[6,20,24],”gp”:[26,67,82],”born”:”1990/01/30″}

这里极其建议在练习的时候使用 kibana 上的 Dev Tools，这个东西有多好用谁用谁知道，它可以自动补齐 es 的各种 query 语法，牛不牛？而且就像 markdown 一样，做到左右分屏，所见即所得。

这里写图片描述

用 painless 获取 doc 的值

下面的例子中，我们通过function_score::script_score更新每个 document 的 score。其中用到了for循环，和强类型定义int。
可以看到运行之后，_score 的值，编程了 goals 值的 sum。

这里写图片描述

以下是更多的取值的例子：

GET hockey/_search
{
“query”: {
“match_all”: {}
},
“script_fields”: {
“total_goals”: {
“script”: {
“lang”: “painless“,
“inline”: “int total = 0; for (int i = 0; i < doc[‘goals’].length; ++i) { total += doc[‘goals’][i]; } return total;”
}
}
}
}

GET hockey/_search
{
“query”: {
“match_all”: {}
},
“sort”: {
“_script”: {
“type”: “string”,
“order”: “asc”,
“script”: {
“lang”: “painless“,
“inline”: “doc[‘first.keyword’].value + ‘ ‘ + doc[‘last.keyword’].value”
}
}
}
}