text2sql论文07-natsql:Making SQL Easier to Infer from Natural Language Specifications


背景

提出了一种更好的SQL 表示, 降低了自然语言和SQL语言之间的GAP,让模型可以更好的进行训练和推断

方法

1、消除了GROUP BY, HAVING, FROM, JOIN ON这些语句,仅仅保留了 SELECT,WHERE,ORDER BY

2、消除了 SET, UNION, EXCEPT. 等语句, 并且消除了嵌套语句。

3、减少了需要的 schema 数量,使得schema-linking 更加简单。

4、同时由于本文的value只存在于where语句中,可以限制按照顺序生成,

结果

这种表示方法容易生成比较高执行准确率的模型。 最终效果,在执行准确率和exact match 都有提升,尤其在执行准确率上取得了SOTA效果