text2sql论文08-T5-SR:A Unified Seq-to-Seq Decoding Strategy for Semantic Parsing


背景

将自然语言查询转换为 SQL 语句的序列到序列(seq2seq)方法近年来备受关注。然而,与基于抽象语法树的 SQL 生成相比,seq2seq 语义解析器面临着更多挑战,包括在模式信息预测方面的质量较差,以及自然语言查询与 SQL 语句之间的语义连贯性不足。。

方法

本文分析了上述困难,并提出了一种面向 seq2seq 的解码策略,称为 SR。该策略包括一个新的中间表示 SSQL 以及一个带有分数重估器的重排序方法,以分别解决上述障碍。实验结果表明,提出的技术是有效的,T5-SR-3b 在 Spider 数据集上达到了sota

结果