1、XiYan-SQL框架:提出了XiYan-SQL框架,它采用多生成器集成策略来增强生成候选SQL的能力。该框架结合了提示词工程(ICL)的巨大潜力和有监督的微调(SFT)方法的高可控性。
- 框架组件:XiYan-SQL框架由三个主要组件组成:Schema Linking、Candidate Generation和Candidate Selection。Schema Linking用于选择相关的列和值,减少无关信息的干扰;Candidate Generation模块生成潜在的候选SQL查询;Candidate Selection模块比较所有候选以确定最终的SQL查询
2、M-Schema:提出了一种新的数据库schema表示方法M-Schema,以半结构化的形式展示数据库、表和列之间的层次结构,增强了模型对数据库结构的理解能力。
3、训练策略:提出了一系列训练策略,通过微调模型生成具有不同偏好的高质量候选SQL查询。
4、候选生成和优化:XiYan-SQL结合了ICL和SFT方法来生成高质量和多样化的候选SQL查询,并通过Refiner进一步优化生成的SQL查询,纠正逻辑或语法错误。
5、候选选择:为了识别最佳候选,微调了一个选择模型,用于区分候选SQL查询之间的细微差别。