算法笔记

分享技能,记录生活,刷题笔记

  • 首页
  • 信息时代
    • 地理信息
    • python
    • easticsearch
    • NLP
    • Linux
  • 生活/情感
  • 数据集
  • 刷题笔记
  • 算法手撕
  • 论文阅读
    • 实体识别-ner
    • 大模型-llm
    • text2sql-文本转sql
  • 文章归档

text2sql论文16:sql reasoning rewards text reward tailored grpo partial schema reinforcement

46 views

论文通过以下方法解决如何提升大型语言模型(LLMs)在Text-to-SQL任务中的推理能力和准确性问题:

1. 提出Reasoning-SQL框架

  • 强化学习(RL)框架:论文提出了一个基于强...

Read more

发布于 text2sql-文本转sql 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-10-23

Qwen2.5-VL:图片处理成token

117 views

  • Qwen2.5-VL
def _preprocess(
        self,
        images: Union[ImageInput, VideoInput],
      ...

Read more

发布于 大模型-llm 并标记为 NLP , python .由 coming 在 2025-10-01

text2sql论文15:You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL

128 views

论文总结来源kimi大模型 papers.cool

Q1: 这篇论文试图解决什么问题?

这篇论文提出了一个名为You Only Read Once (YORO)的新范式,旨在解决文本到SQL(...

Read more

发布于 text2sql-文本转sql .由 coming 在 2025-09-16

MOE-算法

148 views

from torch import nn
import torch.nn.functional as F
import torch
import math

class MoELayer(nn....

Read more

发布于 算法手撕 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-09-05

手撕PPO

13 views

import torch
import torch.nn as nn
import torch.nn.functional as F
from transformers import GPT2L...

Read more

发布于 算法手撕 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-06-19

实现 strStr() 函数-KMP

303 views

实现 strStr() 函数。

给定一个 haystack 字符串和一个 needle 字符串,在 haystack 字符串中找出 needle 字符串出现的第一个位置 (从0开始)。如果不存在...

Read more

发布于 刷题笔记 并标记为 python .由 coming 在 2025-06-18

手撕Softmax

12 views

# softmax

import torch

# X = torch.tensor([-0.3, 0.2, 0.5, 0.7, 0.1, 0.8])
# X_exp_sum = X.exp(...

Read more

发布于 算法手撕 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-06-12

手撕selfAttention和MHA

367 views

from torch import nn
import torch.nn.functional as F
import torch
import math


class SelfAttenti...

Read more

发布于 算法手撕 并标记为 NLP , python , 机器学习 .由 coming 在 2025-06-11

DPO、PPO和GRPO的伪代码loss计算

365 views

1.1 PPO 的关键角色

  • 策略(LLM):我们正在训练的 LLM,用于生成更好的文本。
  • 奖励模型:根据人类偏好对文本打分的 AI 裁判。
  • 价值函数(辅助教练):另一个 AI 模型,充当“辅助...

Read more

发布于 大模型-llm 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-06-11

手撕flash_attention

12 views

import torch
from einops import rearrange

NEG_INF = -1e10  # -infinity
EPSILON = 1e-10

Q_LEN = ...

Read more

发布于 算法手撕 并标记为 NLP , python , 机器学习 , 自然语言处理 .由 coming 在 2025-06-04

文章导航

← 早期文章

Views

  • GEE学习笔记(25): 植被指数的计算(2)-窄带绿度 - 3069 views
  • GEE学习笔记(24): 植被指数的计算(1)-宽带绿度 - 2546 views
  • 正弦位置编码 - 2412 views
  • 客户端连接远程服务器的Jupyter - 2330 views
  • GEE学习笔记(23): 通过阈值法对水体信息进行提取 - 2181 views
  • word2vector-情感分析demo - 2179 views
  • GEE学习笔记(20): 统计不同土地利用类型的面积 - 1963 views
  • DjangoBlog-部署记录 - 1882 views
  • 牛客网-NC140 排序 - 1854 views
  • N-gram简单有效的统计语言模型 - 1845 views

分类目录

  • 信息时代
  • 生活/情感
  • 地理信息
  • python
  • easticsearch
  • NLP
  • 数据集
  • 刷题笔记
  • Linux
  • 算法手撕
  • 论文阅读
  • 实体识别-ner
  • 大模型-llm
  • text2sql-文本转sql

近期文章

  • text2sql论文16:sql reasoning rewards text reward tailored grpo partial schema reinforcement
  • Qwen2.5-VL:图片处理成token
  • text2sql论文15:You Only Read Once (YORO): Learning to Internalize Database Knowledge for Text-to-SQL
  • MOE-算法
  • 手撕PPO
  • 实现 strStr() 函数-KMP
  • 手撕Softmax
  • 手撕selfAttention和MHA
  • DPO、PPO和GRPO的伪代码loss计算
  • 手撕flash_attention

标签云

自然语言处理 python 地理 NLP matlab GEE 机器学习

欢迎您STAR或者FORK本站源代码

GitHub stars GitHub forks

功能

  • 管理站点
  • 登录
  • GitBook
Copyright© 2025  算法笔记  |  SiteMap  |  RSS Feed  |  友情链接 |  Hosting On  Linode |  百度统计
Powered by Django  |  liangliangyy | lylinux | 本页面加载耗时:0.531s

浙ICP备2022004686号-1