Years

2026

2026-01-16 » 当前主流 AI 语言模型深入汇总对比

2025

2025-12-21 » Branch-Solve-Merge: 用并行的分治方法提高 LLM 生成质量
2025-10-27 » 机器翻译进展追踪: TACTIC, 认知理论驱动的多代理翻译框架
2025-10-22 » 来自微信团队的 DeepTrans: 自由(机器)翻译前沿进展调研
2025-10-16 » 新手向: 语言模型训练算法简要总结
2025-10-13 » 深入理解 LoRA 理论原理, 并基于 PyTorch 实现 LoRA 模块
2025-09-23 » RAG 技术调研: RAPTOR 算法 (基于递归聚类-摘要-树结构, 解决整合长文档的离散块语义关联问题)
2025-09-20 » 如何微调 Gemini-2.5-Pro: 简明教程
2025-09-12 » 西班牙语入门学习 1: 字母与发音
2025-09-09 » Prompt4py, 程序化提示词模板框架
2025-08-26 » 基于 Stable Baselines3 和 Gymnasium 的强化学习 (PPO) 算法实践
2025-08-18 » 文本生成算法中, 采样与解码的基本原理: Top-K, Top-P, Temperature, Beam Search
2025-08-16 » 机器翻译技术调研: ByteDance-Seed/Seed-X-PPO-7B, 超越 Gemini-2.5-Pro 的开源翻译小模型背后的训练管线与技术细节
2025-08-13 » Paper 追踪: Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning (上下文学习中示例在提示中的位置会影响生成性能)
2025-08-12 » Paper 追踪: Attention is NOT all you need: Pure Attention Loses Rank Doubly Exponentially with Depth (深层自注意力网络的灾难性秩退化)
2025-07-30 » 从 0 开始, 手搓一个 Transformer (Roformer) Encoder
2025-07-26 » LRU 缓存算法原理与实现
2025-07-22 » 技术调研 DEBATE: Devil's Advocate-Based Assessment and Text Evaluation
2025-07-18 » 论文精读 Re³: Generating Longer Stories With Recursive Reprompting and Revision
2025-07-17 » 机器学习数学基础: 理解对数几率 (Logit 函数)
2025-07-17 » 技术调研 GROVE 框架: A Retrieval-augmented Complex Story Generation Framework with A Forest of Evidence
2025-07-09 » 论文精读 STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation
2025-07-02 » 深入理解 DPO: PPO 的对比学习平替
2025-06-12 » 可控文本生成技术概述, 与 CTRL 方法论(模型)
2025-06-07 » 基于 LLM 的内容自动化 Tagging 实践
2025-06-04 » 论文精读 LongStory: Coherent, Complete and Length Controlled Long story Generation
2025-05-22 » 旋转位置编码 (RoPE), 原理与应用
2025-05-08 » 深度学习中的权重正则化方法: Lasso/Ridge/ElasticNet
2025-04-30 » 深入理解 BERT, 并基于 BERT 实现 NLU
2025-04-26 » 深入对比学习，机器是如何学习到信息的向量表示的？
2025-04-22 » 深入逻辑回归模型
2025-04-21 » 深入线性回归模型, 最小二乘法和梯度下降法求解
2025-04-20 » 皮亚诺公理 (Peano's Axioms)
2025-04-19 » 推荐系统的不同类型-Overview
2025-04-16 » VAE, 变分自编码器
2025-04-15 » 基于集合的相似性度量算法
2025-04-14 » 词频-逆文档频率(TF-IDF)的计算
2025-04-11 » 计算词汇熵(基于词汇的信息熵)
2025-04-11 » 序列模型中什么是 Bidirectional
2025-04-11 » KL 散度的非对称性质
2025-04-10 » 基于潜在狄利克雷分配算法(LDA)实现长文档主题建模
2025-04-09 » 什么是推荐系统 (1)
2025-03-31 » 时序差分方法 (TD)
2025-03-31 » 广义优势估计方法 (GAE)
2025-03-29 » Autono: MCP 兼容性更新
2025-03-27 » RL中的奖励折扣机制
2025-03-26 » 现代强化学习-策略梯度算法学习
2025-03-26 » 强化学习中, 价值函数和优势函数分别是什么?
2025-03-25 » 强化学习发展史
2025-03-19 » 困惑度和熵
2025-03-14 » 深入强化学习算法
2025-03-03 » 分类任务中的投票算法
2025-02-24 » 大模型权重量化学习笔记

2024

2024-10-25 » Autono: A ReAct-Based Highly Robust Autonomous Agent Framework
2024-09-27 » 深度学习-梯度不稳定-学习笔记
2024-09-23 » 词嵌入模型(Embedding Model)是什么
2024-08-05 » MINI XCEPTION 模型学习
2024-06-19 » 学习布隆过滤器

Top ⇈