Categories
NLP
- » 旋转位置编码 (RoPE), 原理与应用
- » 深入理解 BERT, 并基于 BERT 实现 NLU
- » 基于集合的相似性度量算法
- » 词频-逆文档频率(TF-IDF)的计算
- » 计算词汇熵(基于词汇的信息熵)
- » 序列模型中什么是 Bidirectional
- » KL 散度的非对称性质
- » 基于潜在狄利克雷分配算法(LDA)实现长文档主题建模
- » 大模型权重量化学习笔记
- » 词嵌入模型(Embedding Model)是什么
RL
- » 时序差分方法 (TD)
- » 广义优势估计方法 (GAE)
- » RL中的奖励折扣机制
- » 现代强化学习-策略梯度算法学习
- » 强化学习中, 价值函数和优势函数分别是什么?
- » 强化学习发展史
- » 深入强化学习算法
Math
- » 深度学习中的权重正则化方法: Lasso/Ridge/ElasticNet
- » 深入逻辑回归模型
- » 深入线性回归模型, 最小二乘法和梯度下降法求解
- » 如何证明1+1=2?
- » 皮亚诺公理 (Peano's Axioms)
- » 困惑度和熵
DL
Top ⇈Agent
Top ⇈RecommenderSystem
Top ⇈Misc
- » 学习布隆过滤器