nlp
-
» LLM 生成(补全)阶段的 Neural Text Degeneration 检测算法设计: 缓解 Repetition Curse 问题
-
» Agent 长期记忆策略调研: MemoryOS, 首个智能体记忆系统
-
» 当前主流 AI 语言模型深入汇总对比
-
» Branch-Solve-Merge: 用并行的分治方法提高 LLM 生成质量
-
» 机器翻译进展追踪: TACTIC, 认知理论驱动的多代理翻译框架
-
» 来自微信团队的 DeepTrans: 自由(机器)翻译前沿进展调研
-
» 新手向: 语言模型训练算法简要总结
-
» 深入理解 LoRA 理论原理, 并基于 PyTorch 实现 LoRA 模块
-
» RAG 技术调研: RAPTOR 算法 (基于递归聚类-摘要-树结构, 解决整合长文档的离散块语义关联问题)
-
» 如何微调 Gemini-2.5-Pro: 简明教程
-
» 西班牙语入门学习 1: 字母与发音
-
» Prompt4py, 程序化提示词模板框架
-
» 文本生成算法中, 采样与解码的基本原理: Top-K, Top-P, Temperature, Beam Search
-
» 机器翻译技术调研: ByteDance-Seed/Seed-X-PPO-7B, 超越 Gemini-2.5-Pro 的开源翻译小模型背后的训练管线与技术细节
-
» Paper 追踪: Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning (上下文学习中示例在提示中的位置会影响生成性能)
-
» Paper 追踪: Attention is NOT all you need: Pure Attention Loses Rank Doubly Exponentially with Depth (深层自注意力网络的灾难性秩退化)
-
» 从 0 开始, 手搓一个 Transformer (Roformer) Encoder
-
» 技术调研 DEBATE: Devil's Advocate-Based Assessment and Text Evaluation
-
» 论文精读 Re³: Generating Longer Stories With Recursive Reprompting and Revision
-
» 技术调研 GROVE 框架: A Retrieval-augmented Complex Story Generation Framework with A Forest of Evidence
-
» 论文精读 STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation
-
» 深入理解 DPO: PPO 的对比学习平替
-
» 可控文本生成技术概述, 与 CTRL 方法论(模型)
-
» 基于 LLM 的内容自动化 Tagging 实践
-
» 论文精读 LongStory: Coherent, Complete and Length Controlled Long story Generation
-
» 旋转位置编码 (RoPE), 原理与应用
-
» 深入理解 BERT, 并基于 BERT 实现 NLU
-
» 深入对比学习,机器是如何学习到信息的向量表示的?
-
» 基于集合的相似性度量算法
-
» 词频-逆文档频率(TF-IDF)的计算
-
» 计算词汇熵(基于词汇的信息熵)
-
» 序列模型中什么是 Bidirectional
-
» KL 散度的非对称性质
-
» 基于潜在狄利克雷分配算法(LDA)实现长文档主题建模
-
» 困惑度和熵
-
» 词嵌入模型(Embedding Model)是什么
Top ⇈llm
-
» Fill-In-the-Middle Completion:让大语言模型补全文本中间缺口
-
» ML Agent:面向机器学习工程的 Hugging Face 代理运行时
-
» LLM 生成(补全)阶段的 Neural Text Degeneration 检测算法设计: 缓解 Repetition Curse 问题
-
» Atropos:面向语言模型强化学习的环境与 Rollout 框架
-
» OpenSpec 与 SDD:给不可靠的 AI 编程加上一层规格护栏
-
» 深入 Claude Code 源码:学会与你不信任的伙伴(LLM)共事
-
» Harness Engineering: 反馈闭环和熵治理, 构建可控的 LLM Agent
-
» 在中国境内使用 Claude Code, 简明教程
-
» 理解 Agent Skills 开放标准
-
» Agent 长期记忆策略调研: MemoryOS, 首个智能体记忆系统
-
» 当前主流 AI 语言模型深入汇总对比
-
» Branch-Solve-Merge: 用并行的分治方法提高 LLM 生成质量
-
» 机器翻译进展追踪: TACTIC, 认知理论驱动的多代理翻译框架
-
» 来自微信团队的 DeepTrans: 自由(机器)翻译前沿进展调研
-
» 新手向: 语言模型训练算法简要总结
-
» 深入理解 LoRA 理论原理, 并基于 PyTorch 实现 LoRA 模块
-
» RAG 技术调研: RAPTOR 算法 (基于递归聚类-摘要-树结构, 解决整合长文档的离散块语义关联问题)
-
» 如何微调 Gemini-2.5-Pro: 简明教程
-
» Prompt4py, 程序化提示词模板框架
-
» 文本生成算法中, 采样与解码的基本原理: Top-K, Top-P, Temperature, Beam Search
-
» 机器翻译技术调研: ByteDance-Seed/Seed-X-PPO-7B, 超越 Gemini-2.5-Pro 的开源翻译小模型背后的训练管线与技术细节
-
» Paper 追踪: Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning (上下文学习中示例在提示中的位置会影响生成性能)
-
» 技术调研 DEBATE: Devil's Advocate-Based Assessment and Text Evaluation
-
» 论文精读 Re³: Generating Longer Stories With Recursive Reprompting and Revision
-
» 论文精读 STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation
-
» 可控文本生成技术概述, 与 CTRL 方法论(模型)
-
» 基于 LLM 的内容自动化 Tagging 实践
-
» Autono: MCP 兼容性更新
-
» 强化学习发展史
-
» 困惑度和熵
-
» 深入强化学习算法
-
» 大模型权重量化学习笔记
-
» Autono: A ReAct-Based Highly Robust Autonomous Agent Framework
Top ⇈ai
Top ⇈deeplearning
Top ⇈machinelearning
Top ⇈rl
Top ⇈math
Top ⇈deeplearning
Top ⇈ai
Top ⇈agent
Top ⇈ppo
Top ⇈rlhf
Top ⇈agent
Top ⇈pg
-
» RL中的奖励折扣机制
-
» 现代强化学习-策略梯度算法学习
-
» 强化学习发展史
Top ⇈agentic-ai
Top ⇈agi
Top ⇈ceo-py
Top ⇈agentic-ai
Top ⇈agi
Top ⇈machinetranslation
Top ⇈rl
Top ⇈web
Top ⇈backend-developing
Top ⇈redis
Top ⇈cv
Top ⇈cnn
Top ⇈ac
Top ⇈imagegeneration
Top ⇈systems
-
» LRU 缓存算法原理与实现
Top ⇈promptengineering
Top ⇈language
Top ⇈rag
Top ⇈code-agent
Top ⇈claude-code
Top ⇈harness-engineering
Top ⇈spec-driven-development
Top ⇈code-agent
Top ⇈reinforcement-learning
Top ⇈grpo
Top ⇈ppo
Top ⇈gymnasium
Top ⇈stable-baselines3
Top ⇈atropos
Top ⇈decoding
Top ⇈neural-text-degeneration
Top ⇈z-algorithm
Top ⇈kmp
Top ⇈repetition-penalty
Top ⇈min-p-sampling
Top ⇈harness-engineering
Top ⇈machine-learning
Top ⇈hugging-face
Top ⇈mcp
Top ⇈litellm
Top ⇈fastapi
Top ⇈
Top ⇈fim
Top ⇈infilling
Top ⇈code-completion
Top ⇈deepseek
Top ⇈api
Top ⇈python
Top ⇈