llm
-
» InkOS 的记忆和状态实现
-
» InkOS:小说界的 Claude Code
-
» FlawedFictions 调研报告:用 Plot Hole Detection 评估语言模型的深层叙事推理
-
» Fill-In-the-Middle Completion:让大语言模型补全文本中间缺口
-
» ML Agent:面向机器学习工程的 Hugging Face 代理运行时
-
» LLM 生成(补全)阶段的 Neural Text Degeneration 检测算法设计: 缓解 Repetition Curse 问题
-
» Atropos:面向语言模型强化学习的环境与 Rollout 框架
-
» MemPalace: 启发式记忆检索与本地原文记忆系统
-
» OpenSpec 与 SDD:给不可靠的 AI 编程加上一层规格护栏
-
» 深入 Claude Code 源码:学会与你不信任的伙伴(LLM)共事
-
» Harness Engineering: 反馈闭环和熵治理, 构建可控的 LLM Agent
-
» 在中国境内使用 Claude Code, 简明教程
-
» 理解 Agent Skills 开放标准
-
» Agent 长期记忆策略调研: MemoryOS, 首个智能体记忆系统
-
» 当前主流 AI 语言模型深入汇总对比
-
» Branch-Solve-Merge: 用并行的分治方法提高 LLM 生成质量
-
» 机器翻译进展追踪: TACTIC, 认知理论驱动的多代理翻译框架
-
» 来自微信团队的 DeepTrans: 自由(机器)翻译前沿进展调研
-
» 新手向: 语言模型训练算法简要总结
-
» 深入理解 LoRA 理论原理, 并基于 PyTorch 实现 LoRA 模块
-
» RAG 技术调研: RAPTOR 算法 (基于递归聚类-摘要-树结构, 解决整合长文档的离散块语义关联问题)
-
» 如何微调 Gemini-2.5-Pro: 简明教程
-
» Prompt4py, 程序化提示词模板框架
-
» 文本生成算法中, 采样与解码的基本原理: Top-K, Top-P, Temperature, Beam Search
-
» 机器翻译技术调研: ByteDance-Seed/Seed-X-PPO-7B, 超越 Gemini-2.5-Pro 的开源翻译小模型背后的训练管线与技术细节
-
» Paper 追踪: Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning (上下文学习中示例在提示中的位置会影响生成性能)
-
» 技术调研 DEBATE: Devil's Advocate-Based Assessment and Text Evaluation
-
» 论文精读 Re³: Generating Longer Stories With Recursive Reprompting and Revision
-
» 论文精读 STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation
-
» 可控文本生成技术概述, 与 CTRL 方法论(模型)
-
» 基于 LLM 的内容自动化 Tagging 实践
-
» Autono: MCP 兼容性更新
-
» 强化学习发展史
-
» 困惑度和熵
-
» 深入强化学习算法
-
» 大模型权重量化学习笔记
-
» Autono: A ReAct-Based Highly Robust Autonomous Agent Framework
Top ⇈nlp
-
» LLM 生成(补全)阶段的 Neural Text Degeneration 检测算法设计: 缓解 Repetition Curse 问题
-
» Agent 长期记忆策略调研: MemoryOS, 首个智能体记忆系统
-
» 当前主流 AI 语言模型深入汇总对比
-
» Branch-Solve-Merge: 用并行的分治方法提高 LLM 生成质量
-
» 机器翻译进展追踪: TACTIC, 认知理论驱动的多代理翻译框架
-
» 来自微信团队的 DeepTrans: 自由(机器)翻译前沿进展调研
-
» 新手向: 语言模型训练算法简要总结
-
» 深入理解 LoRA 理论原理, 并基于 PyTorch 实现 LoRA 模块
-
» RAG 技术调研: RAPTOR 算法 (基于递归聚类-摘要-树结构, 解决整合长文档的离散块语义关联问题)
-
» 如何微调 Gemini-2.5-Pro: 简明教程
-
» 西班牙语入门学习 1: 字母与发音
-
» Prompt4py, 程序化提示词模板框架
-
» 文本生成算法中, 采样与解码的基本原理: Top-K, Top-P, Temperature, Beam Search
-
» 机器翻译技术调研: ByteDance-Seed/Seed-X-PPO-7B, 超越 Gemini-2.5-Pro 的开源翻译小模型背后的训练管线与技术细节
-
» Paper 追踪: Where to show Demos in Your Prompt: A Positional Bias of In-Context Learning (上下文学习中示例在提示中的位置会影响生成性能)
-
» Paper 追踪: Attention is NOT all you need: Pure Attention Loses Rank Doubly Exponentially with Depth (深层自注意力网络的灾难性秩退化)
-
» 从 0 开始, 手搓一个 Transformer (Roformer) Encoder
-
» 技术调研 DEBATE: Devil's Advocate-Based Assessment and Text Evaluation
-
» 论文精读 Re³: Generating Longer Stories With Recursive Reprompting and Revision
-
» 技术调研 GROVE 框架: A Retrieval-augmented Complex Story Generation Framework with A Forest of Evidence
-
» 论文精读 STORYTELLER: An Enhanced Plot-Planning Framework for Coherent and Cohesive Story Generation
-
» 深入理解 DPO: PPO 的对比学习平替
-
» 可控文本生成技术概述, 与 CTRL 方法论(模型)
-
» 基于 LLM 的内容自动化 Tagging 实践
-
» 论文精读 LongStory: Coherent, Complete and Length Controlled Long story Generation
-
» 旋转位置编码 (RoPE), 原理与应用
-
» 深入理解 BERT, 并基于 BERT 实现 NLU
-
» 深入对比学习,机器是如何学习到信息的向量表示的?
-
» 基于集合的相似性度量算法
-
» 词频-逆文档频率(TF-IDF)的计算
-
» 计算词汇熵(基于词汇的信息熵)
-
» 序列模型中什么是 Bidirectional
-
» KL 散度的非对称性质
-
» 基于潜在狄利克雷分配算法(LDA)实现长文档主题建模
-
» 困惑度和熵
-
» 词嵌入模型(Embedding Model)是什么
Top ⇈ai
Top ⇈deeplearning
Top ⇈machinelearning
Top ⇈rl
Top ⇈agent
Top ⇈math
Top ⇈agent
Top ⇈deeplearning
Top ⇈ai
Top ⇈python
Top ⇈ppo
Top ⇈rlhf
Top ⇈quant
Top ⇈ai-coding
Top ⇈llm
Top ⇈agentic-ai
Top ⇈pg
-
» RL中的奖励折扣机制
-
» 现代强化学习-策略梯度算法学习
-
» 强化学习发展史
Top ⇈agentic-ai
Top ⇈agi
Top ⇈harness-engineering
Top ⇈software-architecture
Top ⇈low-code
Top ⇈code-generation
Top ⇈code-agent
Top ⇈ceo-py
Top ⇈agi
Top ⇈machinetranslation
Top ⇈rl
Top ⇈reinforcement-learning
Top ⇈mcp
Top ⇈inkos
Top ⇈design-patterns
Top ⇈prompt-engineering
Top ⇈multi-agent
Top ⇈execution
Top ⇈etf
Top ⇈canvas
Top ⇈2d
Top ⇈threejs
Top ⇈webgl
Top ⇈3d
Top ⇈web
Top ⇈backend-developing
Top ⇈redis
Top ⇈cv
Top ⇈cnn
Top ⇈ac
Top ⇈imagegeneration
Top ⇈systems
-
» LRU 缓存算法原理与实现
Top ⇈promptengineering
Top ⇈language
Top ⇈rag
Top ⇈claude-code
Top ⇈harness-engineering
Top ⇈spec-driven-development
Top ⇈code-agent
Top ⇈memory
Top ⇈rag
Top ⇈chromadb
Top ⇈grpo
Top ⇈ppo
Top ⇈gymnasium
Top ⇈stable-baselines3
Top ⇈atropos
Top ⇈decoding
Top ⇈neural-text-degeneration
Top ⇈z-algorithm
Top ⇈kmp
Top ⇈repetition-penalty
Top ⇈min-p-sampling
Top ⇈machine-learning
Top ⇈hugging-face
Top ⇈litellm
Top ⇈fastapi
Top ⇈
Top ⇈fim
Top ⇈infilling
Top ⇈code-completion
Top ⇈deepseek
Top ⇈api
Top ⇈python
Top ⇈benchmark
Top ⇈narrative-reasoning
Top ⇈plot-hole-detection
Top ⇈flawedfictions
Top ⇈typescript
Top ⇈memory
Top ⇈state-machine
Top ⇈
Top ⇈amplication
Top ⇈nx
Top ⇈nestjs
Top ⇈graphql
Top ⇈gnn
Top ⇈graph-neural-network
Top ⇈finance
Top ⇈graph-learning
Top ⇈
Top ⇈machine-learning
Top ⇈software-engineering
Top ⇈context-engineering
Top ⇈tradingagents
Top ⇈quantitative-trading
Top ⇈financial-ai
Top ⇈langgraph
Top ⇈efinance
Top ⇈eastmoney
Top ⇈finance-data
Top ⇈skillos
Top ⇈agent-os
Top ⇈markdown
Top ⇈research
Top ⇈hwm
Top ⇈trading
Top ⇈alpha
Top ⇈backtesting
Top ⇈portfolio
Top ⇈risk-management
Top ⇈opentrade
Top ⇈codex
Top ⇈claude-code
Top ⇈technical-indicators
Top ⇈market-microstructure
Top ⇈institutional-flow
Top ⇈us-stocks
Top ⇈hk-stocks
Top ⇈a-shares
Top ⇈reflex
Top ⇈web-framework
Top ⇈react
Top ⇈state-management
Top ⇈funds
Top ⇈mutual-funds
Top ⇈reit
Top ⇈asset-allocation
Top ⇈investing
Top ⇈finance-education
Top ⇈指数
Top ⇈被动投资
Top ⇈全球市场
Top ⇈资产配置
Top ⇈graphics
Top ⇈web
Top ⇈前端
Top ⇈mmo
Top ⇈typescript
Top ⇈websocket
Top ⇈procedural-generation
Top ⇈game-architecture
Top ⇈blender
Top ⇈modeling
Top ⇈glb
Top ⇈fbx
Top ⇈phaser
Top ⇈game-engine
Top ⇈postercraft
Top ⇈flux
Top ⇈海报生成
Top ⇈扩散模型
Top ⇈视觉生成
Top ⇈文本渲染
Top ⇈codex
Top ⇈blender
Top ⇈3d
Top ⇈