Tech

2025-12-10 EverMemOS 框架如何处理记忆

2025-12-04 Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model

2025-11-27 人脑的记忆和Agent的记忆是完全不同的

2025-11-05 从零构建大模型—针对分类的微调

2025-11-03 读 AutoGen 论文

2025-11-01 从零构建大模型—通过微调遵循人类指令

2025-10-28 MiniMax Agent（M2）有惊喜也有失望

2025-10-17 月之暗面的OK Computer还可以更好

2025-10-10 算法工程师为什么一直对自己不满意

2025-10-01 姚顺雨博士答辩总结 Language Agents_Benchmarks, Methods and Frameworks

2025-09-21 从零构建大模型—文本生成策略

2025-09-14 从零构建大模型—在无监督数据上进行预训练

2025-09-11 Anthropic 做 Multi Agent 系统的工程经验（下）

2025-09-10 Anthropic 做 Multi Agent系统的工程经验（上）

2025-08-27 TRAE Agent 基于Agent的编程补丁生成与选择框架

2025-08-24 从零构建大模型-徒手组装GPT

2025-08-17 从零构建大模型——注意力机制

2025-07-26 论文阅读 LongCite Enabling LLMs to Generate Fine-grained Citations in Long-context QA

2025-07-02 GraphRAG实践

2025-06-26 论文阅读 Qwen3 Embedding

2025-06-16 Weaviate使用（四） RAG的两种处理方法

Single Prompt 和 Grouped Tasks

2025-06-15 Weaviate使用（三）两种导入数据的方法

2025-06-14 Weaviate使用（二）使用自定义模型

2025-06-13 论文阅读BGE-M3

Multi-Linguality, Multi-Functionality和Multi-Granularity

2025-06-12 Weaviate使用（一）使用ollama启用大模型和向量模型

2024-05-25 用大模型理解爆火的KAN网络

KANs和MLPs在结构上是对偶的。在MLPs中，激活函数位于节点上；而在KANs中，激活函数位于边上。

2024-05-13 大型语言模型在「想」什么呢？ — 浅谈大型语言模型的可解释性

大语言模型本身是黑箱，显然不是interpretable的。但是它有没有可能是explainable的呢？

2024-04-22 用大语言模型打造AI Agent

2024-04-14 让AI村民组成虚拟村庄会发生什么事

2024-04-13 大型语言模型修炼史（第三阶段）

2024-04-05 大型语言模型修炼史（第一、二阶段）

2024-03-05 改进量的期望 Expected Improvement

2024-02-03 Bayesian Optimization

2024-02-22 grobid的使用

2023-12-17 Gaussian Process Regression with GPyTorch

2023-12-10 Gaussian Process in Practice 高斯过程实践

2023-12-07 Kernel Function 核函数

2023-11-25 书籍 Bayesian Optimization Theory and Practice using Python 之Gaussian Process

2023-11-20 论文 Uncertainty Quantification in Machine Learning for Engineering Design and Health Prognostics

2023-07-20Redash V10安装（在Ubuntu系统上用docker部署安装）

2023-07-19Ubuntu上安装Docker

按照官网教程就可以了

2023-04-27GPU运行LLaMa模型——用HF的方式推理

很简单的运行LLaMa的方法

2023-03-05用随机梯度下降来优化人生【转载】

学以致用，拥有更好的人生

2023-03-01我都用chatGPT干了啥

谢谢你，chatGPT

2023-02-20 chatGPT有可能是个骗局吗

2023-02-16 如何理解Seq2seq

有encoder和decoder就可以说这是一个Seq2seq模型

2023-02-13 chatGPT 在攻陷所有人

chatGPT是划时代的杰作

2023-02-09 如何理解自注意力机制

Attention is all you need

2023-01-31 如何用HuggingFace对不均衡类别进行分类

如果用Trainer这个API，只要更新compute_loss方法就可以，如果是用pytorch写的训练代码或者用了huggingface accelerate模型，那么要更新自己模型的forward函数。

2022-12-10 HuggingFace的Dataset的使用

在数据上吃了很多苦头，数据不符合模型的要求，而造成模型跑不起来，debug的时候走了很多弯路，这样的事情发生了很多次！所以特意把HuggingFace里面的数据类都学习一遍。

2022-10-24 在程序里起名有很多要注意的

好名字有预示作用

2022-08-02 用 HanLP 分词时如何自定义词典

用 hanlp 的效果比较好的粗粒度分词模型 COARSE_ELECTRA_SMALL_ZH 进行分析