技术
生活见闻
关于
宝藏集结
分类
语言
English
Deutsch
Tech
2025-12-10 EverMemOS 框架如何处理记忆
2025-12-04 Does Reinforcement Learning Really Incentivize Reasoning Capacity in LLMs Beyond the Base Model
2025-11-27 人脑的记忆和Agent的记忆是完全不同的
2025-11-05 从零构建大模型—针对分类的微调
2025-11-03 读 AutoGen 论文
2025-11-01 从零构建大模型—通过微调遵循人类指令
2025-10-28 MiniMax Agent(M2)有惊喜也有失望
2025-10-17 月之暗面的OK Computer还可以更好
2025-10-10 算法工程师为什么一直对自己不满意
2025-10-01 姚顺雨博士答辩总结 Language Agents_Benchmarks, Methods and Frameworks
2025-09-21 从零构建大模型—文本生成策略
2025-09-14 从零构建大模型—在无监督数据上进行预训练
2025-09-11 Anthropic 做 Multi Agent 系统的工程经验(下)
2025-09-10 Anthropic 做 Multi Agent系统的工程经验(上)
2025-08-27 TRAE Agent 基于Agent的编程补丁生成与选择框架
2025-08-24 从零构建大模型-徒手组装GPT
2025-08-17 从零构建大模型——注意力机制
2025-07-26 论文阅读 LongCite Enabling LLMs to Generate Fine-grained Citations in Long-context QA
2025-07-02 GraphRAG实践
2025-06-26 论文阅读 Qwen3 Embedding
2025-06-16 Weaviate使用(四) RAG的两种处理方法
Single Prompt 和 Grouped Tasks
2025-06-15 Weaviate使用(三) 两种导入数据的方法
2025-06-14 Weaviate使用(二) 使用自定义模型
2025-06-13 论文阅读BGE-M3
Multi-Linguality, Multi-Functionality和Multi-Granularity
2025-06-12 Weaviate使用(一) 使用ollama启用大模型和向量模型
2024-05-25 用大模型理解爆火的KAN网络
KANs和MLPs在结构上是对偶的。在MLPs中,激活函数位于节点上;而在KANs中,激活函数位于边上。
2024-05-13 大型语言模型在「想」什么呢? — 浅谈大型语言模型的可解释性
大语言模型本身是黑箱,显然不是interpretable的。但是它有没有可能是explainable的呢?
2024-04-22 用大语言模型打造AI Agent
2024-04-14 让AI村民组成虚拟村庄会发生什么事
2024-04-13 大型语言模型修炼史(第三阶段)
2024-04-05 大型语言模型修炼史(第一、二阶段)
2024-03-05 改进量的期望 Expected Improvement
2024-02-03 Bayesian Optimization
2024-02-22 grobid的使用
2023-12-17 Gaussian Process Regression with GPyTorch
2023-12-10 Gaussian Process in Practice 高斯过程实践
2023-12-07 Kernel Function 核函数
2023-11-25 书籍 Bayesian Optimization Theory and Practice using Python 之Gaussian Process
2023-11-20 论文 Uncertainty Quantification in Machine Learning for Engineering Design and Health Prognostics
2023-07-20Redash V10安装(在Ubuntu系统上用docker部署安装)
2023-07-19Ubuntu上安装Docker
按照官网教程就可以了
2023-04-27GPU运行LLaMa模型——用HF的方式推理
很简单的运行LLaMa的方法
2023-03-05用随机梯度下降来优化人生【转载】
学以致用,拥有更好的人生
2023-03-01我都用chatGPT干了啥
谢谢你,chatGPT
2023-02-20 chatGPT有可能是个骗局吗
Impossible.
2023-02-16 如何理解Seq2seq
有encoder和decoder就可以说这是一个Seq2seq模型
2023-02-13 chatGPT 在攻陷所有人
chatGPT是划时代的杰作
2023-02-09 如何理解自注意力机制
Attention is all you need
2023-01-31 如何用HuggingFace对不均衡类别进行分类
如果用Trainer这个API,只要更新compute_loss方法就可以,如果是用pytorch写的训练代码或者用了huggingface accelerate模型,那么要更新自己模型的forward函数。
2022-12-10 HuggingFace的Dataset的使用
在数据上吃了很多苦头,数据不符合模型的要求,而造成模型跑不起来,debug的时候走了很多弯路,这样的事情发生了很多次! 所以特意把HuggingFace里面的数据类都学习一遍。
2022-10-24 在程序里起名有很多要注意的
好名字有预示作用
2022-08-02 用 HanLP 分词时如何自定义词典
用 hanlp 的效果比较好的粗粒度分词模型 COARSE_ELECTRA_SMALL_ZH 进行分析
Search
Results
No results found
Try adjusting your search query