deepseek R1 思维链微调 | chain of thought | cot
多模态论文串讲·上【论文精读·46】
适合新手的 100TB 数据存储方案【100亿模型计划】
AlphaFold 2 论文精读【论文精读】
Chain-of-thought,CoT 介绍,大模型提示工程技巧
CLIP 改进工作串讲(下)【论文精读·42】
Chain of Thought & Tree of Thought 方法简介
Llama 3.1论文精读 · 4. 训练infra【论文精读·54】
MAE 论文逐段精读【论文精读】
o1链式思维原理解读
大模型时代下做科研的四个思路【论文精读·52】
InstructGPT 论文精读【论文精读·48】
Swin Transformer论文精读【论文精读】
【论文讲解】Tree of Thoughts:如何使用大语言模型有意识地解决问题(附论文链接和代码)
DALL·E 2(内含扩散模型介绍)【论文精读】
多模态论文串讲·下【论文精读·49】
在讲 OpenAI Whisper 前先做了一个剪视频小工具【论文精读·44】
讲好故事、论点【研究的艺术·三】
Neural Corpus Indexer 文档检索【论文精读·47】
参数服务器(Parameter Server)逐段精读【论文精读】