@tochenzm
cc 暂无简介
原创 100+ 架构图,系统讲解大模型、强化学习,涵盖:LLM / VLM 等大模型原理、训练算法(RL、RLHF、GRPO、DPO、SFT 与 CoT 蒸馏等)、效果优化与 RAG 等
一个复现deepseek R1 训练过程的项目
一个 pdf 读取的项目
一个大模型推理的框架
一个 用于大模型 微调的框架
Kimi开源产品
最近一年贡献:2 次
最长连续贡献:2 日
最近连续贡献:2 日
贡献度的统计数据包括代码提交、创建任务 / Pull Request、合并 Pull Request,其中代码提交的次数需本地配置的 git 邮箱是 Gitee 帐号已确认绑定的才会被统计。