从零手写Qwen系列大模型。本仓库从零开始使用python手写了 Qwen2 模型架构,Qwen2 系列包括 Qwen2-0.5B、1.5B、7B、72B 等模型。所有模型均可正常运行,可与之进行对话。
计算机视觉入门的保姆级项目。包括经典的传统计算机视觉算法和实操,基于 resnet50 AI 神经网络的算法学习和代码实操,不借助第三方库,从零手写 Resnet50 模型。和相关背景知识。 最后通过本仓库中的代码实战,从零手写 resnet50 神经网络,完成任意一张图片的识别,以及神经网络模型的性能优化。
Transformer 架构是目前主流 AI 大模型的核心。 本仓库是《Transformer通关秘籍》专栏的配套代码仓库。专栏围绕着 Transformer 这一架构,来拆解自然语言处理和 AI 大模型有关的背景、底层技术和算法原理。 在拆解的过程中,会有很多相关背景知识的介绍。阅读专栏,不仅可以对以 Transformer 架构为核心的大模型有一定的了解,还可以对大模型的底层细节和技术背景有更加深刻的认识。