文章列表

本地运行面壁智能的“贺岁模型”:MiniCPM 2B

面壁智能发布的 MiniCPM 2B 是一款可在端侧运行的小参数量语言模型,提供 SFT 与 DPO 两个版本。该模型基于 Docker 容器环境部署,采用 Nvidia 官方 PyTorch 镜像配合 Transformers、Gradi 阅读全文

使用 Transformers 量化 Meta AI LLaMA2 中文版大模型

介绍基于 HuggingFace Transformers 对 Meta AI LLaMA2 中文版大模型进行 4BIT 量化的完整方案,使模型显存占用从 13-14GB 降至约 5GB。核心方法是通过 Transformers 内置的 B 阅读全文