苏洋博客
网站首页
工作生活
编程记录
知识地图
文章存档
关于苏洋
关于本站
GitHub
折腾笔记
联系作者
文章列表
Tag: # Transformers
本地运行面壁智能的“贺岁模型”:MiniCPM 2B
2024年02月02日
Transformers
,
CPM-Model
,
Python
,
Docker
,
Linux
面壁智能发布的 MiniCPM 2B 是一款可在端侧运行的小参数量语言模型,提供 SFT 与 DPO 两个版本。该模型基于 Docker 容器环境部署,采用 Nvidia 官方 PyTorch 镜像配合 Transformers、Gradi
阅读全文
使用 Transformers 量化 Meta AI LLaMA2 中文版大模型
2023年07月22日
LLaMA2
,
LLaMA
,
Transformers
,
HuggingFace
,
Python
,
Docker
,
Linux
介绍基于 HuggingFace Transformers 对 Meta AI LLaMA2 中文版大模型进行 4BIT 量化的完整方案,使模型显存占用从 13-14GB 降至约 5GB。核心方法是通过 Transformers 内置的 B
阅读全文