苏洋博客
网站首页
工作生活
编程记录
知识地图
文章存档
关于苏洋
关于本站
GitHub
折腾笔记
联系作者
文章列表
Tag: # Python
模型杂谈:使用 IN8 量化推理运行 Meta “开源泄露”的大模型(LLaMA)
2023年03月13日
LLaMA
,
Python
,
Docker
,
Linux
针对低显存设备运行 LLaMA 模型的需求,验证发现 PyLLaMA 方案虽能节省显存但 8GB 显卡仍无法直接运行。经测试,tloen/llama-int8 项目通过 INT8 量化可实现 7B 模型在 8GB 显存、13B 模型在 16
阅读全文
模型杂谈:快速上手元宇宙大厂 Meta “开源泄露”的大模型(LLaMA)
2023年03月09日
LLaMA
,
Python
,
Docker
,
Linux
介绍基于 Docker 低成本快速部署 Meta 开源大模型 LLaMA 的实践方案,涵盖模型文件下载与校验、NVIDIA PyTorch 容器环境构建、原版与社区优化版双镜像选择策略,以及显存资源消耗实测对比。
阅读全文
模型杂谈:遭遇“下架风波”的首个国产语言大模型元语(ChatYuan)
2023年03月05日
Chat Yuan
,
Python
,
Docker
,
Linux
元语(ChatYuan)作为首个引发广泛关注的国产语言大模型,上线后因宣传口径与实际能力落差陷入"下架风波"。
阅读全文
在搭载 M1 及 M2 芯片 MacBook设备上玩 Stable Diffusion 模型
2022年12月10日
Stable Diffusion
,
Silicon
,
Core ML
,
Python
,
Apple
,
macOS
,
Linux
介绍在搭载 Apple Silicon 芯片(M1/M2 系列)的 MacBook 设备上运行 Stable Diffusion 模型的完整方案。基于苹果官方开源项目 apple/ml-stable-diffusion,详细说明支持运行的设
阅读全文
使用 Docker 来快速上手中文 Stable Diffusion 模型:太乙
2022年12月09日
Docker
,
Stable Diffusion
,
Python
,
GPU
,
太乙
,
Ubuntu
,
Linux
介绍基于 Docker 快速部署 IDEA 研究院开源的中文 Stable Diffusion 模型"太乙"的完整方案。针对官方镜像存在的黑盒构建、PyTorch 版本过低、依赖冲突及 git 子模块配置等问题,重新封装了开箱即用的容器镜像
阅读全文
使用 Docker 和 HuggingFace 实现 NLP 文本情感分析应用
2022年09月30日
Docker
,
Python
,
HuggingFace
,
Ubuntu
,
Linux
介绍如何基于 Docker 和 HuggingFace 预训练模型快速构建 NLP 文本情感分析应用。通过组合 bert-base-uncased-emotion 英文情感分析模型与 novel-zh-en 中文翻译模型,解决中文数据在英文
阅读全文
向量数据库入坑:使用 Docker 和 Milvus 快速构建本地轻量图片搜索引擎
2022年09月24日
向量数据库
,
Milvus
,
Docker
,
Python
,
Node.js
,
Ubuntu
,
Linux
介绍基于 Docker 和 Milvus 构建本地轻量图片搜索引擎的完整方案。针对开源社区原有示例架构复杂、下载量大、部署繁琐等问题,提出三项核心优化策略:删除 MySQL 组件改用 Milvus 2.
阅读全文
向量数据库入坑:入门向量数据库 Milvus 的 Docker 工具镜像
2022年09月17日
向量数据库
,
Milvus
,
Docker
,
Python
,
Ubuntu
,
Linux
介绍如何快速上手向量数据库 Milvus 的 Docker 工具镜像,包含两步启动本地服务并运行示例程序的方法,以及数据持久化和端口暴露的配置技巧。详细解析了基于 Embedded Milvus 项目制作 210MB 精简镜像的技术过程,包
阅读全文
向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索
2022年09月10日
Faiss
,
向量数据库
,
Python
,
Golang
,
Node.js
,
Ubuntu
,
Linux
向量数据库与传统文本检索方式的对比分析,重点探讨基于 Faiss 的向量语义检索技术相对于传统方法的性能优势与局限性。文章通过 Golang 实现传统文本检索方案(包括 MySQL LIKE 操作符、全文检索及编辑距离算法),并与 Fais
阅读全文
向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss
2022年09月03日
Faiss
,
向量数据库
,
Python
,
Ubuntu
,
Linux
Faiss 是由 Meta AI 开源的高性能相似度检索库,专为海量向量数据的快速召回设计。文章系统介绍了其核心机制:通过构建索引(如 IndexFlatL2、IndexHNSW、IndexIVF 等)避免暴力遍历,在"搜广推"等场景中高效
阅读全文
««
«
1
2
3
4
5
»
»»