文章列表

模型杂谈:使用 IN8 量化推理运行 Meta “开源泄露”的大模型(LLaMA)

, , ,
针对低显存设备运行 LLaMA 模型的需求,验证发现 PyLLaMA 方案虽能节省显存但 8GB 显卡仍无法直接运行。经测试,tloen/llama-int8 项目通过 INT8 量化可实现 7B 模型在 8GB 显存、13B 模型在 16 阅读全文

模型杂谈:快速上手元宇宙大厂 Meta “开源泄露”的大模型(LLaMA)

, , ,
介绍基于 Docker 低成本快速部署 Meta 开源大模型 LLaMA 的实践方案,涵盖模型文件下载与校验、NVIDIA PyTorch 容器环境构建、原版与社区优化版双镜像选择策略,以及显存资源消耗实测对比。 阅读全文

模型杂谈:遭遇“下架风波”的首个国产语言大模型元语(ChatYuan)

, , ,
元语(ChatYuan)作为首个引发广泛关注的国产语言大模型,上线后因宣传口径与实际能力落差陷入"下架风波"。 阅读全文

在搭载 M1 及 M2 芯片 MacBook设备上玩 Stable Diffusion 模型

介绍在搭载 Apple Silicon 芯片(M1/M2 系列)的 MacBook 设备上运行 Stable Diffusion 模型的完整方案。基于苹果官方开源项目 apple/ml-stable-diffusion,详细说明支持运行的设 阅读全文

使用 Docker 来快速上手中文 Stable Diffusion 模型:太乙

介绍基于 Docker 快速部署 IDEA 研究院开源的中文 Stable Diffusion 模型"太乙"的完整方案。针对官方镜像存在的黑盒构建、PyTorch 版本过低、依赖冲突及 git 子模块配置等问题,重新封装了开箱即用的容器镜像 阅读全文

使用 Docker 和 HuggingFace 实现 NLP 文本情感分析应用

, , , ,
介绍如何基于 Docker 和 HuggingFace 预训练模型快速构建 NLP 文本情感分析应用。通过组合 bert-base-uncased-emotion 英文情感分析模型与 novel-zh-en 中文翻译模型,解决中文数据在英文 阅读全文

向量数据库入坑:使用 Docker 和 Milvus 快速构建本地轻量图片搜索引擎

介绍基于 Docker 和 Milvus 构建本地轻量图片搜索引擎的完整方案。针对开源社区原有示例架构复杂、下载量大、部署繁琐等问题,提出三项核心优化策略:删除 MySQL 组件改用 Milvus 2. 阅读全文

向量数据库入坑:入门向量数据库 Milvus 的 Docker 工具镜像

介绍如何快速上手向量数据库 Milvus 的 Docker 工具镜像,包含两步启动本地服务并运行示例程序的方法,以及数据持久化和端口暴露的配置技巧。详细解析了基于 Embedded Milvus 项目制作 210MB 精简镜像的技术过程,包 阅读全文

向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索

向量数据库与传统文本检索方式的对比分析,重点探讨基于 Faiss 的向量语义检索技术相对于传统方法的性能优势与局限性。文章通过 Golang 实现传统文本检索方案(包括 MySQL LIKE 操作符、全文检索及编辑距离算法),并与 Fais 阅读全文

向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss

, , , ,
Faiss 是由 Meta AI 开源的高性能相似度检索库,专为海量向量数据的快速召回设计。文章系统介绍了其核心机制:通过构建索引(如 IndexFlatL2、IndexHNSW、IndexIVF 等)避免暴力遍历,在"搜广推"等场景中高效 阅读全文