文章列表

使用 Docker 和 Diffusers 快速上手 Stable Video Diffusion 图生视频大模型

介绍基于 Docker 与 Diffusers 工具包部署 Stable Video Diffusion 图生视频模型的完整流程。涵盖环境构建、Nvidia 镜像 OpenCV 依赖修正、模型下载与校验、推理程序编写及 Gradio 界面启 阅读全文

修复 OpenCV 依赖错误的小工具:OpenCV Fixer

, , ,
OpenCV Fixer 是一款用于自动修复 OpenCV 依赖兼容性问题的开源工具,可解决因旧版本 opencv 与 numpy 版本冲突导致的 `module 'cv2.dnn' has no attribute 'DictValue' 阅读全文

改善 GitHub Pages 阅读体验:Quick Docs

, , ,
Quick Docs 是一款不足 10MB 的开源工具,旨在解决 GitHub Pages 文档访问缓慢、加载中断影响开发效率的问题。该工具支持通过二进制文件或 Docker 容器快速部署本地文档服务,默认监听 8080 端口,可将多个项目 阅读全文

完善 Golang Gin 框架的静态中间件:Gin-Static

, , ,
针对 Golang Gin 框架原生静态文件处理在根目录部署、通配符路由及动态逻辑共存等场景的局限,以及对社区停滞维护的 gin-contrib/static 中间件进行功能升级与代码完善,推出了开源项目 soulteary/gin-sta 阅读全文

中文版大模型 Token 成本计算器

, ,
开源轻量工具 ai-token-calculator,约 10MB,基于 OpenAI 官方 tokenizer 汉化封装,用于直观计算大模型 API 的 Token 数量与使用成本。支持直接运行可执行文件、Docker 及 Docker 阅读全文

CPU 混合推理,非常见大模型量化方案:“二三五六” 位量化

, , , , ,
基于 llama.cpp 框架介绍非常见整数位量化方案,涵盖 2、3、5、6 位等非标准位数量化技术。详细说明 GGUF 格式转换流程,包括使用 convert.py 将 PyTorch/Safetensors 模型转为 F16 中间格式, 阅读全文

零一万物模型折腾笔记:官方 Yi-34B 模型基础使用

, , , , ,
基于实践测试,对零一万物官方 Yi-34B 及 Yi-34B-200K 模型的本地部署与基础使用进行客观记录。涵盖 Docker 与裸机两种环境配置、模型文件获取方式、硬件资源需求分析,重点验证模型在默认参数下的文本生成表现,包括指令遵循能 阅读全文

本地运行“李开复”的零一万物 34B 大模型

, , , , ,
零一万物34B大模型本地部署方案详解,针对该模型量化后约24GB显存占用易触发内存溢出的问题,提出基于llama.cpp的CPU与GPU混合推理方案。通过Docker构建NVIDIA PyTorch运行环境,利用gguf格式模型与GPU层卸 阅读全文

使用 Redis 构建轻量的向量数据库应用:图片搜索引擎(二)

文章延续前篇,继续介绍基于 Redis 构建轻量级向量数据库的图片搜索引擎实现方案。重点阐述如何利用 OpenAI Clip 模型的文本-图像关联能力,通过两种文本交互方式扩展搜索功能:一是借助分类检测能力进行内容安全风控,通过关键词列表与 阅读全文

使用 Redis 构建轻量的向量数据库应用:图片搜索引擎(一)

探讨基于 Redis 构建轻量级本地图片搜索引擎的技术实践,采用 Docker 容器化部署方案,结合 OpenAI CLIP 模型实现图片特征提取与向量化存储。针对万级图片数据集,使用稠密向量检索方式完成搜索,总耗时低于十分之一秒。 阅读全文