文章列表

使用小尺寸大模型和 Dify 清洗数据:Qwen 2.5 7B

, , , ,
介绍基于 Dify 和 Qwen 2.5 7B 模型构建低成本数据清洗流水线的技术方案。选用 Qwen2.5-7B-Instruct-GPTQ-Int4 量化版本,通过 Docker 部署 PyTorch 环境,借助 VLLM 实现单卡约 阅读全文

Docker 环境下使用 Traefik v3 和 MinIO 快速搭建私有化对象存储服务

, , , ,
基于 Docker 与 Traefik v3 网关,详细演示了 MinIO 私有化对象存储服务的搭建流程。内容涵盖环境准备、指定版本镜像拉取策略、基础容器启动配置,以及通过 Traefik 实现服务暴露与路由转发的完整实践,并提供了可直接复 阅读全文

Docker 环境下使用 Traefik 3 的最佳实践:快速上手

, , , ,
Traefik 3 正式版已发布,从 1.x 或 2.x 升级需注意配置兼容性问题。文章提供了一套开源基础配置方案,涵盖 Docker 环境准备、专用网络创建、HTTPS 证书配置等完整流程。证书支持两种方式:使用本地证书文件或通过 Let 阅读全文

便携移动工作站,端侧 AI 大模型设备折腾笔记:ROG 幻 X 和 4090 扩展坞

分享基于 ROG 幻 X Z13 平板与 ROG XG Mobile 4090 扩展坞搭建移动 AI 开发工作站的经验。设备采用 Intel 13900H + 4060 移动版(8G)+ 4090 移动版(16G)组合,兼顾便携性与算力需求 阅读全文

算能端侧 AI 盒子 Stable Diffusion 一秒一张图:AirBox BM1684X

算能 AirBox BM1684X 是一款基于端侧 AI 计算芯片的紧凑型设备,搭载 Tensor Computing Processor BM1684X 处理器,具备 32 TOPS 算力,支持 FP32、BF16、FP16、INT8 多 阅读全文

从零到一使用 Ollama、Dify 和 Docker 构建 Llama 3.1 模型服务

, , , , ,
围绕 Ollama 官方未直接支持的模型及新版 llama.cpp 转换后的模型运行需求,详细阐述了基于 Docker 环境完成 Llama 3.1 模型服务的完整链路。内容涵盖通过 ModelScope 获取模型文件、拉取指定版本 Oll 阅读全文

福布斯 AI 50 榜单中唯一开源向量数据库:Weaviate

福布斯2023 AI 50榜单中仅有两家向量数据库公司入选,Weaviate作为其中唯一的开源方案,与商业化闭源的Pinecone形成差异化竞争。该产品具备数据持久化与容错能力,支持混合搜索及水平扩展,同时保持轻量化设计,官方定位为AI时代 阅读全文

使用字节豆包大模型在 Dify 上实现最简单的 Agent 应用(四):AI 信息检索

介绍如何基于字节豆包大模型与 Dify 平台构建轻量级 AI Agent 应用,实现智能信息检索功能。内容涵盖火山方舟 2.0 模型开通、API 密钥与推理接入点配置、Dify 模型后端集成等完整流程,并详细说明将 Meilisearch 阅读全文

使用 Dify、Meilisearch、零一万物模型实现最简单的 RAG 应用(三):AI 电影推荐

, , , ,
介绍如何基于 Dify、Meilisearch 与零一万物大模型构建轻量级 RAG 应用,以 AI 电影推荐为实践场景。核心方案采用 Docker 一键部署 Dify 0.6.8 与 Meilisearch 搜索引擎,通过简单接口拼接实现数 阅读全文

Docker 加持的 安卓手机:随身携带的知识库(一)

, , ,
探索将旧安卓手机改造为本地化知识库的可行性方案,以五年前的K20 Pro为实验设备,通过解锁Bootloader、刷入定制Android镜像及修复Docker运行环境,实现无需联网的随身携带服务节点。 阅读全文