苏洋博客
网站首页
工作生活
编程记录
知识地图
文章存档
关于苏洋
关于本站
GitHub
折腾笔记
联系作者
文章列表
Tag: # Dify
使用小尺寸大模型和 Dify 清洗数据:Qwen 2.5 7B
2024年09月30日
Dify
,
Qwen
,
Docker
,
VLLM
,
Linux
介绍基于 Dify 和 Qwen 2.5 7B 模型构建低成本数据清洗流水线的技术方案。选用 Qwen2.5-7B-Instruct-GPTQ-Int4 量化版本,通过 Docker 部署 PyTorch 环境,借助 VLLM 实现单卡约
阅读全文
使用 Dify 和 AI 大模型理解视频内容:Qwen 2 VL 72B
2024年08月20日
Dify
,
Qwen
,
Python
,
Linux
介绍基于 Dify 平台与 Qwen2 VL 72B 多模态大模型解析视频内容的工程化方案。针对长视频受显存及解析长度限制的问题,提出通过 FFmpeg 提取关键帧、结合镜头边界检测与 K-means 聚类筛选代表性帧的技术路径,再经由 D
阅读全文
从零到一使用 Ollama、Dify 和 Docker 构建 Llama 3.1 模型服务
2024年07月28日
Dify
,
Ollama
,
Llama
,
llama.cpp
,
Docker
,
Linux
围绕 Ollama 官方未直接支持的模型及新版 llama.cpp 转换后的模型运行需求,详细阐述了基于 Docker 环境完成 Llama 3.1 模型服务的完整链路。内容涵盖通过 ModelScope 获取模型文件、拉取指定版本 Oll
阅读全文
使用字节豆包大模型在 Dify 上实现最简单的 Agent 应用(四):AI 信息检索
2024年05月22日
Dify
,
DouBao-Model
,
Meilisearch
,
Docker
,
Linux
介绍如何基于字节豆包大模型与 Dify 平台构建轻量级 AI Agent 应用,实现智能信息检索功能。内容涵盖火山方舟 2.0 模型开通、API 密钥与推理接入点配置、Dify 模型后端集成等完整流程,并详细说明将 Meilisearch
阅读全文
使用 Dify、Meilisearch、零一万物模型实现最简单的 RAG 应用(三):AI 电影推荐
2024年05月20日
Dify
,
Yi-Model
,
Meilisearch
,
Docker
,
Linux
介绍如何基于 Dify、Meilisearch 与零一万物大模型构建轻量级 RAG 应用,以 AI 电影推荐为实践场景。核心方案采用 Docker 一键部署 Dify 0.6.8 与 Meilisearch 搜索引擎,通过简单接口拼接实现数
阅读全文
使用 Dify 和 Moonshot API 做一个懒人 AI 阅读工具(二):轻量 RAG 应用
2024年04月25日
Dify
,
Moonshot
,
Docker
,
WordPress
,
Linux
介绍一种基于 Dify 和 Moonshot API 的轻量级 RAG 实现方案,用于解决长文本阅读与检索需求。针对传统 RAG 需配置 embedding 模型、向量数据库等复杂流程,该方案利用 Moonshot 128K 长上下文模型,
阅读全文
使用 Dify 和 Moonshot API 构建你的 AI 工作流(一):让不 AI 的应用 AI 化
2024年04月24日
Dify
,
Moonshot
,
Docker
,
WordPress
,
Linux
介绍基于 Dify v0.6.x 的 AI Workflow 功能与 Moonshot API 构建 AI 工作流的基础实践,涵盖 Docker 环境配置、WordPress 轻量化部署及完整验证环境的搭建方案,提供开箱即用的开源配置仓库,
阅读全文
使用 Dify 和 AWS Bedrock 玩转 Anthropic Claude 3
2024年03月18日
Claude
,
AWS Bedrock
,
Dify
,
Golang
,
Docker
,
Linux
基于 Dify 与 AWS Bedrock 集成 Anthropic Claude 3 模型的实践方案,解决了个人账号因多设备登录触发风控的问题。通过向 Dify 官方仓库提交代码适配,实现了基于 Docker 的快速部署,支持一键搭建 C
阅读全文
使用零一万物 200K 模型和 Dify 快速搭建模型应用
2024年03月13日
Yi-34B-Chat-200K
,
Yi-Model
,
Dify
,
Golang
,
Docker
,
Linux
文章介绍了基于零一万物 yi-34b-chat-200K 模型与 Dify 平台构建自动化电子书翻译方案的完整实践。核心思路是利用 200K 超长上下文窗口一次性处理整章内容,避免传统切分章节的繁琐流程;通过 Dify 快速完成 Promp
阅读全文