文章列表

便携移动工作站,端侧 AI 大模型设备折腾笔记:ROG 幻 X 和 4090 扩展坞

分享基于 ROG 幻 X Z13 平板与 ROG XG Mobile 4090 扩展坞搭建移动 AI 开发工作站的经验。设备采用 Intel 13900H + 4060 移动版(8G)+ 4090 移动版(16G)组合,兼顾便携性与算力需求 阅读全文

算能端侧 AI 盒子 Stable Diffusion 一秒一张图:AirBox BM1684X

算能 AirBox BM1684X 是一款基于端侧 AI 计算芯片的紧凑型设备,搭载 Tensor Computing Processor BM1684X 处理器,具备 32 TOPS 算力,支持 FP32、BF16、FP16、INT8 多 阅读全文

使用搭载骁龙 8 Gen 3 的安卓手机运行 AI 大模型

介绍在搭载骁龙 8 Gen 3 的安卓手机上免 Root、免解锁运行 AI 大模型的方案,涵盖 MLC Chat、MiniCPM 等开源工具部署英文模型(Llama2 7B、Mistral 7B、Gemma 2B 等)、中文模型(面壁 Mi 阅读全文

Stable Diffusion XL Turbo 文生图和图生图实践

介绍基于 Docker 快速部署 Stable Diffusion XL Turbo 模型的完整实践流程,涵盖环境配置、模型下载与验证、文生图及图生图推理程序编写等核心环节。该模型通过对抗扩散蒸馏技术实现实时图像生成,相较 LCM 性能提升 阅读全文

使用 Docker 和 Diffusers 快速上手 Stable Video Diffusion 图生视频大模型

介绍基于 Docker 与 Diffusers 工具包部署 Stable Video Diffusion 图生视频模型的完整流程。涵盖环境构建、Nvidia 镜像 OpenCV 依赖修正、模型下载与校验、推理程序编写及 Gradio 界面启 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 GFPGAN

Stable Diffusion WebUI 中的 GFPGAN 是腾讯开源的人脸修复模型,基于 GAN 网络与预训练技术实现面部细节恢复。该模型通过退化去除模块、StyleGAN 生成及通道分割空间特征变换等技术,结合重建损失、对抗损失、 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 CodeFormer

Stable Diffusion WebUI 中的 CodeFormer 是一款基于 Transformer 的人脸图像修复模型,由 sczhou 团队开发并于 2022 年被 NeurIPS 接收。 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 VAE

Stable Diffusion WebUI 中 VAE 作为核心组件承担图像压缩与解压缩职能,推理时充当解码器还原潜在空间数据为像素图像,训练时则作为编码器将图片转换为低维向量。主流模型包括 Stability AI 推出的 EMA 与 阅读全文

基于 Docker 的深度学习环境:Windows 篇

介绍在 Windows 11 环境下配置 Docker 深度学习环境的完整流程,涵盖 Docker 安装、WSL2 部署与升级、默认版本切换至 WSL2 等关键步骤,并验证 Docker 容器对 NVIDIA GPU 的调用能力。 阅读全文

使用 Docker 快速上手 Stability AI 的 SDXL 1.0 正式版

介绍基于 Docker 本地部署 Stability AI 开源图片生成模型 SDXL 1.0 的完整实践方案,涵盖运行环境准备、模型文件获取、容器镜像构建与运行等关键步骤。提供预构建镜像与手动构建两种途径,支持基础绘图、精炼优化及超分辨率 阅读全文