文章列表

开源软件 FFmpeg 生成模型使用图片数据集

, , ,
开源软件FFmpeg可将视频文件高效转换为高质量图片数据集,适用于构建机器学习训练数据或壁纸集合。通过调整帧率参数控制输出密度,配合图片压缩与缩放策略,能在保证画面代表性的同时显著降低存储占用。以电影《流浪地球2》为例,按每秒提取一帧可生成 阅读全文

廉价的全闪存雷电 NAS 折腾笔记:NUC9 操作系统踩坑

基于 NUC9i5QNX 构建低成本全闪存雷电 NAS 的实操记录,涵盖硬件准备、BIOS 升级流程及多系统兼容性踩坑。重点测试了淘汰固态硬盘的实际读写性能,对比 TrueNAS Scale、Unraid、Debian 等操作系统在雷电组网 阅读全文

廉价的全闪存雷电 NAS 折腾笔记:组网方案的选择

以约一千五百元成本组建全闪存雷电NAS,核心目标为解决AI模型文件高速传输需求。对比传统电口万兆与光纤组网方案,分析其存在设备全链路升级成本高、磁盘介质需同步更换、数据迁移风险大及Mac设备兼容成本高等问题。 阅读全文

廉价的家用工作站方案:ThinkPad 存储升级及数据迁移

, , ,
一台持续运行两年多的ThinkPad家用工作站近期完成存储升级与散热改造。升级选用致态TiPlus 5000固态硬盘,强调数据安全需关注硬盘质量与温度控制,分析了SSD掉盘成因及PCIe 3.0与4. 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 GFPGAN

Stable Diffusion WebUI 中的 GFPGAN 是腾讯开源的人脸修复模型,基于 GAN 网络与预训练技术实现面部细节恢复。该模型通过退化去除模块、StyleGAN 生成及通道分割空间特征变换等技术,结合重建损失、对抗损失、 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 CodeFormer

Stable Diffusion WebUI 中的 CodeFormer 是一款基于 Transformer 的人脸图像修复模型,由 sczhou 团队开发并于 2022 年被 NeurIPS 接收。 阅读全文

Stable Diffusion 硬核生存指南:WebUI 中的 VAE

Stable Diffusion WebUI 中 VAE 作为核心组件承担图像压缩与解压缩职能,推理时充当解码器还原潜在空间数据为像素图像,训练时则作为编码器将图片转换为低维向量。主流模型包括 Stability AI 推出的 EMA 与 阅读全文

使用 Docker 快速上手 Stability AI 的 SDXL 1.0 正式版

介绍基于 Docker 本地部署 Stability AI 开源图片生成模型 SDXL 1.0 的完整实践方案,涵盖运行环境准备、模型文件获取、容器镜像构建与运行等关键步骤。提供预构建镜像与手动构建两种途径,支持基础绘图、精炼优化及超分辨率 阅读全文

构建能够使用 CPU 运行的 MetaAI LLaMA2 中文大模型

, , , , , ,
基于GGML机器学习张量库,介绍将Meta LLaMA2中文大模型转换为可在CPU运行的量化格式的完整流程。内容涵盖使用Docker工具镜像完成模型格式转换、GGML量化压缩(将26GB模型精简至3. 阅读全文

使用 Transformers 量化 Meta AI LLaMA2 中文版大模型

介绍基于 HuggingFace Transformers 对 Meta AI LLaMA2 中文版大模型进行 4BIT 量化的完整方案,使模型显存占用从 13-14GB 降至约 5GB。核心方法是通过 Transformers 内置的 B 阅读全文