文章列表

八十行代码实现开源的 Midjourney、Stable Diffusion “咒语”作图工具

基于 Docker 与约八十行 Python 代码,实现开源版 Midjourney Describe 功能,支持图片解析生成 Prompt 与文本续写生成作图描述。项目提供 CPU 与 GPU 双版本,整合 CLIP/BLIP 图像理解、 阅读全文

模型杂谈:1.5G 显存就能运行的 RNN 14B 的开源模型(ChatRWKV)

, , ,
ChatRWKV 是一款拥有 140 亿参数的开源 RNN 架构语言模型,其突出特性在于极低的显存占用与灵活的部署方式。借助 Docker 容器化方案,用户可在配备 24GB 显存的 RTX 4090 显卡上实现高速推理,亦可通过量化等技术 阅读全文

使用 Docker 和 Alpaca LoRA 对 LLaMA 65B 大模型进行 Fine-Tune

, , , ,
介绍基于 Docker 与 Alpaca LoRA 技术对 LLaMA 大模型进行微调的方法,涵盖 7B 与 65B 两种参数规模。核心方案借助 LoRA 低秩适配与 8-bit 量化技术,将 7B 模型微调所需算力从 4 张 A100 显 阅读全文

基于 Docker 的深度学习环境:入门篇

, , , ,
基于 Docker 的深度学习环境搭建指南,涵盖从 Ubuntu 系统安装到容器化环境配置的完整流程。内容包括关闭 Secure Boot 加速安装、配置 SSH 远程访问、升级系统补丁、安装 Nvidia 显卡驱动等基础步骤,并介绍如何通 阅读全文

模型杂谈:使用 IN8 量化推理运行 Meta “开源泄露”的大模型(LLaMA)

, , ,
针对低显存设备运行 LLaMA 模型的需求,验证发现 PyLLaMA 方案虽能节省显存但 8GB 显卡仍无法直接运行。经测试,tloen/llama-int8 项目通过 INT8 量化可实现 7B 模型在 8GB 显存、13B 模型在 16 阅读全文

使用 Docker、Nginx 和 ttyd 提供稳定的 Web 终端服务

介绍一种基于 Docker、Nginx 和 ttyd 构建稳定 Web 终端服务的方案,旨在让初学者通过浏览器直接访问服务器终端,无需掌握 SSH 登录等复杂操作。核心组件包括:ttyd 将本地终端会话通过 WebSocket 同步至浏览器 阅读全文

模型杂谈:快速上手元宇宙大厂 Meta “开源泄露”的大模型(LLaMA)

, , ,
介绍基于 Docker 低成本快速部署 Meta 开源大模型 LLaMA 的实践方案,涵盖模型文件下载与校验、NVIDIA PyTorch 容器环境构建、原版与社区优化版双镜像选择策略,以及显存资源消耗实测对比。 阅读全文

模型杂谈:遭遇“下架风波”的首个国产语言大模型元语(ChatYuan)

, , ,
元语(ChatYuan)作为首个引发广泛关注的国产语言大模型,上线后因宣传口径与实际能力落差陷入"下架风波"。 阅读全文

探索开源:获取完整的 GitHub 社区数据集

, , ,
介绍通过 GHArchive 获取 2011 至 2022 年完整 GitHub 社区数据集的技术流程,涵盖使用 Node.js 批量生成超 10 万条小时级数据下载链接、采用 aria2 多线程高速下载、通过 diff 比对补全缺失文件、 阅读全文

廉价的家庭工作站设备改造记录:苹果垃圾桶(Mac Pro 2013)

, , ,
记录以约5400元总成本购置并升级Mac Pro 2013的过程,将其改造为家庭数据工作站。设备升级至12核24线程E5-2697v2处理器、128GB RECC内存及2TB PCIe 3.0固态硬盘,满足大容量内存、多核心并行计算与ECC 阅读全文