文章列表

Tag: # Linux

无问芯穹 MaaS AI 平台公测免费试用笔记：二

2024年04月01日无问芯穹, MaaS, Docker, Linux

[上一篇笔记中]，聊过了无问芯穹的 MaaS 服务中的“虚拟机”产品。本篇文章来聊聊最近宣传中提到的大手笔免费百亿 Token 用量的“大模型服务平台” 吧。分享下这个支持异构芯片推理的国产 “Replicate”、模型市场服务使用的经验和小技巧。阅读全文

无问芯穹 MaaS AI 平台公测免费试用笔记：一

2024年04月01日无问芯穹, MaaS, Docker, Linux

本篇文章聊聊正在公开测试的平台，无问芯穹的 MaaS 服务，包含了平台使用体验和一些小技巧。因为测试给的免费卡时比较少，估计想完成完整测试或许需要一些时间，额外用一些账号进行。就先记录下常规折腾过程吧，让再次“复现”的时候能节约一些时间。阅读全文

使用 Dify 和 AWS Bedrock 玩转 Anthropic Claude 3

2024年03月18日Claude, AWS Bedrock, Dify, Golang, Docker, Linux

本篇文章，聊聊怎么比较稳定的使用 Anthropic Claude 3，以及基于目前表现非常好的模型，来做一些有趣的 AI Native 小工具。阅读全文

使用零一万物 200K 模型和 Dify 快速搭建模型应用

2024年03月13日Yi-34B-Chat-200K, Yi-Model, Dify, Golang, Docker, Linux

本篇文章，我们聊聊如何使用 LLM IDE (Dify) 快速搭建一个模型应用，以及使用超长上下文的 200K 模型，完成懒人式的电子书翻译。阅读全文

使用搭载骁龙 8 Gen 3 的安卓手机运行 AI 大模型

2024年02月29日Mistral, CPM-Model, Stable Diffusion, Android, Linux, 硬件经验

本篇文章聊聊，在 Android 手机上简单运行 AI 大模型的方法，来体验英文语言模型（Llama2 7B、Mistral 7B、RedPajama 3B、Google Gemma 2B、Microsoft PHI 2B）；中文语言模型（面壁 MiniCPM、多模态模型）；Stable Diffusion。阅读全文

本地运行面壁智能的“贺岁模型”：MiniCPM 2B

2024年02月02日Transformers, CPM-Model, Python, Docker, Linux

简单聊聊可以在端侧运行的 Mini CPM 2B SFT / DPO 版本的模型。阅读全文

Stable Diffusion XL Turbo 文生图和图生图实践

2024年01月13日Stable Diffusion XL Turbo, Stable Diffusion, PyTorch, Python, Docker, Linux

本篇文章聊聊，如何快速上手 Stable Diffusion XL Turbo 模型的文生图和图生图实战。阅读全文

在 Nvidia Docker 容器编译构建显存优化加速组件 xFormers

2024年01月12日xFormers, Flash Attention, Nvidia, Python, Docker, Linux

本篇文章，聊聊如何在新版本 PyTorch 和 CUDA 容器环境中完成 xFormers 的编译构建。让你的模型应用能够跑的更快。阅读全文

Amazing OpenAI API：把非 OpenAI 模型都按 OpenAI API 调用

2024年01月09日Amazing OpenAI API, OpenAI, Yi-Model, Gemini-Pro, Docker, Linux

分享一个有趣的小工具，10MB 身材的小工具，能够将各种不同的模型 API 转换为开箱即用的 OpenAI API 格式。让许多依赖 OpenAI API 的软件能够借助开发者能够接触到的，非 OpenAI 的 API 私有部署和使用起来。阅读全文

节省时间：AI 模型靠谱下载方案汇总

2024年01月09日HuggingFace, ModelScope, Colab, Python, Docker, Linux

这篇文章，想分享下我日常是如何下载模型的，包括下载来源和工具使用细节，希望对折腾模型的你也有帮助。也希望开源和 AI 领域的研究者、从业者在做技术调研和落地实践的时候，都能节约一些时间。阅读全文