这篇文章,聊聊不同类型的 Windows 设备上使用雷电显卡坞外接 Intel 显卡的经验(同适用 AMD 显卡),希望能给有类似需求的朋友一些参考。
写在前面
上周回北京的前一天,收到了一张 Intel ARC 580 显卡,作为一个爱折腾的人,分享下这几天有趣的折腾过程。
这件事情,要从这封信开始。
Intel ARC 这张显卡,从 2014 年 12 月开始,就有各路媒体和爱好者入手,发布了许多评测,不过好像没有多少是和“雷电显卡坞”相关的,尤其是似乎没有人打用雷电显卡坞跑模型的心思。
元旦第二天,我在知乎上收到了小鱼的一条帖子里的评论“阿特”,知乎好物团队购买了几张蓝戟 Intel Arc B580 显卡,邀请答主们做评测。
那么,就填报报名呗。随后,我就收到了下面这封信:
实话说,我对这张显卡还是蛮感兴趣的。主要有三个原因:
首先,Intel 在 2022 年推出的 Arc A770(A770 规格)就是一张堆料很猛的显卡。有趣的是,这张卡从最初的“差评如潮”到后来口碑逐渐转好,也就用了一年时间,圈内甚至给它起了个“养成系显卡”的昵称。
抛开游戏性能不谈(我有 4090 和 4090 mobile、Steam Deck 等),就单说模型推理来说,在不追求极限性能的情况下,它在玩 LLM 和 Stable Diffusion 图像生成上的表现都相当不错,尤其是价格很棒,功耗也不高,显存给的还多。
而这次的 B580,同样是一张堆料很猛的卡,让我想起了当年小米红米系列的堆料性价比路线。
我个人觉得显卡和小徽章的颜值都蛮高的。硬件参数解析相关的事情,网上参数一大把,我就不写了,还能节约点篇幅分享折腾过程。
其次,虽然我家里已经有了 4090 和 4090 mobile,但这两张卡在运行时的噪音确实有点大。如果能有一张功耗更低、运行更安静的显卡,并且通过某种灵活的高性能连接方案,让家里其他设备也能获得 AI 运算能力,那想想就很有意思。
我之前的文章里,多次提到过“雷电接口”(之前的文章),这项技术最早主要出现在高端笔记本和游戏本上。随着市场发展,现在很多小主机也都配备了功能类似的 USB 4 接口,支持“雷电组网”。如果这张配置强劲的显卡能通过雷电接口实现热插拔,岂不是能随意接入各种设备使用了?
有朋友可能会提到雷电接口组网会带来带宽损耗和预留问题。这确实不假,在许多使用场景下会产生明显的性能瓶颈。不过对于模型推理这个特定场景来说,这个问题主要只会影响模型的初始加载过程。一旦模型被成功装载到显卡显存中,如果不频繁切换模型的话,实际的运算性能并不会受到明显影响。这个场景下,它比还在发育过程中,尚未成熟的 OCuLink 要更合适这个场景一些(很少能够热插拔,并且许多设备需要改装)。
最后,我觉得应该有不少朋友和我一样,偶尔会想玩玩游戏,但手头的设备要么是工作用的,要么装的是 macOS 或 Linux。虽然有各种掌机可以选择,但有时就是想体验下 Windows 下的经典老游戏,这张卡或许能满足这种临时起意的游戏需求。
好了,让我们入坑开始。
关于 Resizable BAR 特性
在入坑前,我想分享一个小知识点,对于是否能够正常使用这张显卡至关重要。
Resizable BAR (Base Address Register) 是一个 PCI Express 总线规范中的功能,它允许 CPU 直接访问显卡全部的显存空间。在这项技术出现之前,CPU 只能以 256MB 为单位分块访问显存,这种方式会造成额外的处理开销和延迟。
启用 Resizable BAR 后,CPU 可以一次性访问完整的显存空间,显著提升数据传输效率。这项改进在特定游戏场景下可以带来至少 5-10% 的性能提升,尤其是在需要频繁加载纹理或处理大量资产的游戏中表现更为明显。
然而,NVIDIA 显卡对这项技术的依赖度并不高。这是因为 NVIDIA 早已在硬件层面实现了类似的功能,称为 BAR1 映射。此外,NVIDIA 的显卡架构本身就对内存访问进行了深度优化,再加上其成熟的驱动层优化方案,使得 Resizable BAR 带来的额外收益相对有限。
相比之下,Intel 和 AMD 显卡从 Resizable BAR 获得的收益更为显著。这主要是因为 AMD 显卡的内存访问架构相对简单,也没有类似 NVIDIA BAR1 这样的专有解决方案。因此,启用 Resizable BAR 能够为“红蓝厂显卡”带来更明显的性能提升。
我们使用的笔记本或掌机设备,具体是否支持,不仅仅要看 BIOS 设置选项,或者使用 GPU-Z 等软件探测,还需要实际实机验证。
显卡坞方案选择思考,为什么选择 “雷电显卡坞”
入坑第一步是选择显卡坞类型,看到标题,你已经知道了我的选择。但是我还是想和你分享下,我为什么会选择雷电接口的显卡坞。
虽然 eGPU 硬件方案有许多种,但是主流的方案还是雷电接口,设备可选性和成熟度也相对其他方案更高。
详细展开原因,主要基于以下几点考虑:
首先,是接口的普及性。从 2015 年苹果率先采用 Type-C 接口并推广“雷雳”协议开始,各大品牌陆续都开始支持雷电接口。特别是 2020 年推出的雷电 4,不仅对雷电 3 进行了升级增强,还推动了 USB 4 协议的发展。现在我们用的设备,尤其是笔记本电脑,基本都标配了满血雷电 4 或者几乎等价的 USB 4 。
其次,是使用场景的灵活性。用雷电扩展坞的好处是,我可以带着轻薄本到处跑,回到家接上显卡坞就秒变“工作站”。而且只需要一根线就能搞定所有外设,再也不用为桌面上缠绕的各种线缆发愁了。
最重要的是安全性。跟其他外接显卡方案比,雷电显卡坞普遍都支持安全“热拔插”,而且接口发热问题是最轻的。 要知道,如果使用设备时要小心翼翼,用户体验就会线性下降。比如,我之前写过的那篇关于 ROG 幻 X 和 4090 扩展坞的文章(《便携移动工作站,端侧 AI 大模型设备折腾笔记:ROG 幻 X 和 4090 扩展坞》)提到的设备,有用户因为热拔插导致设备接口烧毁。所以,虽然设备算力很棒,但是每次使用都要小心翼翼。
另外就是性价比了。随着各路厂商和 DIY 玩家的加入,雷电扩展坞设备的价格也越来越亲民了。
新款 Mac 设备暂时不支持 eGPU
虽然雷电接口的普及和苹果的大力推广离不开关系,但是想要在非 Intel 芯片的 Mac 设备上使用 eGPU,暂时是不被支持的。
在 Apple 还在使用 Intel 处理器的时代,这个方案是提升 Mac 设备性能的高性价比方案,可以用来相对低成本完成媒体处理性能的提升。但随着 M 系列芯片的推出,苹果在软硬件层面都设置了严格的限制(软硬件防火墙高耸)。所以,目前这个方案目前只能用于非苹果设备或者苹果 Intel 芯片的老设备了。
新的 Apple 芯片的设备,仅仅能够做到连接扩展坞,识别出 40Gbps 的雷电连接。
我之前写过两篇文章,一篇是《突破内存限制:Mac Mini M2 服务器化实践指南》,另一篇是《MacBook Pro 原生安装 Ubuntu 24.04 ARM 版》,其中提到的 Asahi Linux 目前正在开发雷电驱动支持。也许在不远的将来,Mac 设备也能重新使用上雷电显卡坞,尤其是未来的雷电 5 显卡坞。
历险前的准备
开始动手前,有不少需要准备的东西,软件、测试硬件、显卡坞硬件、驱动、系统,都得盘一盘。
准备测试硬件:有代表性的设备们
第一阶段的测试,我使用了多台不同类型的设备,除了任何现成的“台式机”。
这些设备类型,应该都比较有代表性:
- 不带显卡的 Intel CPU 笔电:《家用工作站方案:ThinkBook 14 2023 版》里的搭载 i7-13700H 的笔记本(雷电接口)
- 带 Nvidia 独显的 Intel CPU 笔电:《便携移动工作站,端侧 AI 大模型设备折腾笔记:ROG 幻 X 和 4090 扩展坞》中的搭载 i9-13900H 的多功能平板电脑(雷电接口,内置 4060 移动版显卡)
- 带 AMD 核显的 AMD 核心 USB 4 接口设备:两台零刻 SER7 7840HS(全功能 USB4,核心显卡 AMD Radeon 780M)
- 苹果 M 系列芯片的笔电:《2024 年终,个人设备盘点》中的 Apple M3 芯片的 Macbook Air (雷电4 接口)
- 带 AMD 核显的 AMD 核心 USB 3 Gen2 设备:SteamDeck OLED 版本(CPU:AMD BGA ST1,USB 3 Gen2,理论雷电向下兼容)
因为英特尔官方“ARC 显卡,台式机快速入门指南”中专门提到了这个系列的显卡需要 10 代之后的 CPU,所以我没有测试其他的支持雷电,但是芯片代数小于 10 代的设备。
上面这些设备目前基本都使用 Linux 操作环境(Ubuntu 24.04 ~ Ubuntu 24.10)或 macOS 操作系统。为了验证不是 Linux 操作系统驱动兼容性的问题,以及验证雷电显卡坞靠谱,我特意将两台 Intel 笔电和一台 AMD 迷你主机更换了操作系统,重新安装了 Windows 操作系统。
准备扩展坞设备:雷蛇战核幻 X
我选择的是一款老设备:Razer Core X Chroma 雷蛇战核 X 幻彩版,官方说明书中提到它是支持雷电 3 的,实际上不论是官网还是大家实测,雷电 4 也是支持的。
选择它之前,我还使用了“知乎版的 Perplexity”,知乎直答,比较了几轮。基本上每轮都有雷蛇灯厂出品的“战核幻 X”。
选择它,除了看中它的颜值在线、价格实惠(海鲜市场 600 元)外。相比较“开放式机箱”,有金属外壳保护的情况下,既保护了我家猫,也保护了显卡坞里的显卡,当然,这个设备还附带一堆额外的接口。
关于这个显卡坞的详细介绍,文章《Razer Core X Review – Thick and Juicy》里讲的比较多了,我就不赘述了。如果你对这个设备感兴趣,一定要阅读官方设备参数页面,了解供电和显卡坞空间尺寸。设备个性化相关驱动可以在 Razer Core X 支持页面找到。
显卡坞使用的扩展板尺寸不大,比我之前买过的 PCIe 雷电扩展板小多了。可惜的是这个板子上使用的是 6 系雷电芯片,带宽限制在 22Gbps。目前最新的 9 系芯片,能够达到 80 / 120G 连接。或许,随着支持雷电 5 的主板和设备变多,雷电 5 显卡坞产品也快出现了吧。
准备操作系统:Windows
整个过程中,我分别使用 Linux 和 Windows 进行了一些基础的验证尝试。
- Linux 操作系统使用了 Ubuntu 24.04 和 Ubuntu 24.10,你可以参考之前的文章《搭建 Ubuntu 24.04 基础开发环境指南》,来进行快速安装和基础配置调整。
- Windows 镜像使用的是 Windows 11 24H2 版本:(
Win11_24H2_Pro_Chinese_Simplified_x64.iso
),安装使用《开源的全能维护 U 盘工具:Ventoy》文章中的方法,或者经常在文章中提到的 Balena Etcher(“制作系统安装引导盘的两种方法”)制作好安装镜像即可。
因为篇幅原因,本篇文章先聊 Windows 环境下的设备情况。
准备相关驱动:以显卡为主
当前时代下的 Linux、Windows、macOS 都内置了不少设备驱动,能够满足我们的设备基础运行。雷电接口在当前世代系统,也基本都是免驱动的。
所以,我们只需要考虑显卡驱动问题即可。 相比较常见的 N 系显卡,Windows 和 Linux 基本免驱(系统会自动安装驱动),Intel ARC 新出显卡和 AMD 显卡一样,通常需要我们手动完成显卡驱动的安装。
在Intel B580 的官方驱动网站中,目前其实只有 Windows 驱动下载。如果我们点击 Linux (驱动更新时间 2025 年 1 月 9 日,提示适配 Ubuntu 22.04),会出现这个页面和驱动页面相互引用的无尽循环,但就是没有可用的驱动包。
这篇文章只聊 Windows 系统的驱动问题,关于 Linux 环境的 ARC 显卡驱动问题,我们在下一篇文章再聊。
准备数据线:雷电 4 被动线
雷电数据线有 3、4,主动/被动线的差异,虽然这几种线我都有,但是这次测试为了减少干扰因素,我只使用了雷电4被动数据线。
准备测试软件:不需要恰饭的游戏
Linux 下的测试软件有非常多,不少都是开源软件,可信度相对都比较高。但 Windows 环境下,因为近些年评测已经是一门生意,厂商、评测机构经常使用的软件逐渐娱乐化。
所以,我准备了一款不一样的,但又很常见的测试工具。这个游戏出圈之后,可以站着赚钱,应该不需要适配厂商出一些“数字”结果。
开始折腾
下面的过程看似简单,其实花了非常多的时间折腾。
第一关:无显卡笔电 Windows 受限环境下的测试
让我们先从 Windows 开始折腾。
第一台测试的设备是 ThinkBook 14,CPU 是 Intel 13700H,机器没有独显。这台设备是非常典型的日常办公场景用的笔记本。
安装好系统后,默认情况下能够直接识别我们的雷电显卡坞,和显卡坞上的各种接口(网口、USB、HDMI),但是 Intel ARC 显卡是不能直接识别的。不过,为了能够控制“光”,我们可以下载上文提到的个性化驱动。
同样的,使用上文中提到的 Windows 驱动,完整显卡的驱动。在安装过程中,显卡就能够被激活,我们在任务管理器中,可以看到这张显卡的基础资源情况。
重启设备后,我们打开 Intel 的控制面板,能够看到这张卡的运行状况。这里,除了能够展示我们的独显信息外,还能够正确识别到 13700H 上携带的集成显卡。
不过,界面中红色的标签告诉我们这台笔记本电脑(Lenovo ThinkBook)的主板不支持 Resizable BAR 特性。** 在文章的开头,我提到过 Resizable BAR 对于这张显卡的重要性。**
在没有 Resizable BAR 的情况下,虽然游戏也能运行,但是测试工具(默认配置)输出结果惨不忍睹。两次测试结果都只有 18 帧。退出游戏后,打开任务管理器,能够看到刚刚 GPU 吃满了,没有“消极怠工”。
为了排除不是虚幻 5 引擎游戏的事情,我换用媳妇说的“马赛克小游戏”做第二次测试,虚幻4 引擎制作的逸剑。运行是能运行,但是非常卡,帧率不时就掉到 0 帧, GPU 使用率基本经常 100%,显存使用还好,只使用了 2GB(显卡资源的 1/6),还有很大冗余。
我使用台式机的 4090 运行了这款游戏,显存资源使用差不多,GPU 使用率大概是 24%。
此处虽然不合适这样直接对比,但至少说明在这台机器的软硬件环境下,游戏测试这关是过不去了。
Windows 系统的启动过程中,即使我们看不到类似 Linux 设备的 dmesg
的日志输出,但是根据 Linux 的经验,如果我们直接插着显卡坞启动设备,让设备在启动的时候就默认使用外置显卡坞作为视频设备,或许是能够提升性能的,也能够减少一些不必要的干扰项。
我这样试了试,并进行了两次黑猴测试,平均帧率从 18 帧提升到了 21~22 帧。有提升,但是不明显。
通过 GPU-Z,我们能够直观的看到这台设备的主板状况。
主板的“Above 4G Decode enabled in BIOS” 选项虽然在主板中找不到,但其实已经是打开了的,可是最关键的“Resizable BAR”选项却没有打开。
开源项目 github.com/xCuri0/ReBarUEFI 或许解锁这个选项,但是可能会带来一些副作用。目前这台设备还有其他的用途,反正还有其他的设备可以验证,那么在之后的文章中,我们再来试试使用这关方式进行复现吧。
测试到这里,我个人认为,在修改 BIOS 解锁 ReBAR 特性支持之前,这台设备的 Windows 环境的表现,没有继续测试必要了。
当然,如果你对这个有限制的系统环境下,模型的运行效率感兴趣,可以参考《基于 Docker 的深度学习环境:Windows 篇》完成 Docker 环境的部署,参考之前类似这些文章内容进行基础测试。
第二关:AMD 7840HS 核显迷你主机 Windows 测试
有了“第一关”的测试经验,我们了解了 Windows 系统下,即便显卡坞和显卡都能够被正确驱动,但是如果没有 ReBAR 特性支持,外置显卡坞使用 Intel 显卡的使用体验通常是比较糟糕的。
接下来,我们来验证一台国产迷你小主机。这类小主机通常以迷你台式机的定位出现,相比较笔记本 BIOS,相对更加开放,不过也相对缺乏精细设计和验证。
我测试的设备是零刻的 SER7(AMD 7840HS),完成系统的安装之后,我们首先使用 CPU-Z 和 GPU-Z 来了解设备基础状况。
测试的开始,就有一个好消息和一个坏消息。
坏消息是,使用 GPU-Z 查看 ReBAR 支持,默认情况下,设备不支持 ReBAR。
好消息是,我们可以在 BIOS 中,打开这个选项。
接下来,是第二个好消息和第二个坏消息。
坏消息是,BIOS 开启的设置,实际测试下来并不完全符合预期。它在 Windows 中并不奏效。
好消息是,上文中的游戏帧率都有了一些改善(黑猴微弱改善、逸剑改善明显),看来这个设置并不是完全没有奏效。逸剑的帧率记录中一度能够 60 帧运行(也有掉帧),并且 CPU 和 GPU 的占用率都得到了非常大的改善。
关于 ReBAR 的支持,这里应该是官方 BIOS 的 BUG。在官方论坛和社区爱好者论坛里,都有用户反馈过。比如,有海外用户反馈 “resize bar not detected” 的问题,不论是 ARC 770 还是 AMD 7900 都无法完成显卡配置。可惜这个问题反馈被另外一个用户的跟帖打断了。除此之外,最近还有其他用户也在反馈类似问题,从回复看起来厂商没有计划做积极 BIOS 改进支持。
为了减少干扰项,我进行了一些其他的尝试。
我穷举试验了 BIOS 中的设置,不论如何调整,均未能解决 ReBAR 识别的问题。包括正确禁用掉 AMD 780m 核心显卡,并强制设备只使用扩展坞进行输出。
当然,因为这台小主机的 BIOS 存在一些 BUG,在这台设备中完成上面的操作,需要很多额外的技巧,甚至可以单独展开一篇文章来聊了。
此外,我除了尝试只允许蓝厂显卡工作之外,还尝试了更新官方提供的各种版本的 BIOS。很可惜的是,不论是论坛提供的 BIOS、官网提供的 BIOS,还是官方 BIOS 下载站提供的 BIOS 程序,在刷机的时候,都会提示“secure flash rom verify fail”错误,无法完成刷机。
测试到这里,我个人认为,同样在修改 BIOS 解锁 ReBAR 特性支持之前,这台设备的 Windows 环境的表现,没有继续测试必要了。
最后
到这里为止,对于只有核心显卡的设备,在 Windows 环境下使用雷电显卡,外接 Intel ARC 显卡的状况,大家应该就都了解啦。
实际上,除了文章中的测试,我还进行了很多次验证。在不能解锁主板 ReBAR 选项前,再次进行 Windows 环境下的测试应该没有任何必要。
我们,下篇文章再见。
–EOF