文章列表

向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索

在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。 阅读全文

向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss

, , , ,
我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。相信很多同学是第一次听说它,或者只知道它的大名,而不知该如何使用它。本篇文章,我们就来聊聊 faiss,分享这个“黑科技”是如何发挥神奇的“魔法”的。 阅读全文

走进向量计算:制作 OpenBLAS Docker 预构建产物镜像

本篇文章,将聊聊如何在容器中完成支持多 CPU 架构(x86、ARM)、多种 CPU 类型(Intel、AMD)的 OpenBLAS 的 Docker 镜像,来让包括 Milvus 在内的,使用 OpenBLAS 的软件的 Docker 镜像构建可以“又稳又快”。我会试着在接下来的内容中,持续分享如何让一个拥有着一万多颗“星星”的大型数据库项目的容器构建过程不断提速。 阅读全文

从零开始构建向量数据库:Milvus 的源码编译安装(一)

我在知乎上开了一个[新的专栏],想持续聊聊“向量数据库”相关的内容。本篇聊聊向量数据库领域,知名的开源技术项目:Milvus。如果你在寻找如何从源码编译安装,如何在 x86 和 ARM 两种架构的 Linux 上折腾 Milvus,那么这篇文章应该是最为详细的教程向参考内容啦。 阅读全文

走进向量计算:从源码编译 OpenBLAS

, , ,
不论是折腾深度学习、高性能计算,还是折腾向量数据库、相似性检索领域,在折腾的过程中,我们都可能会遇到需要 “OpenBLAS” 这个开源矩阵计算库的场景。这是因为泛 AI 领域离不开矩阵计算,而 OpenBLAS 是全球前三的开源矩阵计算库。本篇文章,我们就来聊聊 OpenBLAS 在 Linux 和 macOS 环境中的编译和构建。 阅读全文

在笔记本上搭建高性价比的 Linux 学习环境:基础篇

本篇文章会尽可能详细的介绍如何在相对廉价的笔记本上搭建高性价比的 Linux 学习环境,让学习和工作都轻松和高效一些。尤其是针对国内网络环境下,如何快速的完成系统的安装和基础配置。使用 Linux 的好处和必要性,我想应该不必过多赘述了,希望本文能够帮助你节约大量不必要的折腾的时间,腾出更多时间来思考、休息、以及打游戏。 阅读全文

抢先体验 Ubuntu 22.04 Jammy Jellyfish

, ,
距离4月21日 Ubuntu 22.04 正式发布越来越近,为了家里的各种 Ubuntu 设备能够安心升级,我决定提前体验接近完成的测试版。本文提到的升级方式适用于 Desktop 桌面版和 Server 版。 阅读全文

AMD 4750u 及 5800u 笔记本安装 Ubuntu 20.04

在[《廉价的家用工作站方案:前篇》]一文中,曾提到在 2021 年第三个季度开始,我又购置了一台新的设备,没错,它就是搭载着 Ryzen3 5800u 的笔记本。然而可惜的是,目前 Ubuntu 社区的发行版并不能够很好的支持搭载 AMD Zen2 / Zen3 芯片的设备。所以,如果你也希望舍弃掉笔记本设备自带的 Windows 系统,拥抱当前时代 Ubuntu LTS 版本,那么本篇文章,将能帮助你避开“坑”,快速体验这些具备高性能 CPU 的设备。 阅读全文

NUC 折腾笔记 - Linux 系统篇

, , , ,
写一篇迟到的折腾笔记:NUC8 8i5beh 。原本计划折腾 Hackintosh ,最后折腾了一台 Linux Homelab 设备。本篇记录 NUC 基础系统配置中的一些细节。 阅读全文

服务端升级 Ubuntu 20.04 LTS 记录

, ,
本文将介绍如何在当前时间点,将服务器版本的 Ubuntu 18.04 LTS 升级为最新的 Ubuntu 20.04 LTS,以及升级过程中的一些细节,希望能帮到跃跃欲试的 Ubuntu 同好。将数据进行备份等操作需要自行处理,另外确保网络稳定,建议都在服务器跳板机上进行操作,更为稳妥。当前这篇内容已经运行在 Ubuntu 20.04 LTS 系统环境中,:) 阅读全文