文章列表

向量数据库入坑:入门向量数据库 Milvus 的 Docker 工具镜像

在之前的文章中,我们聊过了一些和 Faiss 相关的事情,包括如何将数据转换为向量、如何挑选索引类型、如何简单加速向量检索性能、以及如何实现简单的语义搜索功能。也曾提到会聊聊更多实际场景中向量数据库的用法,揭开所谓大厂里的核心服务的神秘面纱,比如:实现简单的搜索引擎、推荐系统、风控系统等等。为了大家都能简单的上手,我做了一个 210MB 的 Docker 镜像,本篇文章就来讲讲这个镜像如何使用,以及我是如何制作这个镜像的。 阅读全文

向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索

在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。 阅读全文

向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss

, , , ,
我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。相信很多同学是第一次听说它,或者只知道它的大名,而不知该如何使用它。本篇文章,我们就来聊聊 faiss,分享这个“黑科技”是如何发挥神奇的“魔法”的。 阅读全文

借助 Docker 来搭 Nginx 的积木:快速实现高性能二维码服务

, , ,
本篇文章,依旧是聊聊如何 “使用 Nginx 和 Docker 来偷懒”。以生成我们常见的二维码为例,聊聊 Nginx 在日常业务中,除了做接入层业务之外的应用。本篇文章中,我们将侧重聊聊更通用的,在容器场景下借助 Docker 的预构建、多阶段构建等能力,来帮助 Nginx 进行“搭积木”的玩法,快速实现某个传统业务。 阅读全文

站点优化日志(2022.08.12)

, , , ,
记录自上次更新以来的一些变化。 阅读全文

走进向量计算:制作 OpenBLAS Docker 预构建产物镜像

本篇文章,将聊聊如何在容器中完成支持多 CPU 架构(x86、ARM)、多种 CPU 类型(Intel、AMD)的 OpenBLAS 的 Docker 镜像,来让包括 Milvus 在内的,使用 OpenBLAS 的软件的 Docker 镜像构建可以“又稳又快”。我会试着在接下来的内容中,持续分享如何让一个拥有着一万多颗“星星”的大型数据库项目的容器构建过程不断提速。 阅读全文

使用 Docker 搭建属于你自己的 Go Playground

, ,
本篇文章将介绍如何通过容器来部署属于你自己的 Go Playground。Go Playground 是 Golang 团队推出的在线语言工具,不论是对于初学者而言,还是对 Golang 开发者来说,它都不失为一个简单好用的神器。但由于种种原因,国内部分用户使用这个功能可能会遇到一些网络问题,而无法使用这个服务;以及出于运行代码包含一些“隐私”,而无奈放弃这个服务。 阅读全文

使用 Golang 正确处理五大互联网注册机构的 IP 数据

, , ,
补一篇内容,聊聊处理五大互联网注册机构提供的 IP 数据中的小坑。 阅读全文

从零开始构建向量数据库:Milvus 的源码编译安装(二)

本篇文章接[上一篇],继续聊聊向量数据库领域,知名的开源技术项目:Milvus,在不同 CPU 架构的 macOS 环境下的编译安装。如果你在寻找如何从源码编译安装,如何在 x86 和 ARM 两种架构的 macOS 上折腾 Milvus,那么这篇文章应该是最为详细的教程向参考内容啦。 阅读全文

从零开始构建向量数据库:Milvus 的源码编译安装(一)

我在知乎上开了一个[新的专栏],想持续聊聊“向量数据库”相关的内容。本篇聊聊向量数据库领域,知名的开源技术项目:Milvus。如果你在寻找如何从源码编译安装,如何在 x86 和 ARM 两种架构的 Linux 上折腾 Milvus,那么这篇文章应该是最为详细的教程向参考内容啦。 阅读全文