文章列表

向量数据库入坑:入门向量数据库 Milvus 的 Docker 工具镜像

在之前的文章中,我们聊过了一些和 Faiss 相关的事情,包括如何将数据转换为向量、如何挑选索引类型、如何简单加速向量检索性能、以及如何实现简单的语义搜索功能。也曾提到会聊聊更多实际场景中向量数据库的用法,揭开所谓大厂里的核心服务的神秘面纱,比如:实现简单的搜索引擎、推荐系统、风控系统等等。为了大家都能简单的上手,我做了一个 210MB 的 Docker 镜像,本篇文章就来讲讲这个镜像如何使用,以及我是如何制作这个镜像的。 阅读全文

向量数据库入坑:传统文本检索方式的降维打击,使用 Faiss 实现向量语义检索

在上一篇文章[《聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss》]中,我们有聊到如何快速入门向量检索技术,借助 Meta AI(Facebook Research)出品的 faiss 实现“最基础的文本内容相似度检索工具”,初步接触到了“语义检索”这种对于传统文本检索方式具备“降维打击”的新兴技术手段。有朋友在聊天中提到,希望能够聊点更具体的,比如基于向量技术实现的语义检索到底比传统文本检索强多少,以及是否有局限性,能不能和市场上大家熟悉的技术产品进行一个简单对比。那么,本篇文章就试着从这个角度来聊聊。 阅读全文

《宝可梦:阿尔宙斯》双周目通关

整理文章草稿,看到了年初春节的时候的通关草稿,为了避免拖到下一部上市后再发布,趁着周末将内容整理出来吧。趁着长假打通了GAME FREAK 的新推出的年货游戏宝可梦起源篇“阿尔宙斯”,遵循旧例,把它也记录下来吧。 阅读全文

向量数据库入坑指南:聊聊来自元宇宙大厂 Meta 的相似度检索技术 Faiss

, , , ,
我们日常使用的各种 APP 中的许多功能,都离不开相似度检索技术。比如一个接一个的新闻和视频推荐、各种常见的对话机器人、保护我们日常账号安全的风控系统、能够用哼唱来找到歌曲的听歌识曲,甚至就连外卖配送的最佳路线选择也都有着它的身影。相信很多同学是第一次听说它,或者只知道它的大名,而不知该如何使用它。本篇文章,我们就来聊聊 faiss,分享这个“黑科技”是如何发挥神奇的“魔法”的。 阅读全文

借助 Docker 来搭 Nginx 的积木:快速实现高性能二维码服务

, , ,
本篇文章,依旧是聊聊如何 “使用 Nginx 和 Docker 来偷懒”。以生成我们常见的二维码为例,聊聊 Nginx 在日常业务中,除了做接入层业务之外的应用。本篇文章中,我们将侧重聊聊更通用的,在容器场景下借助 Docker 的预构建、多阶段构建等能力,来帮助 Nginx 进行“搭积木”的玩法,快速实现某个传统业务。 阅读全文

致新朋友:为生活投票,不断寻找更好的朋友

,
这是一篇迟到的文章,主要分享即将四岁的“折腾群”的运营经验,以及阐明一些我个人在网络上的交友观。我希望这篇内容,能够帮助到想要加入我们 “一起折腾” 的新朋友,了解为什么“入个群都这么麻烦”;也希望这篇内容,能够对想要了解 “社群运营” 的同学有所帮助:希望每个人都能找到适合自己的新朋友。 阅读全文

《三角战略 Triangle Strategy》一周目通关

上个月开了三角战略的新坑,趁着这两周去杭州的路上,把一周目通了。遵循旧例,也把它简单记录下来吧。 阅读全文

站点优化日志(2022.08.12)

, , , ,
记录自上次更新以来的一些变化。 阅读全文

2022 年中总结

因为一些事情,这篇年中总结迟到了整整一个月。在长假的结束后,我重新选择了一份“似曾相识”的工作,继续进行少数派的“修行”。在分享这段旅程和思考之前,依旧先来聊聊技术相关的部分。 阅读全文

走进向量计算:制作 OpenBLAS Docker 预构建产物镜像

本篇文章,将聊聊如何在容器中完成支持多 CPU 架构(x86、ARM)、多种 CPU 类型(Intel、AMD)的 OpenBLAS 的 Docker 镜像,来让包括 Milvus 在内的,使用 OpenBLAS 的软件的 Docker 镜像构建可以“又稳又快”。我会试着在接下来的内容中,持续分享如何让一个拥有着一万多颗“星星”的大型数据库项目的容器构建过程不断提速。 阅读全文