近两年随着大模型技术的快速发展,图片、视频、自然语言等多模态、非结构化数据的查找需求变大,非结构化数据的量级也远大于结构化数据,传统数据库已经无法满足如此多样化数据的处理需求。向量数据库以其海量的数据存储规模、高效的计算查询能力,正在成为大模型时代重要的基础设施。
3 月23 日,火山引擎开发者社区 Meetup 第十三期邀请到了火山引擎的三位技术专家,将从火山引擎的实践应用出发,为大家详解向量检索功能的设计实现以及大规模云原生向量数据库的核心技术和优化,和大家共同探讨大模型时代向量数据库的落地实践。
⏰时间:2024/03/23(周六) 14:00-17:00
地点 :北京市海淀区北三环西路甲 18 号院大钟寺广场 1 号楼 3F-17
形式:线下+线上同步直播
精彩议程
《VikingDB:大规模云原生向量数据库的前沿实践与应用》谢剑桥|火山引擎向量数据库高级工程师
向量数据库是解决海量非结构化数据检索与分析问题的行业共识,我们从 19 年解决大规模分布式向量检索问题,到推出云原生、AI 原生的向量数据库,持续应对抖音集团内外部业务的复杂技术挑战,积累了丰富实践经验。本次演讲将重点介绍 VikingDB 解决各类应用中极限性能、规模、精度问题上的探索实践,并通过落地的案例向听众介绍如何在多模态信息检索、RAG 与知识库等领域进行合理的技术选型和规划。
主要内容:
1. AI 原生、云原生的向量数据库是怎样的
a. 不止RAG——AIGC 时代的向量库应用
b. AI 原生的能力推导
c. 大规模云原生架构设计要点
2. 极端性能、规模、精度问题是怎么解决的
a. 向量数据库的关键性能维度和极限案例
b. 极致性能优化探索
c. 极端规模场景的解决之道
d. 精度:追逐相关性本质
3. 如何用好检索型向量数据库
a. 从应用场景进行技术选择
b. 真实业务场景的避坑指南
《解析云原生数仓 ByteHouse 如何构建高性能向量检索技术》田昕晖|火山引擎 ByteHouse 技术专家
向量检索被广泛使用于以图搜图、内容推荐以及大模型推理等场景。随着业务升级与 AI 技术的广泛使用,用户期望处理的向量数据规模越来越大,对向量数据库产品的稳定性、易用性与性能需求也越来越高。为此火山引擎ByteHouse 团队基于社区 ClickHouse 进行技术演进,提出了全新的向量检索功能设计思路,满足业务对向量检索稳定性与性能方面的需求。
主要内容:
1. 向量检索概念以及在 LLM 场景的应用
2. 当前业界向量数据库发展情况
3. ClickHouse 结合向量检索的优势,以及社区当前向量检索局限性与性能问题分析
4. ByteHouse 向量检索功能设计思路介绍
5. 性能比较
《在火山引擎云搜索服务上构建混合搜索的设计与实现》鲁蕴铖|火山引擎云搜索服务高级研发工程师
当今,随着图片和视频数据的爆炸式增长,人们对于多样化数据搜索的需求也越来越迫切。多模态搜索场景已经成为当前搜索领域的主要趋势。在这个背景下,本次演讲将重点介绍字节跳动在混合搜索领域的探索,并探讨如何在多模态数据场景下进行海量数据搜索。
主要内容:
1. 混合搜索的应用场景
2. 云搜索服务在混合搜索中具备的搜索能力
a. 云搜索服务在混合搜索中的生态能力
b. 云搜索服务在混合搜索中的搜索增强能力
c. 云搜索服务在混合搜索中的排序打分增强能力
3. 云搜索的混合搜索引擎
a. 当前不同向量引擎能力介绍
b. 多种向量引擎及优化编码
c. 不同场景下的向量搜索能力对比与选择
阅读原文链接:https://zjsms.com/iFdjBHb3/