三人团队打造的学术搜索引擎,直接拿下SOTA!
号称搜索结果相关性平均比谷歌学术高5倍,能搜索超1亿个研究对象,还不依赖LLM。
更重要的是:免费,学生党狂喜!
先来看一波使用效果,输入搜索关键词,只需350毫秒,“啪”得一下高度相关文献就列出来了:
还能再一键筛选出可查看PDF的文件。
从年份、引用次数,到出版类型、具体期刊,都能设定一键过滤:
搜索出来的论文,点击题目即可预览,支持一键复制常见学术引用格式:
这个新搜索引擎名叫Lumina,据说目前已处理了超30万次查询,支持24种语言。
为了和谷歌学术等传统学术搜索引擎做比较,开发团队还专门搞了个基准测试,代码库也已开源放了出来,测试结果Lumina搜索结果的相关性拿下SOTA。
开发者发推文叫板谷歌:
我们三个人花几个月就做出来了,比谷歌的好。
AI 3D模拟引擎Ego联合创始人兼CTO、前Meta研究员看过后表示闭眼冲:
强烈推荐大家试一试。
还有不少学者表示好使:
搜索相关性最高高11倍
如开头所述,为了测试Lumina的性能,研究团队开源了一个基准测试。
使用GPT-4作为“评判员”,重点比较了Lumina Base(基础搜索模式)、Lumina Recursive(递归搜索模式)、Semantic Scholar和谷歌学术搜索结果的相关性和精确度。
直接检测评估了每个搜索引擎的前10个搜索结果,对比如下:
在基础搜索模式下(Lumina Base),Lumina搜索结果的相关性比谷歌学术高4.8倍,比Semantic Scholar高8倍,评估基于生成的约2470个查询数据集。
Lumina在递归搜索模式下,搜索结果相关性进一步提升,比谷歌学术高6.8倍,比Semantic Scholar高11.3倍,同样基于2470个查询数据集。
此外,Lumina在每次检索中都能稳定提供2-3个高度相关结果,相比之下,谷歌学术只有50%的检索能提供1个高度相关的结果,Semantic Scholar则仅有30%的检索能达到这一标准。
换句话说,Lumina可以找到原本很难找到的研究成果。
团队还表示,使用Lumina API和一个简单的递归脚本,可以使相关性比谷歌学术高11倍,Lumina API即将发布。
除了基本的检索,Lumina还提供AI概述功能。
比如用“机器学习”关键词搜索,它就会引用检索出来的论文总结介绍机器学习:
点击AI概述中有下划线的关键词,就会触发对该关键词的进一步检索:
AI概述下方还有对搜索论文研究成果图表的汇总:
三人团队打造
Lumina背后是一个仅有三人的开发团队,已获YC投资。
联合创始人兼CEO Mehul Chadda,本科毕业于美国威斯康星大学麦迪逊分校材料工程专业,前高精度科学仪器公司CAMECA制造工程师,负责过原子探针研发工作。
联合创始人兼CTO Akhilesh Sharma,本科毕业于美国伊利诺伊大学香槟分校完成机械工程专业,之前是社交媒体平台Postpress的联合创始人和技术主管,也曾担任美国技术咨询公司Neudesic云技术相关顾问。
联合创始人Ishaan Kapoor,加州大学洛杉矶分校统计学毕业,对深度学习、线性代数和大语言模型感兴趣。
除了这次上新的学术搜索引擎,之前团队还做了一个AI论文解读工具——Lumina-chat。
点击Lumina主页右上角的“Legacy System”即可跳转使用。
打开后是这样婶儿的,可以上传PDF与AI交互进行论文解读:
感兴趣的童鞋可以试试~
https://lumina.sh/c5bbe32b-4fb7-476a-81aa-fe269f67f283