llamaindex的BM25Retriever基于RankBM25[1]的OkapiBM25。RankBM25,两行代码实现搜索引擎RankBM25提供了多种BM25算法,如OkapiBM25,BM25L,BM25+等。它的使用也非常简单安装pipinstallrankbm25初始化以OkapiBM25为例fromrankbm25importBM25Okapicorpus["Hellotheregoodman!","ItisquitewindyinLondon","Howistheweathertoday"]分词使用空格tokenizedcorpus[doc.split("")fordocincorpus]bm25BM25Okapi(tokenizedcorpus)...