【51CTO独家特稿】如今,智能设备已经成为了人们生活中最常见的一种元素,随时随地的浏览网页、聊天、使用社交服务已经成为了很多人的一种生活方式。不得不说,在移动互联网如此迅猛发展的带动下,人们对智能设备的依赖性越来越强。然而,这个依赖性并不是体现在手机本身身上,而是那些让我们能够随时随地触碰到互联网的APP。
确实,不管是互联网还是移动互联网,真正吸引人们的正是其提供的内容。而对于移动互联网来说,内容即是应用。目前,APP市场是我们获取应用最常见的方式之一,除了如今的Google Play外,国内的第三方APP市场也是数不胜数,机锋、应用汇、安卓、N多等等。
然而,某一个APP市场并不能完全满足用户需求,因为没有哪款第三方APP市场做的大而全。那么有没有一种这样“搜索”服务,能够搜索出所有第三方APP市场的内容,同时帮助用户找到“***”的那款应用呢?
豌豆荚应用搜索正是这样一种整合国内主流第三方APP市场,并提供内容优化的搜索服务。在谈到应用搜索时,身为豌豆荚创始人的王俊煜说到,“应用搜索发布两个月以后,达到了整个应用收录量一万的这样一个高峰。大概在2月份时,收录量达到了十万,到今天为止,它已经达到了十五万。这其实也可以看出来,一方面是Android应用的数量增长非常快。另一方面,也是我们的覆盖率也一直在做不断的提升,保证用户在豌豆荚应用搜索里面,始终能找到他能想得到的所有的应用,特别是在中文世界里面,尽可能全的收录用户想要的应用,这是豌豆荚应用搜索一年来主要的进展。”
公正性如何保证?
作为国内搜索行业的老大,百度搜索的公正性一直为人诟病,其竞价排名模式也招来了不少问题。同样,豌豆荚应用搜索也面临着这一问题。“现在来说一点搜索引擎永远应该坚持的价值观,那么就是客观公正的准则。广告必须明确标识的准则。”身为豌豆荚创始人王俊煜如是说。
保证客观公正的前提是要有一套“合情合理”的算法,根据王俊煜的介绍,应用搜索会根据关键词的匹配度、应用下载量、近日用户点击量、不同应用商店的服务质量等各种维度对搜索结果进行排序,为用户挑选出***的应用。当然,在整个搜索页面里,应用搜索也会有类似于Google广告的位置,用户可以直观的看到哪款应用是精品推荐,哪款应用是推广上去的。
这里分享一些豌豆荚提供的相关数据:
◆2010年10月21日,用户可以从豌豆荚找到1000款不同的应用;
◆2011年6月8日,用户可以从豌豆荚找到10000款不同的应用;
◆2012年2月7日,用户可以从豌豆荚找到100000款不同的应用。
豌豆荚已有超过3000万用户,与超过20家应用商店合作,为用户提供超过15万款不同应用,用户通过豌豆荚搜索下载的应用数量总计超过了10亿个。
以下是51CTO记者对豌豆荚创始人王俊煜的采访整理:
51CTO记者:做搜索肯定会涉及到算法问题,“应用搜索”的算法条件是如何得来的?或者说,我们如何判定这些款应用是用户最想要找到的?
王俊煜:豌豆荚排序有两个概念,一个是应用的排序,比方说搜小鸟,是把愤怒的小鸟的放在前面,还是把愤怒的小鸟太空版放在前面,这是其中的一种排序,这个排序主要依据,一个是关键词的匹配,一个是下载量。因为我们会认为说越受欢迎的应用,应该是更可能命中你的需求的,这是一个简单的假设。
当然我们也会通过用户的评价,我们用户会打分,或用户卸载的时候,他也会留下一些记录,这种时候就可以综合去判断这个应用的质量,这个问题相对来说是比较好解决的。
还有另外一种排序,同样的应用在不同市场都出现,比如愤怒的小鸟,应该是所有的应用市场都收录,就看你把哪个应用市场放在前面和后面。我们在想什么样的因素对用户来说是最重要的,假设说不同应用市场的应用是一样的话,你最关心的肯定是下载的速度,下载的稳定性,也包括它会不会在里面加入比方说去篡改这个应用本身,加入一些广告,这些都是你会考虑的一些要素。不管是下载的速度还是服务的稳定性,还是说它的应用有没有一些不良的记录,这些我们的数据里面都会进行分析,然后综合给一个排序,保证用户来点击的时候,他能够下到的是一个访问速度最快,同时又是最安全,最原滋原味的一个应用,这是我们对这两种排序的一个最主要的思路。
51CTO记者:“应用搜索”也会涉及到一个排名的问题,像Google,我们知道一些影响排名的因素,所以我们会去做SEO优化,可以帮助我们让页面的排名更靠前一些,“应用搜索”会不会也有一套类似的标准,能够让其他商店或者开发者去做优化,提高排名。
王俊煜:这个涉及到刚才讲到的开放的生态系统的问题,现在有一个障碍,开发者没有办法直接和应用搜索打交道,他也没有地方去做优化。比如他描述的信息,他所有的标题,其实都是由应用市场来向我们提供的,其实开发者他自己在这里面做的事情是比较的有限,我们也在想说让开发者直接参与到这里面来,包括他能够看到豌豆荚的应用搜索,给他带去了多少下载量,他分别是根据什么样的关键搜索词进来的,用户是通过什么样的渠道找到你的应用的,用户的评分是多少。只有提供了更多的信息,开发者才能做出更好的判断。
因为我们自己也做SEO,所以我们自己也看很多SEO方面的数据,所以开发者应该有类似的需求,但我们目前的架构可能还不是特别的支持这件事情,因为他本身并不能直接来影响这上面的数据,现在更多的对豌豆荚进行SEO的需求,可能是应用商场的需求,不同的应用商店,这里面会有一些竞争,但还没有到开发者这个层面。应用商店我们的标准一直是很统一的,首先我们最关心下载速度、稳定性,还有你提供的应用的质量,包括你描述的这种可靠性,这些都是我们会不断的给不同的应用市场来传达的。好的应用市场,优秀的应用市场,也会在豌豆荚应用搜索流量里面分到更大的份额,这样也是一个更健康的一个生态系统。
51CTO记者:之前您曾谈到,“应用搜索”的所有算法及条件的判断都是由机器来完成的,那么针对目前市场上很普遍的添加人们关键词的问题,比如我开发一款豌豆荚音乐,在市场上,我可以把关键词设为“QQ”、“微信”等热门词,诱导用户在搜索过程中发现我的应用。针对这个问题,“应用搜索”是如何解决的?
王俊煜:我们现在的做法其实跟Google是很接近的,***我们是坚持不去人工干预。为什么不人工干预?人工干预可能有时候能解决短期的问题,比如你发现一个搜索结果不对,你赶紧进后台改一改,确实这个搜索结果就更对了。但是实际上来讲,搜索你希望做的是满足用户各种各样需求的办法,你进行了一次人工干预,这次可能对,但是你其实放弃了一个机会,就是系统性地去解决这个问题的一个机会,所以这是我们坚决不去做人工干预的一个最主要的原因。
现在我们的做法,每周都会有一次,大家来看搜索有什么问题,看完以后再去总结,再看对算法需要进行什么样的系统性的调整,或者对我们的设计需要进行什么样的一个系统性的调整。但是不会说是对某一个CASS去进数据库里面去把它改掉,我们是通过这样的办法来做的。
比方你刚才说例子其实我们也会遇到,早期有一件很荒谬的事情,豌豆荚里面是搜不到豌豆荚的,最主要的原因是豌豆荚它没有提交给各种各样的应用商店,我们也没有办法说人工的把豌豆荚加上。但是这样带来一个问题,我们发现豌豆荚出来以后,结果里面就是各种各样关键词堆弃关键词的产品,不管是什么各种各样的应用,它都会加上豌豆荚这个关键词,因为它搜索量确实很高,而本身又没有加入豌豆荚。
我们早期通过这个CASS来发现这个问题,然后你就会去做一些工作,比方关键词的堆弃有没有一些什么样的固定的东西认为它这个关键词是堆弃,然后做了关键词堆弃以后,怎么去降低它的权重?怎么样进行一定的惩罚?这些都是通过分析一个一个的案例,去做系统性的改进,而不是人工的去一个个把它给擦掉,这样效率其实是不高的。
51CTO记者:还有就是关于搜索及时性的问题,比如一个市场新增加一款应用,用户能够很及时的从咱们的应用搜索里搜到那款应用吗?
王俊煜:对,我们现在收录时间在十分钟以内,只要有我们任何一个收录的市场有一个应用的话,十分钟以内这里应该是能搜到的,没有搜到的话,应该是有问题的。同时能够计算出相关的排名情况。