程序员的一个爬虫,把估值175亿的马蜂窝给捅了

开发
10月21日,一篇名为《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》火了!直指旅游网站马蜂窝大量内容和评论涉嫌造假。

10月21日,一篇名为《估值175亿的马蜂窝,竟是一座僵尸和水军构成的鬼城?》火了!直指旅游网站马蜂窝大量内容和评论涉嫌造假。

事情是这样的:

某数据团队的几个同学回国参加创业大赛,吃外卖拉了肚子,就在平台写了一段差评,结果反而被污蔑诋毁。 

 

碰巧这个团队在美国学的都是数据分析,一怒之下决定训练一个模型,用于筛选餐饮评论的水军,恰巧马蜂窝成了他们的练手对象,没想到不爬则矣,一爬把马蜂窝给捅了!

 

[[247694]]

 

这篇文章中表示:“在马蜂窝网站上,发现了7454个抄袭账号,平均每个人从携程、艺龙、美团、Agoda、Yelp上抄袭搬运了数千条点评,合计抄袭572万条餐饮点评,1221万条酒店点评,占到官网声称总点评数的85%。”

文章中还列举了几项抄袭石锤:

 

 

还有的抄袭账号自相矛盾,性别忽男忽女,甚至有些直接调用Google翻译接口

 

 

马蜂窝回应

22日早上,马蜂窝也随即发布了声明,表示会对涉嫌虚假的信息,进行查处。 

 

另据***消息,针对自媒体报道的马蜂窝数据造假一事,马蜂窝已向北京市朝阳区人民法院提起诉讼,称乎睿数据侵犯名誉权,目前已获立案。 

[[247695]] 

23日,马蜂窝CEO陈罡也针对此事作出回应:马蜂窝在餐饮等点评数据方面存在部分问题,但远没有外界所表述的那么夸大。目前已经重新梳理工作流程,堵住漏洞。

网友怎么说?

目前,这件事已经在各大论坛都议论纷纷:

 

 

 

 

这件事总算让我见识到程序员的厉害之处了: 

 

‘水军’和‘爬虫’一直都存在于互联网行业,因为流量和数据对于一个互联网企业不可或缺,关于数据纠纷问题在互联网更是屡见不鲜,目前此事真相还未明了,我们暂时不予置评。

但通过这件事情告诉我们,惹谁也别惹程序员!尤其是有正义感又闲的技术宅。 

责任编辑:庞桂玉 来源: 程序猿
相关推荐

2022-06-20 09:00:00

深度学习人工智能研究

2019-02-19 15:20:12

消息总线架构异步

2024-04-02 08:45:08

ChatGPTAI会议人工智能

2019-06-11 12:19:10

ABTest分流系统

2019-03-29 08:21:51

马蜂窝Golang并发代理

2020-02-22 21:51:43

程序员Microsoft SServerSQL

2019-02-18 15:23:21

马蜂窝MESLambda

2019-03-25 15:14:19

Flutter马蜂窝开发

2019-06-11 11:18:40

容灾缓存设计

2018-10-29 12:27:20

2019-04-26 15:16:02

马蜂窝火车票系统

2014-01-06 09:33:32

程序员管理

2020-03-22 15:49:27

Kafka马蜂窝大数据平台

2020-01-03 09:53:36

Kafka集群优化

2020-02-21 16:20:37

系统驱动项目管理

2019-02-27 15:24:54

马蜂窝游抢单系统

2015-06-16 10:31:36

程序员

2020-07-10 09:55:15

程序员技能开发者

2011-02-14 13:05:17

PythonWeb

2015-06-08 10:48:39

程序员程序员自白
点赞
收藏

51CTO技术栈公众号