拉里还在思考,谢尔盖突然先开了口。
“这个模型有漏洞。”
谢尔盖从椅子上站起来,走到白板前面,从笔架上拿了一支马克笔。
他在陈浩画的梯形图旁边画了一个箭头,指向第一位那个方框。
“假设美联航的竞爭对手达美航空,不买gg,而是雇一帮人,反覆点击美联航的gg。
每点击一次,美联航付一次钱。
一天点一万次,美联航白白烧掉一万多美金,而且一张机票都没卖出去。”
他在箭头旁边写了一个词:点击欺诈。
“在cpc模式下,这个问题是致命的。
gg主一旦发现自己的预算被竞爭对手恶意消耗,第一反应就是停止投放。
一旦信任崩了,整个系统就废了。”
谢尔盖不是因为赌不起找茬,而是在用工程师的本能找系统的脆弱点。
任何一个经歷过分布式系统开发的程式设计师,第一反应永远是找到系统的漏洞。
谢尔盖皱著眉继续说道。
“还有一个问题。
你说让gg主竞价,出价高的排前面。
那如果一家网上赌场出了十美金一次点击,而一家本地书店只出五毛钱呢?
用户搜书,排在第一位的是赌场gg。
你让我们怎么跟用户交代?
搜索结果的纯净度,是我们从第一天就坚持的底线。
pagerank的核心原则就是让最好的內容排在最前面。
如果gg排名完全由出价决定,那我们跟那些卖搜索排名的流氓引擎有什么区別?”
拉里在旁边没说话,但他明显也有相同的意思。
技术上的让步可以谈,搜索质量上的妥协,没得商量。
陈浩起身走回白板前面。
“你提的问题都很好,確实的这个方法容易出现的问题。
但这些我早就有了解决方案。
先说点击欺诈。”
他拿了支马克笔,在白板右侧画了一个流程图。
“每一次gg点击在计费之前,先经过一套质量过滤系统。
第一关是ip检查。
同一个ip位址在短时间內重复点击同一条gg,第二次开始不计费。
gg主不花冤枉钱。
第二关是行为特徵分析。
正常用户点击gg之后,会在落地页上停留、瀏览、甚至购买。
如果一个点击发生后很快就关闭了页面,这个点击標记为可疑。
积累到一定数量,整个ip段进入黑名单。
第三关则是人工覆核,为整个系统兜底。
系统自动標记的异常点击,由一个小团队定期抽查。
如果確认是恶意行为,相关费用退还给gg主。”
他在流程图的末端画了一个方框,里面写了“退款”两个字。
“点击欺诈是cpc模式最大的隱患。
但这不是一个无解的问题。
它是一个工程问题。而你们两个是我见过的最好的工程师。
相信按照刚才的方法,你们很容易就搭建一个能够解决问题的工作流。”
谢尔盖盯著那个流程图,陷入思考,没有马上提出反驳。
陈浩接著说第二个问题。
“赌场出十块钱、书店出五毛钱的问题。
你的担心是对的。
如果纯按出价排序,垃圾gg主有钱就能霸占最好的位置,搜索体验迟早完蛋。”
他在白板上写了一个公式:
gg排名 = 出价 x 相关度