第319章 天下乌鸦果然一般黑。(1/2)
两人身后的办公桌上,一个敞开的必胜客披萨盒占了半张桌面。
盒子里的披萨还剩三片,芝士已经凝固成硬壳。
旁边立著两瓶喝到一半的矿泉水和一罐可乐。
“索引层的抓取频率如果从四小时降到一小时,带宽成本直接翻四倍。
翻四倍,拉里!
我们帐上的钱经不起这么烧!”
“可是如果不把抓取频率提上去,新网页的收录延迟就会从六小时变成二十四小时。
用户搜不到最新的內容,他们会回去用牙虎的目录!”
“那就先做增量抓取!只对更新频率高的站点提高频率,其他的维持原样。”
“增量抓取的调度算法你写了三个礼拜了,还是有bug!
上周四跑了一次全量测试,直接把第七號机架的三台机器內存打爆了。”
陈浩敲了两下门框。
两个人同时扭过头来。
“嗨。”陈浩从门口走进来。
“我是陈浩。大卫萨克斯介绍来的,说今天约在这里聊投资的事。”
拉里的表情略微显得尷尬。
一聊到技术,他俩差点忘了还约了人,还是重要的投资人。
谢尔盖则立刻反应过来,伸出手来。
“哦,对,大卫说过。
陈先生,你好。
抱歉,我们刚才在討论一个技术问题,没注意时间。”
拉里也把马克笔盖上,走过来握手。
“陈先生,欢迎。
大卫跟我们说了你的来意。请坐请坐。”
陈浩跟两人握完手,环顾了一圈这间会议室。
桌面上除了那个冷披萨盒,还散落著几份列印的论文、一本翻得卷了边的技术书籍、两支没盖的笔等各种杂物。
椅子东倒西歪,有一把的靠背上搭著一件黑色的抓绒外套。
陈浩笑了一声。
“你们搬到正规写字楼了,看这个使用方式,跟车库也没什么区別。”
谢尔盖先愣了一下,然后笑出来了,用手挠了挠后脑勺的捲髮。
“呃,我们最近加班比较多,东西没来得及收拾。”
他弯下腰,把桌上的披萨盒合上,往旁边挪了挪。
又把那几份散落的论文摞成一堆,推到桌角,动作很快。
拉里拉开一把椅子请陈浩坐下,然后走到角落里一台小型饮水机旁边。
“喝杯水我们这里条件简陋,咖啡机坏了三天了,还没修好。”
“水就行。”
拉里从旁边的架子上拿了一个纸杯,接了半杯热水端过来。
他在陈浩对面坐下来。
谢尔盖也拖了把椅子过来,坐在拉里旁边。
拉里开口了。
“大卫跟我们说你对搜寻引擎有兴趣。
那我先简单介绍一下我们目前的情况。”
拉里站起来走到白板前面,把之前写满的那面擦了一大块。
从桌上摸起一支马克笔,拔开笔帽,在白板上画了一个简单的网状结构图。
“我们的核心技术叫pagerank。
传统的搜寻引擎靠人工编辑目录,或者靠关键词出现的频率来排序。
这两种方法都有致命缺陷。
人工编辑的速度跟不上网际网路的膨胀,关键词频率容易被垃圾站作弊。
我们的算法完全不同,我们分析网页之间的超连结关係。
一个网页被越多的高质量网页引用,它的排名就越高。
这跟学术论文的引用逻辑一样。”
本章未完,点击下一页继续阅读。