十年一梦
100/180

32016·深水区

100V3_C28_差量

4415字 · 约9分钟

阅读进度 0%已读 0 分钟 / 共 9 分钟

V3_C28_差量

十二月初。倒计时第五天。

许畅在白板上画了一张图。

不是数字。是一条曲线。横轴是数据量。纵轴是准确率。曲线是S形的。从左下角开始往上爬。爬得很陡。到了中间变缓了。到了右上角几乎变平了。

他在曲线上标了几个点。

72%,六月。
80%,十月底。
82%,十一月。
84.3%,现在。

四个点。四个月。从72到84.3。涨了12.3个百分点。平均每月三个点。

但不是匀速的。前面快后面慢。72到80用了四个多月。80到84.3用了一个多月。看起来后面更快了。但那是因为加了服务器。加了数据。加了人。如果不加这些。后面比前面慢得多。

"我们在这里。"许畅用笔指着84.3那个点。"曲线在变平。"

"变平意味着什么?"我问。

"意味着到85%不难。但从85%往上会越来越难。每往上一个点需要的数据量是前一个点的两到三倍。"

他在84.3和85之间画了一段虚线。虚线很短。零点七个百分点。在白板上大概两厘米。但他在这两厘米旁边标了一行字——

"50万条新标注。"

五十万条。

我心里算了一下。五十万乘以一毛钱。等于五万块。五万块。不贵。还行。

"五万块?"

"对。这只是标注的费用。加上清洗、预处理、训练时间,总计大概六七万。"

六七万。占账上余额的大约百分之五。可以承受。

我觉得还行。

然后许畅说了另一句话。


"这只是第一批。"

他放下笔。转过来看着我。

"模型每迭代一次都需要新数据。旧数据跑多了会过拟合,就是学生背了答案不是真的学会了。需要注入新的样本。每一轮迭代。每一轮。"

"所以每次迭代都要花?"

"是。每次都要标新数据。每次都要清洗。每次都要训练。训练要用GPU。GPU要烧电。电费每个月在涨。"

"那总共需要多少?"

许畅停了一下。

"看情况。"

两个字。看情况。

我听出了这两个字背后的意思。

"看情况"不是"不确定"。是"没有终点"。

这不是一次性的投入。不是花五万块标完五十万条就结束了。是每次往前走一步都要再交一次入场费。走一步。交一次。再走一步。再交一次。无限循环。

S形曲线的右半段,从80%到90%到95%,每一步都比上一步贵。不是贵一点。是贵得多。指数级的贵。

"你的意思是——"

"我的意思是。从84.3到85。花六七万。可以做到。从85到90。可能还要花三四十万。从90到95,如果有那一天,可能需要一百万以上。"

一百万。账上总共一百三十七万。

我没有说话。

许畅也没有补充。他说完了。他的工作是诊断。诊断完了交给我。我是决策的人。他不是。

决策的人现在坐在椅子上。腰垫在后面。手放在膝盖上。手指没有动。

一百万。这个数字在我脑子里转了几圈。从84.3到85花七万。从85到90花四十万。从90到95花一百万。加起来一百五十万。比我们账上所有的钱都多。

但这是长期的。不是明天就要花的。明天要花的只有七万。七万能到85%。85%能让TS重新谈。TS谈好了300万进来。300万够烧一年半。一年半里也许能到90%。到了90%可以接大项目。大项目的收入能覆盖到95%的成本。

也许。又是也许。创业的每一步都建立在也许上面。也许是最不稳的地基。但你只有也许。确定的东西在大公司里。不确定的在创业公司里。

许畅说了"看情况"。我在心里翻译了一下。"看情况"翻译成人话就是:取决于钱够不够。钱够就继续。钱不够就停在某个百分点上。停在哪里由钱决定。不由技术决定。不由努力决定。由钱决定。

这是AI的真相。技术人员以为瓶颈是算法。创始人以为瓶颈是方向。投资人知道瓶颈是钱。

方教授说过一句话。"你们有数据是稀缺资产。"他说得对。但他没说完整。完整的版本应该是——"你们有数据是稀缺资产。但把数据变成价值需要钱。没有钱数据就是一堆躺在硬盘上的字节。值钱和变现之间差了一条产业链。产业链的每一段都要交费。标注要交费。训练要交费。GPU要交费。电费要交费。人工要交费。"

稀缺资产。稀缺是真的。资产也是真的。但资产不等于现金。资产是冻着的。解冻需要热量。热量就是钱。

我们的数据价值很高。但我们的钱很少。高价值加上低现金等于什么?等于一个有一座金矿但没有挖掘机的人。金矿在那里。看得见。摸得着。但挖不出来。因为挖掘机要租。租金要按月付。

无底洞的另一个名字叫什么?叫"有矿没钱"。


周小薇一直在听。

她没有打断许畅。她的方式是等所有人说完了她再出数字。数字不插队。数字等前面的话说完了再站出来。

"天使轮200万。"她说。声音平的。"已经烧了113万。余额87万。加上陈峰借的50万。137万。"

"过去五个月烧了113万。平均月烧22.6万。但不是匀速的。前三个月月烧大约15万。后两个月月烧接近30万。因为加了标注团队。加了两台服务器。加了许畅的工资。加了GPU的电费。"

她在Excel上拉了一条趋势线。趋势线是往上走的。

"如果许畅说的'持续迭代'成立。明年的烧钱速度会比今年快。不是快一点。是快很多。标注量翻倍。训练轮次增加。服务器可能还要加。月烧从17万可能涨到20万甚至25万。"

她抬头看我。

"137万按25万月烧。五个半月。到明年五月中旬。"

她在说这些的时候把Excel的屏幕转过来让我看。表格很大。几十行。每一行是一个月。每一列是一个科目。工资。房租。服务器。标注。电费。差旅。杂项。每一格都有数字。有些是黑的(已发生)。有些是红的(预测)。黑的确定。红的不确定。但她的红色预测从来不离谱。她预测上个月的支出误差不到百分之三。

"你看这列。"她指着标注费用那一列。"八月零。九月开始2.1万。十月2.3万。十一月3.5万。十二月——如果扩到15人标50万条——5万。一月可能更多。"

数字在往上走。每个月比上个月多。不是多一点。是多得越来越快。

"算力这列也是。"她指了另一列。"八月1.2万。十月加两台1.8万。十二月再加两台2.4万。一月如果再加——"

"不加了。"我说。"先看能不能到85%。到了再说。"

"到了以后呢?85%到90%还需要加吗?"

"看情况。"

她看了我一眼。"你刚才听到许畅说'看情况'了。现在你也说。你觉得我会信?"

她不信"看情况"。她信数字。数字没有"看情况"这个选项。数字只有加和减。进来的加。出去的减。减到零就结束了。

五月中旬。又是五月。签TS时说五月是死线。三周倒计时那周也说。现在还是。不管怎么算都是五月。五月是所有计算的终点。

"如果Pre-A的300万在三月到账呢?"

"137万加300万等于437万。按25万月烧等于17.5个月。到后年六月。那是另一种活法。"

另一种活法。Pre-A到了就是17个月。不到就是5个月。差12个月。差了整整一年。一年的差距。取决于一张TS。取决于85%。取决于0.7个百分点。

刘海洋在旁边听着。没说话。手里的圆珠笔在纸上点了几下。点的节奏不均匀。他在想什么我不知道。


散会以后。我去找刘海洋。

他的工位上多了两个空的红牛罐。今天白天喝的。白天喝红牛——昨晚也没怎么睡。

"你怎么看许畅说的?"

他想了想。手指在键盘上停着。

"他说的是对的。数据是瓶颈。不是算法。算法我们已经用了最好的了。是数据不够。"

"那'看情况'呢?真的是无底洞?"

他又想了想。更久一些。

"'持续迭代'有优化空间。不一定每次都要全量新数据。可以用差量更新。"

"差量更新?"

"就是每次只更新模型学得不好的那部分。不需要全部重新标注。只标错误案例。收集真实用户反馈。用反馈数据做增量训练。能省一半成本。也许更多。"

"省一半——"

"从六七万降到三四万。每次迭代。不是没有成本。但可控。"

"你跟许畅讲了吗?"

"没有。"

"为什么?"

"因为差量更新需要重新设计训练流程。这是架构的事。是我的事。不是他的事。"

他停了一下。

"我写一个方案。"

他转回屏幕。打开了一个新文档。开始打字。

我站在他旁边看了三秒。他打字的速度很快。每一行都在说同一件事——怎么用更少的钱做到同样的效果。怎么在无底洞里找到一个台阶站住。

这是刘海洋。许畅看到了问题的存在。刘海洋看到了问题的出口。

许畅说"无底洞"。刘海洋说"无底洞里有台阶"。同一个洞。不同的看法。许畅看到的是深度。刘海洋看到的是可能踩到的地方。

差量更新。这个词我不懂技术细节。但我懂它的意思——不要每次都推翻重来。只改需要改的。保留做对的。修正做错的。用最小的成本做最大的进步。

这不只是技术方案。这是一种哲学。适用于代码。也适用于人。也适用于婚姻。

不要每次都推翻重来。保留做对的。修正做错的。

也许我跟黄雨萱之间也需要一次差量更新。不需要把九年全推翻。只需要改那几个做错的地方。那些"没事""挺好""问题不大"的地方。

但这个念头只闪了一下。很快就被面前的白板覆盖了。白板上有S形曲线。有84.3。有50万条。有"看情况"。

工作先做。家的事以后再说。

以后。又是以后。


下午。我去了一趟标注间。

标注间已经扩大了。从六个人变成了十五个人。从二十平米搬到了旁边一间更大的房间。三十平米。八张桌子。每人一台电脑。

我站在门口。看了一会儿。

十五个人低着头。面前是屏幕。手指在键盘和鼠标之间切换。咔嗒咔嗒。节奏整齐。比以前更整齐了。因为人多了。人多了节奏就稳了。单独一个人的节奏是不规律的。十五个人加在一起就变成了一个均匀的声音。

王姐坐在最前面。她现在是"标注组长"。管着十四个人。她的屏幕上跟别人一样——一行行客服对话在滚动。但她多了一个任务——抽检。每天抽检一百条。看其他人标得对不对。

窗户开着。十二月的风进来了。有两个人把衣领立起来了。但没有人关窗户。因为十五台电脑发的热让房间不太冷。冷风和热气混在一起。温度大约十五六度。不暖。但能忍。

墙上贴着标注规范。A4纸打印的。字很密。"退款意图标注规则""投诉分类标准""闲聊vs正式咨询的边界"。规范纸的边角起了。被人用透明胶带压平了。又起了。又贴了。反复了好几次。纸面上有好几层胶带的痕迹。

这就是AI的现实面。不是白板上的S形曲线。不是许畅屏幕上的loss图。不是刘海洋凌晨的Git提交。

是十五个人。十五台电脑。十五双手。一毛钱一条。一天一千条。一个月三万条。十五个人一个月四十五万条。

五十万条新标注。十五个人标一个月零五天。

刘海洋的差量更新方案如果有效。也许只需要二十五万条。半个月多一点。省一半。省一半。标注费从五万降到两万五。两万五也是钱。但比五万好。

好一半就是好。在快要死的时候好一半可能就是活和死的区别。

我在标注间站了五分钟。没有说话。没有人跟我说话。他们在忙。咔嗒咔嗒。节奏均匀。十五个人的鼠标声汇成了一种白噪音。白噪音让人安静。让人在焦虑的时候找到一个可以站着的地方。

王姐抬头看了我一眼。点了一下头。又低下去了。她在标一条投诉。"你们的服务太差了我再也不来了"。她标了"投诉——对服务"。咔嗒。下一条。

每一条的背后是一个人的手指动了一下。咔嗒。每一个咔嗒的背后是一毛钱。每一毛钱的背后是AI的胃口。每一份胃口的背后是账上少了的那一点钱。

标注间和服务器和GPU和电费和工资和租金。全是AI的嘴。它在吃。不停地吃。吃数据。吃电。吃钱。吃人的时间。

AI的胃口在长大。它吃得越多越聪明。越聪明要吃更多。

这就是许畅说的"看情况"。看什么情况?看它什么时候吃饱。答案是——永远不会。AI没有"饱"这个概念。它只有"更准"。更准的代价是更多。更多的代价是钱。

钱是有限的。AI的胃口是无限的。有限追无限。追不上。

但你可以在某一个"够用"的点上停下来。85%也许就是那个点。85%够签客户。够拿融资。够活下去。

不需要95%。不需要99%。需要的是"够用"。

够用。这两个字在创业里比"最好"值钱一百倍。

完美是大公司的奢侈品。够用是创业公司的生命线。你不需要做到99%。你需要做到客户愿意付钱的那个百分比。那个百分比是85%。不是我定的。是客户定的。是吴老板定的。是鲜茶记的王姐定的。是投资人定的。

85%。够用的线。越过这条线。门就开了。没越过。门关着。

我不需要完美。我需要够用。然后活下去。活着的公司可以慢慢变好。死了的公司什么都不是。

刘海洋的差量更新也许是通向"够用"的一条捷径。不走弯路。不花冤枉钱。只改需要改的。保留对的。修正错的。

够用。活着。继续。

这三个词是2016年十二月我的全部哲学。


晚上。办公室只剩我。

所有人都走了。刘海洋今天早走了。他要回去写差量更新的方案。他说"明天给你"。许畅也走了。张富贵走之前在群里发了一条"鲜茶记那边王姐说合同模板明天发来看看"。

安静。服务器嗡嗡转。

我站在白板前面。拿起一支笔。黑色的。

画了一张表。

第一行:余额137万。
第二行:本月支出17.6万。
第三行:下月加数据标注,支出预计20万。
第四行:再下月,可能22万。
第五行:……

越画越皱眉。数字在往上走。每一行比上一行大。支出在加速。收入在——TBD。

我在表格的右下角写了两个字。

无底洞。

写完以后看了三秒。然后拿白板擦擦掉了。

但痕迹还在。马克笔的墨水渗进了白板的涂层里。擦掉了字。擦不掉颜色。浅浅的灰色。"无底洞"三个字的鬼影还在白板右下角。

你不凑近看看不出来。但我知道它在那里。

跟蓝色笔记本一样。推进了书架底层。擦掉了白板上的字。但痕迹都在。

有些东西擦不干净。写过的字。说过的话。花掉的钱。消耗的时间。

刘海洋的差量更新方案明天会到。也许能省一半成本。也许不能。但至少有人在想怎么省。有人在想怎么在无底洞里找到一个台阶。台阶不是出口。但台阶能让你站住。站住了就不会继续往下掉。

今天是十二月初。到TS截止日期还有两周多。到85%还有0.7个百分点。到五月死线还有五个月。到三月硬线还有三个月。

所有的数字都在倒计时。所有的倒计时都在走。走的速度是一样的。一天一天。均匀的。不因为你焦虑就快。不因为你轻松就慢。

时间是最公平的东西。也是最残忍的。

关了灯。走了。

门口那张"什么都可能发生"的纸还在。歪的。图钉锈了。纸黄了。字还能看清。

什么都可能发生。包括无底洞。也包括台阶。

看刘海洋明天的方案吧。