V3_C30_算力
十二月。账单到了。
周小薇把当月的支出明细打印出来。A4纸。两页。第一页是分项。第二页是汇总。
她走到我工位旁边。把两页纸放在桌上。没有说话。放下就走了。她的方式。数字自己会说话。不需要人陪。
我拿起来看。
GPU服务器月租:6台。每台3000元。合计18000元。
标注团队费用:15人。王姐3500。其他14人平均3100。加上场地水电。合计约48000元。
核心团队人工:赵秉文8000。刘海洋15000。张富贵8000。周小薇6000。许畅12000。林工10000。小陈8000。合计67000元。
办公场地:共享办公4800。标注间1200。合计6000元。
服务器托管+带宽+电费:约5000元。
其他杂项(外卖、差旅、打印、快递):约3000元。
合计:约147000元/月。
十四万七。
我盯着这个数字。十四万七。
每个月。十四万七从账上流走。
每一行我都认识。但加在一起的时候它们变成了另一种东西。不是数字了。是重量。每天大约五千块。每小时两百块。每分钟三块三。我现在坐在椅子上看这张纸。看了三分钟。花了十块钱。十块钱。两碗沙县拌面。
钱不是花掉的。是被吸走的。被GPU吸走的。被标注间吸走的。被工资吸走的。被每一个正在运行的东西吸走的。
账上多少?加上陈峰借的五十万。一百三十七万。
137万除以14.7万。等于9.3个月。到明年九月。
但这是静态的。不增加任何东西的情况。不加服务器。不加标注量。不涨工资。不出差。不路演。维持现状。
维持现状的意思是什么?是准确率停在84.3%。停在84.3%,到不了85%。到不了85%,TS谈不了。TS谈不了,Pre-A没钱。没钱——
不想了。
周小薇拉了另一张表。不是账单。是预测。
她把笔记本电脑转过来给我看。Excel。屏幕上是一张大表格。横轴是月份。从2016年12月到2017年12月。纵轴是三列:收入。支出。余额。
收入那一列几乎是空的。零。零。零。到了一月有一行小字:"鲜茶记签约(预估)10500。"二月:"AI实施项目(意向)150000。"三月以后全是问号。
支出那一列在增长。十二月14.7万。一月15.2万(加了两台服务器)。二月15.8万(标注量增加)。三月16万。逐月在涨。
余额那一列——红色的。每一行比上一行红。不是颜色在变。是数字在变小。137。122。106。90。74。58。
到五月。余额:约43万。
"这是不再加服务器、不增加标注量的情况。"她说。
"那能到85%吗?"
"按刘海洋的差量更新方案。也许能。但慢。三月底也许。"
"如果要快——加服务器呢?"
"加两台。月烧涨到17万。到五月余额变成31万。"
31万。五月。如果Pre-A没到。31万能撑两个月。到七月。
"如果再快呢?加四台呢?"
"月烧19万。到五月余额17万。到六月归零。"
六月归零。
"也就是说——"
"加了服务器。到85%会更快。但命也更短。你在赛跑。跑得越快油烧得越多。跑到终点的时候也许油箱刚好空了。也许差一口气。差一口气就趴在路上了。"
她说"趴在路上"的时候语气没变。跟说"合计十四万七"一样平。
钱不是花掉的。是被AI吞掉的。AI吃数据。数据要标注。标注要人工。人工要工资。工资要钱。AI吃完了数据吃钱。吃完了钱吃命。
从两百万到一百三十七万。五个月。烧了六十三万。平均月烧十二万六。但不是匀速的。前三个月慢。后两个月加速。加速是因为加了人加了服务器加了标注。以后会更快。因为AI的胃口在长大。
我看着那张Excel。眼睛从上往下扫。从第一行到最后一行。
第一行。2016年1月。余额185万。绿色。那时候刚拿到天使轮。账上有钱。心里有底。觉得什么都能做。
第七行。7月。余额130万。黄色。标注间开了。服务器加了。月烧在涨。但方向确定了。心里还行。
第十一行。11月。余额87万。黄色偏红。TS来了。但估值低了。借了50万。续了一口气。
第十二行。12月。余额137万(含借款)。红色。月烧14.7万。差量方案执行后也许能降到12万。但标注量在涨。服务器可能还要加。
往后看。预测区域。每一行的余额都比上一行少。每一格的红色都比上一格深。像水位在下降。你站在河岸上看水位刻度。一月一格。水退一格。到了某一格水就干了。干了以后河床上的鱼就死了。
鱼就是我们。河就是账户。水就是钱。
从200万的绿色滑到137万的黄色再滑到最后几行的红色。绿黄红。交通灯。绿灯过了。黄灯在闪。红灯要来了。但你不能停。停了就堵在十字路口了。闯红灯至少还有一个概率——万一过去了呢。
万一。又是万一。创业公司活在万一里。
"你有什么想法?"她问。
"差量方案执行以后。月烧能降多少?"
"标注费减半。算力减三成。综合下来月烧从14.7万降到大约12万。"
"12万的话——"
"137万除以12万。11.4个月。到明年十一月。比之前多了两个月。"
两个月。刘海洋用四页纸买了两个月。
"但这是不加服务器不冲85%的情况。"她补了一句。"如果一月加两台冲85%。月烧回到14万。到明年九月。如果冲到了85%并且签了客户有收入进来。时间会延长。如果没签——"
"不说这个。"
"好。"
下午。刘海洋拿着一叠纸走过来。
四页。A4。手写的。字很密。每一行都是代码逻辑的伪代码和文字说明。有些地方画了流程图。有些地方画了箭头。有一处用红笔圈了。旁边写着"关键节点"。
差量更新方案。
"按这个方案。"他说。声音平的。跟他提交代码的时候一样平。"每次迭代需要的新数据减少百分之五十。算力消耗减少百分之三十。"
"百分之五十——"
"对。不需要全量重新标注。只标错误案例和新增的边界情况。用用户反馈做增量训练。"
我拿过来看。看不太懂技术细节。但我能看懂数字。数据量减半。算力减三成。意味着每次迭代的成本从六七万降到三四万。省了一半。
"许畅看过了吗?"
"还没。"
"给他看一下。"
刘海洋把四页纸放在许畅桌上。许畅从论文里抬头。拿起来。看了。
三分钟。
这是很长的三分钟。许畅看技术文档的速度通常很快。三分钟说明他在认真看。在找问题。在评估可行性。
他在第二页某一行停了。手指点了两下。
"这里有个工程权衡。"他说。没有抬头。对着纸说的。"差量更新在数据分布漂移时效果会下降。新数据如果跟旧数据的分布差异太大。增量训练可能不收敛。"
刘海洋:"我知道。所以我在第三页加了一个检测机制。分布漂移检测器。如果新数据的分布偏移超过阈值。自动回退到全量训练。"
许畅翻到第三页。看了。
"嗯。"
一个字。
这个"嗯"不是敷衍。是"我看到了你考虑到了我想到的问题"的嗯。是技术人员之间的最高效沟通。不需要说"你做得好"。不需要说"这个方案可行"。一个"嗯"就够了。
这是他们到目前为止时间最长的一次当面技术交流。三分钟的阅读。两轮对话。一个"嗯"。加起来不到五分钟。但信息密度比大多数公司的两小时会议高。
刘海洋站在那里等了两秒。许畅没有补充。他转身回去了。
差量更新方案通过了。从今天开始执行。
成本省一半。月烧从14.7万降到大约12万出头(标注费减半+算力减三成)。
137万除以12万等于11.4个月。到明年十一月。
比之前多了两个月的命。刘海洋用四页手写纸换来了两个月。四页纸。密密麻麻。每一行字后面是他想了多久?也许一周。也许更久。也许从许畅说"看情况"的那天就开始想了。
他不说"无底洞"。他说"我来想办法"。然后想了。然后写了四页纸。然后省了两个月的命。
这就是骨头。骨头不抱怨重力。骨头撑住。
散会以后。六点。大家开始收拾东西。
周小薇没走。她留了下来。等其他人走了。走到我旁边。
"有件事单独跟你说。"
"说。"
"三月是硬线。"
"你说过。"
"我再说一遍。因为你最近在想怎么到85%。但85%到了不等于钱到了。从85%到TS签署到打款。至少两个月。如果一月底到85%。二月签TS。最快三月打款。三月打款。加上账上的余额。能撑到七八月。没问题。"
"那如果85%到了但在二月底呢?"
"二月底到85%。三月签TS。四月打款。四月打款。账上余额到四月大约还有五六十万。加上Pre-A的三百万。够了。但中间没有缓冲。"
"如果三月才到85%呢?"
"三月到85%。四月签TS。五月打款。五月——"
她停了。
"五月账上大概还有三十万左右。如果打款在五月中旬以后。可能不够发五月的工资。"
三十万。五月的工资。十四万七。三十万减十四万七等于十五万三。剩十五万三。撑到六月初。如果六月初Pre-A的钱还没到——
"所以。"她说。"85%的目标不是年底。不是一月。是越快越好。但即使快。也要留两个月给TS流程。倒推回来——一月底之前到85%是最安全的。二月底是极限。三月到就晚了。"
她说完了。看着我。等我消化。
她总是等我消化。她说完数字以后不催。不追问。她把数字放在你面前。然后等。等你自己走到那个结论。她的等跟陈峰的等不一样。陈峰的等是"我相信你能做出判断"。她的等是"你必须自己面对这个数字因为我没办法替你面对"。
两种等。都是真的。
我消化了。消化的过程大约三十秒。三十秒里我在心里倒推了三遍。一月底85%→二月签TS→三月打款→安全。二月底85%→三月签TS→四月打款→紧但可以。三月85%→四月签TS→五月打款→可能来不及。
三遍。三种结果。最好的和最坏的之间差了两个月。两个月决定生死。
然后我打开手机。群消息。发给了四个人。刘海洋。许畅。张富贵。周小薇。
六个字:
"三月前,85%。"
没有解释为什么。六个字就够了。他们不需要知道五月的工资表长什么样。他们只需要知道——三月前。85%。
张富贵最先回复。一个"收到"。然后一秒后又发了一条:"老赵,鲜茶记那边我在跟。85%到了我第一时间约演示。"
刘海洋回了一个"嗯"。
许畅回了一个"OK"。
周小薇没回。她就站在我旁边。不需要回。
十二月的上海。晚上七点。
窗外园区的灯一半亮一半灭。有些公司下班了。灯灭了。有些还在加班。灯亮着。从我们的窗户看出去。能数到大约二十个亮着灯的窗户。每一个窗户后面都有一家公司。每一家公司都在做自己的事。也许他们也在算账。也许他们也在看Excel。也许他们也在想三月。
服务器的冷却风扇声在安静的办公室里格外清楚。嗡嗡嗡。均匀的。不停的。它不管你的账上有多少钱。它只管转。转一天收你一天的钱。停了就不收了。但停了AI也停了。
周小薇的Excel打印稿放在我桌上。两页。第二页汇总那面朝上。红色的数字。147000。在荧光灯下很刺眼。
我把它翻过去。正面朝下。白色的A4纸的背面。什么都没有。干净的。
但翻过去不等于不在了。数字还在纸上。纸还在桌上。桌还在办公室里。
窗外的天已经完全黑了。十二月的上海。六点天就黑了。园区里的路灯亮了一半。另一半是暗的。有些公司下班了。灯灭了。有些还在。有些可能跟我们一样。在算还能活几个月。
远处有一盏窗户特别亮。不知道是哪家公司。也许他们在加班。也许在开会。也许也在看Excel。也许他们的Excel上也有红色的数字。也许他们也在倒计时。
或者也许他们已经倒完了。灯亮着只是因为忘了关。
办公室里六台服务器在嗡嗡转。角落里。绿色的灯在闪。每一台都在跑。每一台每一秒都在吃钱。你坐着它在吃。你站着它在吃。你回家了它还在吃。你睡着了它还在吃。
它不知道账上有多少钱。它只知道跑。
回家。地铁。站着。
心里算了一遍。不用打开备忘录。已经算过太多遍了。
五月是死线。三月是硬线。85%是门槛。
每一个新计划都把死线往前推了一点。一开始说八月。后来说七月。再后来说六月。现在说五月。有时候说四月。
每一次"加速"都在缩短命。加服务器——命短了。加标注——命短了。冲85%——命短了。
每一个让你跑得更快的决定同时让你活得更短。速度和寿命是反比的。跑得越快死得越快。
但不跑也是死。慢慢地死。84.3%待着。客户等不来。TS签不了。Pre-A拿不到。账上的钱一天一天少。少到零。
快死和慢死选一个。
选快。至少快的路上有一个终点线。85%。越过去就活。没越过去——至少知道死在了哪里。
地铁进站了。感应机器叫了一声。我刷卡。进去。上车。站着。抓吊环。看着车厢顶上的灯管。白色的。嗡嗡的。跟服务器的声音一样。
三月在倒计时。
每过一天。倒计时少一天。每少一天。账上少一万多。每少一万多。离零近一点。
但同时。每过一天。准确率也在涨一点。84.3。84.5。84.7。也许明天就到84.8了。也许后天到85了。
两条线。一条往下。一条往上。
交叉点在哪里?在三月的某一天。
如果那一天往上的那条线已经越过85。那一天就是活的开始。
如果那一天往上的那条线还在84.几。那一天就是死的开始。
不知道是哪一天。但在三月。
三月。
到站了。出去了。
冬天的风从站口灌进来。冷的。直接吹到脸上。鼻子一酸。不是要哭。是冷的。十二月的上海。风比十一月硬。
出了站。走回小区。路上没什么人了。八点多了。路灯亮着。橘黄色的。照着空荡荡的人行道。梧桐树已经光了。叶子全落了。枝上什么都没有。光秃秃的骨架在路灯下面很清楚。一根一根的。从主干到小枝。
春天它们会重新长出叶子。但那是春天的事。现在是冬天。冬天的树不思考春天。冬天的树只管站着。不掉就行。
我也是。不掉就行。
走吧。回家。
家里也许有菜。也许有粥。也许黄雨萱还没睡。也许她在看CPA。也许她在等我。也许不是等。只是还没睡。
不管是什么。推开门就知道了。
今天的事做完了。明天的事明天来。
一天一天来。一个百分点一个百分点爬。一万块一万块烧。
直到三月。或者直到85%。看哪个先到。
这就是2016年十二月。一年快过完了。从一月的日活七到十二月的准确率84.3%。从车库到张江。从四个人到七个人加十五个标注。从两百万到一百三十七万。从不知道AI是什么到S形曲线的右半段。
这一年我学到了什么?学到了数字。所有的数字。好的坏的。涨的跌的。准确率和余额。客户数和月烧。TS和估值。
还有一些数字不是公司的。是家里的。十万。二十公分。五十个字。半克盐。
所有的数字都在倒计时。都在往某个终点走。
走吧。不管走到什么。走就对了。
站着不动才是最贵的。因为站着不动的每一分钟也要花三块三。
2016年。我的第一年AI创业。从不知道NLP是什么到知道一条标注一毛钱。从TensorFlow学不懂到差量更新方案通过。从日活七到准确率84.3%。
明年会怎样?
不知道。但三月会来。三月来的时候我得有85%。有一个签约的客户。有一张估值更高的TS。有一家活着的公司。
有这些就行。其他的以后再说。
够用。活着。继续。