V3_C29_散场
十二月中旬。
许畅说需要更多标注人员。五十万条标注。六个人不够。需要扩。
周小薇去找人了。不是在招聘网站上找。太慢了。她去了旁边街道的劳务市场。一间门面。玻璃门上贴着红纸的招聘信息。保安。保洁。分拣。缝纫。食堂帮工。
她在里面坐了一个下午。跟十几个人聊了。最后带了十二个回来。
都是女的。三十五岁到五十岁。有些是下岗的。有些是在家带孩子的。有些两样都是。她们会用电脑。至少会用鼠标和键盘。打字不需要太快。标注不需要打字。只需要看一行字。判断它是什么意思。然后点一个下拉框。选一个选项。咔嗒。下一条。
时薪十五块。一天八小时。一天一百二十。一个月按二十六天算三千一百二。不算多。但对大部分人来说够了。够交房租。够买菜。够给孩子交学费。
标注间搬了。从原来的二十平米搬到旁边一间更大的。三十平米。八张桌子。每张桌子坐两个人。十五台电脑。有一台是从原来的房间搬过来的。屏幕有一个亮点。左下角。林工以前用的那台。
新来的十二个人里有一个叫小刘的。三十八岁。以前在超市当收银员。超市关了。来了。第一天她问王姐:"标什么啊?"王姐说:"看一行字。判断它是什么意思。选一个选项。""跟我以前扫条码差不多嘛。""差不多。但这个没有哔的声音。"
还有一个叫张阿姨的。五十二岁。最老的。她打字很慢。但标注不需要打字。她看得很认真。每一条看两遍。第一遍看内容。第二遍确认选项。所以她的速度是最慢的。一天大概八百条。但她的准确率是最高的。王姐抽检的时候发现张阿姨的错误率不到百分之一。
王姐还是组长。管十四个人。月薪从三千二涨到了三千五。涨了三百。我提的。她没有要求。但三百块对一个管十四个人的组长来说是应该的。不是奖励。是该给的。
我站在新标注间的门口。
十五个人低着头。面前是屏幕。白色的背景。黑色的字。一行行客服对话在滚动。每一行左边是客户说的话。右边是一个下拉框。下拉框里的选项:退款。投诉。咨询。闲聊。情绪正面。情绪负面。情绪中性。对人投诉。对产品投诉。
每一行需要两个判断。第一个是意图分类。第二个是情绪分类。两个下拉框。两下鼠标。咔嗒。咔嗒。下一条。
十五个人同时点鼠标的声音。不是杂乱的。是整齐的。有一种节奏。不是统一的节奏。是十五种略有不同的节奏叠加在一起以后形成的一种平均节奏。快的人带着慢的人。慢的人拖着快的人。最后变成了一个稳定的频率。大约每秒三到四次咔嗒。
这个声音让我想到了什么?
想到了流水线。想到了工厂。想到了传送带上一个一个过去的零件。想到了拧螺丝的手。想到了去年在松江那个骗我们两万的假工厂——车间里冲床在转。重复的声音。机械的声音。人在机器旁边。做机器做的事。
现在这间标注间里也是一样。人在电脑旁边。做电脑以后会做的事。
第一排靠窗的是小刘。前收银员。她标得很快。也许是因为当收银员练出来的反应速度。扫条码是一种训练。看一眼条码。刷一下。哔。下一个。现在是看一行字。判断。点一下。咔嗒。下一条。唯一的区别是没有哔的声音。但节奏差不多。
第二排靠门的是张阿姨。五十二岁。她每一条都看两遍。看得很慢。但几乎不出错。王姐说她是"质量最好的"。她不争速度。她争准确。
第三排中间有一个很年轻的。大概二十二三岁。大学毕业没找到工作来的。她标得最快。每分钟十二条。比王姐还快。但准确率低一些。她把"客气的投诉"标成了"正面评价"好几次。"你们的东西还行吧"——这到底是夸还是损?年轻人分不清。因为年轻人说话直接。"还行吧"在年轻人嘴里是真的还行。在中年人嘴里可能是"其实不太行但我不好意思说"。
年龄差异造成的语义差异。这是AI和标注都解决不了的问题。
重复。
她们在做的事情就是重复。看一行字。判断。点。下一行。看。判断。点。下一行。一天一千条。一个月两万六千条。十五个人一个月三十九万条。
每一条一毛钱。
而我们做的AI是什么?是替代重复劳动的工具。我们告诉客户——"用了我们的AI客服,你的客服人员就不用每天重复回答同样的问题了"。
AI替代重复。
但AI本身是靠更多的重复喂大的。
这十五个人在重复的劳动。跟她们试图被AI替代的那种重复劳动。本质上没有区别。
一边是高科技。AI。深度学习。NLP。Transformer。Attention。
另一边是低技术。坐着。看屏幕。点鼠标。一毛钱一条。
这两边是同一件事的两个面。折叠在一起。打开是一面。合上是另一面。你看到的那一面取决于你站在哪里。
站在白板前面你看到的是S形曲线。准确率。里程碑。
站在标注间门口你看到的是十五双手。十五个下拉框。三十九万次咔嗒。
王姐看见我站在门口。
她停下了手里的鼠标。擦了一下额头。不是热。是习惯。她在工厂拧螺丝的时候也会隔一会儿擦一下额头。劳动的惯性。身体不热但手会往额头上摸。
"小赵。"
"王姐。"
她站起来。走到门口旁边。靠着门框。手里还拿着鼠标的那个姿势。手指弯着。四指并拢。拇指在外面。
"你来看看?"
"嗯。看看。"
"有什么要改的吗?"
"没有。就是看看。"
她笑了一下。不大。嘴角动了一点。
"小赵,我跟你说个事。"
"你说。"
"我以前在松江工厂拧螺丝。一天八小时。一种螺丝。从早拧到晚。拧了三年。三年。同一种螺丝。M8的。十字头的。拧到后来闭着眼都知道力道。"
她说这些的时候语气很平。不是抱怨。是陈述。跟她标注"投诉"和"退款"一样的语气。
"现在给你们的机器人教说话。"她顿了顿。"拧螺丝无聊。现在也无聊。"
她看了我一眼。
"但这个无聊好像更值钱一点。"
我没有立刻回答。
她说的"更值钱"不是说钱多了——三千五跟以前差不多。她说的是——这个无聊的东西在做一件她觉得有意义的事。拧螺丝的意义是什么?螺丝拧进去了。固定了一个零件。零件组装成一个产品。产品被卖了。然后再拧下一个。
标注的意义是什么?她点了一个"退款"。这个"退款"被送进了模型。模型学了。学完了以后遇到一个新的"退款"问题能自动回答。
她在教一台机器说话。
以前拧螺丝的时候她不知道那个螺丝最终安在了什么产品上。现在标注的时候她也不知道她标的那条数据最终被模型学成了什么样子。她只知道——点了。下一条。点了。下一条。
但"值钱一点"三个字让我停了。
为什么她觉得更值钱?因为我们告诉她了。我跟她说过:"你标的每一条数据都在教AI说话。"她记住了。她不知道AI是什么。她不知道NLP是什么。但她知道"教说话"是什么。她教过自己的孩子说话。从"妈妈"到"苹果"到"我想吃"。一个词一个词地教。现在她在教一台机器。一条一条地标。
从孩子到机器。教学方法没变。被教的对象变了。
这比拧螺丝有意义吗?也许。也许只是另一种螺丝。更小的。看不见的。拧进去的不是金属。是数据。但结果一样——她不知道她做的事情最终变成了什么。她只知道每个月三千五到账了。
我想起方教授说过一句话。不是直接对我说的。是他在一次采访里说的。我后来在网上看到的。"AI不是魔法。AI是统计学加上廉价劳动力。"
统计学是许畅的。廉价劳动力是王姐的。两个加在一起才是AI。
拆开了看。AI不神奇。
我走出标注间。在走廊里站了一会儿。
走廊的灯是声控的。我站着不动。灯灭了。黑暗里。
他们做的事。深度学习。智能客服。白板上的S形曲线。许畅屏幕上的loss图。刘海洋的两万行代码。Git日志里的蓝绿交替。这些是AI。是先进的。是未来的。是投资人愿意给1200万估值的。
标注间里的事。坐着。看屏幕。点鼠标。一条一毛钱。一天一千条。日复一日。月复一月。这些是什么?是让前面那些"先进"存在的前提。
没有王姐们的十根手指。那些论文里的数字全是零。没有三十九万次咔嗒。S形曲线就画不出来。
高科技底下的低级劳作。
两者折叠在一起。你展开来看是两层。合上了看是一层。创业者看到的永远是合上了的那层——光鲜的。但站在标注间门口你看到了打开的那层——灰色的。
我没有对这件事做任何评判。因为我没有资格评判。我用她们的劳动换取数据。数据换取准确率。准确率换取融资。融资换取活下去的时间。
我是这条链子上的一环。不比她们高。也不比她们低。只是站在不同的位置上做不同的动作。
但站在走廊里的那一刻我感到了一种奇怪的晕眩。不是头晕。是一种认知上的失重。
你以为自己在做一件很高级的事。白板上画曲线。跟投资人谈估值。用英文缩写讨论算法。这些看起来很高。很远。很未来。
回头一看。底座是十五个人坐在一个月租一千二的房间里点鼠标。
高科技和低端劳动之间没有台阶。没有过渡。没有缓冲区。它们直接连在一起。中间没有任何东西。
许畅的论文建立在王姐的咔嗒声上。刘海洋的架构建立在小刘的时薪十五块上。张富贵的客户签约建立在张阿姨一天八百条的准确率上。
每一个"高"的东西下面都有一个"低"的东西在撑。你拿掉了下面的。上面的就塌了。
这不是AI独有的问题。所有的产业都是这样。互联网建立在光缆上。光缆建立在挖沟的工人上。但你在讨论互联网的时候不会想到挖沟的人。你在讨论AI的时候也不会想到王姐。
今天我想到了。因为我站在标注间门口。看到了。闻到了。听到了。
标注间的灯是白炽灯。不是LED。黄一点。偏暖。但暖的灯照在屏幕上反而刺眼。因为屏幕是白色背景。白光和黄光叠在一起。有一种说不清的灰。
十五台电脑。十五个键盘。键盘都不一样。有黑的。有白的。有灰的。有一台键盘缺了一个键帽。F5。缺了也不影响。标注不需要按F5。
十五个人。有的穿羽绒服。有的穿棉袄。有一个穿了一件碎花的棉衣。看起来是自己做的。手缝的。针脚在领口那里有点粗。
窗外是停车场。偶尔有车驶过。声音闷闷的。隔着玻璃来的。像在很远的地方有人在敲一面很大的鼓。
王姐桌上有一杯茶。泡了不知道多久了。茶叶沉在底部。颜色深了。已经凉了。没有人提醒她。她也忘了喝。手在忙。眼在看。嘴没空喝。
旁边小刘的桌上放着一个保温杯。粉色的。上面有一朵印花。她的。她女儿送的。女儿五岁。在幼儿园。下午四点半要去接。她每天三点半开始看表。四点收拾东西。四点十分出门。刚好赶上。
张阿姨的桌上什么都没有。干干净净。只有键盘、鼠标和一副老花镜。老花镜不戴。放在旁边。她说"屏幕上的字够大不用戴"。但偶尔遇到一条特别长的客服对话她会戴上。戴上了看完了又摘下来。摘下来的时候会用衣角擦一下镜片。
这就是下午三点的标注间。十二月。上海。张江旁边。月租一千二。十五个人。十五种生活。十五个回家以后有各自的事要做的人。她们中间有一个要去接女儿。有一个回去还要做饭。有一个要去菜市场。有一个还要去另一份兼职。
但从九点到五点她们都在这里。面对同一种屏幕。做同一种动作。咔嗒。咔嗒。三十九万次。
我往许畅的工位走去。
他在看论文。屏幕上是英文。标题很长。我看不太懂。但看到了几个词。"Auto-labeling"。"Semi-supervised"。自动标注。半监督。
我停下来。
"许畅。"
"嗯?"他抬头。
"那些标注的人。最终会被AI替代吗?"
他停了一下。表情不是困惑。是在整理答案。他整理答案的方式跟刘海洋不同。刘海洋想了再说。许畅是在说的同时整理。
"当数据规模足够大。自动标注的成本会低于人工。理论上是的。"
"理论上?"
"我们现在的模型到90%以上。部分低难度的类别可以自标注了。比如简单的退款请求。比如明确的咨询。但复杂的——歧义的、情绪模糊的、骂人的——还需要人。"
"那王姐——"
"王姐做的是质量审核。那部分会晚一些。"
他停了一下。
"但晚。不代表不会。"
五个字。晚。不代表不会。
他说完了。这是一个精准的答案。没有多余的字。没有情绪。没有安慰。没有回避。他只是说了一个事实。
事实有时候比谎言更让人不舒服。因为事实不给你退路。
"你说这个——"我开了个头。
然后没了。因为我不知道该说什么。问"那怎么办"?怎么办不了。这是技术的方向。方向不会因为你替一个人担心就改变。
许畅已经转回去看论文了。他不是冷漠。他给了一个精准的答案。答案就是全部了。
我往门口走。标注间的门开着。经过的时候往里看了一眼。
王姐没有看过来。她在屏幕上点一个选项。咔嗒。然后点下一个。咔嗒。
节奏里没有停顿。
她不知道许畅刚才说了什么。她也不需要知道。她只需要知道今天标了多少条。明天还有多少条。月底薪水几号到。
剩下的。不是她该想的。是我该想的。
但我也没有答案。
我只有一个感觉。站在标注间门口的那种感觉。十五个人。十五台电脑。三十九万次咔嗒。一条一毛钱。
她们不知道自己在做的事情有一天可能被自己教出来的AI替代。
也许知道了也不在乎。三千五一个月。朝九晚五。周末双休。现在能做的事就做。以后的事以后再说。
跟我一样。我也是这样的。现在能做的就做。以后的事以后再说。
只是我做的是85%。她们做的是咔嗒。
不同的动作。同一种活法。
走了。
走廊的声控灯感应到了我的脚步。亮了。照到了标注间的门。门开着。里面的咔嗒声漏出来。均匀的。持续的。
灯亮了两秒。灭了。
我走了。咔嗒声留在身后。
回办公室。刘海洋的差量更新方案在邮箱里了。四页。手写的扫描版。字很密。他说能省一半成本。
省一半。省的那一半是什么?是二十万条标注。是两千个工时。是一千个小刘和张阿姨的下午。
省了对公司好。对她们来说——少了两千个工时意味着少了两千个一百二十块。
省钱和养人之间不总是对齐的。
但现在不想这个。现在想85%。
回办公室。继续做85%。
门口"什么都可能发生"的纸还在。歪的。我每次经过都看到。但今天看到的时候想到了王姐。
什么都可能发生。包括她教出来的AI有一天不再需要她教了。
那一天什么时候来?
许畅说了。晚。不代表不会。