
Illustration by Sandbox Studio, Chicago with Ana Kova
无法想象的复雜(zá)。在头脑真空地(dì)带和(hé)數(shù)据集群之間(jiān)的光(guāng)线。就像城市的灯光(guāng),在消退。
——William Gibson, Neuromancer
或许连黃(huáng)鼎隆自(zì)己都(dōu)没有意识到,他(tā)的名字首字母(DingLong)的缩写恰好也是深度学习(Deep Learning)的缩写。
他(tā)和(hé)美國(guó)人(rén)码特(Matt Scott)创立的是一(yī)家专注于深度学习的技術(shù)公司。两位创始人(rén),一(yī)个出生于30多年(nián)前刚刚被改革開(kāi)放春風(fēng)拂过的深圳,入学清华读博士從(cóng)未有海(hǎi)外(wài)留学的经历;另一(yī)人(rén)则来自(zì)大苹果城纽约,身為(wèi)犹太人(rén)早在90年(nián)代就来到中國(guó)并這(zhè)块土(tǔ)地(dì)及人(rén)结下(xià)了(le)不解之缘。
在差异性和(hé)多元化的浪潮在太平洋彼岸的美國(guó)逐渐退却之時(shí),在中國(guó),两个有着不同文化背景及人(rén)生经历的人(rén)走在一(yī)起结成创业伙伴,一(yī)种微(wēi)妙而有趣的关系蔓延在两人(rén)之間(jiān)。
尽管来到中國(guó)十多年(nián),但(dàn)是码特的中文依然不灵光(guāng),在接受采访時(shí)还要(yào)黃(huáng)鼎隆充当翻译。但(dàn)是,想必是在中國(guó)同事的耳濡目染下(xià),码特已经习惯成自(zì)然地(dì)将 C++ 称作(zuò)“C 加加”,而在黃(huáng)鼎隆慢(màn)条斯理地(dì)向别人(rén)介绍公司的情况的同時(shí),美國(guó)人(rén)却又往往扮演起熱(rè)情而炽烈的布道(dào)者,他(tā)带着纽约人(rén)特有的自(zì)豪与夸耀的语气向别人(rén)讲述他(tā)对中國(guó)和(hé)中國(guó)人(rén)民的爱。
在过去两年(nián)多的時(shí)間(jiān)里,创业的两人(rén)始终处在深邃却又激烈的漩涡之中,何止是他(tā)们,还有某个因為(wèi)工(gōng)作(zuò)上(shàng)除了(le)纰漏就哭鼻子的兼通(tōng)英日双语的小姑娘,他(tā)们都(dōu)在宵衣旰食的创业人(rén)生中沉浮激荡。
又何止這(zhè)家公司,在过往的两年(nián)甚至可(kě)以追溯得更久远的時(shí)間(jiān)里,以人(rén)工(gōng)智能(néng)及深度学习為(wèi)例的技術(shù)领域和(hé)整个商业世界都(dōu)在猛烈地(dì)生老(lǎo)病死进行(xíng)着新陈代謝(xiè),而更大的现实世界更是如(rú)此。
世界一(yī)直在变,在此变化着的世界里,那(nà)些本就各异的人(rén),他(tā)们又发生着怎样的变化,他(tā)们又在自(zì)己力所能(néng)及的范围如(rú)何改变這(zhè)个世界。
巴别塔
早在两千多年(nián)前,希腊的亚里士多德(Aristotle)就说过,了(le)解你自(zì)己是智慧的初始。然而自(zì)图灵(Alan Turing)提出他(tā)伟大的计算机和(hé)人(rén)工(gōng)智能(néng)构想之后,自(zì)机器出现以后,人(rén)类就已经不再只是满足于仅仅了(le)解自(zì)身,他(tā)们试图建筑一(yī)座后现代的技術(shù)巴别塔,让人(rén)和(hé)机器之間(jiān)不再有隔阂,他(tā)们想更多地(dì)了(le)解机器,了(le)解蕴含于0和(hé)1里的混沌世界。
正是這(zhè)样的野心和(hé)好奇心,不断推动着人(rén)工(gōng)智能(néng)和(hé)随后的机器学习深度学习的进步发展。
1943年(nián),沃伦. 麦卡洛克(Warren McCulloch)和(hé)沃尔特·皮茨(Walter Pitts)在阈值逻辑算法的基础上(shàng)提出了(le)可(kě)以应用于神经网络的计算模型。8年(nián)后,被后人(rén)誉為(wèi)“人(rén)工(gōng)智能(néng)之父”的马文·明(míng)斯基(Marvin Minsky)在他(tā)24岁的時(shí)候就组装了(le)出了(le)历史上(shàng)第一(yī)台神经网络学习机器 SNARC。

年(nián)轻時(shí)的罗森布拉特 来源:peoples
基于只有简单加减法运算的两层电脑神经网络,弗兰克•罗森布拉特(Frank Rosenblatt)在1957年(nián)创造出了(le)可(kě)以进行(xíng)模型识别的“感知器”(Perceptron),他(tā)同時(shí)还提出了(le)加入數(shù)学符号的神经网络层,而這(zhè)样的想法直到整整20年(nián)后才得以实现,同時(shí),罗森布拉特描绘的在“感知器”中应用的异或逻辑电路系统直到保罗·维博思(Paul Werbos)在近20年(nián)后提出“反向传播算法”(Backpropagation)時(shí)才应用到神经网络之中。
然而,明(míng)斯基和(hé)西(xī)摩尔·帕普特(Seymour Papert)在1969年(nián)出版的書(shū)里提出了(le)计算器机器应用神经网络的两大阻碍因素,他(tā)们认定感知器无法处理或与逻辑电路,同時(shí),他(tā)们还相信电脑没有足够的运算能(néng)力来满足大规模神经网络的長(cháng)時(shí)間(jiān)运行(xíng)。两位权威人(rén)物(wù)的意見(jiàn)意外(wài)地(dì)中断了(le)人(rén)工(gōng)智能(néng)研究的势头和(hé)方向,罗森布拉特的天才设想被业界抛弃,人(rén)工(gōng)智能(néng)的发展在整个70年(nián)代几乎陷入了(le)万马齐喑的境地(dì)。
1971年(nián),在43岁生日当天,罗森布拉特乘船(chuán)不幸发生意外(wài)英年(nián)早逝,而就在這(zhè)年(nián),有科学家提出了(le)利用 GMDH(Group Method of Data Handling,數(shù)据分组处理)算法来训练组成一(yī)个8层的深度网络,直到1979年(nián),斯坦福大学的团队终于造出了(le)可(kě)以自(zì)行(xíng)在房間(jiān)內(nèi)导航并规避障碍物(wù)的“斯坦福车”(Stanford Cart),一(yī)年(nián)后,福島邦彦公布了(le)用于识别手迹的多层神经网络“神经认知机”(Neocognitron),這(zhè)套算法激发了(le)随后的卷积神经网络的诞生。
在1989年(nián),法國(guó)的燕樂(yuè)存(Yann LeCun)团队成功地(dì)将反向传播算法应用了(le)深度神经网络中以实现识别邮件上(shàng)的手写邮编,但(dàn)缺点同样也异常显著,他(tā)们光(guāng)用算法训练深度网络就耗費(fèi)了(le)3天的時(shí)間(jiān),深度神经网络在此時(shí)显然没有任何实用性可(kě)言。
三年(nián)后,翁巨扬提出了(le)“生長(cháng)认知网”(Cresceptron),成功地(dì)從(cóng)2维和(hé)3维混雜(zá)的场景中自(zì)动识别出了(le)3D 对象,和(hé)日本科学家的神经认知机需要(yào)程序員(yuán)手动合并识别中的某些特征不同的是,生長(cháng)认知网可(kě)以自(zì)动学习每一(yī)层神经网络里未被监督的特征,后者还同時(shí)能(néng)在神经网络里通(tōng)过后台分析将习得的项目分门别类。
尤尔根·施密特胡博(Jürgen Schmidhuber)在1993年(nián)利用神经历史压缩机通(tōng)过“递归神经网络”(recurrent neural networks,RNNs)解决了(le)一(yī)个同時(shí)有上(shàng)千层神经网络展開(kāi)的“非常深度学习”的任务。
两年(nián)后,科学家们进一(yī)步证明(míng)了(le),利用算法可(kě)以成功训练一(yī)个紧密联系的6层神经网络,尽管整个训练过程耗時(shí)長(cháng)达2天。根据燕樂(yuè)存的估计,在本世纪初時(shí),递归神经网络识别处理全美一(yī)到两成的手写支票。
但(dàn)是,由于在人(rén)工(gōng)智能(néng)神经网络(Artificial Neural Networks)过長(cháng)的计算時(shí)間(jiān)以及科学家们当時(shí)一(yī)直不清楚人(rén)类大脑通(tōng)过生物(wù)网络自(zì)主连线的运行(xíng)机理,于是,在90年(nián)代及整个千禧年(nián)初期,神经网络和(hé)深度学习在实践上(shàng)并没有大规模開(kāi)展。

2014年(nián)時(shí)在 Google 工(gōng)作(zuò)的辛顿 Photo: Josh Valcarcel/WIRED 来源:WIRED
事实上(shàng),早在80年(nián)代中期,深度学习的相关理论就已经在机器学习领域開(kāi)始得到传播,而到了(le)新千年(nián),前者也開(kāi)始流传到了(le)人(rén)工(gōng)智能(néng)神经网络界,但(dàn)是直到2006年(nián),杰弗里·辛顿(Geoffrey Hinton)和(hé)鲁斯兰·萨拉库蒂诺夫(Ruslan Salakhutdinov)的研究成果引起了(le)大家的关注和(hé)熱(rè)情。
他(tā)们指出,一(yī)个多层的“前向反馈神经网络”(feedforward neural network)可(kě)以一(yī)次预训练一(yī)层神经网络并像未被监督的受限玻尔兹曼机(restricted Boltzmann machine)一(yī)样依次训练每一(yī)层,在此基础上(shàng)调整好它对监督下(xià)的反向传播算法的应用。這(zhè)使得提升深度学习速度有了(le)切实的操作(zuò)可(kě)能(néng)性。
深度学习越来越多地(dì)從(cóng)实验理论投入到了(le)应用领域。

深度学习在语音识别领域体现出了(le)前所未有的巨大优势
2009年(nián),邓力邀請(qǐng)辛顿到雷蒙德的微(wēi)软研究院进行(xíng)深度学习在语音识别上(shàng)的应用研究,两人(rén)共同组织了(le)当年(nián) NIPS 上(shàng)该领域的研讨会,是次主要(yào)讨论了(le)语音深度生成模型(deep generative model)方面的限制和(hé)基于深度神经网络(deep neural nets,DNN)的大數(shù)据领域存在的可(kě)能(néng)性。
两位科学家的研究最终得出让人(rén)惊喜的成果,他(tā)们发现,即使没有预训练,通(tōng)过对數(shù)据尤其是大量基于文本输出层的深度神经网络的训练,错误率较之 GMM-HMM 和(hé)其他(tā)高级生成模型的语音识别系统都(dōu)出现了(le)显著的降低(dī),其他(tā)几个主要(yào)的语音识别研究团队也证实了(le)邓力和(hé)辛顿的结论。
深度学习震动了(le)整个语音识别领域,同样是在這(zhè)一(yī)年(nián),斯坦福大学的李飞飞教授開(kāi)放了(le)她在2007年(nián)创建的 ImageNet 的數(shù)据库。

2012年(nián)还在 Google 的吴恩达 Credit Jim Wilson/The New York Times 来源:《纽约時(shí)报》
在过往,被用来训练图片处理识别的數(shù)据库主要(yào)是 MNIST,它涵盖了(le)6万张训练图片和(hé)1万张测试图片,截至目前為(wèi)止,研究团队在 MNIST 上(shàng)取得的最佳成绩是0.23%的错误率,到了(le)2012年(nián),丹·奇雷商(Dan Ciresan)团队在 CVPR 上(shàng)提交的论文向大家展示了(le) GPU 上(shàng)最大池化(max-pooling)的卷积神经网络在提升視(shì)觉 Benchmark 记录上(shàng)的惊人(rén)表现。
是年(nián),吴恩达(Andrew Ng)和(hé)杰夫·迪恩(Jeff Dean)带领下(xià)的 Google Brain 利用超过1.6万台电脑处理器组建了(le)一(yī)个神经网络,他(tā)们從(cóng)1000万段 YouTube 的視(shì)頻(pín)中抽取一(yī)帧分辨率為(wèi)200 X 200的缩略畫(huà)面来训练神经网络從(cóng)中识别出猫。

深度学习第一(yī)次赢得了(le) ImageNet 竞赛
在這(zhè)一(yī)年(nián),辛顿团队里的两名年(nián)轻人(rén)利以巨大优势赢得了(le)当年(nián)的 ImageNet 竞赛,這(zhè)是深度学习首次参加到竞赛中去,随后,奇雷商团队也在醫(yī)学图片的癌症发现上(shàng)赢得了(le) ICPR,深度学习所体现出的巨大威力震惊了(le)整个世界。
到了(le)2013年(nián)時(shí),ImageNet 竞赛的前20名无一(yī)例外(wài)全部采用了(le)深度学习技術(shù),排名第一(yī)的纽约大学将错误率降低(dī)到了(le)0.11197,在物(wù)体识别项目中,排名第一(yī)的阿姆斯特丹大学(University of Amsterdam)和(hé) Euvision Technologies 组建的团队的平均正确率均值(Mean Average Precision)还只有0.22581。到次年(nián)時(shí),Google 在两个类别的竞赛都(dōu)获得了(le)第一(yī),错误率和(hé)均值则分别為(wèi)0.06656和(hé)0.43933。
终于,深度学习從(cóng)理论的象牙塔里走到了(le)现实世界里中。
在1960年(nián)的阿尔弗雷德·科日布斯基纪念演讲(Alfred Korzybski Memorial Lecture)上(shàng),麦卡洛克這(zhè)样指出,探究知识的生理学基层的目的就在于為(wèi)了(le)在“我们如(rú)何知道(dào)我们所知”這(zhè)个問(wèn)题上(shàng)获得一(yī)个让人(rén)满意的解释。
半个多世纪以后,科学家们以超人(rén)的勇气和(hé)天才将這(zhè)个問(wèn)题問(wèn)得更加深入与更加具有革命性:我们如(rú)何让机器知其所知。
对另外(wài)一(yī)些人(rén),他(tā)们的野心和(hé)好奇在于,在让机器知其所知之后,在巴别塔建成之后,如(rú)何让“凯撒的归凯撒”,如(rú)何在這(zhè)个新世界中寻找到那(nà)块商业上(shàng)的应许之地(dì)。
危险想法
2009年(nián),就在深度学习将要(yào)登上(shàng)历史舞(wǔ)台的同時(shí),為(wèi)了(le)在搜索市场上(shàng)和(hé) Google 颉颃,微(wēi)软推出了(le) Bing 搜索,中文名“必应”。
然而,现实情况却并不容樂(yuè)观,Google 此時(shí)已经占据了(le)六成以上(shàng)的本土(tǔ)搜索份额,而在中國(guó)市场,百度霸占了(le)超过3/4的搜索领地(dì),谷歌(gē)也仅仅能(néng)抢下(xià)不到20%的市场。
在搜索市场将近固化的局面下(xià),必应如(rú)何才能(néng)脱颖而出成了(le)摆在当時(shí)微(wēi)软中國(guó)团队最大的考验和(hé)难题。這(zhè)時(shí)候,码特和(hé)黃(huáng)鼎隆都(dōu)在微(wēi)软亚洲研究院,然而前者属于研究部门,而后者则在 MSN 做(zuò)产品,在研究院的架构中,两人(rén)之間(jiān)还横亘着一(yī)个工(gōng)程部门。
码特并不适应自(zì)己的美國(guó)同事和(hé)他(tā)们的行(xíng)事习气,他(tā)自(zì)己是一(yī)个足够勤勉為(wèi)了(le)工(gōng)作(zuò)目标可(kě)以日以继夜的人(rén),但(dàn)是,让码特有些遗憾的是,那(nà)些同侪却并没有如(rú)此完全投入。
对黃(huáng)鼎隆来说,类似的問(wèn)题也同样困扰着他(tā),即使设在北京的亚洲研究院此時(shí)成立已经超过了(le)11年(nián),但(dàn)彼時(shí),微(wēi)软对 Bing 更多的期望和(hé)目标还是在本土(tǔ)狙击 Google,没有多少(shǎo)人(rén)会在意关注它在受诸多非可(kě)控因素影响并已经被割据殆尽的中國(guó)搜索市场上(shàng)的成長(cháng)和(hé)表现。
两人(rén)都(dōu)有心想要(yào)做(zuò)出一(yī)些事情来改变局面。然而,大公司的弊病往往在于,不少(shǎo)時(shí)候,想做(zuò)事的人(rén)发现,為(wèi)“做(zuò)事”而做(zuò)的事情并不比做(zuò)事本身少(shǎo)。
“大公司里面很(hěn)多的阻力,尤其是中間(jiān)的那(nà)一(yī)层肯定会很(hěn)不爽嘛,你越过了(le)我来做(zuò)這(zhè)个事情,而且还有品牌产品技術(shù)市场销售都(dōu)有很(hěn)多問(wèn)题。”黃(huáng)鼎隆现在对此已经习以為(wèi)常。
那(nà)時(shí)候,码特已经在机器学习方面做(zuò)出了(le)一(yī)些可(kě)以转化应用的成果,但(dàn)是,研究院的其他(tā)部门对此反应平平,只有黃(huáng)鼎隆表示了(le)兴趣,经过进一(yī)步的切磋,两人(rén)一(yī)拍即合。
码特的机器学习研究成果则可(kě)以把英语文本转化成朗读音頻(pín),黃(huáng)鼎隆则看(kàn)到了(le)它在市场上(shàng)的潜力和(hé)商业前景。在当時(shí),微(wēi)软在國(guó)內(nèi)市场上(shàng)尚有一(yī)战之力的只有 MSN,而這(zhè)个 IM 产品最主要(yào)的用户还是城市中的白领用户,在黃(huáng)鼎隆看(kàn)来,這(zhè)批用户对英语学习和(hé)翻译有着强烈的需求。
技術(shù)和(hé)用户需求的结合就意味着商业上(shàng)的可(kě)能(néng)性。两人(rén)迅速從(cóng)各自(zì)部门拉人(rén)组建团队,最终開(kāi)发出了(le)在线词典英库(Engkoo),果不其然,英库在推出后大获成功,彼時(shí),這(zhè)个內(nèi)部创新产品為(wèi)必应贡献了(le)超过60%的流量,每月的用户高达400万,而且,巨大的流量為(wèi)它带来了(le)针对目标用户的英语学习广告,最终成功实现了(le)商业变现。
黃(huáng)鼎隆喜欢码特在工(gōng)作(zuò)上(shàng)的投入和(hé)天才,码特喜欢在和(hé)黃(huáng)鼎隆合作(zuò)中的心无旁骛,他(tā)们的合作(zuò)有了(le)一(yī)个成功的開(kāi)端。然而,這(zhè)却也成為(wèi)了(le)他(tā)们此次合作(zuò)关系的開(kāi)始和(hé)结束:一(yī)个人(rén)选择离開(kāi),一(yī)个人(rén)选择留下(xià)。
不久之后,中國(guó)人(rén)选择去腾讯负责微(wēi)博业务,此時(shí),谁也不知道(dào)新浪微(wēi)博的先发优势竟然会强大到所有竞争对手最终都(dōu)先后认输投降的境地(dì)。而码特则继续留在了(le)研究院,先后推出了(le)必应词典和(hé)英库输入法,当然,美國(guó)人(rén)也不会料到,即使 Google 败走之后,微(wēi)软依然没能(néng)在這(zhè)块市场上(shàng)占据自(zì)己的立足之地(dì),始终不温不火(huǒ)。
直到2014年(nián),事情才出现了(le)改变。這(zhè)一(yī)年(nián),发生了(le)两件事,深深地(dì)影响了(le)黃(huáng)鼎隆和(hé)码特两人(rén)。
首先,深度学习在外(wài)界的聚光(guāng)灯下(xià)熠熠生彩,它的价值和(hé)意义受到越来越多人(rén)的关注重視(shì)。
其次,码特和(hé)他(tā)的中國(guó)女(nǚ)友(yǒu)结婚了(le)。两位老(lǎo)友(yǒu)見(jiàn)面了(le),在婚礼结束后,就在举行(xíng)婚礼的餐厅里,两人(rén)一(yī)边食指大动啖着烤肉,一(yī)边兴奋地(dì)讨论起深度学习会带来的变化和(hé)应用场景,他(tā)们构想出一(yī)幅具体而微(wēi)的图景,两人(rén)不约而同地(dì)意识到技術(shù)的进步使曾经的某些构想有了(le)实现的机会。
在那(nà)样的夜里,谈到最尽兴的关头,“创业”的念头闪过两人(rén)的心头,并如(rú)一(yī)粒不安的种子般扎根。
這(zhè)時(shí)候,两人(rén)都(dōu)处在自(zì)己职业生涯中的平稳上(shàng)升期,黃(huáng)鼎隆是 TripAdvisor 的中國(guó)區(qū)副总裁,而码特亦成為(wèi)微(wēi)软 HiPo 培训项目中的一(yī)員(yuán)。在完成拼搏程度几乎和(hé)创业没有多大差别的英库项目之后,在经历了(le)总有完备资源支持的大公司之后,摆在两人(rén)面前的最大問(wèn)题是:值得為(wèi)了(le)這(zhè)个他(tā)们自(zì)己此時(shí)也仅仅只能(néng)描绘出大致轮廓的图景而放弃眼前的一(yī)切吗?
随着对象和(hé)時(shí)間(jiān)的不同,黃(huáng)鼎隆对這(zhè)个問(wèn)题的答(dá)案也并不相同。
“那(nà)天晚上(shàng)就很(hěn)兴奋,真是晚上(shàng)回去睡(shuì)不着觉的感觉。那(nà)時(shí)候,就会回想起一(yī)起做(zuò)英库那(nà)个项目,那(nà)对我们来说是职业生涯中很(hěn)愉快(kuài)很(hěn)有成就感的一(yī)段時(shí)光(guāng),我们就感觉很(hěn)有火(huǒ)花碰撞,不做(zuò)不行(xíng)一(yī)定要(yào)去做(zuò)。”创业两年(nián)的黃(huáng)鼎隆這(zhè)样描述。
黃(huáng)鼎隆一(yī)直是个理性的人(rén),有時(shí)候甚至冷(lěng)静低(dī)调到让周围人(rén)感到不可(kě)思議(yì)的地(dì)步。他(tā)和(hé)公司的同事打招呼说要(yào)一(yī)个人(rén)回深圳处理私事,归来后,他(tā)给大家展示的是其深圳政协委員(yuán)的身份。两年(nián)前,也是如(rú)此。他(tā)并没有兴奋到立即都(dōu)投身到创业的大潮之中去,那(nà)晚之后,黃(huáng)鼎隆和(hé)码特花了(le)几个月的业余時(shí)間(jiān)做(zuò)调研,反复切磋预演假想中的创业。
理性与感性,冷(lěng)静和(hé)冲动,失败与成功,它们的界限究竟在哪里呢?
当自(zì)忖已然对计划考虑周全,理性的职业人(rén)便转身成為(wèi)脱离大公司体制的自(zì)由的创业人(rén),当已经考虑到失败的后果却依然无所畏惧,再怎么冷(lěng)静的人(rén)也会禁不住冲动起来去追寻內(nèi)心的召唤,当已经不再畏惧失败的時(shí)候,再怎么冷(lěng)静理性的人(rén)也会具备前所未有的信心和(hé)勇气去追逐成功。
那(nà)颗创业的种子在几个月的時(shí)間(jiān)里萌芽破土(tǔ)生長(cháng)。终于,在那(nà)个让他(tā)们內(nèi)心波澜万丈的夜晚的數(shù)月之后,黃(huáng)鼎隆和(hé)码特终于下(xià)定了(le)决心,他(tā)们要(yào)去创业。
黃(huáng)鼎隆对创业与否這(zhè)个問(wèn)题的答(dá)案还有另外(wài)一(yī)个版本。
在18个月前,他(tā)告诉他(tā)的清华后辈们“成败未定,创业本来就是一(yī)个九死一(yī)生的事情”,他(tā)告诉年(nián)轻学生们当時(shí)的心情:“理智的话我觉得都(dōu)不会选择创业的,你要(yào)是纯理性去分析,怎么选你都(dōu)不会去创业”。
黃(huáng)鼎隆说,如(rú)果自(zì)己在读博士的時(shí)候选择去创业可(kě)能(néng)会被父母打断腿。
现在,他(tā)和(hé)码特选择创业则是主动把自(zì)己置身到了(le)一(yī)个充满不确定性風(fēng)险的境地(dì),這(zhè)里将会有他(tā)们前所未闻的剧变、可(kě)能(néng)会失败而且失败几率很(hěn)大、生活将不再轻松平和(hé)而会变得墨突不黔。
无论何時(shí),创业都(dōu)是危险的。
然而,历史上(shàng)最不朽的失败者王尔德说过,如(rú)果一(yī)个想法不够危险,它又有什么资格能(néng)算是一(yī)个想法。
新世界
在创业的時(shí)候,黃(huáng)鼎隆和(hé)码特甚至都(dōu)没有获得融资。各取了(le)两人(rén)名中的一(yī)字,公司叫做(zuò)码隆。
“当時(shí)就不断在想,搜索引擎的下(xià)一(yī)步是什么。如(rú)果搜索的东西(xī)还是放在文字文本上(shàng)的话,那(nà)么這(zhè)个仗基本上(shàng)已经结束了(le),但(dàn)是再往后一(yī)个更大的机会是图像,它巨大的宝库,才刚刚拉開(kāi)一(yī)点小小的缝。”早在微(wēi)软的時(shí)候,黃(huáng)鼎隆就開(kāi)始预想搜索的下(xià)一(yī)个机会。
在创业调研的几个月里,他(tā)们决定把深度学习技術(shù)用在当時(shí)已经成熟的图片识别方面,但(dàn)是,仅仅是“以图识图”這(zhè)样的功能(néng)并不足以吸引用户和(hé)市场。
在最初的商业计划書(shū)里,他(tā)们给码隆的产品取的名字叫 kumo,在日文里,這(zhè)个词有两个意思,“云”和(hé)“蜘蛛”,kumo 依托于云服务,同時(shí),黃(huáng)鼎隆他(tā)们希望這(zhè)个产品能(néng)像蜘蛛一(yī)样爬取尽可(kě)能(néng)多的图片。最终,他(tā)们為(wèi)码隆构思出来的产品商业模式是,通(tōng)过图片搜索识别来帮助用户做(zuò)出决策。
kumo 首先是引擎,而引擎的价值就在于把关键字和(hé)內(nèi)容联系起来,kumo 主攻的是图片,那(nà)如(rú)何向别人(rén)证明(míng)這(zhè)个价值呢?黃(huáng)鼎隆用 Google 的例子做(zuò)了(le)简单的算數(shù),他(tā)把当時(shí) Google 的营收和(hé)搜索次數(shù)相比,得出来用户在 Google 的每次搜索价值7美分。他(tā)在商业计划書(shū)里向投资人(rén)表明(míng),图片搜索的需求和(hé)价值会比普通(tōng)的文本搜索更大。
当時(shí),他(tā)為(wèi)图片搜索做(zuò)出了(le)约550亿美元的保守估计,并预测其在随后數(shù)年(nián)里将增長(cháng)成為(wèi)一(yī)个千亿美元级别的市场。
在2014年(nián),Google 作(zuò)价4亿英镑收购了(le)人(rén)工(gōng)智能(néng)创业公司 Deepmind,后一(yī)年(nián),Facebook 提出了(le)它的深度学习技術(shù) DeepFace 用来自(zì)动标签和(hé)识别用户照片,其中包含了(le)超过1.2亿个参數(shù)。其识别正确率高达97.35%,较 Facebook 之前使用的系统提升了(le)27%。
但(dàn)是,這(zhè)些事实和(hé)黃(huáng)鼎隆自(zì)己的预测并不足以增加别人(rén)相信码隆成功的可(kě)能(néng)性,除非他(tā)们能(néng)够证明(míng)自(zì)己。

创立不久,码隆获得大奖
码隆在7月份注册,此時(shí)距离科技部主办的第三届中國(guó)创新创业大赛报名截止時(shí)間(jiān)只剩下(xià)一(yī)周不到的時(shí)間(jiān),黃(huáng)鼎隆、码特以及另一(yī)位前微(wēi)软的设计師(shī)组成的小团队抱着一(yī)半测试自(zì)己一(yī)半向别人(rén)证明(míng)的心态踩着截止日期报名参赛。
参赛团队报名提交资料的時(shí)候并不需要(yào)提交实物(wù),于是,刚刚创业不久还只有一(yī)个概念的黃(huáng)鼎隆他(tā)们趁势填上(shàng)了(le)“視(shì)觉决策引擎”。從(cóng)网络初赛、地(dì)區(qū)赛、行(xíng)业半决赛再到最后的全國(guó)总决赛,在每轮比赛之間(jiān)大约有2到3周時(shí)間(jiān)的間(jiān)隔,而這(zhè)就也成了(le)黃(huáng)鼎隆他(tā)们在赢得上(shàng)轮比赛获得评委意見(jiàn)之后不多的用来进一(yī)步修正自(zì)己的产品的時(shí)間(jiān)。
大赛持续了(le)约2个月,和(hé)其他(tā)已经有了(le)成型产品的参赛者不同,他(tā)们的产品在每一(yī)轮比赛中都(dōu)不断地(dì)改动优化,最终,他(tā)们获得了(le)此次大赛团队组全國(guó)第二名,之后一(yī)个多星期,他(tā)们又获得了(le)深圳创业创新大赛的冠军,不到两个月后,码隆在2015年(nián)入选了(le)微(wēi)软创投加速器。
此時(shí),深度学习已经成為(wèi)一(yī)个洛阳紙(zhǐ)贵的技術(shù)概念与实践。

深度学习的出现推动了(le)整个 AI 和(hé)机器学习的大发展 来源:Nvidia
深度学习究竟如(rú)何帮助人(rén)们进行(xíng)“視(shì)觉决策”呢?
不妨让我们從(cóng)过去几十年(nián)里最風(fēng)行(xíng)的人(rén)工(gōng)智能(néng)神经网络说起。它是在我们对人(rén)脑的认识理解基础上(shàng)结合人(rén)工(gōng)智能(néng)产生的交叉学科,在大脑里,神经在一(yī)定物(wù)理距离內(nèi)可(kě)以和(hé)其他(tā)任意神经连接。但(dàn)是,可(kě)惜的是,人(rén)工(gōng)智能(néng)神经网络却受限于自(zì)身各个分隔的神经层、连接和(hé)數(shù)据传播方向。
一(yī)个对象输入人(rén)工(gōng)智能(néng)神经网络的第一(yī)层,然后再由第二层的神经处理自(zì)己的任务,在进入到下(xià)一(yī)层,重复這(zhè)样的程序直至最后一(yī)层,最终得出输出结果。每一(yī)个神经都(dōu)获得一(yī)个和(hé)它执行(xíng)任务相关的正误情况的权重,最后的输出结果便由這(zhè)些权重决定。然而,問(wèn)题在于,即使最基本的神经网络也有着惊人(rén)的计算需求,同時(shí),它还需要(yào)人(rén)工(gōng)来提取样本的特征,這(zhè)些极大阻碍了(le)它的实际应用。
深度学习则從(cóng)根本上(shàng)改变了(le)這(zhè)一(yī)情况。
它由多个线性或非线性变换组成大量的任务处理神经层,利用非监督或自(zì)监督特征学习算法和(hé)层次特征提取等算法来实现取代手工(gōng)特征学习提取,從(cóng)而创造出更好的表达并在大规模没有标签化的數(shù)据基础上(shàng)利用這(zhè)些表达建立出更好的模型。
词向量(distributed representations)假定观察到的數(shù)据是因為(wèi)各个神经层中的因子互动而产生的,深度学习则进一(yī)步假定這(zhè)些神经层的活动和(hé)不同层级的抽象组成之間(jiān)有着对应关系,數(shù)量和(hé)大小各异的神经层可(kě)以用来提供不同的抽象。
于是,深度学习可(kě)以從(cóng)较低(dī)层次開(kāi)始学习從(cóng)而习得更高层、更抽象的概念,在最底层利用无监督学习逐层预训练学习特征,将结果作(zuò)為(wèi)更高一(yī)层的输入,到最上(shàng)层则改用监督学习进行(xíng)调整,和(hé)贪婪算法结合后,這(zhè)套方法使得深度学习能(néng)够习得抽象概念并选出那(nà)些有助于学习的特征。
也就是说,相比以前以人(rén)工(gōng)智能(néng)神经网络為(wèi)代表的浅度学习,深度学习可(kě)以更好地(dì)自(zì)主学习數(shù)据和(hé)对象特征并持续进化自(zì)己的学习能(néng)力,大數(shù)据的大行(xíng)其道(dào)让深度学习有了(le)前所未有的用武之地(dì),數(shù)据量越大,它的精度就越高。而 MapReduce 大规模集群架构的兴起、GPU 的大规模应用和(hé)应运而生的优化算法更是极大地(dì)缩短了(le)深度学习训练數(shù)据需要(yào)的時(shí)間(jiān)。
当深度学习風(fēng)靡整个业界的時(shí)候,不同的模型和(hé)算法就成為(wèi)了(le)每个公司的独门武器,黃(huáng)鼎隆对码隆的技術(shù)颇有信心。他(tā)们內(nèi)部首先建立了(le)一(yī)个量化的评测体系,在新算法投入使用之前,都(dōu)会在公司里进行(xíng)测试打分。
在這(zhè)之前,码特他(tā)们还会先设计一(yī)个系统把个人(rén)偏好、界面设计喜好等因素排除掉让大家更客观地(dì)评分,但(dàn)是這(zhè)显然还不够,更有说服力更有决定性的是客户的使用反馈。
现在,码隆面向的是企业用户,而在创业之初,情况却并非如(rú)此,那(nà)時(shí)候,他(tā)们将目标锁定在了(le)普通(tōng)消費(fèi)者身上(shàng)。
技術(shù)的逻辑
11月的深圳,气温依然高达27℃。码特卷上(shàng)百叶窗,边呼吸着温熱(rè)的海(hǎi)風(fēng),边吃着刚买来的麦当劳汉堡和(hé)薯条充饥。他(tā)谈到了(le) give up,码特告诉我,在工(gōng)作(zuò)上(shàng)有時(shí)候需要(yào)不过分坚持甚至放弃自(zì)己的想法来让更多人(rén)说出他(tā)们的意見(jiàn),只有這(zhè)样才可(kě)能(néng)维持一(yī)个良好的工(gōng)作(zuò)氛围促进整个集体的成長(cháng)。
码隆一(yī)開(kāi)始推出的产品叫 StyleAI,他(tā)们当時(shí)决定要(yào)從(cóng)時(shí)尚作(zuò)為(wèi)突破口来应用深度学习帮助用户穿衣打扮。尽管推出了(le)App 和(hé)微(wēi)信微(wēi)信公众号,但(dàn)是,在用户和(hé)市场看(kàn)来,這(zhè)始终只是个“人(rén)工(gōng)智能(néng)+時(shí)尚”噱头下(xià)的玩(wán)具而已,而习惯了(le)大公司充足资源從(cóng)来有过一(yī)线经验的黃(huáng)鼎隆和(hé)码特也渐渐回过味来,他(tā)们最终意识到,深度学习在2C 领域很(hěn)难有大作(zuò)為(wèi)。
最大的障碍在于,時(shí)尚涉及到包括布料、生产加工(gōng)、设计等太多的产业上(shàng)下(xià)游链条,而一(yī)个创新小公司根本无力同時(shí)应付從(cóng)产业生态链到消費(fèi)者的商业闭环,他(tā)们既没有资源也不具备精力耐心去自(zì)己补完這(zhè)个链条。在消費(fèi)者端兜兜转转不少(shǎo)時(shí)間(jiān)之后,他(tā)们忽然意识到自(zì)己其实应该把重心放到上(shàng)游环节上(shàng)去。
“這(zhè)是一(yī)个新的领域,就意味着你要(yào)解决很(hěn)多未知的問(wèn)题,甚至有一(yī)些是没答(dá)案的,所以你就把這(zhè)些問(wèn)题装在脑袋里面。吃饭的時(shí)候也想,洗澡的時(shí)候也想,上(shàng)厕所的時(shí)候想,睡(shuì)觉的時(shí)候想,没日没夜地(dì)想,然后一(yī)下(xià)子灵光(guāng)乍现,有个点子!解决了(le)!”回忆起过往苦思冥想公司方向的時(shí)光(guāng),黃(huáng)鼎隆依然兴奋。
在這(zhè)个技術(shù)创新起决定性作(zuò)用的市场里,要(yào)想让深度学习技術(shù)发挥最大的作(zuò)用,要(yào)想让码隆商业上(shàng)成功的可(kě)能(néng)性尽可(kě)能(néng)增多的话,两个從(cóng)微(wēi)软出来的人(rén)想出来的主意是把公司的技術(shù)開(kāi)放出来,让更多的企业接触使用。
让深度学习帮助這(zhè)些企业解决它们以往遇到现在需要(yào)解决优化的問(wèn)题,反过来,同時(shí)又让這(zhè)些深度参与到時(shí)尚产业各个链条的既有资源又有能(néng)力的参与者来推广促进深度学习技術(shù)。

于是,他(tā)们转向了(le)2B 市场,推出了(le)平台 ProductAI,他(tā)们对這(zhè)个产品的介绍是 AI for your product。
优料宝是他(tā)们的典型用户。
這(zhè)个布料交易平台同時(shí)面向买家和(hé)卖家,一(yī)个典型的应用场景是,买家对某块面料产生兴趣的话,就会用以图搜图功能(néng)在优料宝上(shàng)搜索相似相同布料的卖家。這(zhè)样的用户需求一(yī)直存在,但(dàn)問(wèn)题是对于這(zhè)些传统企业而言,要(yào)在自(zì)己的平台搭建一(yī)个涉及到人(rén)工(gōng)智能(néng)甚至深度学习技術(shù)的图像搜索引擎并不是他(tā)们擅長(cháng)的,更不要(yào)说后续的维护、更新和(hé)扩容上(shàng)的成本投入。
另一(yī)方面,這(zhè)些相关产业链上(shàng)的企业之前积累了(le)大量的图片和(hé)用户行(xíng)為(wèi)數(shù)据,但(dàn)為(wèi)這(zhè)些數(shù)据标签化乃至进行(xíng)數(shù)据挖掘对這(zhè)些企业而言几乎是闻所未闻的天方夜谭,于是,這(zhè)些數(shù)据几乎没有发挥任何作(zuò)用。
ProductAI 首先在全网抓取各种图片,然后将其中没有标签的部分外(wài)包给分散在全國(guó)的數(shù)百人(rén)的团队进行(xíng)标记,由此形成數(shù)据库和(hé)学习模型。
每个企业客户都(dōu)有着各自(zì)不同的用户群体和(hé)需求,在這(zhè)些个性化差异的前提下(xià),对數(shù)据模型进行(xíng)训练,最终将算法以 API 的形式接入客户自(zì)助搭建的平台上(shàng)来实现以图搜图和(hé)图像鉴别等功能(néng)。ProductAI 本身是免費(fèi),它的主要(yào)收入来自(zì)客户对 API 的调用。
黃(huáng)鼎隆的技術(shù)观以及由此产生的商业观在人(rén)看(kàn)来如(rú)此激进:他(tā)认定智能(néng)手机和(hé) App 的浪潮正在慢(màn)慢(màn)消退。這(zhè)不仅是他(tā)放弃继续開(kāi)发2C 端上(shàng) App 的部分原因,也成為(wèi)他(tā)成為(wèi)中國(guó)第五位购买 HoloLens 消費(fèi)者的动因,他(tā)相信 AR/VR 和(hé)可(kě)穿戴设备在不久的将来会掀起新的浪潮。
不过,真正吊诡的地(dì)方是,黃(huáng)鼎隆和(hé)码特创业以時(shí)尚為(wèi)起点,而他(tā)们的终点则是革掉传统時(shí)尚的命。
“现在就是有人(rén)定义了(le)時(shí)尚,所以大家才会流行(xíng),就是因為(wèi)现在各种东西(xī)太混沌了(le),导致各种东西(xī)信息不对称,信息不对称过的情况下(xià)就是有几个人(rén)就能(néng)说了(le)算。我们现在要(yào)做(zuò)的事情的根本就是要(yào)消除知识的信息不对称。”大部分可(kě)以見(jiàn)到的宣传照片上(shàng),黃(huáng)鼎隆都(dōu)穿着風(fēng)格和(hé)時(shí)尚绝缘的衣服,他(tā)和(hé)码特对時(shí)尚都(dōu)没有什么具体的概念。
10年(nián)前,在电影《穿普拉达的女(nǚ)魔头》(The Devil Wears Prada)里,梅麗(lì)尔·斯特里普(Meryl Streep)扮演的時(shí)尚雜(zá)志主编米兰达对新人(rén)的時(shí)尚观弃如(rú)敝履。這(zhè)是黃(huáng)鼎隆最喜欢最常用来说的场景,他(tā)告诉我,码隆要(yào)做(zuò)的就是抢占時(shí)尚的话语权。
按照黃(huáng)鼎隆的想法, 只要(yào)有足够多的纽约东京米兰等城市的街拍图片,那(nà)么就能(néng)從(cóng)中分析出這(zhè)些城市最流行(xíng)的颜色究竟是什么甚至可(kě)以将流行(xíng)趋势用量化的方式计算出来,“比如(rú)粉色從(cóng)上(shàng)一(yī)周的21%提升到這(zhè)一(yī)周的38%,這(zhè)就是一(yī)个趋势嘛”,他(tā)這(zhè)样比方。
于是,時(shí)尚就不再是设计師(shī)、评论家和(hé)時(shí)尚雜(zá)志编辑们的特权,而仅仅成為(wèi)深度学习技術(shù)下(xià)一(yī)件枯燥理性没有任何神秘和(hé)审美的机械工(gōng)作(zuò)而已,或者说,每一(yī)个普通(tōng)人(rén)都(dōu)能(néng)直观地(dì)了(le)解到最流行(xíng)的颜色和(hé)時(shí)尚。
即使不能(néng)站在時(shí)尚潮流的風(fēng)口浪尖,就算不能(néng)一(yī)蹴而就地(dì)去引领主导時(shí)尚,用黃(huáng)鼎隆的原话来说,中國(guó)至少(shǎo)不会完全仅仅充当時(shí)尚的跟風(fēng)者,并且还有机会“從(cóng)世界的服装工(gōng)厂变成一(yī)个時(shí)尚策源地(dì)”,這(zhè)是中國(guó)纺织信息中心的目标,這(zhè)也是当局看(kàn)重了(le)码隆技術(shù)的可(kě)能(néng)性而选择与之合作(zuò)的最主要(yào)原因。
于黃(huáng)鼎隆个人(rén)而言,比起审美话语权和(hé)國(guó)家宏大叙事這(zhè)些因素,他(tā)所谓的“一(yī)个效率的提升和(hé)人(rén)力的解放”或许才是其有了(le)反动時(shí)尚念头的真实动机。
别忘了(le)黃(huáng)鼎隆他(tā)们最初“視(shì)觉决策搜索”的设想以及他(tā)们对這(zhè)块市场的宏愿。
图片连接的不止是图片而已,它其实和(hé)文本搜索其实并没有太大差异,我们毋宁说,搜索就是互联网上(shàng)最基础、应用最广泛的 HUB,它连接的是用户的需求和(hé)內(nèi)容。內(nèi)容不止局限于文本、图片等,它应该而且在本质上(shàng)涵盖更丰富更多样性的內(nèi)容,是視(shì)頻(pín)、音樂(yuè)、游戏,还可(kě)以是商品、服务。
搜索的价值和(hé)意义与其说满足用户需求寻找到內(nèi)容,不如(rú)说是跨越需求和(hé)內(nèi)容两端的信息不透明(míng)鸿沟,不如(rú)说是打破整个商业价值链条上(shàng)的冗余累赘,這(zhè)是技術(shù)演进的必然目的和(hé)结果,也是互联网经济市场规律的必然方向,這(zhè)也自(zì)然而然地(dì)成了(le)搜索引擎进化的最主要(yào)趋势。
這(zhè)是搜索的一(yī)个动态演化趋势,它不仅仅只是帮助用户寻找答(dá)案的工(gōng)具,而是提供最符合用户需求的內(nèi)容,深度学习的意义也正在于此,经过漫長(cháng)的自(zì)我演化和(hé)学习,它可(kě)能(néng)做(zuò)到“如(rú)何知道(dào)我们所知”,由此来帮助用户做(zuò)出最理性的决策。
ProductAI 面向的是企业用户,但(dàn)实际上(shàng),它最终服务的还是普通(tōng)消費(fèi)者。它连接的不止是图片和(hé)图片、图片和(hé)布料,它还可(kě)以通(tōng)过商品包装、視(shì)頻(pín)、AR 等将更多的內(nèi)容连接起来。连接和(hé)內(nèi)容越多,应用场景越多,用户和(hé)數(shù)据也就越多,商业上(shàng)的可(kě)能(néng)性也就越多,這(zhè)些反过来也会推动深度学习算法更加智能(néng)化。
從(cóng)某种意义上(shàng)来说,深度学习不止是視(shì)觉引擎的技術(shù)基石,它更像是一(yī)个摈除了(le)所有非理性因素的數(shù)字化大脑,假用户自(zì)认為(wèi)的选择权做(zuò)出基于數(shù)据的决策。在以往,搜索是一(yī)个过程和(hé)手段,而在可(kě)以预見(jiàn)到的将来甚至现在,搜索本身就是目的和(hé)结果,于是,它也就具备了(le)商业上(shàng)闭环的可(kě)能(néng)性。
技術(shù),赋予了(le)商业前所未有的可(kě)能(néng)性。
這(zhè)种可(kě)能(néng)性在过去5年(nián)里在黃(huáng)鼎隆和(hé)码特的手上(shàng)逐渐变得触手可(kě)及。
一(yī)个中國(guó)人(rén),一(yī)个美國(guó)人(rén),他(tā)们有着太多不同的地(dì)方,但(dàn),在仅有的几个相同点上(shàng),他(tā)们却有着惊人(rén)的相似。他(tā)们对一(yī)些事情极為(wèi)在意,对另一(yī)些事情却无动于衷。
码特现在还用着那(nà)部已经氧化掉色的 iPhone 5,父母曾经坚决反对他(tā)和(hé)异教外(wài)國(guó)人(rén)的感情关系,在八九年(nián)的時(shí)間(jiān)里,他(tā)在這(zhè)个問(wèn)题上(shàng)始终未曾妥协,最后终于迎来皆大欢喜的结局。
在微(wēi)软亚洲研究院的融资发布会上(shàng),黃(huáng)鼎隆已经尽了(le)全力让自(zì)己表现得对這(zhè)样熱(rè)闹的场景已然熟稔,但(dàn),在聚光(guāng)灯外(wài)的角落里,他(tā)不時(shí)显出些张皇失措和(hé)些许的落寞。
之后,已经对大數(shù)字习以為(wèi)常的记者問(wèn)道(dào)為(wèi)什么6200万元的融资那(nà)么低(dī)時(shí),之前就和(hé)码特约定不在融资問(wèn)题上(shàng)作(zuò)假的黃(huáng)鼎隆无奈地(dì)苦笑了(le)下(xià),只能(néng)生硬地(dì)摆出耐心平和(hé)的架势回答(dá)這(zhè)样的問(wèn)题——只有他(tā)和(hé)玛特知道(dào),這(zhè)筆(bǐ)數(shù)字其实并不比那(nà)些创业公司的真实融资额低(dī)。
在创业這(zhè)件事上(shàng),两个人(rén)并不熟练。
他(tā)们改变什么了(le)吗?他(tā)们自(zì)己并不确定,這(zhè)个世界也不确定,唯一(yī)可(kě)以确定的只有一(yī)样,黃(huáng)鼎隆说创业這(zhè)两年(nián)来因為(wèi)缺乏锻炼和(hé)加班吃垃圾食品太多的缘故,他(tā)们都(dōu)不约而同地(dì)变胖了(le)。
在十一(yī)月某个夜里的十一(yī)点,深圳燥熱(rè)的空气渐渐凉却下(xià)去,码特看(kàn)了(le)看(kàn)紙(zhǐ)袋中剩余不多的薯条,喝(hē)完最后一(yī)口可(kě)樂(yuè),抿了(le)抿嘴,继续回到他(tā)的座位上(shàng)和(hé)两三个同事熬夜。這(zhè)对他(tā)来说已经生活的常态,但(dàn)他(tā)享受着。此時(shí),在地(dì)球另一(yī)端,黃(huáng)鼎隆依然独自(zì)一(yī)人(rén)身在异國(guó)参加 APEC 会議(yì),在那(nà)里,他(tā)寻找着新的商业合作(zuò)伙伴。
和(hé)无數(shù)普通(tōng)的夜一(yī)样,這(zhè)是他(tā)们普通(tōng)的一(yī)夜。
和(hé)无數(shù)创业的故事一(yī)样,他(tā)们的這(zhè)个故事也才刚刚開(kāi)始。