学霸终结者[校对版]_第648页

“别急，听我慢慢解释，我让他们做的工作，不是那种很有难度的。你们不了解人工智能，所以才会那么觉得。”

顾莫杰千方百计地解释，然后一点点分辨。

“百度知道，你们都用过吧？百度知道其实就是一个很好的人工智能训练方法。上面的提问，都很接近汉语的日常对话。回答也很符合逻辑。但是，目前来看，百度知道因为是基于互助的，很多高质量的、细微的问题并没有人去回答。回答的答案好不好、是否最合适，也是题主自己选择，不一定客观。之所以有这个瓶颈，是因为百度是一家商业公司，他们必须追求利润，所以内容提供只能指望几乎无偿的第三方，百度自己不可能雇人去回答问题、审核问题、确认质量。所以它的数据有很多瑕疵、误导，不够纯净，会导致人工智能在深度学习时效率大大降低。”

砖家们听得很认真，毕竟深度学习型人工智能这块，国内也找不出比顾莫杰更有思想的人了。

顾莫杰看得出来他们有些不信，于是为了加强自己的说服力，就举了个例子。

“百度李老板你们认识吧？上周开会之前，其实我飞到京城的时候，就专门和李彦宏吃了个饭。去年年底，我提醒他百度知道和百度搜索的数据资源，适合用来做人工智能，上周他就告诉我，年后他刚刚成立了一个论证策划团队，定了个名叫‘百度大脑’的项目，刚刚在论证。我说的这些，你们觉得有疑问的，可以找百度方面求证。”

顾莫杰这么一援引，砖家们立刻多信了几分。

“所以，我的想法就是，国家出大头的钱，初音入股一部分，成立一个非营利的、带有公益属性的云智能大数据中心。我们出钱雇佣专人回答问题、审核问题、归档问题。充实汉语的语音识别率深度学习数据库、充实机器人听汉语问题并对话的智能程度。最终目标，是把汉语人工智能，训练成全世界人工智能度和语音识别率最高的语言。这么做不仅有远期的经济意义，也有重大的政治意义，甚至可以提升华夏的文化优越感。”

顾莫杰描绘的这个远景，连李总都有些心动。

“人工智能……这个东西，是分语言的么？汉语有汉语的人工智能、英语有英语的人工智能？”

“将来机器翻译水平提升到绝对拟真后，差距不大。但是思维模式上还是有差别的。”顾莫杰辩解了两句，然后又条分缕析说了一顿。

那些专业言语，自然无需再赘述一番，没读懂的人，回去看一下同一时刻在大洋彼岸、乔布斯和库克说的那番话，就知道了。

顾莫杰的陈述，几乎与乔布斯如出一辙。

或者应该说，是乔布斯与顾莫杰如出一辙。

李总眼神更加热切了，有那么一瞬间，他似乎看到了中华民族伟大复兴。

“那个……那东西怎么经营呢？有了大数据，难道就直接给初音智能免费调用？那你们初音准备出多少资金？要是比例不够大，岂不是拿着国家的钱在假公济私了。”

“我们初音可以出资30，并且提供管理和培训方案，提供一切技术支持。政府提供场地和设备出资，以及部分人员薪酬，总计占比70。初音方面，可以免费调用这个云智能大数据中心的一切成果。但是成果数据的所有权，依然归属国有的中心。将来如果有诸如百度、或者后起之秀的国内新人工智能研发厂商崛起，也可以问数据中心买数据产品。那些企业都没有出资，国家就可以通过从他们身上收费出卖数据使用权来回本。”