第648页

“别急,听我慢慢解释,我让他们做的工作,不是那种很有难度的。你们不了解人工智能,所以才会那么觉得。”

顾莫杰千方百计地解释,然后一点点分辨。

“百度知道,你们都用过吧?百度知道其实就是一个很好的人工智能训练方法。上面的提问,都很接近汉语的日常对话。回答也很符合逻辑。但是,目前来看,百度知道因为是基于互助的,很多高质量的、细微的问题并没有人去回答。回答的答案好不好、是否最合适,也是题主自己选择,不一定客观。之所以有这个瓶颈,是因为百度是一家商业公司,他们必须追求利润,所以内容提供只能指望几乎无偿的第三方,百度自己不可能雇人去回答问题、审核问题、确认质量。所以它的数据有很多瑕疵、误导,不够纯净,会导致人工智能在深度学习时效率大大降低。”

砖家们听得很认真,毕竟深度学习型人工智能这块,国内也找不出比顾莫杰更有思想的人了。

顾莫杰看得出来他们有些不信,于是为了加强自己的说服力,就举了个例子。

“百度李老板你们认识吧?上周开会之前,其实我飞到京城的时候,就专门和李彦宏吃了个饭。去年年底,我提醒他百度知道和百度搜索的数据资源,适合用来做人工智能,上周他就告诉我,年后他刚刚成立了一个论证策划团队,定了个名叫‘百度大脑’的项目,刚刚在论证。我说的这些,你们觉得有疑问的,可以找百度方面求证。”

顾莫杰这么一援引,砖家们立刻多信了几分。

“所以,我的想法就是,国家出大头的钱,初音入股一部分,成立一个非营利的、带有公益属性的云智能大数据中心。我们出钱雇佣专人回答问题、审核问题、归档问题。充实汉语的语音识别率深度学习数据库、充实机器人听汉语问题并对话的智能程度。最终目标,是把汉语人工智能,训练成全世界人工智能度和语音识别率最高的语言。这么做不仅有远期的经济意义,也有重大的政治意义,甚至可以提升华夏的文化优越感。”

顾莫杰描绘的这个远景,连李总都有些心动。

“人工智能……这个东西,是分语言的么?汉语有汉语的人工智能、英语有英语的人工智能?”

“将来机器翻译水平提升到绝对拟真后,差距不大。但是思维模式上还是有差别的。”顾莫杰辩解了两句,然后又条分缕析说了一顿。

那些专业言语,自然无需再赘述一番,没读懂的人,回去看一下同一时刻在大洋彼岸、乔布斯和库克说的那番话,就知道了。

顾莫杰的陈述,几乎与乔布斯如出一辙。

或者应该说,是乔布斯与顾莫杰如出一辙。

李总眼神更加热切了,有那么一瞬间,他似乎看到了中华民族伟大复兴。

“那个……那东西怎么经营呢?有了大数据,难道就直接给初音智能免费调用?那你们初音准备出多少资金?要是比例不够大,岂不是拿着国家的钱在假公济私了。”

“我们初音可以出资30,并且提供管理和培训方案,提供一切技术支持。政府提供场地和设备出资,以及部分人员薪酬,总计占比70。初音方面,可以免费调用这个云智能大数据中心的一切成果。但是成果数据的所有权,依然归属国有的中心。将来如果有诸如百度、或者后起之秀的国内新人工智能研发厂商崛起,也可以问数据中心买数据产品。那些企业都没有出资,国家就可以通过从他们身上收费出卖数据使用权来回本。”