Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

  • A+
所属分类:dw手表时尚

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

大数据文摘出品

作者:刘俊寰

沸沸扬扬的Daniel Povey入华大事终于尘埃落定!

在2019小米开发者大会前一天,小米创始人雷军在微博上宣布,国际语音识别和AI领域专家,语音识别开源工具Kaldi之父Daniel Povey正式入职小米,出任小米语音首席科学家,并将出席2019小米开发者大会。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

拒绝Facebook的加盟邀约、被大学解聘之后,这个语音识别大牛曾在Twitter上宣布以兼职顾问的身份加入北京初创公司爱数智慧,并表示全职工作会选择一家中国企业。

此前,Daniel Povey发Twitter表示,即将与小米签订合约,预计将在年底前正式入职。

如今,他说到做到,正式加盟小米!据了解,Daniel Povey将在北京组建独立研究团队,开发新一代的“PyTorch-y"Kaldi。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

昨天,2019小米开发者大会上,小米相关负责人公布了小米智能生活系统MIUI在未来2-3年的战略安排。其中,小米蓝牙音箱”小爱同学“作为MIUI的场景入口之一自然是关注重点,而Daniel Povey的加盟无疑会大大增强小米在自然语言处理上的能力。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

Daniel Povey立下军令状:6个月后将有新一代Kaldi

下午五点,作为压轴嘉宾,Daniel Povey首次以小米员工的身份,针对“Kaldi”的未来研究计划,以及自然语言处理的最近发展,进行了主题演讲。这也是被开除事件后,Daniel Povey首次公开演讲。

Daniel首先表达了加盟小米的巨大热情。他介绍道,Kaldi现在还存在诸多缺点,包括没有Python接口、难以与TensorFlow和PyTorch结合、不支持整数化等。

Daniel说道,此前他对TensorFlow和PyTorch表示出极大的排斥,因为他认为Kaldi系统本身足够优秀,但现在他改变了看法,“TensorFlow和PyTorch十分优美,实用性也很强”。他举例说道,利用TensorFlow和PyTorch能够成功搭载移动端,这是Kaldi无法做到的。

对于这个方向的研究,Daniel表示他已经思考得足够成熟,但一直缺少机会和资金支持,现在加盟小米,或许就是最好的时机。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

随后,Daniel向大家介绍了Kaldi在技术上取得的新进展:

  • Kaldi新版本将更注重信号电平增强
  • 数据增强(混响、噪声、速记扰动)将会动态进行
  • 节省磁盘空间
  • 计划更自然地支持多渠道方案
  • 希望使训练使得信号直接运行的网络变得更加容易

同时,Daniel也公布了下一代kaldi的研究计划:
  • 在DNN方面使用PyTorch
  • 使用Kaldi进行图形/FST相关方面的解码
  • 增加Python接口
  • 通过使用pybind11将Python接口添加到Kaldi(此项工作已开始)
  • 在PyTorch中执行LF-MMI

新官上任三把火,Daniel这次也放出了狠话,立下军令状:
6个月之后会看到新版Kaldi成品。
而要实现这个目标,还需要写大量代码,这是他一个人无法完成的,而小米能够提供充足的人力和物力支持,帮助他在预计时间内完成新一代Kaldi开发。
这也是他加盟小米的诸多原因之一。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化

小米AI能力“添翼”,“小爱同学”未来可期


小米集团副总裁崔宝秋表示,过去近三年小米重点发力了两大AI领域,其中一个就是“小爱同学”,可以说,“小爱同学就是小米的AI”。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化


小米AI实验室主任王斌介绍道,在自然语言处理方面,小米已经成功搭载了基础算法、人机对话、机器翻译等功能,在Lite分析结果对比中,处理速度提升了224%,模型减少了65%,F1降低了1%。

目前,小爱同学已经为诸多领域赋能,包括智能投影、蓝牙音频、蓝牙芯片等。

崔宝秋表示,小米这两年发展势头猛烈,这就吸引到很多人才加入,包括Daniel Povey。
可以想见,Daniel Povey的加盟对于“小爱同学”的开发研究将会起到重大的促进作用。

小米挖宝全过程:被学校开除,拒绝Facebook,最终加盟小米



Daniel加入小米的过程颇为曲折,让我们也再来回顾一下小米是如何挖到这枚语音识别界的“宝藏男孩”。

今年5月份,由于约翰霍普金斯大学(JHU)所在地区Baltimore的犯罪率居高不下,为了保证学生的安全,JHU要设立自己的警察力量。
然而有的学生觉得,Baltimore已经有严重的种族问题,JHU如果有自己的警察,则会不可避免的加剧种族矛盾。

抗议的学生将学校行政楼大门锁上了,而Daniel Povey所隶属的语言和语音处理中心(Center for Language and Speech Processing, CLSP)的机房就在Garland的地下室里。

为了维护过热的服务器,保证系统正常运行,Daniel Povey在5月8日组织了一场“反抗议”的抗议活动。
然而事情愈演愈烈,他的行为被这帮抗议学生描述成“一个白人至上主义的JHU教授带领着一帮人去攻击抗议的学生”。

最终,Daniel Povey被学校带薪停职,从8月31日起生效。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化


随后,Daniel在自己的主页上发表了一篇长文,叙述了事情的始末,发表了自己的看法,并透露了自己的下一步动向。
“我将从8月19日开始去西雅图找一份私营部门的工作,但我仍然会远程与我的学生和同事一起工作。


这个私营企业是Facebook,Daniel本来准备从19号开始在西雅图办公室为Facebook开发语音识别系统。
然而Facebook在15号告诉他,允许他作为全职承包商为工作6周的时间,同时在此期间他们将对学校的事件进行的调查,他的FTE offer将取决于Facebook的调查结果。
 

于是,Daniel果断拒绝了这个offer,他表示:
“整件事让我有(和学校)似曾相识的感觉。


Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化


发生了这一连串的事情之后,Daniel表示:
“如果有人好奇的话,我的计划是在一家中国公司工作,也许在一所中国大学找一份兼职工作。


就是在这个时候,小米集团人工智能部总经理叶航军透露道,当时这个帖子被小米人工智能部门语音组的负责人看到了,因为语音组一直在用Kaldi,所以对他非常关注。

于是小米开始联系Daniel,Daniel也回信表达了一下自己的看法。
在后续沟通中,小米通过邮件回答了Daniel的一些疑问,包括小米招他负责什么,小米的战略,以及怎么看待开源等。

之后Daniel来到了小米“面试”,小米工作人员向他介绍了公司在做的一些项目,分享小米对开源的看法等,Daniel当场表现出极大的兴趣。

Daniel Povey也解释了选择来小米工作的原因,在他看来,以小米为代表的中国互联网公司有着纯粹、极致的开源文化,以及开放、共享的理念。

Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化




实习/全职编辑记者招聘ing

加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至[email protected]



Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化
Daniel Povey入职小米立军令状:半年后发布新版Kaldi,赞赏中国互联网公司开源文化
点「在看」的人都变好看了哦!