- A+
大数据文摘出品
作者:刘俊寰
沸沸扬扬的Daniel Povey入华大事终于尘埃落定!
在2019小米开发者大会前一天,小米创始人雷军在微博上宣布,国际语音识别和AI领域专家,语音识别开源工具Kaldi之父Daniel Povey正式入职小米,出任小米语音首席科学家,并将出席2019小米开发者大会。
拒绝Facebook的加盟邀约、被大学解聘之后,这个语音识别大牛曾在Twitter上宣布以兼职顾问的身份加入北京初创公司爱数智慧,并表示全职工作会选择一家中国企业。
此前,Daniel Povey发Twitter表示,即将与小米签订合约,预计将在年底前正式入职。
如今,他说到做到,正式加盟小米!据了解,Daniel Povey将在北京组建独立研究团队,开发新一代的“PyTorch-y"Kaldi。
昨天,2019小米开发者大会上,小米相关负责人公布了小米智能生活系统MIUI在未来2-3年的战略安排。其中,小米蓝牙音箱”小爱同学“作为MIUI的场景入口之一自然是关注重点,而Daniel Povey的加盟无疑会大大增强小米在自然语言处理上的能力。
下午五点,作为压轴嘉宾,Daniel Povey首次以小米员工的身份,针对“Kaldi”的未来研究计划,以及自然语言处理的最近发展,进行了主题演讲。这也是被开除事件后,Daniel Povey首次公开演讲。
Daniel首先表达了加盟小米的巨大热情。他介绍道,Kaldi现在还存在诸多缺点,包括没有Python接口、难以与TensorFlow和PyTorch结合、不支持整数化等。
Daniel说道,此前他对TensorFlow和PyTorch表示出极大的排斥,因为他认为Kaldi系统本身足够优秀,但现在他改变了看法,“TensorFlow和PyTorch十分优美,实用性也很强”。他举例说道,利用TensorFlow和PyTorch能够成功搭载移动端,这是Kaldi无法做到的。
对于这个方向的研究,Daniel表示他已经思考得足够成熟,但一直缺少机会和资金支持,现在加盟小米,或许就是最好的时机。
随后,Daniel向大家介绍了Kaldi在技术上取得的新进展:
-
Kaldi新版本将更注重信号电平增强
-
数据增强(混响、噪声、速记扰动)将会动态进行
-
节省磁盘空间
-
计划更自然地支持多渠道方案
-
希望使训练使得信号直接运行的网络变得更加容易
-
在DNN方面使用PyTorch
-
使用Kaldi进行图形/FST相关方面的解码
-
增加Python接口
-
通过使用pybind11将Python接口添加到Kaldi(此项工作已开始)
-
在PyTorch中执行LF-MMI
6个月之后会看到新版Kaldi成品。
而要实现这个目标,还需要写大量代码,这是他一个人无法完成的,而小米能够提供充足的人力和物力支持,帮助他在预计时间内完成新一代Kaldi开发。
这也是他加盟小米的诸多原因之一。
可以想见,Daniel Povey的加盟对于“小爱同学”的开发研究将会起到重大的促进作用。
然而有的学生觉得,Baltimore已经有严重的种族问题,JHU如果有自己的警察,则会不可避免的加剧种族矛盾。
然而事情愈演愈烈,他的行为被这帮抗议学生描述成“一个白人至上主义的JHU教授带领着一帮人去攻击抗议的学生”。
“我将从8月19日开始去西雅图找一份私营部门的工作,但我仍然会远程与我的学生和同事一起工作。
”
然而Facebook在15号告诉他,允许他作为全职承包商为工作6周的时间,同时在此期间他们将对学校的事件进行的调查,他的FTE offer将取决于Facebook的调查结果。
“整件事让我有(和学校)似曾相识的感觉。
”
“如果有人好奇的话,我的计划是在一家中国公司工作,也许在一所中国大学找一份兼职工作。
”
在后续沟通中,小米通过邮件回答了Daniel的一些疑问,包括小米招他负责什么,小米的战略,以及怎么看待开源等。
实习/全职编辑记者招聘ing
加入我们,亲身体验一家专业科技媒体采写的每个细节,在最有前景的行业,和一群遍布全球最优秀的人一起成长。坐标北京·清华东门,在大数据文摘主页对话页回复“招聘”了解详情。简历请直接发送至[email protected]