一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛能拿下怎样的成绩?
时限是,10天。
(资料图)
近日,全球语音顶会INTERSPEECH 2020「口音英语语音识别挑战赛」结果公布,一支名叫「大耳朵图图喵喵喵」的团队摘下了两大赛道的第二名和第三名。
参赛选手是这位:
啊不,其实来自他们当中。
说起网易有道与AI语音技术相关的产品,大家或许都不陌生,比如丁磊多次安利、上市都带着的有道词典笔……
相比在市场上取得的认可,许多人可能不会想到,有道AI语音背后的团队非常年轻:成立不到两年,大部分都是应届生,来自知名语音实验室,或者海外高校深造项目。
此次拿奖的时来和Harry Wu(均为花名),就是今年7月刚刚加入网易有道的应届生。
事实上,打这场比赛,对于他们而言更像是一次对工作成果的「突击测验」:被通知要参赛时,距离提交测试结果的截至日期只剩下10天了。
时间紧迫,两人临时组队,又是代表团队第一次出征算法赛事,但在心态上他们倒还真一点也不慌。
用有道之前积累的技术去参赛,10天也足够了。攻坚克难了这么久,是时候拿出来检验一下了。
INTERSPEECH 2020「口音英语语音识别挑战赛」由中国计算机学会、西北工业大学、上海交通大学、新加坡南洋理工大学等多家重量级机构联合举办,共分为两个赛道:
Track1是口音种类识别,参赛者需要使用官方提供的各种口音英语训练数据,训练语种分类模型。
Track2则是口音英语语音识别,参赛者需要使用规则限定的训练数据,训练语音识别模型。
简单来说,一方面是要做英语口音的分类,另一方面是要做语音识别,把带口音的英语语音转成文字。
时来和Harry的工位就挨在一起,两人当即一合计,觉得在语音识别方面,基本可以原封不动地用上现成的技术——有道词典、精品课、云笔记等一系列产品里都有ASR技术的身影,平时的研发工作中,早已经考虑到了复杂口音的情况,识别准确率和响应速度都是经过实战检验的。
而在口音分类这个比较新颖的任务上,他们正在研究中的多语种技术方案正好能够派上用场:
原来会觉得相关的技术方案还处在实验室阶段,要实际应用起来还需要学术界进一步验证。但既然比赛有这个机会,正好可以拿这个方法试验一下。
程序员打比赛,就是直接开干,效率拉满——就在工位上随时讨论。而事后两人回想起来,印象最深的不是时间有多紧、加了多少班,恰恰是设计算法、测试结果的这个过程:
一开始,在口音分类这个全新的任务上,两人想到这会跟说话人的特征有比较强的相关性。而在引入这一信息之后,他们的方案还真在开发集上取得了令人惊喜的效果。
但在测试集开放之后,进一步的验证结果却差强人意。直到比赛结束,测试集公布,他们才发现测试集里说话人的数目,是训练集和开发集加起来的差不多10倍,即一个说话人非常复杂的场景。
虽说碰上了这样那样的小波折,但其实对于两位语音算法工程师而言,这反而更加坚定了他们攻关AI语音技术的决心:语音领域技术相对成熟,但远没有到「做完了」的程度,现实的复杂场景、各种各样的噪音、方言口音,都仍有值得钻研之处。
至于最后的结果,其实可以说是「两全其美」。
虽然准备还是有些仓促,没能拿下冠军,但对初出茅庐的网易有道语音团队而言,面对强劲的业内对手,首次「出击」能拿到顶会挑战赛的二等奖,还是证明了现有技术方案可行、新的设想值得进一步推动。
另一方面,团队组长孙艳庆也坦承,参与比赛对整个语音团队来说,学习到了行业中新的想法和技术,打开了后续开发的新思路。
其实比起单纯去打比赛、发论文,如果和一线的开发者们多聊聊,就能明显地感觉到,网易有道的这支语音团队是非常务实的——以技术落地为导向,以用户反馈为指标。
孙艳庆谈到,在内部,技术方案的推动一般有两种途径。
一种是来自业务端的需求。技术团队要做的,是去评估现有的技术是否能够解决问题,并真正落地到产品中,给用户带来优质的体验。
另一种则来自于工程师们对新技术、新用户需求的敏感度。如果判断一种新技术会被大规模地应用,技术团队也会提前进行相应的布局。
而评价成果的指标则更为直接:用户体验。
这种脚踏实地的作风,也给时来、Harry这样的职场新人留下了深刻的印象。
我们大部分的技术,最终都会聚焦到非常具体的产品上面。不会去做在将来一段时间看来,意义不是很大的一些事情。技术如果只是停留在学术层面上,就没办法真正流行、发展起来。落地对于技术而言是一个非常非常核心的点。
解决用户切实的问题,解决产品中的痛点,或许正是在这样的导向之下,虽然团队仅成立了不到两年的时间,但在产品层面,网易有道在语音方面的许多技术点已经跻身行业前列。
比如语音识别(ASR)。以网易有道词典为例,对话翻译、发音指导,各种功能的实现都离不开精准的语音识别。而经过测试,有道语音识别技术在一些场景上识别准确率超过98%,并且,不止支持中文、英文,还支持日、韩、法、德等多种语言。
在语音合成(TTS)方面,有道语音合成引擎音色逼近真人,同样支持中、英、日、韩、葡等多种语言。在过硬的技术基础之上,今年9月,有道词典还用TTS技术实现了王源明星语音的上线,效果受到了用户的广泛好评。
并且,为了更好地服务于产品,这支规模并不算大的团队,覆盖的技术点却很全面:从录音、拾音环节开始,到中间的语义理解,再到语音识别合成,都有涉及。可以说,在技术上已经形成了比较完整的链条。
事实上,能以一支小而精的团队支撑起复杂业务背后的核心算法,团队内部的氛围是技术实力之外的另一个重要影响因素。
如果你问有道语音团队的工程师们这支团队的特点是什么,就能获得这样几个关键词:年轻、活泼、脚踏实地。
因为年轻、活泼,即使是新人融入起来也完全没有压力,不管是技术的交流还是平时的相处,都可以畅所欲言。
另一方面,虽然团队成员们普遍年纪不大,却个个「身怀绝技」。作为组长,孙艳庆认为,一个脚踏实地的团队,应该给每个人充分的才华施展空间,而在这个空间之下,大家潜心钻研技术,在专注于自己侧重点的情况下,去突破个人的局限。
脚踏实地的价值观延续在整个有道AI团队。不仅是在语音方面,有道的AI能力还覆盖神经网络翻译(NMT)、图像识别(OCR)和自适应教育等等。
并且,其发力深耕的这些AI技术,都切切实实落在了产品上,让C端用户有了最直观的体验:
NMT翻译准确率行业领先,支持12种语言的中文互译,9种语言的英文互译。
OCR可以帮助实现线下学习资料在线化。对中文文本的识别准确度达到97.5%,对英语文字的识别准确度为95.3%,对中英文混合文本的识别准确度为96.2%,已经支持102种主流语言文字识别。
AI行业已经过了“风口飞猪”的时代,愈加务实的市场更加看重技术的落地。当泡沫散去,唯有脚踏实地的团队才能在一代代产品的稳定推出中,扎实生根。
也正是因为这样的氛围,在毕业之际,时来、Harry等人毫不犹豫地拒绝了其他offer,选择加入网易有道。
嗯,一定不是因为这里经常聚众吸猫。
— 完—
本文系网易新闻•网易号特色内容激励计划签约账号【量子位】原创内容,未经账号授权,禁止随意转载。
量子位QbitAI · 头条号签约作者
վ"ᴗ" ի 追踪AI技术和产品新动态
喜欢就点「在看」吧 !
标签:
上一篇 : 3月14日基金净值:博时卓越品牌混合(LOF)最新净值2.431,跌1.18%
下一篇 : 最后一页
最新推荐
鱼羊发自凹非寺 量子位报道|公众号QbitAI 一个成立不到两年的团队,两个初入职场的新人,杀入顶会挑战赛...
3月14日,博时卓越品牌混合(LOF)最新单位净值为2 431元,累计净值为2 602元,较前一交易日下跌1 18%...
的机器人钛博士今天记录了15起重要投融资事件,总计交易金额超过4 22亿元,医疗健康占总投融资额的45 45%。
1、鱼腥草辛、微寒,归肺经,有清热解毒、消痈排脓、利尿通淋的作用。2、平时好吃油腻食物、酗酒或吃辣...
每经AI快讯,有投资者在投资者互动平台提问:有关贵公司承包苹果扩境AR的业务信息是否属实?如果属实,...
摩尔线程MTTS80显卡上手体验国产GPU的春天来了Strike发布于2022-11-1722:0038书签×开始的地方摩尔线程M...
1、冰箱,就是人们用来储存食物的。2、随着科技技术的发展,冰箱也在不断发展更新中。3、从以前的老式冰...
直播吧3月14日讯据《慢镜头》报道,尤文将在赛季末重新考虑博格巴的未来。报道称,博格巴再次受伤,将缺...
1、第一种:香油炸蝎法将蝎子用咸盐水清洗3遍左右;2、取适量香油放入锅内,待油开;3、油开将蝎子
1、嘉,汉语常用字,读作jiā,最早见于西周金文,其本义是美好。2、拼音:jiā释义:美好:~宾。3、~...
1、典型调查:是指从调查对象的总体中选取一个或几个具有代表性的单位,如个人、群体、组织、社区等等,...
1、热爱党热爱教育事业,自觉遵守国家的法律法规和学校的各项规章制度,认真履行教师职责,积极做好本职...
1、《甜蜜的负担》是由杨盛元填词,许卿耀谱曲,涂惠源、徐德昌编曲。2、陈明真演唱的歌曲。本文到此结...
大洋网讯3月12日~3月21日,澳门与横琴粤澳深度合作区(简称“合作区”)将组建“澳琴联合招商推介代表团”...
体验生涯规划课程,找准职业选择方向这所初中学校开展的实践活动不一般N晚报记者王国伟通讯员朱悦婷“经...
1、红嘴牛椋鸟(学名:Acridotheresburmannicus)是椋鸟科、八哥鸟类,中等大小,体长约25厘米
根据市场公开信息整理,科威尔(688551)于3月14日将有6 21万股限售股份解禁上市,为公司股权激励一般...
解答:1、春分那天可以吃牛肉吗?2、经过这么漫长寒冷的冬天,我们需要吃点肉来补充营养。春分节气适合...
03月12日12时四川自贡疫情数据阳了以后为什么会腰疼?应该怎么办?以下为详情!一、03月12日12时自贡疫...
1、方法一:直接打电话咨询院校招聘。2、方法二:准考证号=学校代码学院代码专业代码报名人数,代码可在...
产销同比分别增长48 8%和55 9%,环比分别增长30%和28 7%,出口同比增长79 5%……中国汽车工业协会3...
四川金钟食品有限公司是一家专业从事生猪产业链开发的农业产业化企业,是成都市生猪产业发展带动农民增...
1、用谷歌桌面能满足你的要求。2、或鱼鱼桌面秀。本文就为大家分享到这里,希望小伙伴们会喜欢。
一、合同成立是合同生效的前提条件吗合同成立是合同生效的前提条件。合同生效的前提条件是:合同当事人...
1、标准文具采用优质木浆制成,可用于学生写作文,从业者写报告和总结。2、它适合所有年龄的人。3、文具...
1、魔兽世界急救、烹饪、钓鱼这三样都需要向特定的NPC购买教材,阅读教材后才能习得相应的中级生活技能...
1、《怎样让新托福写作的语言更美国》是2010年机械工业出版社出版的图书,作者是慎小嶷。2、本书主要从...
汽车现在已经越来越普及,基本上都快实现每家每户都有汽车了,那么汽车这么多的情况之下,我们在用车的...
1、好吧、楼主钟山还是可以的、你可以选环工系专业都是不错的、不过硬件设施不行、夏天没有空调的、交通...
1、笔划汉字拼音笔划汉字拼音4王wáng,
1、PLC中自锁是线圈控制触点维持线圈自身的通电状态。2、最简单的自锁是用常开触点X1控制线圈Y1,再回过...
1、主体性是指人在实践过程中表现出来的能力、作用、地位。2、即人的自主、主动、能动、自由、有目的地...
当血友病遇上关节炎“玻璃人”兄弟成功换关节
新华社北京3月10日电(记者黄垚)据中央气象台预报,未来几天受寒潮影响,中东部大部地区气温将出现明显下...
2023年2月17日,中国证监会发布全面实行股票发行注册制相关制度规则,自公布之日起施行。全面实施注册制之...
1、你在哪个培训机构取得的,就在当地的安监局网站进行查询,网站上一般有专门的特种作业查询方式,一般...
一、题文法国启蒙思想和中国维新思想在促进社会变革的政治实践中效果明显不同,其主要原因是二、解答D本...
春天的胶囊衣橱,少不了这几件,风衣,衣橱,拼色,春装,针织衫,牛仔裤,针织开衫,牛仔衬衫,身材比例
近日,多地气温突破同期纪录,初春时节甚至热出了初夏的感觉。但是,随着一股强冷空气来袭,部分地区将...
1、成人高考的学历现在已经在逐步淘汰了,如果你已经工作了,建议不要上这种形式的,成人高考的学历分为...
1、孕妇在孕期服用叶酸片是为了避免胎儿神经管畸形。2、叶酸又称维生素B9,在人体内无法合成,只能通过...
1、辽A沈阳市辽B大连市辽C鞍山市辽D抚顺市辽E本溪市辽F丹东市辽G锦州市辽H营口市辽J阜新市辽K辽阳市辽L
香蕉聊是——九眼科技,国内比较大的图片社交平台inAPP的母公司。是一款新推出的垂直于95后年轻人,以实...
活动现场。红网时刻新闻3月9日讯(通讯员虢萍)春风三月暖人心,医者仁心塑真情。为提高女性健康防治意...
美国空军公布未来战机蓝图今天的热度非常高,现在也是在热搜榜上了,那么具体的美国空军公布未来战机蓝...
1、一般疑问句没有疑问词,特殊疑问句句首要加疑问词。2、陈述句改为疑问句,一般都要把助动词、系动词...
1、昨天下午,我听了一场空前盛大的讲座。著名讲师邹越做了题为《让生命充满爱》的演讲,讲述了一个激动...
利息净收入占总营收七成以上,且增速超8%,不过具体来看,2022年,平安银行净息差为2 75%,同比下降4个基点
3月9日电,在法拉第未来(FF)2022年第四季度财报电话议上,有投资者询问FF是否获得了在美国销售车辆的...
1、一样的,几乎是不相上下,各有分工级别一样看军衔。2、军衔一样看资历,资历一样看年纪,年纪一样看...
一张陌生人的图片“活化”成为视频? 深度合成正瓦解“眼见为实”
一张陌生人的图片“活化”成为视频? 深度合成正瓦解“眼见为实”
外交部发言人:中方以实际行动支持加强乌克兰核设施安全|速看料
怎么把两个表格的数据匹配到一起求和_怎么把两个表格的数据匹配到一起 观热点
2比0击败沙特队 U20亚洲杯国足首胜!目前排名小组第二!! 天天观察
windows无法连接到无线网络怎么办?密码页面也不出现_Windows无法连接到无线网络怎么办 今日播报
急需反弹!马布里:我宁愿死在球场上也不会放弃比赛!_全球最新
上海交通大学附属闵行实验学校(暂名)建设有新进展 明年完工并开办招生 世界新动态
全球观点:特朗普称若再当总统1天就解决俄乌冲突,还表示与普京关系非常好
三一重工董事长向文波:企业市值只要过万亿 金牌员工每人发500万元 观天下
天天百事通!赞宇科技:一般而言,若原材料价格上涨,会对现有库存的增值有利
中京电子:公司新能源汽车动力与储能电池BMS用FPCA产线目前订单充裕
Copyright © 2015-2022 全球律师网版权所有 备案号:豫ICP备20009784号-11 联系邮箱:85 18 07 48 3@qq.com