乔治敦大学新生在计算语言学会议上发表论文!

时间:2020-08-29 09:49:37浏览:1374

预约

近日,乔治敦大学新生Aryaman Arora在计算语言学协会(ACL)的第58届年会上发表论文,该学生在计算语言方面很有成就。下面随着托普仕老师一起看一看吧。

  一年级学生Aryaman Arora(C'24)甚至在收到乔治敦大学录取通知书之前都正在崭露头角,成为一位崭新的计算语言学家。

  与工作语言学系博士 学生卢克·盖斯勒(G'23)和计算机科学与语言学系教授内森·施耐德(Nathan Schneider)认为,阿罗拉(Arora)开发了一种更好的方法,使机器可以通过文字转语音软件来抄写印地语和旁遮普语的发音。

  上个月在计算语言学协会(ACL)的第58届年会上发表了一篇描述这种创新的文章。

  由于大流行,会议实际上是在举行的。Arora录制了一段视频,介绍了他们的研究结果,并通过Zoom参加了现场问答环节。

  早期研究热情

  阿罗拉(Arora)生于印度,他的母语为北印度语和英语,并在5岁时移居美国。在高中时,意识到自己对北印度语的了解正在逐渐消失,阿罗拉决定做出一致的努力以恢复这些技能。他对这种语言的兴趣将他带到了免费的多语言在线词典Wiktionary,后来他开始在北印度语中进行编辑。

  他最终成为站点管理员,不仅扩大了对南亚语言的覆盖范围,还编写了支持字典的代码。

  这段经历激发了他对计算机科学和语言学之间交汇处的好奇心,在他高中毕业的那个夏天,华盛顿特区居民就乔治敦的研究机会与施耐德进行了接触。

  施耐德说:“我从当地才华横溢的高中学生那里收到了很多要求,但阿里亚曼(Aryaman)的确脱颖而出,因为他有很多经验,非常适合我所做的研究。”

  这位教授的研究着重于算法学习语言细微差别的能力,他对阿罗拉(Arora)的印地语知识和对北美计算语言奥林匹克竞赛(NACLO)的参与印象深刻。

  改善文字转语音

  文本到语音转换软件将屏幕上的文本转换为声音的多种语言为虚拟助手(例如来自Amazon的Alexa)提供了支持,或者可供视障人士使用。每种语言和书写系统都会给文本语音转换技术带来一系列独特的挑战。

  默认情况下,“ schwa”(英语是uh元音)的发音是 bout和u m,它以书面印地语的每个辅音放在后面。但是,口语印地语只发音其中一些。schwa发音的规则尚不清楚。

  “就像在英语中一样,在印地语中,单词的拼写方式并不总是与单词的发音完全一样,” Arora解释说。“如果文本语音转换软件无法很好地模拟schwa删除,那么最好的情况是该单词对于母语为母语的人来说听起来很奇怪。在最坏的情况下,单词将完全改变,这使文本到语音转换变得难以理解。”

  Arora,Gessler和Schneider创建的模型修复了印地语中schwa删除的问题,迄今为止,该系统具有98%的最高准确性。该模型解决了一个核心问题,以后可以在创建最终用户系统时使用它。

  盖斯勒说:“语言学家至少在过去的50年中一直试图解释schwa缺失的现象,但是没有一种解释是完全令人满意的。” “这就是为什么我们能够为现实应用提供如此好的解决方案感到非常兴奋的原因。”

  Arora,Gessler和Schneider在2019年12月的ACL会议上提交了他们的研究论文,并在此会议上进行了同行评审,并被发表并接受介绍。

  进一步发展

  阿罗拉(Arora)今年早些时候被乔治敦大学(Georgetown College)录取,并将获得计算机科学和语言学专业的双重学位。他希望继续与施耐德(Schneider)合作进行印地语的计算研究,并最终希望在该领域攻读博士学位。

  这位年轻的研究人员说,这种类型的研究可以增进对跨文化的了解。施耐德补充说,由于大多数人都与AI进行交互,因此这一点特别重要。

  他补充说:“互联网和技术正在成为我们生活的核心部分,并延伸到我们与他人互动的方式。” “考虑到构建此技术时出现的公平性问题和潜在的偏见,也很重要,因此,看到除最富裕和学习最深入的语言(例如英语)之外的其他语言方面的一些工作也令人兴奋。”

  经常指导学生的施耐德说:“与乔治城大学的学生合作绝对是一种享受。Aryaman对出色的新研究和学习充满了动力,光明和兴奋。”

  以上就是托普仕美国高端留学为大家介绍的乔治敦大学新生在计算语言学会议上发表论文,更多关于美国留学的相关问题,欢迎在线咨询托普仕高端留学顾问老师。托普仕留学专注于美国TOP30名校申请,5V1服务模式体系,严格限制招生人数,让您直达美国名校!

扫一扫添加托普仕留学客服,了解更多资讯!

托普仕留学微信二维码

微信:Tops6868