自然语言处理领域热点:博士论文致谢引热议,达摩院语言模型刷新纪录

发布时间:2021-04-20作者:51云监测

这两天有两个热点事件,“读到泪目的博士论文致谢”与“阿里达摩院发布中文领域最大规模语言模型”,看似不相关的两个新闻,其实有着千丝万缕的关系,他们的纽带就是自然语言处理技术。

 

读到泪目的博士论文致谢

 


近日,一篇中科院博士论文致谢文章打动许多人,并在社交媒体上引发热议。

全文如下:

我走了很远的路,吃了很多的苦,才将这份博士学位论文送到你的面前。二十二载求学路,一路风雨泥泞,许多不容易。如梦一场,仿佛昨天一家人才团聚过。

出生在一个小山坳里,母亲在我十二岁时离家。父亲在家的日子不多,即便在我病得不能自己去医院的时候,也仅是留下勉强够治病的钱后又走了。我十七岁时,他因交通事故离世后,我哭得稀里糊涂,因为再得重病时没有谁来管我了。同年,和我住在一起的婆婆病故,真的无能为力。她照顾我十七年,下葬时却仅是一副薄薄的棺材。另一个家庭成员是老狗小花,为父亲和婆婆守过坟,后因我进城上高中而命不知何时何处所终。如兄长般的计算机启蒙老师邱浩没能看到我的大学录取通知书,对我照顾有加的师母也在不惑之前匆匆离开人世。每次回去看他们,这一座座坟莹都提示着生命的每一分钟都弥足珍贵。

人情冷暖,生离死别,固然让人痛苦与无奈,而贫穷则可能让人失去希望。家徒四壁,在煤油灯下写作业或者读书都是晚上最开心的事。如果下雨,保留节目就是用竹笋壳塞瓦缝防漏雨。高中之前的主要经济来源是夜里抓黄鳝、周末钓鱼、养小猪崽和出租水牛。那些年里,方圆十公里的水田和小河都被我用脚测量过无数次。被狗和蛇追,半夜落水,因蓄电瓶进水而摸黑逃回家中;学费没交,黄鳝却被父亲偷卖了,然后买了肉和酒,都是难以避免的事。

人后的苦尚且还能克服,人前的尊严却无比脆弱。上课的时候,因拖欠学费而经常被老师叫出教室约谈。雨天湿漉着上课,屁股后面说不定还是泥。夏天光着脚走在滚烫的路上。冬天穿着破旧衣服打着寒颤穿过那条长长的过道领作业本。这些都可能成为压垮骆驼的最后一根稻草。如果不是考试后常能从主席台领奖金,顺便能贴一墙奖状满足最后的虚荣心,我可能早已放弃。

身处命运的漩涡,耗尽心力去争取那些可能本就是稀松平常的东西,每次转折都显得那么身不由己。“幸运的是,命运到底还有一丝怜惜。进入高中后,学校免了全部学杂费,胡叔叔一家帮助解决了生活费。进入大学后,计算机终于成了我一生的事业与希望,胃溃疡和胃出血也终与我作别。

从家出发坐大巴需要两个半小时才能到县城,一直盼着走出大山。他从炬光乡小学、大寅镇中学、仪陇县中学、绵阳市南山中学到重庆的西南大学,再到中科院自动化所,我也记不清有多少次因为现实的压力而觉得自己快扛不下去了。这一路,信念很简单,把书念下去,然后走出去,不枉活一世。世事难料,未来注定还会面对更为复杂的局面。但因为有了这些点点滴滴,我已经有勇气和耐心面对任何困难和挑战。理想不伟大,只愿年过半百,归来仍是少年,希望还有机会重新认识这个世界,不辜负这一生吃过的苦。最后如果还能做出点让别人生活更美好的事,那这辈子就赚了。

全文波澜不惊,却能直击人心。有网友评论说,“他活成了这个世界的一束光”,是无数“寒门学子”的希望。也有人说“计算机专业才是寒门学子改变命运的机会”。

这篇谢文的论文是《人机交互式机器翻译方法研究与实现》,作者黄国平,2017年毕业于中国科学院大学自动化研究所模式识别国家重点实验室的工学博士,目前就职于腾讯人工智能实验室(腾讯AI Lab),研究方向为机器翻译和辅助翻译,且一直致力于机器翻译与人工翻译的深度融合,以期提高人工翻译的效率,推动机器翻译等人工智能技术的产业落地。

机器翻译是自然语言处理(NLP)的应用之一,自然语言处理(NLP)作为根植于语言学、计算机科学和数学等多种学科沃土而成长起来的多边缘学科,成为人工智能中亟需解决的任务之一,同时也是该领域的一个重要研究方向。自然语言处理的飞速发展,为机器翻译研究提供了强有力的支持。

 

阿里达摩院发布中文领域最大规模语言模型

 

就在博士论文致谢引发热议的第二天,阿里达摩院发布了中文领域最大规模的预训练语言模型PLUG。PLUG全名为Pre-training for Language Understanding and Generation,PLUG集语言理解与生成能力于一身,在小说创作、诗歌生成、智能问答等长文本生成领域表现突出。该模型参数规模达270亿,是目前全球规模最大的中文纯文本预训练语言模型。并且在发布后,PLUG刷新了中文语言理解评测基准CLUE分类榜单历史纪录。

阿里达摩院语言技术实验室负责人司罗称:“达摩院NLP团队将进一步攻克自然语言处理领域科研难题,完善中文及跨语言人工智能基础设施,让AI没有难懂的语言,并探索通用人工智能之路。”

是的,PLUG也是自然语言处理(NLP)领域的研究

 

自然语言处理(NLP)

 

自然语言处理(NLP)是当最热门的研究领域之一,推动着语言智能的持续发展和突破,并越来越多地应用于各个行业。正如国际知名学者周海中先生曾经所言:“自然语言处理是极有吸引力的研究领域,它具有重大的理论意义和实用价值。”

自然语言处理(NLP)也是人工智能中最为困难的问题之一。美国微软公司创始人比尔·盖茨先生曾经表示,“语言理解是人工智能领域皇冠上的明珠”。

自然语言处理还有哪些应用方向?

 

自然语言处理主要应用于机器翻译、舆情监测、自动摘要、观点提取、文本分类、问题回答、文本语义对比、语音识别、中文OCR等等方面。

不得不提的是,51云监测的错别字和敏感词监测系统,也是自然语言处理应用之一。帮助网站检测本文中的错别字词和敏感词,给出正确词语,尤其特定语境下的表述问题,比如政务领域中对领导人的特定称谓表述错误等等,51云监测就会给出正确的表述,这里需要强大的自然语言处理技术和丰富的汉语词库。

无论是中科院博士研究的机器翻译,阿里达摩院发布的预训练语言模型,还是51云监测的错别字和敏感词监测系统,都是自然语言处理(NLP)技术应用在不同场景中的研究,这些技术的最终目的是在改善人们的生活,提升中国的科技力量。

025-57926567 / 025-57926595
周一至周五09:00-18:00

service@fnii.cn
点击发送邮件

3087454211
点击咨询
25684437
点击咨询

“51云监测”微信咨询 1V1 微信咨询 “51云监测”微信公众号 “51云监测” 微信公众号