这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

雷锋网  •  扫码分享
我是创始人李岩:很抱歉!给自己产品做个广告,点击进来看看。  


自然语言处理人工智能皇冠上的明珠,而填补语言鸿沟的机器翻译则是自然语言处理最典型的应用技术之一。自20世纪90年代起,机器翻译迈入了基于统计建模的时代,发展到今天,深度学习等机器学习方法已经在机器翻译中得到了大量的应用,因此目前也是相当火爆。想必同学们也会经常在网上找一些好的学习资源。

最近,笔者在 github 上发现了一份机器翻译的教程,项目的 GitHub 地址为:

https://github.com/NiuTrans/MTBook


这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图1

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图2

这套教程对机器翻译的统计建模和深度学习方法进行较为系统地介绍,不仅有相应的原理介绍和实现代码,还提供了实战案例,并通过图例对一些形式化定义和算法进行解释(共320张插图),对初学者来说,极为友好,可以学会建立自己的模型。

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图3

值得一提的是,这份机器翻译教程还很贴心地提供slides,每个章节都有对应的课件,slides 共有 598页之多。整理好的slides,直接下载PDF就能使用,这人文关怀,无微不至。


这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图4

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图5

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图6

就有网友评价道:算法、参数设置实验都比较细致,对小白友好,对专业领域的小伙伴很有帮助。


这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

废话就不多说了,让我们一起来具体看看都有哪些内容吧:本教程共分为七个章节,章节的顺序参考了机器翻译技术发展的时间脉络,同时兼顾了机器翻译知识体系的内在逻辑。各章节的主要内容包括:

  • 第一章:机器翻译简介

  • 第二章:词法、语法及统计建模基础

  • 第三章:基于词的机器翻译模型

  • 第四章:基于短语和句法的机器翻译模型

  • 第五章:人工神经网络和神经语言建模

  • 第六章:神经机器翻译模型

  • 第七章:神经机器翻译实战(参加一次比赛)

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

电子书截图7

如果在学习中遇到相关问题,还可以点击下面的网址,加入讨论区答疑:

https://github.com/NiuTrans/MTBook/issues


这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

这份名为《机器翻译:统计建模与深度学习方法》的教程是由肖桐、朱靖波老师编著,东北大学自然语言处理实验室· 小牛翻译联合出品的。作者表示, 开源的本质是,通过对于源代码的免费共享使得无论软件还是硬件都可以通过社会化协作的方式,吸引更多志同道合者 。这种“人人为我,我为人人”也是他们团队做开源项目所推崇的。撰写这份教程的目的,是让更多的人理解并学会机器翻译技术,并让这项技术帮助更多有需要的人。这套教程可以供计算机相关专业高年级本科生及研究生学习之用,也可以作为自然语言处理,特别是机器翻译领域相关研究人员的参考资料。

目前,所有源代码均已开放。上架不到一周的时间,在GitHub上的热度已经突破1000颗星星~这么好的资源,同学们赶快学起来吧!  雷锋网 雷锋网 (公众号:雷锋网)  雷锋网

这套477页的开源电子书和598页的课件,是一份写给机器翻译爱好者的学习资料

随意打赏

提交建议
微信扫一扫,分享给好友吧。