Quantcast
Channel: InfoQ - 促进软件开发领域知识与创新的传播
Viewing all articles
Browse latest Browse all 1638

跨专业自学NLP,这个90后撸出了开源类库HanLP,已在GitHub收获1.5W星

$
0
0

截止2019 年 10 月底,一款名为HanLP的自然语言处理类库在GitHub Star 数达到了 15.5 K,超过了宾夕法尼亚大学的 NLTK、斯坦福大学的 CoreNLP、哈尔滨工业大学的 LTP。这是一款由一系列模型与算法组成的自然语言处理(NLP)开发工具包。

你或许想象不到,这款NLP工具包被开发出来时,它的作者何晗,还是一位日语专业的大二学生。如今,在攻读博士期间,何晗又创作了一本《自然语言处理入门》,希望解决小白们的NLP入门难题。该书得到了周明、刘群、王斌等业内顶级NLP专家的推荐。

“理论是根,项目是树“,如果说HanLP是树,那么这本《自然语言处理入门》便是树的根基。在该书问世之际,AI前线与何晗展开对话,了解这位极具天赋的学生“种植树”,“培育根”的故事。

痴迷游戏走上编程之路

何晗有两个爱好:动漫和游戏。这两个爱好后来也深深影响了他最为关键的两次重大人生抉择。

高中时,何晗就读于黄冈中学理科“状元班”,班上学霸云集,但何晗觉得自己和那些学霸同学比差远了。“我肯定不是学霸,我属于那种均值80分,方差特别大的类型”。


Viewing all articles
Browse latest Browse all 1638

Trending Articles