「自然语言处理」领域的优质资料
simple-jieba:用 100 行实现简单版本的 jieba 分词
词嵌入1:从「分布表示」说起

分词 / 是 / 什么 / ?

词是能够独立活动的最小语言单位。在自然语言处理中,通常都是以词作为基本单位进行处理的。由于英文本身具有天生的优势,以空格划分所有词。
阅读更多