《驾驭文本:文本的发现、组织和处理》处理是目前互联网内容应用(如搜索引擎、推荐引擎)的关键技术。本书涵盖了文本处理概念和技术的多个方面,包括文本预处理、搜索、字符串匹配、信息抽取、命名实体识别、分类、聚类、标签生成、摘要、问答等。《驾驭文本:文本的发现、组织和处理》的特点在于通过实例来理解文本处理的这些概念和技术,读者利用现有的开源工具就可以自己实现这些实例。《驾驭文本:文本的发现、组织和处理》适合于互联网文本内容处理领域的开发人员阅读,也适合有志于加入这一领域的学生、从业人员阅读。即使对于已经从事多年文本处理研究和开发工作的人员来说,《驾驭文本:文本的发现、组织和处理》也不失为一种有益的补充性读物。
阅读更多