/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
/中文/
spaCy是一个建立在Python和Cython高级自然语言处理(NLP)最新研究基础上的库。从一开始,它就被设计为用于真实世界的应用--用于构建真实的产品和收集真实的洞察力。spaCy是世界上最快的句法解析器,根据独立的基准测试,它的准确率在1%以内。它的速度快得惊人,易于安装,并带有一个简单而富有成效的API。
SpaCy(nlp自然语言处理 句法分析)是一款非常全面的NLP自然语言文本处理库,支持Python和CPython的NLP自然语言文本,可以帮助编程工作人员更好的工作,欢迎有需要的朋友前来下载。
非破坏性标记化
指定实体的确认
预训练的统计模型和单词向量
迅猛的速度
强大的、经过严格评估的精度
简单的深度学习集成
语音部分标签
标签化依赖性解析
方便的字符串到哈希值映射
句法驱动的句子分割
内置的语法和NER的可视化工具。
高效的二进制序列化
Numpy数据数组导出
简单的模型包装和部署
支持50多种语言
修复问题 #459: 在空文档上可能解析失败。
重命名 spacy.load() 的关键词参数 pipeline 为 create_pipeline。
修复问题 #539: 打开某些 JSON 文件时未指定编码。
修复问题 #514: 添加新 entity label 时序列化失败。
修复问题 #536: OOV words 默认概率不正确。
重命名 spacy.load() 的关键词参数 vectors 为 add_vectors。
修复问题 #541: GloVe 矢量加载不正确。
修复问题 #522: 相似性和矢量规范计算不正确。
修复问题 #544: 添加 vocab.resize_vectors() 方法, 以支持更改为不同维度的矢量。