从中文文本中自动提取关键词和摘要
MIT License
pke_zh, python keyphrase extraction for chinese(zh). 中文关键词或关键句提取工具,实现了KeyBert、PositionRank、TopicR...
Keyphrase Generation for Scientific Document Retrieval
Extract Keywords from sentence or Replace keywords in sentences.
结巴中文分词
文本挖掘和预处理工具(文本清洗、新词发现、情感分析、实体识别链接、关键词抽取、知识抽取、句法分析等),无监督或弱监督方法
xmnlp:提供中文分词, 词性标注, 命名体识别,情感分析,文本纠错,文本转拼音,文本摘要,偏旁部首,句子表征及文本相似度计算等功能
pytextclassifier is a toolkit for text classification. 文本分类,LR,Xgboost,TextCNN,FastText,TextRNN,B...
text2vec, text to vector. 文本向量表征工具,把文本转化为向量矩阵,实现了Word2Vec、RankBM25、Sentence-BERT、CoSENT等文本表征、文本相似...
一键中文数据增强包 ; NLP数据增强、bert数据增强、EDA:pip install nlpcda
利用Python实现中文文本关键词抽取,分别采用TF-IDF、TextRank、Word2Vec词聚类三种方法。
一款高性能敏感词(非法词/脏字)检测过滤组件,附带繁体简体互换,支持全角半角互换,汉字转拼音,模糊搜索等功能。
Implementation of TextRank with the option of using pre-trained Word2Vec embeddings as the simila...
A Chinese information extraction tool.
Chinese word segmentation based on statistical methods (for Python)
Python implementation of TextRank algorithms ("textgraphs") for phrase extraction