立即注册即可免费获得 5MB
CHN
ENG
KOR
登录
-
CHN
ENG
KOR
退出
-
用户
-
剩余流量
-
MB
有效期
-
일 남았습니다.
增加容量
我的页面
支付历史
用户词典
仪表板
收集
数据收集
收集列表
清洗
数据预处理
清洗列表
分析
定制
增加容量
前往信息页面
请从收集列表中选择要预处理的数据。
语素分析
数据预处理
选择列
请选择用于文本分析的列
语素分析
选择选项
未选择
对收集到的原文进行分析,不使用语素分析。
分析语言
CHN
ENG
分析器
MeCab-IMC
Mecab-IMC是TEXTOM的定制语素分析器,增强了Mecab-ko分析器的性能。与最初的Mecab-ko相比,它提供了卓越的性能和速度。
Jieba
CoreNLP
它提供基于斯坦福大学开发的CoreNLP库的语素分析结果。
分析词类
名词
动词
形容词
外语
数字
用户词典
使用
未使用
预先指定
-
请先在用户字典(我的页面-用户字典)中注册要优化的关键词。如果使用TEXTOM进行多次分析,那么使用用户字典可以实现快速有效的分析,而无需重复任务。以上翻译结果来自有道神经网络翻译(YNMT)· 通用场景
应用
数据预处理
选择选项
未选择
数据预处理不使用清洗数据进行分析。
重复已删除
根据所选项目删除重复数据
精确匹配:删除基于所选列的值完全匹配的数据
完美匹配
未选择
选择列
过滤垃圾邮件
根据所选列筛选数据以包含或排除特定的单词。
包含关键字:只使用包含指定字的数据进行分析。
排除关键字:从分析中排除包含指定单词的数据。
AND:过滤数据以满足'所有'指定的include和exclude关键字条件。
OR:过滤数据以满足'任何'指定的include和exclude关键字条件。
关键词
未选择
选择列
关键词
包括
例外
应用