Start TEXTOM
Home Communication FAQ
通过FAQ搜索功能可以更快的找到答复。 如没有找到咨询内容的回复可使用Q&A进行咨询。
有可能您要收集的文本内容当中很多都不是完全公开的内容,或者网页运营商从政策上拒绝大容量爬取数据等等原因会阻碍您收集到完整的数据。
(微信和微博由于平台的特性,能够收集到的数据会有限。)
这时您可以使用‘个人用户词典’。将修改前单词和修改后单词的表格用EXCEL整理好之后上传到‘个人用户词典’。之后在‘手动编辑’栏里选择个人用于词典并适用,可以免于重复操作。
修改过的单词时无法复原的。所以我们建议务必将从自动预处理得到的单词目录先下载并保存好之后,再进行下一步的操作。如果在编辑过程中出现失误,请将下载并保存好的文件重新上传之后重新进行编辑操作即可。
使用TEXTOM的时候会在‘提炼/会在’‘数据清洗/语素分析’阶段进行分析时消耗流量。
不是的。‘添加关键词’适用于在同等条件下(收集时间,平台)对不同关键词进行收集。这是对两个不同关键词的操作。谷歌和百度搜索引擎可以适用算法口令。可以用‘+’符号添加收集的文本中必须包含的单词。例如:如果您在‘关键词’一栏输入‘休闲娱乐+运动’,那么收集到的会是同时包含‘休闲娱乐’和‘运动’的文本。
不是的。如果您希望收集英文文本,您需要在‘关键词’一栏输入您想要收集的英文关键词。如果您在‘数据清洗/语素分析’里选择的语言是‘英文’,那么系统会在您收集的文本当中仅选取英文文本进行分析。