Home About Overview

About 读取大数据的内部价值,提供精密的分析及咨询

Collecting (收集)

通过WEB和SNS上的多样化渠道,快速的采集数据并建立数据组 (Data Set)。
采用阶段性的处理方式提高数据配置效率

  • 快速的收集所需数据
  • 选择符合特性与细分下的频道
  • 添加想要收集的频道

Storage (储存)

TEXTOM是以hadoop的数据高效率储存, 管理分散
文件并集中处理的程序为基础, 出色的保管大容量文件

  • 体现数据收集, 精炼, 分析后储存和管理的分散文件系统和NoSQL功能。
  • 为精准选择有效的数据, 提供实时的数据索引功能。
  • 确保个频道的数据量以及收集量

Cleaning (提炼)

不仅仅可以从收集到的数据进行分析, 还可通过用户持 有的数据进行
2way的数据提炼/分析, baysin

  • 提炼过程的特长
  • 汉语, 英语为基础快速准确的形态分析
  • 调查及特殊文字的处理
  • 提供N-gram, TF-IDF, Topic Modeling等多样的分析数值

Matrix (矩阵)

考虑到分析者的便捷性操作
推荐 (UCINET, NODEXL)
几款数据分析形式的程序

  • 1-Mode, 2-Mode 生成矩阵
  • 矩阵, Euclidean, jacquard,cosine
    等生成多种形态的数值

Visualization (视觉化)

分袖的结果值根据不同的分析目的,提供可以直观的反映分析内容的多种图表和图片

  • - 01 -可以选择加权值方式
  • - 02 -持有数据的视觉化