批量数据处理通过对庞大的数据进行分析可以解决物联网、云计算、互联网以及车联网等领域的诸多决策问题并发现新的洞察.因此,批量数据处理可以适用于较多的应用场景。
流式数据的特点是,数据连续不断、来源众多、格式复杂、物理顺序不一、数据的价值密度低.而对应的处理工具则需具备高性能、实时、可扩展等特性。
交互式数据处理具备的这些灵活、直观、便于控制的特征能够保证输入的信息得到及时处理,帮助用户更加快速的得到关键的信息使交互方式继续进行下去。
分类/聚类分析是细分市场的有效工具,同时也可用于研究消费者行为,寻找新的潜在市场、选择实验的市场,并作为多元分析的预处理。通过分类/聚类分析可以帮助用户处理庞大的数据处信息。
关联规则分析支持间接数据挖掘,可以处理变长的数据,它的最大特点就是计算的消耗量是可以预见的。关联规则分析可以产生清晰有用的结果,有效的帮助用户挖掘关联信息。
对大规模图数据进行高效处理,其主要优势表现在于,海量的图数据存储和维护能力,强大的分布式并行处理能力,和良好的可伸缩性和灵活性,实现秒级的图数据处理,高效的获得关键信息。
数据预测模型主要是分析不同的参数情况得到的不同结果,通过比较不同的结果,进行决策。根据事物的过去和现预测未来,从而减少对未来事物认识的不确定性,指导我们的决策行动,减少决策的盲目性。
根据对系统进行观测得到的时间序列数据,用曲线拟合方法对系统进行客观的描述。实现从秒级到季度的时间序列分析,用于国民经济宏观控制、区域综合发展规划、企业经营管理。
对一些难以建立物理模型和数学模型的对象系统,可通过仿真模型来顺利地解决预测、分析和评价等系统问题。可以把一个复杂系统降阶成若干子系统以便于分析。
回归分析在分析多因素模型时,更加简单和方便,通过标准的统计方法可以计算出唯一的结果,可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果,从而提高用户的决策准确度。
遗传算法提供了一种求解复杂系统问题的通用框架,它不依赖于问题的具体领域,对问题的种类有很强的鲁棒性,因此能为用户提供不同的应用场景来解决实际的问题。
神经网络具有自学功能,联想存储功能,和高速寻找优化解的能力,利用一个针对某问题而设计的反馈型人工神经网络,发挥计算机的高速运算能力,可以很快的帮助用户找到优化解决方案。
社会网络分析是定性和定量的桥梁,它对大量的图表数据进行定量分析得出定性的结论。社会网络分析法所具有的优点使得该方法能为用户解决更多的问题。
空间分析运用的手段包括各种几何的逻辑运算、数理统计分析,代数运算等数学手段,帮助用户解决所涉及到的地理空间的实际问题,提取和传输地理空间信息,以辅助决策。
大数据可视化,不同于传统的信息可视化,新的可视化方法能够帮助人们分析大规模、高维度、多来源、动态演化的信息,并辅助作出实时的决策。