数据挖掘工具深度测评

文 | 商业智能研究院 2022-05-17

数据挖掘应用程序可帮助发现大量数据之间的联系,典型应用就是“杂货店的顾客购买模式”。如今这个信息时代,合适的数据挖掘工具能帮助企业赢在起跑线上。

1

1、FineBI

FineBI最新的版本主打的是超大数据量性能和自助式分析2个特点,最高可以支撑20亿数据的秒级呈现,在功能方面跟Tableau很接近,适用于企业中的技术人员、业务人员和数据分析师,可以完全自主的进行探索式分析,软件在易用性和功能上做的都很不错。

FineBI在内置的数据挖掘算法方面相对比较丰富一些,除了预测和聚类之外,还支持分类、回归、关联规则一共五大数据挖掘模型算法。

2、IBM Cognos Analytics

IBM Cognos Analytics 既适用于部门级的业务人员,也适用于业务人员 + IT 部门这种目前比较流行的搭配组合。业务人员也可快速的制作仪表盘,比如使用云词图和主状态,并且通过 Data Player(数据参数播放器)进行播放式的多维数据分析。同时,也可以制作 Story(故事),特别是在汇报和总结工作的时候比较实用,通过数据来讲故事,总结分析。

只是,目前国内有关 IBM Cognos Analytics 的相关介绍还比较少,学习资料大多是英文,学习成本较高。

3、R

R作为一种统计分析软件,是自由软件,是完全免费,开放源代码的,可以实现许多统计功能。R作为一个开放的统计编程环境,我们可以自由地编制函数来扩展现有的语言。所以,它的更新速度比一般统计软件,如,SPSS,SAS等快得多。这也是其程序包繁多并且更新迅速的原因之一。

但R语言跟SPSS一样,并不适合毫无统计知识的初学者使用。

4、Tableau

Tableau提供了一系列专注于商业智能的交互式数据可视化产品。Tableau允许通过将数据转化为视觉上吸引人的交互式可视化(称为仪表板)来实现数据的洞察与分析。

在挖掘语言集成方面,Tableau目前除了支持R语言之外,还支持与Python语言的集成。

5、SPSS

从数据挖掘工具的角度来说,SPSS在统计分析领域有更高一筹的优势,既可以很好地进行回归分析、方差分析以及多变量分析等,又能在计算分析的同时输出图形,极高地提升工作效率。Excel 表格数据、文本格式数据均可以导入,节省了相当大的工作量。

但它要求使用者懂统计学,理解一些分析模型;功能性弱于R,在数据可视化方面过于单调,较为成熟的数据分析师甚至会直接跳过SPSS,选取可视化更强的分析工具。

6、Pentaho

Pentaho BI平台不同于传统的BI产品,它是一个以流程为中心的,面向解决方案(Solution)的框架。其目的在于将一系列企业级BI产品、开源软件、API等等组件集成起来,方便商务智能应用的开发。

它侧重于大中型企业应用。

7、KNIME

KNIME这款数据分析平台,数据和工具的集成能力不错,容易与第三方的大数据框架集成其通过大数据组件的扩展(Big Data Extension)能够方便的和Apache的Hadoop和Spark等大数据框架集成在一起,非常的容易使用。

它兼容多种数据形式,也能与第三方的机器学习库集成使用,比如H2O,Keras,Scikit-Learn等提供基于Web报告或者数据视图的展示支持动态工作流的设计。

8、Weka

Weka是一个应用了机器学习算法来进行数据挖掘的框架,其算法不但可以直接应用于数据集,还能用Java代码直接调用。其提供了很多的工具用于数据的预处理、分类、回归等以及最后的可视化,典型的应用场景为,比如物联网。

正如KNIME一样,WeKa和Hadoop,Spark也能无缝的集成。和R相比,Weka在统计分析方面较弱,但在机器学习方面要强得多。

与任何软件一样,数据挖掘解决方案需要选择适合自己。例如,如果您正在评估来自企业供应商SAS的数据挖掘工具,那么是否拥有相应技术的数据分析师?如果想要让普通业务员都能做数据挖掘,那么FineBI等易上手的工具更适合你。

商业智能BI产品更多介绍:www.finebi.com

免费试用FineBI


本月阅读量最高的10篇文章

立即试用FineBI,还可获得更多的方案、案例和模板

免费下载和试用 >

售前咨询

服务热线

400-811-8890转1

售后咨询

在线QQ

800049425

服务热线

400-811-8890转2

投诉建议

总裁办24H投诉

173-127-81526