h2o flow

研究机构Gartner将数据科学和机器学习平台定义为“一个有凝聚力的软件应用程序,它提供了创建多个数据科学解决方案并将这些解决方案集成到业务流程、周围基础设施和产品中所必需的基本构建块的混合物。”来源:企业网D1Net

h2o flow

这种平台使数据科学家能够在整个数据和分析流程中执行任务。这些任务包括与数据访问和接收、数据准备、交互式探索和可视化、功能工程、高级建模、测试、培训、部署和性能工程相关的任务。考虑到这一点,Gartner发布了一份魔力象限报告,介绍了数据科学和机器学习领域的16家领先供应商和平台。

领导者

Gartner分析师写道:“魔力象限中的领导者在数据科学和机器学习市场中具有强大的影响力和重要的知识共享能力。他们在探索、模型开发和实施的整个过程中展示了深度和广度的优势。领导者在提供卓越服务和支持的同时,还能灵活应对瞬息万变的市场环境。能够熟练使用leader平台的数据科学家专业人员数量庞大,而且还在不断增加。领导者最有能力影响市场的发展和方向。他们涉及所有行业、地理位置、数据领域和用例,因此他们对这个市场有着坚实的理解和战略。他们不仅可以根据当前的市场条件专注于有效的实施,而且他们还拥有一个坚实而强大的路线图来利用这个快速变化的行业的新发展和先进技术。他们提供思想引领和创新差异化,并在实施过程中经常颠覆市场。”

(1)Alteryx公司

Alteryx的总部设在加利福尼亚州的尔湾。Gartner分析师表示,“Alteryx提供了统一的机器学习平台Alteryx ytics,使公民数据科学家能够在单一工作流程中建立模型。2017年年中,Alteryx收购了专注于模型部署和管理的数据科学提供商Yhat。Alteryx公司于2017年初在纽约证券交易所进行了首次公开募股(IPO),加强了其扩大投资和增强平台的能力。Alteryx已经从挑战者象限发展到领导者象限。这得益于强大的执行力(在收入增长和客户获取方面)、令人印象深刻的客户满意度,以及专注于帮助组织灌输数据和分析文化。”

(2)H20.ai公司

H2O.ai总部位于加州山景城。Gartner分析师表示,“H2O.ai提供了一个开源的机器学习平台。在这个魔力象限中,我们评估了核心组件H2O流量、H2O蒸汽;用于火花集成的H2o苏打水;以及提供深度学习能力的H2O深水。H2O.ai已经从之前魔力象限的梦想家发展成为领导者。它通过重大的商业扩张不断取得进步,并巩固了其作为意识形态领导者和创新者的地位。”

(3)KNIME公司

KNIME总部位于瑞士苏黎世。Gartner表示,“KNIME提供了一个完全开源的KNIME分析平台,全球有超过10万人使用。KNIME提供业务支持和业务扩展,以促进企业部署的协作、安全性和性能。在过去的一年里,KNIME推出了面向AWS和微软Azure的云平台版本,更加注重数据质量,扩展了深度学习功能,并将部分商业功能转化为开源。KNIME正在加速其产品开发和客户获取。KNIME的平台被世界上大多数行业和大部分地区使用。该供应商展示了对市场的深刻理解、强大的产品战略和所有使用案例的优势。这些属性共同巩固了其作为领导者的地位。”

(4)RapidMiner公司

RapidMiner总部位于马萨诸塞州波士顿。Gartner分析师表示,“RapidMiner的平台包括RapidMiner Studio、RapidMiner Server和RapidMiner Radoop。RapidMiner Studio是一款模型开发工具,提供免费版和商业版。它的价格取决于逻辑处理器的数量和模型使用的数据量。通过采用免费版本,客户可以获得一个逻辑处理器和10,000行数据。RapidMiner服务器旨在共享、协作和维护模型。RapidMiner Radoop直接将RapidMiner的执行扩展到Hadoop环境。RapidMiner仍然是一个领导者,为全方位的数据科学家和数据科学团队提供了一个全面且易于使用的平台。RapidMiner通过引入新的生产力和性能功能,继续强调核心数据科学以及模型开发和执行的速度。”

(5)SAS公司

SAS的总部设在北卡罗来纳州的卡里。Gartner分析师表示,“SAS为分析和数据科学提供了许多软件产品。对于这个魔力象限,我们评估了SAS Enterprise Miner(EM)和SAS Visual ytics产品套件,包括可视化统计、可视化数据挖掘和机器学习。SAS依然是老大,但是在视觉完整性和执行能力上已经失去了一些基础。可视化分析套件展示了一个充满希望的未来,因为它的Viya云就绪架构比以前的SAS架构更开放,更容易让广泛的用户访问分析。但其混乱的多产品策略影响了SAS的视觉完整性,对高许可成本的感知削弱了其执行能力。随着市场焦点转向开源软件和灵活性,SAS在提供一个有凝聚力的开放平台方面动作缓慢,并为此付出了代价。”

挑战者

Gartner分析师表示,“挑战者有坚实的存在、可信度、可行性和强大的产品能力。但是,他们可能不会像领导者那样表现出思想领导力和创新能力。挑战者主要有两种类型。一家历史悠久的数据科学和机器学习供应商因其稳定性、可预测性和长期客户关系而取得了成功。他们需要更新他们的发展愿景,以便跟上市场发展的步伐,变得更有影响力和创新力。如果他们继续做他们一直在做的事情,他们的业务增长和市场份额可能会受到损害。在相关市场建立了良好基础的供应商正在进入数据科学和机器学习市场。他们的解决方案可以扩展现有客户的现有平台,但也是许多潜在新客户的合理选择。因为这些供应商证明他们能够影响这个市场,并提供明确的方向和愿景,他们可能会发展成为领导者。”

(1)MathWorks公司

MathWorks是一家私营公司,总部位于马萨诸塞州的Netick。Gartner分析师表示,“Mathwork的两个主要产品是MATLAB和Simulink,但只有MATLAB符合这个魔力象限的选择标准。MathWorks仍然是一个挑战者。其执行能力得益于其在通用高级分析领域的持续可见性、重要的安装基础和强大的客户关系,但受参考客户在关键能力上的平均分影响。它的完整愿景受限于其对工程和高端金融用例的关注。”

(2)TIBCO软件公司

TIBCO Software位于加利福尼亚州的帕洛阿尔托。Gartner分析师表示,“基于其在分析和商业智能领域的地位,TIBCO于2017年6月从Quest Software收购了一个成熟的Statistica平台,并进入了数据科学和机器学习市场。此外,2017年11月,TIBCO宣布收购Alpine Data,这是上一个魔力象限的梦想家。在执行能力方面,这个魔力象限只评价TIBCO在Statistica平台上的能力。TIBCO的其他收购只会有助于其完整性。TIBCO作为挑战者进入这个魔力象限。Statistica平台拥有庞大而成熟的客户群,并在三个典型用例中获得高分:业务探索、高级原型设计和生产改进。”

深谋远虑

Gartner表示,“远见者通常是较小的供应商或新进入者,他们代表着正在塑造或可能影响市场的趋势。然而,人们可能会担心这些供应商能否有效地继续实施,并随着他们的增长而扩大。他们通常在市场上默默无闻,所以他们的领导力往往低于挑战者和领导者。一个有远见的人有很强的远见,并支持一个路线图。他们在解决市场需求方面具有创新性。虽然他们提供的功能通常是创新和可靠的,但在产品的完整性和广度方面往往存在差距。”

远见者值得考虑,因为他们可能:

提供启动创新计划的机会。

提供一些引人注目的差异化功能,作为现有解决方案的补充或替代,提供竞争优势。

更容易受到产品路线图和方法的影响。

(1)Databricks公司

Databricks总部位于加利福尼亚州旧金山。Gartner分析师表示,“Databricks在云端基于Apache Spark为Databricks提供了统一的分析平台。除了Spark,它还为Amazon Web Services(AWS)提供安全性、可靠性、可操作性、性能和实时支持的专有功能。Databricks于2017年11月宣布推出一款微软Azure Databricks平台,该平台未被纳入此魔力象限,因为在评估时通常不可用。Databricks是这个魔力象限的新成员。作为一个有远见的人,它使用开源社区和自己的Spark专业知识来提供一个可访问和熟悉的平台。除了数据科学和机器学习,Databricks还专注于数据工程。2017年,D轮融资金额达1.4亿美元,这为Databricks提供了大量资源,以扩展其部署选项并实现其愿景。”

(2)大台库

大台库总部设在纽约,总部设在巴黎。Gartner分析师表示,“Dataiku提供的数据科学工作室(DSS)专注于跨学科协作和易用性。通过使用户能够快速启动机器学习项目,Dataiku仍然是一个有远见的人,也是许多数据科学需求的热门选择。其完整性愿景源于其合作和开源支持,这也是其产品路线图的重点。由于用例的广度相对较差,且缺乏自动化和数据流,其整体视觉评分低于之前的幻方图。由于在操作和扩展机器学习模型方面存在一些困难,大台库的执行能力也有所下降。”

(3)多米诺公司

Domino数据实验室的总部位于加利福尼亚州的旧金山。Gartner分析师表示,“Domino提供了一个Domino数据科学平台。这是专家数据科学团队的端到端解决方案。该平台专注于集成开源和专有工具生态系统、协作、可重复性以及模型开发和部署集中化的工具。Domino成立于2013年,是该市场的知名制造商,并继续在数据科学家中获得人气。多米诺坚持其远见卓识的立场。虽然其执行能力有所提升,但其在机器学习生命周期之初的薄弱功能(数据访问、数据准备、数据探索和可视化)仍然受到阻碍。然而,在过去的一年里,Domino已经证明了它有能力赢得新用户,并在竞争激烈的市场中获得领导地位。”

(4)国际商用机器公司

IBM的总部设在纽约的Armonk。Gartner分析师表示,“IBM提供了许多分析解决方案。对于这个幻方图,我们评估了SPSS,包括SPSS Modeler和SPSS Statistics。数据科学经验(DSX)是数据科学和机器学习的第二个产物,不符合我们对执行能力轴心的评价标准,但确实有助于IBM的完整性。IBM现在是一个有远见的人,和其他供应商相比,在远见者的完备性和执行能力上已经失去了优势。然而,IBM的DSX产品可能会激发更全面和创新的愿景。IBM已经宣布计划在2018年为其SPSS产品提供新的界面,该界面将SPSS Modeler完全集成到DSX中。”

(5)微软公司

微软的总部设在华盛顿州的雷德蒙。Gartner分析师表示,“微软为数据科学和机器学习提供了许多软件产品。在云端提供Azure机器学习(包括Azure Machine Learning Studio)、Azure数据工厂、Azure流分析、Azure HDInsight、Azure数据湖、Power BI。针对本地工作负载,微软为SQL Server提供了机器学习服务,该服务于2017年9月发布。在这个魔力象限的最后期限之后。只有Azure Machine Learning Studio符合这个魔力象限的包含标准,虽然微软有更广泛的高级分析产品,这确实影响了我们对其完整性的评价。但是微软仍然是一个有远见的人。它获得这个位置主要是因为其较低的市场响应度和产品可行性得分,因为Azure Machine Learning Studio的纯云特性限制了它在许多需要内部部署选项的高级分析案例中的可用性。”

利基企业

Gartner分析师解释说:“小众公司在特定行业或方法上显示出优势,或者与特定技术栈完美结合。一些利基公司表现出一定程度的远见,这表明他们可能会成为远见卓识者。然而,与市场上的其他公司相比,他们往往很难让自己的愿景引人注目,或者他们可能是在努力创造创新和思想领先的历史记录,从而使他们成为远见卓识者。如果其他利基公司继续以增强其在市场中的势头和吸引力的方式执行任务,他们可能会成为挑战者。”

(1)阿纳康达公司

Anaconda原名Continuum ytics,总部位于德克萨斯州奥斯汀。Gartner分析师解释道,“Anaconda出售的是Anaconda Enterprise 5.0,这是一个基于交互式笔记本概念的开源开发环境。它还提供了一个松耦合的分发环境,可以访问各种开源开发环境和开源库,主要基于Python。Anaconda的优势在于,它可以联合起来,为大量不断构建机器学习功能的Python开发者提供一个中心接入点。然而,在质量、可靠性和可持续性方面,Anaconda对这些开发人员的工作几乎没有控制权。Anaconda通过Anaconda Cloud培养了一个广泛的开发者社区。Anaconda作为一家利基公司的地位反映了它对精通Python的经验丰富的数据科学家的适用性。”

(2)安戈斯公司

总部位于加拿大多伦多的Angoss于2018年1月被Datawatch收购。Gartner分析师表示,“由于收购的延迟,与幻方图过程和不确定性的影响相比,它在文件中的名字仍然是Angoss。本次评测涵盖以下产品:KnowledgeSEEKER,公司最基础的产品,主要针对桌面环境下的公民数据科学家;KnowledgeSTUDIO比KnowledgeSEEKER包含更多的模型和功能;以及新推出的KnowledgeENTERPRISE,这是一款功能齐全的旗舰产品。Angoss与银行客户有长期合作经验。这有助于为银行和其他具有类似数据和分析需求的行业提供服务,如保险、运输和公用事业。”

(3)SAP公司

SAP总部位于华尔道夫。Gartner分析师表示,“SAP公司再次将其平台更名为:SAP business objects Predictive ytics。该平台有许多组件,如用于数据集准备和功能工程的数据管理器、用于公民数据科学家的自动化建模器、用于更复杂的机器学习的预测合成器和用于操作的预测工厂。SAP Leonardo机器学习和SAP Leonardo生态系统的其他组件对SAP在这个魔力象限的执行能力没有贡献。在过去的一年里,SAP在几个方面取得了不错的进展,但在其他方面仍然落后。它是一家小众企业,因为与其他公司相比,它的客户满意度较低,而且缺乏想法共享。”

(4)Teradata公司

Teradata总部位于加利福尼亚州圣地亚哥。Gartner分析师表示,“Teradata统一数据架构(UDA)是一个企业分析生态系统,它结合了开源和商业技术来提供分析功能。UDA包括Aster ytics、Teradata数据库、Hadoop和数据管理工具。Teradata虽然运营能力很强,但仍然缺乏统一的端到端技术平台。Teradata保持了固有的性能和可靠性优势,但在数据科学开发中缺乏凝聚力和易用性,削弱了其在视觉完整性方面的执行能力和进步。还是小众企业。”

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。

发表回复

登录后才能评论