随着组织积累的数据越来越多,他们用来管理这些数据的软件和服务也在不断扩大。根据 Statista 的数据,2021 年,公司在其 IT 环境中平均使用了 110 个软件即服务 (SaaS) 应用程序,比 2017 年的 16 个应用程序增加了七倍。
大数据在数量、速度和种类方面都带来了挑战,但这并不意味着您必须忍受臃肿的 IT 生态系统才能应对这些挑战。事实上,许多企业可以通过精简数据集成管道、削减不必要的工具和服务来实现显著的优势。下面,我们将讨论您应该如何以及为什么重新考虑数据集成工作流程。
选择正确的数据集成工具
数据集成的最大困难之一是知道如何最好地整合手头的所有信息。数据集成管道中的来源可能包括各种文件、数据库、网站和应用程序(包括内部和外部)。
根据 IDG 的一项调查,目前各公司在其商业智能和分析流程中平均使用 400 多个不同的克罗地亚电报数据 数据源。此外,其中 20% 的公司使用 1,000 个或更多数据源,数量太多,人力数据工程师无法妥善管理。
为了处理这种不断上升的复杂性,组织需要选择最适合该工作的数据集成工具。现代数据集成和 ETL(提取、转换、加载)解决方案包含数十甚至数百个针对最流行数据源的预构建连接器和集成。这使得用户可以轻松地将工具调整到他们当前的工作流程,而不是相反。
Datavail 最近的一位客户是一家非营利性教育机构,在寻求改进其现有数据集成流程时遇到了这个问题。该客户从各种来源获取信息:CRM 和 ERP 应用程序、财务规划和预测软件、分析工具等。为了处理这些来源,客户使用了多种 ETL 工具(包括 Fivetran、Matillion 和自定义 Python 脚本),但代价是更高的 IT 费用和复杂性。