欢迎访问深圳敏捷云计算科技有限公司!

在甲骨文云上部署 Informatica IDMC 的分析平台:数据智能的新境界

2024-03-05 原创文章

Oracle 和 Informatica 的合作将两个行业领导者在数据库和数据管理领域的优势结合起来,提供了一个全面的企业数据仓库和湖库生态系统。


本参考架构展示了 Informatica IDMC 安全代理如何在 Oracle Cloud Infrastructure (OCI) 中运行。可以使用超过 300 个连接器从各种本地和云源中导出数据,然后导入到 Oracle 自动化数据库中,供分析或数据科学流程使用。没有这种集成,我们可以从应用程序数据(例如 Oracle E-Business Suite)中获取可操作的信息,但我们无法丰富这些数据与其他数据源的信息,以解锁有价值的洞察。在操作系统上运行分析工作负载也不是一个好的实践。本参考架构将技术解决方案定位于整体业务背景中:


集成提供了一个分析平台,其中包含交互记录的应用程序数据与管理层中的其他一组策划数据相结合,并在开发层中被提炼为可操作的信息和洞察。


架构

本参考架构展示了 Informatica IDMC 安全代理如何在 Oracle Cloud Infrastructure (OCI) 中运行。数据从本地和基于云的企业应用程序、文件、对象存储和数据库中导出,然后导入到 Oracle 自动化数据库中,供分析或数据科学流程使用。以下图表是参考架构的功能性表示。


总体而言,该架构包括以下逻辑分区。本参考架构侧重于数据精炼和数据持久化架构组件:


摄取、转换

  • 摄取并精炼数据,以便在架构的每个数据层中使用。


持久化、策划、创建

  • 便于访问和浏览数据,展示当前和历史业务视图。它包含原始数据以及粒度和聚合的策划数据。对于关系技术,数据可能在简单关系、纵向、维度或 OLAP 形式中逻辑或物理结构化。对于非关系数据,此层包含一个或多个数据池,要么是分析过程的输出,要么是针对特定分析任务优化的数据。
  • Oracle 自动化数据仓库是一种自驾、自保护、自修复的数据库服务,专为数据仓库工作负载优化。您无需配置或管理任何硬件,也无需安装任何软件。Oracle Cloud Infrastructure 负责创建数据库,以及备份、打补丁、升级和调优数据库。


分析、学习、预测

  • 抽象化数据的逻辑业务视图供消费者使用。这种抽象化便于采用敏捷开发方法、迁移到目标架构,以及从多个联合源提供单一报告层。



在上述架构中,计算形状托管 Informatica Cloud 安全代理。Informatica Cloud 安全代理是一个轻量级程序,负责运行所有任务,并在您的组织与 Informatica 智能数据管理云之间的防火墙上实现安全通信。当安全代理运行任务时,它连接到 Informatica Cloud 托管设施以访问任务信息。它直接且安全地连接到源和目标,传输数据,协调任务流,运行流程,并执行任何额外的任务要求。


架构包含以下组件:

租户(Tenancy)

  • 租户是 Oracle 在您注册 Oracle Cloud Infrastructure 时在 Oracle Cloud 内设置的安全且独立的分区。您可以在您的租户内在 Oracle Cloud 中创建、组织和管理资源。租户与公司或组织同义。通常,一家公司会有一个租户,并在该租户内反映其组织结构。单个租户通常与单个订阅关联,而单个订阅通常只有一个租户。


区域(Region)

  • Oracle Cloud Infrastructure 区域是一个地理上局限的地区,包含一个或多个被称为可用性域的数据中心。区域与其他区域相互独立,它们之间可能相隔很远(跨越国家甚至大洲)。


可用性域(Availability Domain)

  • 可用性域是区域内独立、自主的数据中心。每个可用性域内的物理资源与其他可用性域的资源隔离,从而提供故障容忍性。可用性域不共享诸如电源或冷却系统,或内部可用性域网络的基础设施。因此,一个可用性域的故障不太可能影响该区域内的其他可用性域。


分区(Compartment)

  • 分区是 Oracle Cloud Infrastructure 租户内跨区域的逻辑分隔。使用分区来组织 Oracle Cloud 中的资源,控制对资源的访问,并设置使用配额。为了控制对给定分区中资源的访问,您需要定义策略,指定谁可以访问资源以及他们可以执行哪些操作。


虚拟云网络(VCN)和子网

  • VCN 是您在 Oracle Cloud Infrastructure 区域中设置的可定制、软件定义的网络。与传统数据中心网络一样,VCN 使您能够完全控制网络环境。VCN 可以拥有多个不重叠的 CIDR 块,您可以在创建 VCN 后更改这些块。您可以将 VCN 划分为子网,子网可以限定在一个区域或一个可用性域。每个子网包含一系列连续的、不与 VCN 中其他子网重叠的地址。您可以在创建后更改子网的大小。子网可以是公共的或私有的。


安全列表

  • 对于每个子网,您可以创建安全规则,指定必须允许进出子网的流量的源、目的地和类型。


路由表

  • 虚拟路由表包含规则,用于将流量从子网路由到 VCN 外部的目的地,通常通过网关。


互联网网关

  • 互联网网关允许 VCN 中的公共子网与公共互联网之间的流量交换。


网络地址转换(NAT)网关

  • NAT 网关使 VCN 中的私有资源能够访问互联网上的主机,而不将这些资源暴露给传入的互联网连接。


服务网关

  • 服务网关提供从 VCN 到其他服务(如 Oracle Cloud Infrastructure 对象存储)的访问。从 VCN 到 Oracle 服务的流量通过 Oracle 网络结构传输,不经过互联网。


堡垒服务(Bastion Service)

  • Oracle Cloud Infrastructure 堡垒提供对没有公共端点且需要严格资源访问控制的资源的受限和时限性安全访问,如裸机和虚拟机、Oracle MySQL 数据库服务、自治事务处理(ATP)、Oracle 容器引擎 Kubernetes (OKE),以及任何其他允许安全壳协议(SSH)访问的资源。通过 Oracle Cloud Infrastructure 堡垒服务,您可以在不部署和维护跳板主机的情况下启用对私有主机的访问。此外,您通过基于身份的权限和集中式、审计的、时限性 SSH 会话获得改善的安全姿态。Oracle Cloud Infrastructure 堡垒消除了对公共 IP 的堡垒访问需求,消除了提供远程访问时的麻烦和潜在的攻击面。


计算(Compute)

  • Oracle Cloud Infrastructure 计算服务使您能够在云中预配和管理计算主机。您可以启动满足您的 CPU、内存、网络带宽和存储资源需求的计算实例。创建计算实例后,您可以安全地访问它,重启它,连接和断开卷,并在不再需要时终止它。


身份和访问管理(IAM)

  • Oracle Cloud Infrastructure 身份和访问管理(IAM)是 Oracle Cloud Infrastructure (OCI) 和 Oracle Cloud 应用程序的访问控制平面。IAM API 和用户界面使您能够管理身份域及其内的资源。每个 OCI IAM 身份域代表一个独立的身份和访问管理解决方案或不同的用户群体。


策略

  • Oracle Cloud Infrastructure 身份和访问管理策略指定谁可以访问哪些资源,以及如何访问。授权在组和分区级别进行,这意味着您可以编写一项策略,给予一个组在特定分区内或对租户的特定类型访问权限。


对象存储

  • 对象存储提供对大量结构化和非结构化数据的快速访问,包括数据库备份、分析数据以及图像和视频等丰富内容。您可以安全地存储数据,然后直接从互联网或云平台内检索数据。您可以无缝扩展存储,而不会遭遇性能降低或服务可靠性下降。对于您需要快速、立即且频繁访问的“热”存储,使用标准存储。对于您长期保留且很少或极少访问的“冷”存储,使用归档存储。


自动化数据仓库

  • Oracle 自动化数据仓库是一种自驾、自保护、自修复的数据库服务,专为数据仓库工作负载优化。您无需配置或管理任何硬件,也无需安装任何软件。Oracle Cloud Infrastructure 负责创建数据库,以及备份、打补丁、升级和调优数据库。



推荐方案

使用以下建议作为在 Oracle Cloud 上集成 Informatica IDMC 平台的起点。您的需求可能与此处描述的架构不同。


虚拟云网络(VCN)

  • 创建 VCN 时,根据您计划连接到 VCN 子网的资源数量,确定所需的 CIDR 块数量和每个块的大小。使用标准私有 IP 地址空间内的 CIDR 块。
  • 选择不与任何其他网络(Oracle Cloud Infrastructure、您的本地数据中心或其他云提供商)重叠的 CIDR 块,以便您打算设置私有连接。
  • 创建 VCN 后,您可以更改、添加和移除其 CIDR 块。
  • 设计子网时,考虑您的流量流向和安全需求。将特定层或角色内的所有资源连接到相同的子网,这可以作为安全边界。
  • 使用区域性子网。


虚拟机和其他建议

  • 有关虚拟机大小和其他建议,请参阅部署部分中的链接。


安全列表

  • 使用安全列表定义适用于整个子网的入站和出站规则。



考虑因素

在 Oracle Cloud 上集成 Informatica IDMC 平台时,请考虑以下实施选项。

                       

部署

Terraform 代码以 Oracle Cloud Infrastructure 资源管理器中的示例堆栈的形式提供。您也可以从 GitHub 下载代码,并根据您的需求进行自定义。

使用 Oracle Cloud Infrastructure 资源管理器中的示例堆栈进行部署:

  • 访问 Oracle Cloud Infrastructure 资源管理器,如果您尚未登录,请输入租户和用户凭证。
  • 选择您希望部署堆栈的区域。按照屏幕上的提示和指示创建堆栈。
  • 创建堆栈后,点击 Terraform 操作,并选择 Plan。
  • 等待作业完成,并审阅计划。
  • 如需进行任何更改,请返回到堆栈详情页面,点击编辑堆栈,并进行必要的更改。然后再次运行 Plan 操作。


如果不需要进一步更改,返回到堆栈详情页面,点击 Terraform 操作,并选择 Apply。



使用 GitHub 中的 Terraform 代码进行部署:


  1. 访问 GitHub。
  2. 克隆或下载仓库到您的本地计算机。
  3. 按照 README 文档中的指示进行操作。



开启您的Oracle云之旅:Agilewing - 您的智能云服务伙伴

作为Oracle的高级合作伙伴,Agilewing正重新定义企业体验Oracle云服务的方式。借助于其简化的开户流程和一流的技术支持,Agilewing将复杂的开户和操作流程转化为一种轻松、直观的体验。通过我们的一站式服务,您可以迅速开启并享受Oracle云的全方位服务,从而无缝融入云端世界。


Agilewing的AgileCDN服务,结合了OCI的云基础服务,提供了一流的全球内容加速解决方案。超过2800个全球POP节点和7000个直连点的强大网络,确保了无论您的业务扩展到全球哪个角落,都能保持高效稳定的运行。


利用Oracle云的先进技术,Agilewing致力于简化云服务搭建、云迁移和业务出海的过程。我们的合作模式为客户带来经济高效的解决方案,使他们能够更加专注于核心业务,同时享受Oracle云的高性能和安全保障。


Oracle云服务,作为一个充满潜力的领域,以其高性能、安全性和全球统一的服务标准,为各类企业开启了新的机遇之门。通过Agilewing的专业服务,无论是个人用户还是企业,都能轻松步入这个充满技术革新和高效能的新时代。现在,就让Agilewing引领您开始探索Oracle云服务,打开一个全新的世界大门。