欢迎访问深圳敏捷云计算科技有限公司!

甲骨文云OCI 设计健康保险分析的数据湖仓:探索大数据的深度与广度

2024-03-13 原创文章

健康保险提供商需要分析来自不同数据源的数据,以改善索赔管理客户体验并防止欺诈。数据源可能包括网页交易、办公室访问、电话转录等;这些数据通常分散在多个系统中,没有共同的存储、处理或可视化工具。


健康保险提供商可以捕获大量数据,并转向基于云的大数据解决方案来汇总和管理数据。可以使用Oracle云基础设施(OCI)数据湖仓架构来捕获、管理和从数据中获得洞察。通过湖仓架构,您可以存储和整理结构化和非结构化数据,并访问紧密集成的服务,用于组织来自多个来源的大量高度多样化的数据。OCI数据湖仓架构提供数据湖和数据仓库能力,以及诸如数据科学和Oracle分析云等紧密集成的服务,为您提供完整、高级的分析体验。以下参考架构介绍了平台拓扑、组件概览和推荐的最佳实践。


架构

此参考架构的两个主要元素是Oracle健康保险(OHI)和Oracle收入管理与计费(RMB),作为软件即服务在Oracle云上提供。该架构支持基于数据科学服务的综合医疗网络中的多种场景,结合自主数据仓库(ADW)和数据湖功能。此外,该架构还使用了数据目录和Oracle分析云等服务。


Oracle健康保险管理系统

  • 使保险公司能够简化医疗保健IT,实现更高水平的运营效率,降低成本,并快速适应市场和监管的持续需求。它具有在单一平台管理不同业务规则的灵活性,可扩展性强,适用于小型和大型医疗保健提供商,并为专业人士和客户提供统一体验。它在索赔裁定和索赔处理方面透明,提供更好的客户体验,同时确保云上所需的安全性。


Oracle医疗保险付款方的收入管理和计费

  • 提供以下先进的商业服务:简化和自动化账单、付款和收款流程,以实现对账单信息的准确和及时访问,并控制收入泄漏。支持交换、个人账单和集团账单,仅限行政服务的计费并附带止损,政府计划等,同时通过符合HIPAA标准的云解决方案最小化成本和风险。凭借及时准确的账单和透明度,提高客户满意度,并具备满足大量需求的扩展能力。


Oracle集成云(OIC)

  • 用于云和本地应用程序的集成,并可用于:自动化业务流程洞察业务流程开发可视化应用程序使用符合SFTP标准的文件服务器存储和检索文件,以及与B2B交易伙伴交换业务文件 Oracle云基础设施被归类为无视图云服务提供商,能够支持HIPAA范围内的客户。 注意:需要商业合作协议,以确定Oracle云基础设施和客户在根据HIPAA及其修正法案适当保护患者健康信息方面的各自责任。


以下图表介绍了概念性健康保险湖仓参考架构。

在上述表示中,我们可以找到以下集成:

OHI通过Oracle保险网关(OIG)与OIC集成。

  • OHI可以直接与OCI技术适配器(例如REST、SOAP、文件/SFTP、B2B、ERP)集成,或通过API网关集成,使用无服务器的Oracle函数服务进行自定义转换。
  • OIC通过数据集成将数据发送到数据湖仓中的ADW。
  • Oracle RMB通过Oracle GoldenGate与数据湖仓/ADW集成,并有可能通过API网关到OIC技术适配器进行额外集成。
  • Oracle ERP和EPM相互集成,ERP直接与数据湖仓和OIC集成。
  • 在此示例中,OIC还扮演了与客户数据中心集成的额外角色,包括PeopleSoft和Siebel CRM以及第三方应用程序。
  • 此集成使用动态路由网关(DRG)和FastConnect/VPN连接。
  • ADW使用查询加速器快速无缝地查询对象存储数据湖中的数据。
  • Oracle分析云和数据科学与数据湖仓中的其他服务无缝集成。 该架构具有多重用途,包括在安全、可靠且快速检索的存储中存储重要数据,作为机器学习模块的来源,以及为内部和外部使用提供高级可视化和报告功能。



架构包含以下组件:

自主数据仓库

  • Oracle自主数据仓库是一种自驾、自保护、自修复的数据库服务,专为数据仓库工作负载优化。您无需配置或管理任何硬件,也无需安装任何软件。Oracle云基础设施负责创建数据库,以及备份、打补丁、升级和调优数据库。

对象存储

  • 对象存储提供对大量结构化和非结构化数据的快速访问,包括数据库备份、分析数据和丰富内容,如图像和视频。您可以安全地存储数据,然后直接从互联网或云平台内检索数据。您可以无缝扩展存储,而不会经历性能或服务可靠性的降低。对于需要快速、立即和频繁访问的“热”存储,使用标准存储。对于长期保留且很少或极少访问的“冷”存储,使用归档存储。

数据目录

  • Oracle云基础设施数据目录是一种完全托管的、自助服务式的企业数据发现和治理解决方案。它为数据工程师、数据科学家、数据管理人员和首席数据官提供了一个单一的协作环境,用于管理组织的技术、业务和运营元数据。

Oracle分析云

  • Oracle分析云是一个可扩展且安全的公共云服务,为商业分析师提供现代化、AI驱动的自助式分析功能,用于数据准备、可视化、企业报告、增强分析以及自然语言处理和生成。通过Oracle分析云,您还可以获得灵活的服务管理能力,包括快速设置、简单扩展和打补丁,以及自动化的生命周期管理。

数据科学

  • OCI数据科学是一个完全托管的、无服务器的平台,用于数据科学团队在OCI上构建、训练和管理机器学习(ML)模型。它可以轻松与其他OCI服务(如自主数据仓库、对象存储等)集成。您可以构建和评估高质量的机器学习模型,通过快速利用企业信赖的数据增加业务灵活性,并通过更容易部署ML模型来支持数据驱动的业务目标。

Oracle数据集成

  • Oracle云基础设施数据集成是一种完全托管的、无服务器的、云原生服务,可以从多种数据源提取、加载、转换、清洁和重塑数据到目标Oracle云基础设施服务,如自主数据仓库和Oracle云基础设施对象存储。ETL(提取转换加载)利用Spark上的完全托管的扩展处理,ELT(提取加载转换)利用自主数据仓库的完整SQL下推能力,以最小化数据移动并提高新摄取数据的价值。用户使用直观的、无代码的用户界面设计数据集成流程,优化集成流程以生成最有效的引擎和编排,并自动分配和扩展执行环境。Oracle云基础设施数据集成提供交互式探索和数据准备,并帮助数据工程师通过定义规则来处理模式变更,以防止模式漂移。



GoldenGate

  • Oracle云基础设施GoldenGate是一个完全托管的服务,允许从位于本地或任何云中的源进行数据摄取,利用GoldenGate CDC(变更数据捕获)技术进行非侵入式和高效的数据捕获,并实时、大规模地将数据传输到Oracle自主数据仓库,以便尽快向消费者提供相关信息。

Oracle函数

  • Oracle函数是一个完全托管的、多租户的、高度可扩展的、按需的函数即服务(FaaS)平台。它由Fn Project开源引擎驱动。函数允许您部署代码,并直接调用它或响应事件触发它。Oracle函数使用托管在Oracle云基础设施注册表中的Docker容器。

API网关

  • Oracle API网关服务使您能够发布具有私有端点的API,这些端点可从您的网络内部访问,并且如果需要,您可以将它们暴露给公共互联网。端点支持API验证、请求和响应转换、CORS、身份验证和授权以及请求限制。

虚拟云网络(VCN)和子网

  • VCN是您在Oracle云基础设施区域中设置的可自定义的软件定义网络。像传统数据中心网络一样,VCN使您完全控制网络环境。VCN可以有多个不重叠的CIDR块,您可以在创建VCN后更改。您可以将VCN分割成子网,这些子网可以限定在一个区域或一个可用性域。每个子网包括一个连续的地址范围,不与VCN中的其他子网重叠。您可以在创建后更改子网的大小。子网可以是公共的或私有的。

动态路由网关(DRG)

  • DRG是一个虚拟路由器,为VCN与该区域外的网络之间的私有网络流量提供路径,例如另一个Oracle云基础设施区域的VCN、本地网络或另一个云提供商的网络。

FastConnect

  • Oracle云基础设施FastConnect提供了在您的数据中心和Oracle云基础设施之间创建专用、私有连接的简便方法。与基于互联网的连接相比,FastConnect提供更高带宽选项和更可靠的网络体验。

VPN连接

  • VPN连接提供您的本地网络与Oracle云基础设施中的VCN之间的站点到站点IPSec VPN连接。IPSec协议套件在数据包从源传输到目的地之前对IP流量进行加密,并在到达时解密流量。


建议

您的需求可能与这里描述的架构有所不同。请将以下建议作为起点。

VCN

  • 创建VCN时,根据您计划附加到VCN子网中的资源数量,确定所需CIDR块的数量和每个块的大小。使用标准私有IP地址空间内的CIDR块。
  • 选择与您打算建立私有连接的任何其他网络(在Oracle云基础设施、您的本地数据中心或其他云提供商中)都不重叠的CIDR块。
  • 创建VCN后,您可以更改、添加和移除其CIDR块。
  • 在设计子网时,考虑您的流量流和安全要求。将特定层或角色内的所有资源附加到同一个子网,这可以作为安全边界。

安全

  • 使用策略限制谁可以访问您公司的OCI资源以及他们如何访问。
  • 使用Oracle Cloud Guard主动监控和维护OCI中资源的安全。Cloud Guard使用您可以定义的检测器配方来检查资源的安全弱点,并监控操作者和用户的风险活动。当检测到任何错误配置或不安全活动时,Cloud Guard推荐纠正措施,并根据您可以定义的响应器配方协助采取这些措施。对于需要最大安全性的资源,Oracle建议您使用安全区域。安全区域是与基于最佳实践的Oracle定义的安全政策配方相关联的分区。例如,安全区域中的资源不得从公共互联网访问,并且必须使用客户管理的密钥加密。在安全区域中创建和更新资源时,OCI会根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。

自主数据仓库

  • 该架构使用共享基础设施上的Oracle自主数据仓库。启用自动扩展以提供最高三倍的数据库工作负载处理能力。
  • 如果您希望在公共云环境中的私有数据库云环境内拥有自助服务数据库功能,请考虑使用专用基础设施上的Oracle自主数据仓库。
  • 考虑使用自主数据仓库的混合分区表功能,将数据分区移动到Oracle云基础设施对象存储,并透明地提供给用户和应用程序。我们建议您对不常消费且不需要与自主数据仓库存储的数据具有相同性能的数据使用此功能。
  • 考虑使用外部表功能实时消费存储在Oracle云基础设施对象存储中的数据,无需将其复制到自主数据仓库。此功能透明且无缝地连接自主数据仓库外部策划的数据集,无论格式如何(parquet、avro、orc、json、csv等),与自主数据仓库中的数据进行连接。
  • 考虑在消费对象存储数据时使用ADW查询加速器,为使用和连接数据仓库和数据湖的用户提供改进和更快的体验。

对象存储

  • 对象存储提供可靠且成本效益高的数据持久性,快速访问大量结构化和非结构化数据,包括数据库数据、分析数据、图像、视频等。我们建议使用标准存储从外部来源摄取数据并用于进一步处理,因为它可以快速且频繁地访问。您可以建立生命周期策略,从标准存储移动数据到冷存储,当不再经常需要时。

数据目录

  • 为了全面了解存储在平台上并流动的数据的端到端视图,请考虑收集不仅支持数据持久层的数据存储,还包括源数据存储。将这些收集的技术元数据映射到业务词汇表,并通过自定义属性进行丰富,允许您映射业务概念,并记录和管理安全和访问定义。
  • 为了促进创建虚拟化存储在Oracle云基础设施对象存储上的数据的Oracle自主数据仓库外部表,请利用Oracle云基础设施数据目录之前收集的元数据。这简化了外部表的创建,确保了跨数据存储的元数据的一致性,且不易出现人为错误。




开启您的Oracle云之旅:Agilewing - 您的智能云服务伙伴

作为Oracle的高级合作伙伴,Agilewing正重新定义企业体验Oracle云服务的方式。借助于其简化的开户流程和一流的技术支持,Agilewing将复杂的开户和操作流程转化为一种轻松、直观的体验。通过我们的一站式服务,您可以迅速开启并享受Oracle云的全方位服务,从而无缝融入云端世界。


Agilewing的AgileCDN服务,结合了OCI的云基础服务,提供了一流的全球内容加速解决方案。超过2800个全球POP节点和7000个直连点的强大网络,确保了无论您的业务扩展到全球哪个角落,都能保持高效稳定的运行。


利用Oracle云的先进技术,Agilewing致力于简化云服务搭建、云迁移和业务出海的过程。我们的合作模式为客户带来经济高效的解决方案,使他们能够更加专注于核心业务,同时享受Oracle云的高性能和安全保障。


Oracle云服务,作为一个充满潜力的领域,以其高性能、安全性和全球统一的服务标准,为各类企业开启了新的机遇之门。通过Agilewing的专业服务,无论是个人用户还是企业,都能轻松步入这个充满技术革新和高效能的新时代。现在,就让Agilewing引领您开始探索Oracle云服务,打开一个全新的世界大门。