欢迎访问深圳敏捷云计算科技有限公司!

利用甲骨文云OCI视觉技术从图像和扫描文件中提取数据

2024-03-13 原创文章

Oracle云基础设施(OCI)视觉是Oracle云基础设施上可用的多种人工智能服务之一。OCI视觉赋予您应用机器学习和人工智能的能力,无需数据科学专业知识。它拥有预训练模型,允许您快速进行OCR、图像分类和对象检测、文档分类、异常检测等。


您可以使用传递学习方法,通过自定义数据对预训练模型进行调优。您可以使用现有的标记数据集进行调优,或者,如果您的数据尚未标记,您可以使用Oracle数据标注服务来简化这项任务。


架构

这种架构展示了OCI视觉作为核心时,各种组件在典型系统中的关系。


在此系统中,终端用户使用Web应用程序上传照片或商业文件的图像。应用程序将文件存储在对象存储中。Oracle事件检测到新文件并触发一个无服务器函数,该函数生成对视觉服务的REST API调用。视觉服务从对象存储中检索文件并分析图像。结果存储在数据库中,应用程序可以使用这些结果。


以下图表展示了这一参考架构。

此架构包含以下组件:

区域

  • Oracle云基础设施区域是一个包含一个或多个称为可用性域的数据中心的地理区域。区域彼此独立,相隔很远(跨越国家甚至大洲)。


可用性域

  • 可用性域是区域内独立的、相互独立的数据中心。每个可用性域中的物理资源与其他可用性域中的资源相隔离,提供了故障容错能力。可用性域不共享基础设施,如电力或冷却系统,或内部可用性域网络。因此,一个可用性域的故障不太可能影响该区域内的其他可用性域。


故障域

  • 故障域是可用性域内的硬件和基础设施分组。每个可用性域有三个故障域,具有独立的电力和硬件。当您在多个故障域中分配资源时,您的应用程序可以承受物理服务器故障、系统维护和故障域内的电力故障。


虚拟云网络(VCN)和子网

  • VCN是您在Oracle云基础设施区域中设置的可定制、软件定义的网络。就像传统数据中心网络一样,VCN使您完全控制网络环境。VCN可以有多个不重叠的CIDR块,您可以在创建VCN后更改。您可以将VCN分割成子网,这些子网可以限定在一个区域或一个可用性域。每个子网包括一个连续的地址范围,不与VCN中的其他子网重叠。您可以在创建后更改子网的大小。子网可以是公共的或私有的。


分区

  • 分区是Oracle云基础设施租户内跨区域的逻辑分隔。使用分区来组织Oracle云中的资源,控制对资源的访问,并设置使用配额。要控制对给定分区中资源的访问,您需要定义策略,指定谁可以访问资源以及他们可以执行的操作。


负载均衡器

  • Oracle云基础设施负载均衡服务提供从单个入口点到后端多个服务器的自动流量分配。
  • 负载均衡器为不同的应用程序提供访问。


安全列表

  • 对于每个子网,您可以创建安全规则,指定必须允许进出子网的流量的源、目的地和类型。


对象存储

  • 对象存储提供快速访问大量结构化和非结构化数据,包括数据库备份、分析数据以及丰富内容,如图像和视频。您可以安全地存储数据,然后直接从互联网或云平台内检索数据。您可以无缝扩展存储,而不会经历性能或服务可靠性的降低。对于需要快速、立即和频繁访问的“热”存储,使用标准存储。对于长期保留且很少或很少访问的“冷”存储,使用归档存储。


FastConnect

  • Oracle云基础设施FastConnect提供了在您的数据中心和Oracle云基础设施之间创建专用、私有连接的简便方法。与基于互联网的连接相比,FastConnect提供更高带宽选项和更可靠的网络体验。


Oracle基础设施云视觉

  • OCI视觉用于从PDF和图像中提取信息。Vision支持OCR、文档理解、表格分类、对象检测和图像分类。


应用程序

  • 该架构中的应用程序允许用户上传图像,并使用图像的元数据来改善搜索和上下文。



建议

您的需求可能与此处描述的架构有所不同。将以下建议作为出发点。

VCN

  • 创建VCN时,根据您计划附加到VCN子网中的资源数量,确定所需CIDR块的数量和每个块的大小。使用标准私有IP地址空间内的CIDR块。
  • 选择与您打算设置私有连接的任何其他网络(在Oracle云基础设施、您的本地数据中心或其他云提供商)都不重叠的CIDR块。
  • 创建VCN后,您可以更改、添加和移除其CIDR块。
  • 在设计子网时,考虑您的流量流和安全要求。将特定层或角色内的所有资源附加到同一个子网,它可以作为安全边界。
  • 使用区域子网。


安全

  • 使用Oracle Cloud Guard主动监控和维护Oracle云基础设施中资源的安全。Cloud Guard使用您可以定义的检测器配方来检查资源的安全弱点,并监控操作者和用户的风险活动。当检测到任何错误配置或不安全活动时,Cloud Guard推荐纠正措施,并基于您可以定义的响应器配方协助采取这些措施。
  • 对于需要最高安全级别的资源,Oracle建议您使用安全区域。安全区域是与基于最佳实践的Oracle定义的安全政策配方相关联的分区。例如,安全区域中的资源不得从公共互联网访问,并且必须使用客户管理的密钥进行加密。在安全区域中创建和更新资源时,Oracle云基础设施会根据安全区域配方中的策略验证操作,并拒绝违反任何策略的操作。


Cloud Guard

  • 克隆并自定义Oracle提供的默认配方,创建自定义的检测器和响应器配方。这些配方使您能够指定哪种类型的安全违规会生成警告,以及允许对其执行哪些操作。例如,您可能希望检测将可见性设置为公共的对象存储桶。
  • 在租户级别应用Cloud Guard,以覆盖最广泛的范围,并减少维护多个配置的管理负担。
  • 您还可以使用Managed List功能将特定配置应用于检测器。


安全区域

  • 克隆并自定义Oracle提供的默认配方,创建自定义的检测器和响应器配方。这些配方使您能够指定哪种类型的安全违规会生成警告,以及允许对其执行哪些操作。例如,您可能希望检测将可见性设置为公共的对象存储桶。
  • 在租户级别应用Cloud Guard,以覆盖最广泛的范围,并减少维护多个配置的管理负担。
  • 您还可以使用Managed List功能将特定配置应用于检测器。


负载均衡器带宽

  • 在创建负载均衡器时,您可以选择一个提供固定带宽的预定义形状,或者指定一个自定义的灵活形状,在该形状中您设置带宽范围,并让服务根据流量模式自动缩放带宽。无论采取哪种方法,您都可以在创建负载均衡器后随时更改形状。


Oracle函数

  • 此架构使用一个函数调用OCI视觉REST API,并使用特定图像,然后存储由视觉返回的元数据。该函数可以使用Java或Python SDK构建。


事件

  • 在此架构中,Oracle云基础设施事件服务配置为监听对象存储创建中的更改。在对象上传到对象存储后,该服务被调用,并调用函数进行处理。


考虑因素

在部署此架构时,请考虑以下几点。

性能

  • 出于性能和可扩展性的原因,我们使用函数调用视觉REST API。另一种解决方案是直接从应用程序调用视觉REST API。如果您选择这样做,请考虑将REST API调用作为后台作业运行。

访问

  • OCI视觉支持通过OCI控制台、Java和Python SDK客户端以及OCI CLI进行访问。在测试时,建议使用CLI工具或控制台。

可用性

  • 在此示例中,数据库不是高度可用的。对于关键应用程序,请考虑以高可用模式运行MySQL数据库服务,并配有3个副本。

集成

  • 当扫描业务文件(如收据和申请表)的PDF格式时,请考虑使用Oracle集成云从诸如电子邮件之类的系统中提取PDF,然后调用视觉AI,最后将内容推送到目的地系统,如ERP或CRM系统。


开启您的Oracle云之旅:Agilewing - 您的智能云服务伙伴

作为Oracle的高级合作伙伴,Agilewing正重新定义企业体验Oracle云服务的方式。借助于其简化的开户流程和一流的技术支持,Agilewing将复杂的开户和操作流程转化为一种轻松、直观的体验。通过我们的一站式服务,您可以迅速开启并享受Oracle云的全方位服务,从而无缝融入云端世界。


Agilewing的AgileCDN服务,结合了OCI的云基础服务,提供了一流的全球内容加速解决方案。超过2800个全球POP节点和7000个直连点的强大网络,确保了无论您的业务扩展到全球哪个角落,都能保持高效稳定的运行。


利用Oracle云的先进技术,Agilewing致力于简化云服务搭建、云迁移和业务出海的过程。我们的合作模式为客户带来经济高效的解决方案,使他们能够更加专注于核心业务,同时享受Oracle云的高性能和安全保障。


Oracle云服务,作为一个充满潜力的领域,以其高性能、安全性和全球统一的服务标准,为各类企业开启了新的机遇之门。通过Agilewing的专业服务,无论是个人用户还是企业,都能轻松步入这个充满技术革新和高效能的新时代。现在,就让Agilewing引领您开始探索Oracle云服务,打开一个全新的世界大门。