欢迎访问深圳敏捷云计算科技有限公司!

甲骨文云-使用OCI语音识别转录自然语言

2024-03-13 原创文章

Oracle Cloud Infrastructure (OCI) 语音是多个云原生AI服务之一。您可以使用语音服务将音频文件转换为存储在JSON格式中的可读文本。


语音通过允许您轻松将包含人类语音的音频文件转换为高度准确的文本转录,发挥了口语的力量。该服务是一个OCI原生应用程序,您可以通过Web应用程序、REST API、SDK、CLI或控制台访问它。


语音使用自动语音识别(ASR)技术提供视频和音频文件的语法正确转录。语音处理低保真度的音频录音,并转录诸如会议或呼叫中心通话等具有挑战性的录音。使用语音,您可以将存储在对象存储或数据资产中的文件转换为准确、标准化、时间戳标记和过滤亵渎词的文本。这种功能可以与下游服务一起使用。例如,您可以使用其他服务,如语言和预测分析,来分析通话情绪、针对广告定位内容、索引媒体文件夹,并使用Data Lake House创建媒体搜索引擎。


架构

此架构展示了以OCI语音为核心的典型系统中各种组件之间的关系。


这种架构可以应用于许多类型的应用程序。例如,一个Web应用程序可以记录帮助台代表与报告问题的客户的对话。对话的音频文件被保存到对象存储,该存储对新音频文件发出事件。Oracle事件触发一个函数应用程序,通过REST API调用向语音服务创建转录请求。语音接受任务,从对象存储检索音频文件,将文件输入预训练的声学和语言模型,并输出一个JSON文本文件。JSON文件存储在对象存储中。对象存储检测到新的文本文件并发出事件。Oracle事件触发Oracle函数以拉取文本文件,并将文本和元数据上传到MySQL数据库。Oracle事件还触发Oracle通知,当转录准备好时发布消息,Web应用程序可以订阅。Web应用程序在帮助台代表创建的工单中显示转录。


可选地,Web应用程序可以检索音频文件元数据,如音频文件持续时间、大小、开始日期和时间,并将其保存在帮助台工单中。


存储在对象存储中的音频和文本文件可以使用Data Lakehouse(图中未显示)提供给下游分析工具。


以下图表展示了这个参考架构。

该架构包含以下组件:

区域

  • Oracle Cloud Infrastructure区域是一个地理定位区域,包含一个或多个数据中心,称为可用性域。区域彼此独立,相互之间可能相隔很远(跨越国家甚至大洲)。


可用性域

  • 可用性域是区域内独立的、独立的数据中心。每个可用性域中的物理资源与其他可用性域的资源隔离,提供故障容忍性。可用性域不共享基础设施,如电力或冷却,或内部可用性域网络。因此,一个可用性域的故障不太可能影响该区域中的其他可用性域。


故障域

  • 故障域是可用性域内的硬件和基础设施分组。每个可用性域有三个故障域,具有独立的电力和硬件。当您在多个故障域中分布资源时,您的应用程序可以容忍物理服务器故障、系统维护和故障域内的电力故障。


虚拟云网络(VCN)和子网

  • VCN是您在Oracle Cloud Infrastructure区域内设置的可自定义、软件定义的网络。像传统数据中心网络一样,VCN让您完全控制您的网络环境。VCN可以有多个不重叠的CIDR块,您可以在创建VCN后更改它们。您可以将VCN分割成子网,这些子网可以特定于一个区域或一个可用性域。每个子网由不与VCN中其他子网重叠的连续地址范围组成。您可以在创建后更改子网的大小。子网可以是公共的或私有的。


区域

  • 区域是Oracle Cloud Infrastructure租户内跨区域的逻辑分区。使用区域在Oracle Cloud中组织资源,控制对资源的访问,并设置使用配额。要控制对给定区域中资源的访问,您需要定义策略,指定谁可以访问资源以及他们可以执行的操作。


负载均衡器

  • Oracle Cloud Infrastructure负载均衡服务提供了从一个入口点到后端多个服务器的自动化流量分发。
  • 负载均衡器为不同的应用程序提供访问。


安全列表

  • 对于每个子网,您可以创建安全规则,指定必须允许进出子网的流量的来源、目的地和类型。


对象存储

  • 对象存储提供快速访问大量结构化和非结构化数据,包括数据库备份、分析数据以及图片和视频等丰富内容。您可以安全地存储数据,然后直接从互联网或云平台检索数据。您可以无缝扩展存储,而不会经历性能或服务可靠性的下降。对于需要快速、立即和频繁访问的“热”存储,使用标准存储。对于长时间保留且很少或极少访问的“冷”存储,使用归档存储。


Oracle函数

  • 这种架构使用一个函数调用OCI语音REST API处理特定音频文件,然后将转录的文本文件和元数据存储在对象存储中。该函数可以使用Java或Python SDK构建。


Oracle Cloud Infrastructure事件

  • 在这种架构中,事件服务被配置为监听对象存储创建中的变化。上传对象到对象存储后,该服务被调用并调用函数进行处理。


Oracle Cloud Infrastructure语音

  • Oracle Cloud Infrastructure语音是一项新的AI服务,使用自动语音识别(ASR)技术将语音转换为文本。


Oracle Cloud Infrastructure通知

  • 通知服务通过发布-订阅模式向分布式组件广播消息,为托管在Oracle Cloud Infrastructure及外部的应用程序提供安全、高可靠、低延迟和持久的消息传递。



建议

您的需求可能与此处描述的架构不同。使用以下建议作为起点。


VCN

  • 创建VCN时,根据您计划附加到VCN子网中的资源数量确定所需的CIDR块数量和每个块的大小。使用标准私有IP地址空间内的CIDR块。
  • 选择不与任何其他网络重叠的CIDR块(在Oracle Cloud Infrastructure、您的本地数据中心或您打算建立私有连接的其他云提供商)。
  • 创建VCN后,您可以更改、添加和移除其CIDR块。
  • 设计子网时,考虑您的流量流向和安全要求。将特定层或角色内的所有资源附加到同一子网,这可以作为一个安全边界。


安全

  • 使用Oracle Cloud Guard主动监控和维护Oracle Cloud Infrastructure中资源的安全。Cloud Guard使用您可以定义的检测器配方来检查资源的安全弱点,并监控操作员和用户的风险活动。当检测到配置错误或不安全活动时,Cloud Guard推荐纠正措施,并根据您可以定义的响应者配方协助采取这些措施。
  • 对于需要最大安全性的资源,Oracle建议您使用安全区域。安全区域是与Oracle定义的安全政策配方相关联的区域,这些政策基于最佳实践。例如,安全区域中的资源不得从公共互联网访问,并且必须使用客户管理的密钥进行加密。在安全区域中创建和更新资源时,Oracle Cloud Infrastructure会根据安全区域配方中的政策验证操作,并拒绝违反任何政策的操作。


Cloud Guard

  • 克隆并自定义Oracle提供的默认配方,以创建自定义检测器和响应者配方。这些配方使您能够指定哪种类型的安全违规行为会生成警告以及允许对其采取哪些措施。例如,您可能想要检测设置为公共可见的对象存储桶。
  • 在租户级别应用Cloud Guard,以覆盖最广泛的范围并减少维护多种配置的管理负担。
  • 您还可以使用“托管列表”功能将特定配置应用于检测器。


安全区域

  • 克隆并自定义Oracle提供的默认配方,以创建自定义检测器和响应者配方。这些配方使您能够指定哪种类型的安全违规行为会生成警告以及允许对其采取哪些措施。例如,您可能想要检测设置为公共可见的对象存储桶。
  • 在租户级别应用Cloud Guard,以覆盖最广泛的范围并减少维护多种配置的管理负担。
  • 您还可以使用“托管列表”功能将特定配置应用于检测器。


负载均衡器带宽

  • 创建负载均衡器时,您可以选择提供固定带宽的预定义形状,或指定自定义灵活形状,在其中设置带宽范围并根据流量模式自动扩展带宽。无论采用哪种方法,您都可以在创建负载均衡器后随时更改形状。



考虑因素

性能

  • 使用Oracle云原生服务 - 事件、函数、通知和AI语音部署无服务器应用程序,这些应用程序根据工作负载自动扩展。这些服务由Oracle管理。
  • AI语音任务按严格的先进先出方式处理。您可以在租户级别创建一个包含最多10,000个任务的作业队列。如果您提交的作业超过了最大任务数,该作业将失败。作业保留90天。


访问

  • OCI语音支持通过OCI控制台、Java和Python SDK客户端以及OCI CLI进行访问。在测试时,建议使用CLI工具或控制台。


可用性

  • 在这个示例中,数据库不是高可用的。对于关键应用程序,考虑以HA模式运行MySQL数据库服务,拥有3个副本。


成本

  • 使用Oracle云原生服务 - 事件、函数、通知和AI语音部署无服务器应用程序,这些应用程序不会产生固定成本。您只需在使用时支付服务请求费用。



开启您的Oracle云之旅:Agilewing - 您的智能云服务伙伴

作为Oracle的高级合作伙伴,Agilewing正重新定义企业体验Oracle云服务的方式。借助于其简化的开户流程和一流的技术支持,Agilewing将复杂的开户和操作流程转化为一种轻松、直观的体验。通过我们的一站式服务,您可以迅速开启并享受Oracle云的全方位服务,从而无缝融入云端世界。


Agilewing的AgileCDN服务,结合了OCI的云基础服务,提供了一流的全球内容加速解决方案。超过2800个全球POP节点和7000个直连点的强大网络,确保了无论您的业务扩展到全球哪个角落,都能保持高效稳定的运行。


利用Oracle云的先进技术,Agilewing致力于简化云服务搭建、云迁移和业务出海的过程。我们的合作模式为客户带来经济高效的解决方案,使他们能够更加专注于核心业务,同时享受Oracle云的高性能和安全保障。


Oracle云服务,作为一个充满潜力的领域,以其高性能、安全性和全球统一的服务标准,为各类企业开启了新的机遇之门。通过Agilewing的专业服务,无论是个人用户还是企业,都能轻松步入这个充满技术革新和高效能的新时代。现在,就让Agilewing引领您开始探索Oracle云服务,打开一个全新的世界大门。