Speech-to-Text：准确地将语音转换为文字- Google Cloud

2025-01-10 使用由 Google 的 AI 技术提供支持的 API，准确地将语音转换为文字。使用准确的字幕来转录您的内容通过语音指令，在产品中提供更好的用户体验从客户互动中汲取数据洞察，以改进您的服务优势运用 Google 先进的深度学习神经网络算法来进行自动语音识别 (ASR)。Speech-to-Text

使用由 Google 的 AI 技术提供支持的 API，准确地将语音转换为文字。

使用准确的字幕来转录您的内容
通过语音指令，在产品中提供更好的用户体验
从客户互动中汲取数据洞察，以改进您的服务

优势

运用 Google 先进的深度学习神经网络算法来进行自动语音识别 (ASR)。

Speech-to-Text 用户界面支持对自定义资源进行实验、创建和管理。

在需要的位置部署语音识别功能，无论是在云端（使用 API）还是在本地（使用Speech-to-Text On-Prem）。

主要特性

通过来，以的和，同时或的。使用，将中的为、、或其他。

从一系列经过的中进行，、和，这些针对的要求进行了。例如，我们的模型 is 进行针对的进行了，例如以 8 的。

使用我们简单易用的界面，对您的语音音频进行实验。尝试使用不同的配置来优化质量和准确率。

完全控制你的基础设施和受保护的语音数据，同时在你自己的私人数据中心利用谷歌的语音识别技术。

自推出 Speech-to-Text 以来，我们一直在努力为更多语种带来高质量的语音识别。今天，我们将支持的语言从 64 种扩展到 71 种（总语言环境为 120 种到 127 种），新增了七种语言：缅甸语、爱沙尼亚语、乌兹别克语、旁遮普语、阿尔巴尼亚语、马其顿语和蒙古语。

Sourcenext是便携式语音翻译器 Pocketalk 的制造商，是利用 Google Cloud Speech-to-Text 全面语言支持的组织之一。

SourcenextCorporation 技术战略运营官 Hajime Kawatake 表示：“Google Cloud Speech-to-Text 的广泛语言功能使我们的产品 Pocketalk 成为可能。“让我们的客户能够在世界任何地方接收到高度准确和可靠的语音到语音翻译，所提供的语言的绝对广度提高了产品质量。”

增强型

Google is 推出了针对的，为来自和的不足的最的。在中，它在方面的表现 is 好比我们的基本好 62 % ，现在它正在帮助 Contact I 和的。今天， Speech – to – 了对三种的：、和。

这些功能的首批用户之一是 Voximplant，这是一个在俄罗斯拥有众多企业客户的云通信平台，它立即意识到新电话模型的卓越准确性。 

Voximplant 首席执行官 Alexey Aylarov 表示：“我们与 Google Cloud 合作是因为我们希望利用 Google 的 AI 技术创新我们的语音平台。“由于我们经常从低带宽的电话网络中接收音频，因此增强型已经帮助改变了游戏规则，提高了人对人和人对虚拟座席对话的准确性。我们很高兴看到 Google Cloud 致力于为更多用户和区域提供高质量模型。”

语音适应

语音 is 适应自适应允许谷歌的。通过自适应，您可以诸如或之类的。您 is 提供还可以向有关它如何的，从而大大的。

Speech-to-Text：准确地将语音转换为文字- Google Cloud