最佳語音轉文本應用

最佳語音轉文本應用

最好的语音转文本软件使语音转换为文本变得简单易行,并且可用于桌面和移动设备。

Speech-to-text 曾经被认为是非常小众的,专门为有无障碍需求的人或听写服务。然而,语音转文本正越来越成为主流,因为现在办公室工作现在可以通过使用语音识别软件更简单、更容易地完成,而不必通过成员打字和大声说话来记录文本现在已经很普遍了。

虽然最好的语音转文本软件过去仅适用于台式机,但移动设备的发展和易于访问的应用程序的爆炸式增长意味着现在也可以在 智能手机(opens in new tab) 或 平板电脑(opens in新标签)。 

这使得最好的语音到文本应用程序对从教育到商业的各种不同环境中的用户越来越有价值。这不仅是因为该技术已经成熟到转录错误相对较少的水平,一些服务正确地拥有 99.9% 的清晰音频成功率。

尽管如此,这主要适用于普通情况和情况,并且排除了法律或医学专业所需的技术术语的使用。尽管如此,数字转录仍然可以满足基本 笔记(在新标签中打开)等需求 ,这仍然可以使用手机应用程序轻松完成,从而简化听写过程。

但是,不同的语音转文本程序具有不同级别的能力和复杂性,其中一些使用先进的机器学习来不断纠正用户标记的错误,以免重复出现。其他是可下载的软件,仅与其最新更新一样好。

这里是最好的语音到文本识别程序,在大多数情况和情况下应该能够胜任。

直接跳转到:

  • 语音到文本应用程序的最佳付费
  • 最佳自由言论文本应用程序
  • 需要考虑的移动语音到文本应用程序

我们还推出了 最好的语音识别软件


语音到文本应用程序的最佳付费:

(图片来源:龙)

1.龙无处不在

最佳移动语音到文本应用程序

购买理由

+

高质量语音识别

+

与桌面 Dragon 软件同步

+

优秀的认可

+

功能齐全的应用程序

避免的原因

听写仅限于应用程序内

Dragon Anywhere 是适用于 Android 和 iOS 设备的 Nuance 移动产品,但这不是“精简”应用程序,而是通过云提供完整的听写功能。 

所以基本上你得到了和桌面软件一样出色的语音识别——我们注意到的唯一有意义的区别是我们的口语出现在屏幕上的延迟非常轻微(毫无疑问是由于在云中的处理)。但是,请注意,该应用程序总体上仍然足够响应。

它还拥有对样板文本块的支持,这些文本块可以通过简单的命令设置并插入到文档中,这些以及自定义词汇表可以在移动应用程序和桌面 Dragon 软件之间同步。此外,您可以通过 Evernote 或云服务(如 Dropbox)跨设备共享文档。

但是,这不像桌面应用程序那样灵活,因为听写仅限于在 Dragon Anywhere 内——您不能直接在另一个应用程序中听写(尽管您可以将文本从 Dragon Anywhere 听写板复制到第三方应用程序)。其他需要注意的是应用程序需要互联网连接才能工作(由于其云驱动的性质),以及它是一种订阅产品,没有一次性购买选项,这可能不符合每个人的口味。

尽管如此,即使考虑到这些限制,拥有与桌面软件相同质量的成熟、强大的语音识别,在您离开办公室时安装在您的手机或平板电脑上,无疑是一个福音。

Nuance Communications 提供 7 天免费试用,让您在订阅前先试用该应用。 

阅读我们完整的 Dragon Anywhere 评论

分频器

(图片来源:龙)

2.龙专业

企业级语音转文本解决方案

购买理由

+

强大的功能 

+

专为专业人士设计 

+

160 wpm 听写 

避免的原因

过时的用户界面

弱录音转录

如果您正在寻找商业级听写应用程序,最好的选择是 Dragon Professional。该软件面向专业用户,为您提供口述和编辑文档、创建电子表格以及使用语音浏览网络的工具。   

根据 Nuance 的说法,该解决方案能够以每分钟 160 个单词的等效打字速度进行听写,准确率达到 99%——而且在任何培训完成之前,这是开箱即用的(应用程序可以适应您常用的声音和词语)。

除了使用语音创建文档外,您还可以导入自定义单词列表。还有一个额外的移动应用程序,可让您转录音频文件并将其发送回您的计算机。   

这是一个功能强大、灵活且非常有用的工具,特别适合个人,例如专业人士和自由职业者,允许更灵活、更轻松地完成打字和文档管理。

总体而言,该界面易于使用,如果您完全卡住,您可以访问一系列帮助教程。虽然该软件看起来很昂贵,但它只是一次性费用,与付费订阅转录服务相比非常有利。

另请注意,购买 Dragon Home 或 Dragon Professional Individual 后,Nuance 目前提供 12 个月的 Dragon Anywhere 访问权限,无需额外费用。

阅读我们完整的 Dragon Professional 评论

分频器

(图片来源:水獭)

3. 水獭

文字应用程序的大小演讲

购买理由

+

免费套餐

+

团队协作

+

导出选项

+

实时字幕

避免的原因

没有实时聊天支持

Otter 是一个基于云的语音到文本程序,特别针对移动使用,例如在笔记本电脑或智能手机上。该应用程序提供实时转录,允许您根据需要进行搜索、编辑、播放和组织。

Otter 是一款专门用于会议、采访和讲座的应用程序,可以更轻松地记下丰富的笔记。但是,它也可以与团队之间的协作一起工作,并且为不同的演讲者分配了不同的演讲者 ID,以便更容易理解转录。

有三种不同的付款计划,基本的一种可以免费使用,除了上述功能外,还包括关键字摘要和 wordcloud,以便更容易找到特定主题提及。您还可以整理分享、导入音视频进行转录,并提供600分钟免费服务。

高级计划还包括高级和批量导出选项、从 Dropbox 同步音频的能力、额外的播放速度,包括跳过静音暂停的能力。高级计划还允许长达 6,000 分钟的语音转文本。

Teams 计划还增加了双因素身份验证、用户管理和集中计费,以及用户统计、声纹和实时字幕。

阅读我们完整的 Otter 评论

分频器

(图片来源:Verbit)

4.动词

智能语音转文字服务

购买理由

+

企业服务

+

团队合作

+

智能人工智能

避免的原因

不是一直活着

Verbit 旨在提供更智能的语音到文本服务,使用 AI 进行转录和字幕。该服务专门针对企业和教育机构。

Verbit 使用多种语音模型,使用神经网络和算法来减少背景噪音,专注于术语以及区分说话者而不考虑口音,并将新闻和公司信息等上下文事件合并到录音中。

尽管 Verbit 确实提供了用于转录和字幕的实时版本,旨在提高准确性,但其他计划提供人工编辑以确保转录完全准确,并宣传四小时的周转时间。

总而言之,虽然 Verbit 确实提供直接语音到文本服务,但它可能更好地被认为是一种转录服务,但对企业和教育以及团队使用的关注意味着它在这里获得了一席之地作为一个考虑的选择。

阅读我们的完整 Verbit 评论(在新标签中打开)

分频器

(图片来源:语音学)

5. 语音学

领先的语音识别技术

购买理由

+

支持不同的口音

+

媒体字幕

+

关键字触发器

避免的原因

没有免费选项

没有开箱即用的解决方案

Speechmatics 提供了一种将语音转换为文本的机器学习解决方案,其自动语音识别解决方案可用于现有的音频和视频文件以及现场使用。

与一些可能与口音作斗争或收费更高的自动转录软件不同,Speechmatics 标榜自己能够支持所有主要的英国口音,无论国籍如何。这样一来,它的目标不仅是应对不同的美国和英国英语口音,还包括南非和牙买加口音。

Speechmatics 提供比许多其他提供商更广泛的语音到文本转录用途。示例包括获取 呼叫中心(在新选项卡中打开) 电话录音并将其转换为可搜索的文本或 Word 文档。该软件还可以使用视频和其他媒体来添加字幕,并使用关键字触发器进行管理。

总体而言,Speechmatics 旨在提供比许多其他提供商更灵活、更全面的语音到文本服务,并且自动化的使用应该使它们保持价格竞争力。

阅读我们完整的 Speechmatics 评论

分频器

(图片来源:布雷纳)

6. 脑力专业版

PC 的虚拟助手

购买理由

+

强大的数字助理

+

用于远程控制 PC 的漂亮 Android 应用程序

避免的原因

仅限订阅(不能一次性购买)

Braina Pro 是一款语音识别软件,它不仅是为听写而构建的,也是一个全方位的数字助手,可帮助您在 PC 上完成各种任务。它不仅支持英语,还支持近 90 种不同语言的第三方软件听写,并具有令人印象深刻的语音识别能力。

除此之外,它还是一个虚拟助手,可以被指示设置警报、在您的 PC 中搜索文件、或搜索互联网、播放 MP3 文件、大声朗读电子书,此外您还可以执行各种自定义命令。

Windows 程序还有一个配套的 Android 应用程序,它可以远程控制您的 PC,并使用本地 Wi-Fi 网络向您的计算机发送命令,这样您就可以启动音乐播放列表,例如,无论您身在何处屋。漂亮。

Braina 有一个免费版本,功能有限,但包含所有基本的 PC 命令,以及 7 天的语音识别试用版,可让您在订阅之前自行测试其功能。是的,这是另一种仅限订阅的产品,无法一次性付费购买。另请注意,您需要在线并安装 Google 的 Chrome 浏览器才能使用语音识别功能。

阅读我们完整的 Braina Pro 评论

分频器

(图片来源:亚马逊)

7.亚马逊转录

基于云的语音转文本技术

购买理由

+

词汇编辑

+

应用程序的音频

+

识别扬声器和频道

避免的原因

不适合消费者

Amazon Transcribe 是一个大型的基于云的自动语音识别平台,专门开发用于将音频转换为应用程序的文本。它特别旨在提供比传统提供商更准确和全面的服务,例如能够处理低保真和嘈杂的录音,例如您可能会在 联络中心(opens in new tab)

Amazon Transcribe 使用深度学习过程,自动添加标点符号和格式,以及使用安全的实时流进行处理,或者通过批处理将语音转录为文本。

除了为单个单词提供时间戳以便于搜索之外,它还可以识别不同的说话和不同的频道,并相应地注释文档以说明这一点。

还有一些用于编辑和管理转录文本的不错的功能,例如词汇过滤和替换词,可用于保持产品名称的一致性,因此任何后续转录更易于分析。

总体而言,Amazon Transcribe 是目前最强大的平台之一,尽管它更多地针对企业和企业用户而不是个人。

分频器

(图片来源:微软)

8. Microsoft Azure 语音转文本

Azure 平台认知服务的一部分

购买理由

+

实时转录

+

专有名词的自定义

+

处理多个扬声器

避免的原因

复杂的设置

Microsoft 的 Azure 云服务提供高级语音识别作为平台语音服务的一部分,以提供 Microsoft Azure Speech to Text 功能。 

此功能使您可以简单轻松地从各种音频源创建文本。还有一些自定义选项可用于更好地处理不同的语音模式、寄存器甚至背景声音。您还可以修改设置以处理不同的专业词汇,例如产品名称、技术信息和地名。

Microsoft 的 Azure Speech to Text 功能由深度神经网络模型提供支持,并允许实时音频转录,可以设置为处理多个扬声器。

作为 Azure 云服务的一部分,你可以在云中、本地或边缘计算中运行 Azure Speech to Text。在定价方面,您可以在一个免费容器中运行该功能,每个并发请求最多可提供每月 5 小时的免费音频。

阅读我们完整的 Microsoft Azure Speech to Text 评论(在新选项卡中打开)

分频器

(图片来源:IBM)

9. IBM Watson 语音转文本

购买理由

+

机器学习

+

批量转换

+

输出选项范围

+

智能格式化

避免的原因

比 AWS/Google 贵

多说话人识别屡试不爽

IBM 的 Watson Speech to Text 作品是此列表中的第三个云原生解决方案,该功能由人工智能和机器学习提供支持,作为 IBM 云服务的一部分。

虽然可以选择将语音实时转录为文本,但也可以选择批量转换音频文件并通过一系列语言、音频和其他输出选项对其进行处理。

您还可以使用演讲者标签、智能格式和时间戳标记转录,以及对技术词或短语、首字母缩略词和数字使用应用全局编辑。

与其他云服务一样,Watson Speech to Text 允许在您自己的防火墙后面的云和本地轻松部署,以确保维护安全性。

阅读我们完整的 Watson Speech to Text 评论


文本应用程序的最佳言论自由:

(图片来源:谷歌)

1.谷歌板

易于访问的文本到语音

购买理由

+

自由的

+

便于使用

+

附加的功能

避免的原因

没有快捷命令

如果您已经拥有 Android 移动设备,那么如果尚未安装,请从 Google Play 商店下载 Google 键盘,您将拥有一个即时文本转语音应用程序。虽然它主要设计为用于物理输入的键盘,但它也有一个直接可用的语音输入选项。而且因为谷歌硬件的所有力量都在它背后,它是一个功能强大且响应迅速的工具。

如果这还不够,那么还有其他功能。除了滑动等物理输入之外,您还可以使用语音命令触发文本中的图像。此外,它还可以与谷歌翻译一起使用,并被宣传为提供超过 60 种语言的支持。

尽管 Google 键盘不是专用的转录工具,因为没有直接集成的快捷命令或文本编辑,但它可以满足您从基本转录工具所需的一切。由于它是一个键盘,这意味着它应该能够与您可以在 Android 智能手机上运行的任何软件一起使用,因此您可以使用它进行文本编辑、保存和导出。更好的是,它是免费的,并且没有广告妨碍您使用它。

分频器

(图片来源:Just Press Record)

2.只需按记录

基于云的转录工具

购买理由

+

便于使用 

+

以云为基础 

+

多种语言   

避免的原因

没有安卓应用   

如果您想要一个专用的听写应用程序,值得一试 Just Press Record。这是一款移动录音机,具有一键录音、转录和跨设备 iCloud 同步等功能。最棒的是它几乎针对任何人,并且非常易于使用。 

录制笔记时,您只需按一个按钮,即可获得无限的录音时间。然而,这个应用程序真正伟大的地方在于它还提供了强大的转录服务。 

通过它,您可以快速轻松地将语音转换为可搜索的文本。转录文件后,您可以在应用程序中对其进行编辑。还支持 30 多种语言,如果您在国外工作或与国际团队一起工作,它是完美的应用程序。另一个不错的功能是标点命令识别,确保您的转录没有拼写错误。   

此应用程序以云技术为基础,这意味着您可以从任何设备(在线)访问笔记。您还可以将音频和文本文件共享到其他 iOS 应用程序,并且在组织它们时,您可以查看综合文件中的录音。 

分频器

(图片来源:演讲稿)

3. 演讲稿

由 Google 技术提供支持

购买理由

+

内置谷歌语音识别技术 

+

识别标点符号 

+

便于使用 

避免的原因

没有 iOS 应用 

Speechnotes 是另一个易于使用的听写应用程序。这里有用的一点是您不需要创建帐户或类似的东西;您只需打开应用程序并按下麦克风图标,即可关闭。   

该应用程序由谷歌语音识别技术提供支持。录制笔记时,您可以通过语音命令或使用内置的标点符号键盘轻松口述标点符号。 

为了让事情变得更简单,您可以使用内置键盘上的一组自定义键快速添加姓名、签名、问候语和其他常用文本。还有自动大写,对笔记所做的每一次更改都会保存到云中。

在自定义笔记方面,您可以访问大量的字体和文本大小。该应用程序可从 Google Play 商店免费下载,但您可以进行应用内购买以访问高级功能(还有 Chrome 浏览器版本)。   

阅读我们完整的 Speechnotes 评论

分频器

(图片来源:转录)

4. 转录

人工智能驱动的听写软件

购买理由

+

人工智能技术 

+

识别视频和语音备忘录 

+

方便使用的 

避免的原因

没有安卓选项 

作为将视频和语音备忘录转换为文本文件的个人助理,Transcribe 是一款由 AI 提供支持的流行听写应用程序。它使您只需按一下按钮即可进行高质量的转录。   

该应用程序可以自动转录任何视频或语音备忘录,同时支持来自世界各地的 80 多种语言。虽然您可以使用 Transcribe 轻松创建笔记,但您也可以从 Dropbox 等服务导入文件。

转录文件后,您可以将原始文本导出到文字处理器进行编辑。该应用程序可免费下载,但如果您想长期充分利用这些功能,则必须进行应用内购买。有一个试用版,但基本上只有 15 分钟的免费转录时间。不过,转录仅在 iOS 上可用。   

分频器

(图片来源:微软)

5.Windows 10 语音识别

微软桌面操作系统已完全集成语音识别

购买理由

+

与 Windows 完全集成

+

无需额外费用

避免的原因

仍然不能提供最好的准确性(但培训有帮助)

如果您不想为语音识别软件付费,并且您正在运行微软最新的桌面操作系统,那么您可能会很高兴听到 Windows 10 实际上在操作系统中内置了一些非常可靠的语音识别功能。

Windows Speech Recognition,因为它的名字富有想象力——请注意,这与 Cortana 不同,它提供基本命令和助手功能——不仅让您通过语音控制执行命令,还提供口述文档的能力。

您获得的准确度无法与 Dragon 等提供的准确度相媲美,但话又说回来,您无需支付任何费用即可使用它。还可以通过阅读文本来训练系统并使其访问您的文档以更好地学习您的词汇来提高准确性。绝对值得沉迷于一些培训,特别是如果您打算使用语音识别功能。

这种语音识别功能实际上也存在于早期版本的 Windows 中,尽管微软在最新的操作系统中对其进行了更多的磨练。该公司一直在 忙于吹嘘其 在由深度神经网络驱动的语音识别方面取得的进步,而微软肯定会让我们期待未来令人印象深刻的事情。可能的最终目标是让 Cortana 最终完成所有工作,从语音命令到听写。

通过前往控制面板(搜索它,或右键单击开始按钮并选择它)打开 Windows 语音识别,然后单击轻松访问,您将看到“启动语音识别”选项(您将如果您还没有这样做,还可以在这里找到设置麦克风的选项)。


最好的语音转文字软件

需要考虑的移动语音到文本应用程序

除了上面已经介绍的内容之外,所有移动设备上都有越来越多的应用程序可用于处理语音到文本,尤其是因为可以使用 Google 的语音识别技术。 

iTranslate Translator (在新选项卡中打开) 是一款适用于 iOS 的语音转文本应用程序,其不同之处在于它专注于翻译语音语言。它不仅旨在将您听到的不同语言翻译成您自己语言的文本,它还可以翻译图像,例如您可能在外国拍摄的标志照片并为它们获取翻译。这样一来,iTranslate 是一个非常不同的应用程序,它将语音到文本的概念带入了一个新颖的方向,而且从各方面来说,它都做得很好。 

ListNote Speech-to-Text Notes (在新选项卡中打开) 是另一个使用 Google 语音识别软件的语音到文本应用程序,但这次在将其与笔记程序集成方面做得比许多其他应用程序更全面。您记录的文本注释是可搜索的,您可以使用其他文本应用程序导入/导出。此外,还有一个密码保护选项,它会在前 20 个字符之后加密笔记,以便您可以搜索笔记的开头。您的笔记还有一个组织者功能,使用类别或指定颜色。该应用在 Android 上是免费的,但包含广告。

语音笔记(在新标签中打开) 是一个简单的应用程序,旨在将语音转换为文本以做笔记。这令人耳目一新,因为它将谷歌的语音识别技术与一个简单的笔记应用程序结合在一起,所以这里有更多的功能可以玩。您可以对笔记进行分类、设置提醒并相应地导入/导出文本。

SpeechTexter (在新选项卡中打开) 是另一个语音转文本应用程序,其目的不仅仅是将您的声音录制到文本文件中。此应用程序专为使用社交媒体而构建,因此您可以直接将语音录制到社交媒体网站并发送,而不是发送消息、电子邮件、推文和类似内容。如果您想使用的不仅仅是英语,还可以下载许多语言包以进行离线工作,这很方便。

还可以考虑阅读这些相关的软件和应用指南:

  • 最佳文字转语音软件(在新标签中打开)
  • 最佳转录服务(在新标签中打开)
  • 最佳蓝牙耳机(在新标签中打开)

哪个语音转文本应用程序最适合您?

在决定使用哪个语音转文本应用程序时,首先要考虑您的实际需求,因为免费和预算选项可能只提供基本功能,因此如果您需要使用高级工具,您可能会发现付费平台更适合给你。此外,高端软件通常可以满足各种需求,因此请确保您清楚了解您认为语音转文本应用程序可能需要哪些功能。

我们如何测试最好的语音转文本应用程序

为了测试最好的语音转文本应用程序,我们首先在相关平台上设置了一个帐户,然后我们测试了该服务,以了解该软件如何用于不同目的和不同情况。目的是推动每个语音转文本平台,看看它的基本工具有多么有用,以及掌握任何更高级的工具有多么容易。

阅读更多关于我们如何在 TechRadar 上测试、评级和评论产品的信息(在新标签中打开)

Leave a Comment