我们如何评估和测试应用程序
我们的最佳应用综述是由那些职业生涯大部分时间都在使用、测试和撰写软件的人撰写的。除非明确说明,否则我们会花费数十个小时研究和测试应用,按照每个应用的预期用途使用它们,并根据我们为该类别设定的标准对其进行评估。我们从未因任何应用在我们的文章中展示位置或任何网站的链接而获得报酬——我们珍视读者对我们的信任,相信我们会对我们评论的类别和应用提供真实的评估。有关我们流程的更多详细信息,请阅读我们如何选择要在 Zapier 博客上展示的应用的完整概述。
听写软件有各种不同的形状和大小。有些集成在您已使用的产品中。其他则是提供一系列额外功能的独立应用程序。虽然每种软件的外观和感觉都不同,但以下是我寻找最佳软件时所考虑的因素:
高准确率。忠于你所说的话是这里最重要的特征。此列表中的最低得分为 92% 准确率。
易于使用。这不是一个很高的门槛,因为大多数选项都很简单,任何人都可以在几秒钟内弄清楚。
语音命令的可用性。这些功能可让您在口述时添加“指令”,例如添加标点符号、开始新段落或更复杂的命令,例如将句子中的所有单词大写。我对以语音命令为代价提供高精度的人工智能驱动应用 意大利电报数据库 程序进行了例外处理。
支持的语言可用性。这里的大部分选择都支持相当多(或令人印象深刻)的语言。
我通过阅读一份 200 字的脚本来测试这些应用,其中包含数字、复合词和一些棘手的术语。我为每个应用阅读了三遍脚本:准确度得分是所有尝试的平均值。最后,我使用语音命令删除和格式化文本,并控制应用的可用功能。
我使用笔记本电脑或智能手机的麦克风在安静且没有背景噪音的房间里测试这些应用。对于偶尔的听写,您自己电脑或智能手机上的等效麦克风应该可以很好地完成工作。如果您每天都要进行大量听写,那么投资购买外部麦克风(例如Jabra Evolve)可能是值得的。
那么人工智能呢?
在ChatGPT热潮之前,人工智能并不是一个热门关键词,但它已经存在。此列表中的应用程序使用多种技术,其中可能包括人工智能——尤其是机器学习和自然语言处理 (NLP) 。虽然他们可以重塑品牌以跟上炒作的步伐,但与Hugging Face或OpenAI Whisper相比, 他们使用的管道或模型可能不那么前沿。
现有的听写平台可能会继续保持现状,选择继续开发其技术,或许会混合一些大型语言或多模式模型,以便在未来提供更多功能。但专门在 OpenAI 的 Whisper 或甚至 GPT-4o 或 Claude 3.7 Sonnet 等旗舰模型上运行的应用程序数量急剧增加。