苹果新Speech API转录速度惊人，胜过OpenAI Whisper 55%

科技媒体 macstories 发布了一篇关于苹果新推出的 Speech API 的博文，引发了业界的广泛关注。通过对一段时长34分钟、大小达7GB 的4K 视频文件进行转录测试，结果显示，苹果的新 Speech API 仅耗时45秒，速度远超其他同类工具。相较之下，OpenAI 的 Whisper 转录时间为101秒，苹果的技术优势可见一斑，提升了约55% 的效率。

苹果在2025年全球开发者大会 WWDC 上首次宣布了这一 Speech 框架，框架中包含了 SpeechAnalyzer 和 SpeechTranscriber 两款模块。这一技术的推出，标志着苹果在语音处理领域的进一步突破，尤其是在速度和准确性方面的提升。

在具体的测试中，媒体使用了基于新模块开发的 Yap 应用进行转录。通过对比不同工具的表现，Yap 以45秒的快速转录时间，成为了市场上表现最优的选择。相对而言，MacWhisper（基于 OpenAI 的 Whisper 开源语音转录模型）需要1分41秒，而 VidCap 则需要1分55秒。更早版本的 MacWhisper(V2)甚至要耗时3分55秒。

虽然所有测试工具在识别专有名词时都出现了一定误差，比如 “AppStories” 的识别，但 Yap 在本地化运算上的优势，确保了其在处理多段视频时的效率更为显著。通过计算每周处理多段视频所节省的时间，用户可以显著提高工作效率。

这项技术的快速发展，不仅为视频内容创作者提供了便利，也为后续的应用场景拓展奠定了基础。未来，随着 AI 技术的不断演进，苹果在语音识别领域可能会推出更多创新的解决方案，进一步提升用户体验。

划重点:

🌟 苹果新 Speech API 转录34分钟4K 视频仅需45秒，速度超越竞争对手。

⏱️ 与 OpenAI Whisper 相比，苹果技术提升了约55% 的效率，表现显著。

📈 本地化运算优势使 Yap 在多段视频处理上效率更高，为用户节省大量时间。