谷歌为Gemini新增上传音频功能可以通过AI处理音频并进行转录和分析等

尽管谷歌的 Gemini AI 已经可以处理图片、PDF 文件甚至上传视频文件进行分析，但谷歌此前并没有带来音频文件的支持，对于喜欢使用 AI 总结会议音频的用户来说是个遗憾。

所以现在谷歌要为用户带来音频文件的支持，谷歌实验室副总裁兼 Gemini AI 团队负责人已经确认此次更新并将其称为首要请求，用户可以在 Gemini AI 网页版、iOS 版和 Android 版上上传音频文件。

支持的音频文件格式包括 MP3、WAV 及其他大多数常见的音频格式文件，上传音频文件后可以交给 AI 将音频内容转录为文字，或者直接要求生成摘要例如会议的重点内容等。

当然付费用户和免费用户获得的权益是不同的，其中免费用户每次最多可以上传 10 个音频文件片段，并且所有音频文件的总和时长不超过 10 分钟，用户也可以尝试分次进行上传和分析。

如果是付费用户包括 Google AI Pro 或 Google AI Ultra 等订阅，则可以上传最多 3 小时也就是 180 分钟的音频文件，这可以满足大多数会议音频或其他音频的分析需求。

对免费用户来说 10 分钟确实有些少，例如较长的会议音频录音可能有 30 分钟甚至更久，这种情况下用户就需要考虑付费订阅 Google AI 服务以获得更高的使用配额了。

以上就是“谷歌为Gemini新增上传音频功能可以通过AI处理音频并进行转录和分析等”的详细内容，想要了解更多IT圈内资讯欢迎持续关注编程学习网。

扫码二维码 获取免费视频学习资料

Python编程学习

查看2022高级编程视频教程免费获取