讯飞听见可以将导入的音视频转写为文字,1小时音频最快5分钟出稿,音质清晰、发音标准的普通话音频,转写准确率最高达98%,支持中文、英语、俄语、法语、德语等11种语音以及17个专业领域效果优化。
以PC端为例,导入音视频转文字可以点击此处直达官网入口→【导入音视频】,也可以下载讯飞听见客户端后在首页工作台选择【导入文件】。
进入转写入口后,可选择上传音频的语言、专业领域、热词优化,完成选项后提交转写。
音频语言:支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语 四川话、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语、维吾尔语
专业领域:涵盖通用、法律、金融、医疗、科技、体育、教育、运营商、政府、游戏、电商、军事、企业、生活、娱乐、人文历史、汽车
热词优化:若添加音频关键词,可提升转写的准确率。
注意: ①词与词之间用逗号隔开 ②最多可输入200个热词 ③单个热词1-16个字符 ④上限为1000个字符 ⑤仅限输入中文
以上设置项选择完成后,点击【+】上传音视频,选择提交转写即可。(用户也可根据操作习惯切换为旧版机器快转页面)
上传文件格式支持:mp3、wav、pcm、m4a、m4v、amr、wma、aac、mp4、mpg、3gp,单个文件最长5小时、最大2GB,单次支持上传100个 。
步骤 4:
转写完成后,打开文件即可查看音频及转写结果。转写结果层次清晰,AI智能生成会议纪要、全文摘要、章节速览,更能支持全文翻译、语篇规整,原文转写内容与录音进度对照,可根据实际需要二次编辑。
可通过右上角搜索框检索转写全文内容,处理好的文档可以链接或二维码形式分享给用户,也下载为本地文件存储。如有文案优化需求,还可通过AI写作对转写结果进行进一步处理。
电脑端进入讯飞听见工作台后,点击【开始录音】,即可进行多场景实时录音转文字,记录您的会议或者直播课程等。工作台还可看到历史录音,并对历史录音进行关键词总结和摘要提炼。
转写页面概览
注意:实时转写仅支持在线实时转写,即网络畅通的情况下边录边转,无网络状态下不支持转写。
适用于书面稿整理的场景,能够对转写后的文稿直接进行规范整理,去除口语词、语气词和重复内容,将一篇冗长杂乱的语音稿整理成重点突出的书面文稿。
如果转写场景中有多人参与会话,需要根据声纹区分说话人,可如图示在【设置】中打开【区分说话人】按钮。会后还可根据说话人标识,只看特定发言人会议观点和内容,会议节奏一目了然。
如果是较为嘈杂的收音场景,还可以通过【微信收音】功能,用手机微信小程序收音提升收音转写效果。
热词优化包括【自定义热词】和【替换热词】两个功能。
自定义热词:输入需要提升转写准确率的词语,应用后可提高对应词语的转写准确率,支持保存、导入热词库。
替换热词:输入错误词语、正确结果并应用,将本次转写结果中的错误内容批量修改为正确内容,并在接下来的转写结果中提升相关词语的识别准确率。
AI纪要功能适用于录音结束后,对完整录音的AI总结梳理,有利于快速回顾录音内容,对重要内容,待办事项等梳理一目了然,大大缩短整理时间。
操作:①会议结束后,点击“结束录音”按钮后,点击右侧【AI 纪要】即可生成一篇完整的会议纪要。
②讯飞听见【AI纪要】功能AI纪要功能现提供【标准】版、【DeepSeek】版和【星火X1】版多模式服务。
其中,星火X1版本的AI纪要,支持引用【用户记录】和【用户图片】生成内容纪要,即除了结合录音内容,还将结合用户记录和用户图片ocr内容共同生成AI纪要。
【用户记录】包含高亮打点、标记、记笔记的内容
【用户图片】内容指的是插入的图片里的ocr提取的文案内容
一键生成全文摘要、章节速览以及各说话人总结,帮助用户快速浏览、理解全文内容。
注意,需开启【高精转写】后才能说话人总结
讯飞听见提供【高精转写】功能,转写后准确率更高,说话人区分也会更加准确。点击【高精转写】之后,会生成一份新的准确率更高的高精转写文件方便使用,原来的转写结果不受影响。【高精转写】功能为付费会员专享
讯飞听见可对转写结果进行全文翻译,中文、英语、日语、俄语、法语等多种语言可供选择(具体语种以页面显示为准)。
注意:
实时录音转写过程中翻译按钮名为【语音翻译】,翻译结果仅支持查看无法保存,如需翻译结果,请会后重新进行翻译。
讯飞听见的录音转文字结合AI生成思维导图功能,支持将语音信息快速转化为结构化知识体系,自动提取核心内容并生成可视化导图,显著提升学习、会议、创作等场景的信息处理效率,辅助用户高效梳理逻辑、管理知识及制定决策,适用于教育、商务、医疗等多领域复杂信息的智能化整理与深度分析。
此功能同时支持导入音视频和实时录音转写场景,均在转写结果右侧展示。
导入音视频转写时,讯飞听见将在转写完成后,AI智能生成思维导图,同时支持查看大图、一键复制、下载和重新生成。
实时录音转写时,讯飞听见既能一边录音一边转写,还能根据当前录音内容输出思维框架。实时录音转写时,思维导图也支持查看大图、复制和下载。
在录音结束后,讯飞听见将根据完整录音调整内容框架,自动刷新思维导图。
讯飞听见的录音转文字与AI生成思维导图功能结合,能够显著提升信息处理效率,适用于多场景的知识管理与思维整理。打开讯飞听见PC客户端点击开始录音/导入文件,或点击链接【思维导图】,立即体验~
讯飞听见支持多种语言输入,有中文、英语、日语、韩语以及我国多地的方言可供选择,支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语、阿拉伯语、 四川话、维吾尔语、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语。
个人和企业畅享包用户录音时还支持【方言免切换】【中英粤混合】
实时录音转写时,当声源语言选择【方言免切换】或者【中英粤混合】,录音语言将自动识别转写,轻松克服语言障碍,实现跨区域合作。
录音转文字及实时翻译
1、一键录音,实时录音转文字、语音翻译
①录音实时转文字:准确率98%*,13种语言自由转写*。
②多语种实时翻译:高效精准翻译,8国语言随心互译。
2、录音过程,重点标记、拍照辅助记录
①记录过程中随时标记,不再遗漏任何重点。
②一键拍摄或插入图片,让记录更全面。
3、录音间隙,随想随记
①实时添加批注,记录迸发灵感。
4、轻松一刻,小窗悬浮字幕
①追影视作品、听播客记录、看爱豆直播。
②内录外录自由选择,再也不怕噪音干扰。
5、录音结束,转写结果智能编辑、文本翻译
①机器转写:1小时录音5-10分钟出稿,提升工作效率。
②人工精转:专业语音标注团队,多轮校验准确度更高。
③依据语义自动优化语气词,智能区分音频角色及段落。
④转写文本快速翻译,语种比对高效便捷。
6、语篇规整,转写结果智能精炼
①冗长语句精简,调整语序表达。
②语气词删除,去除多余口水话。
③书面语展示,提升文稿可读性。
7、Al融入,转写结果自动总结
①章节速览,根据文本结果快速归纳总结。
②一问一答,帮你深度理解文本内容。
③关键词匹配,快速展示文本重点。
8、录音结果,多格式快速分享
①重点内容选取,多格式输出,字音同步分享。
②产品通过【可信云】及AI企业自研技术认证,信息保存安全可靠。