讯飞听见可以将导入的音视频转写为文字,1小时音频最快5分钟出稿,音质清晰、发音标准的普通话音频,转写准确率最高达98%,支持中文、英语、俄语、法语、德语等11种语音以及17个专业领域效果优化。
以PC端为例,导入音视频转文字可以点击此处直达官网入口→【导入音视频】,也可以下载讯飞听见客户端后在首页工作台选择【导入文件】。
进入转写入口后,可选择上传音频的语言、说话人数量、热词优化和领域选择,完成选项后提交转写。
音频语言:支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语 四川话、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语、维吾尔语
专业领域:涵盖通用、法律、金融、医疗、科技、体育、教育、运营商、政府、游戏、电商、军事、企业、生活、娱乐、人文历史、汽车
热词优化:若添加音频关键词,可提升转写的准确率。
注意: ①词与词之间用逗号隔开 ②最多可输入200个热词 ③单个热词1-16个字符 ④上限为1000个字符 ⑤仅限输入中文
以上设置项选择完成后,点击【+】上传音视频,选择提交转写即可。(用户也可根据操作习惯切换为旧版机器快转页面)
上传文件格式支持:mp3、wav、pcm、m4a、m4v、amr、wma、aac、mp4、mpg、3gp,单个文件最长5小时、最大2GB,单次支持上传100个 。
转写完成后,打开文件即可查看音频及转写结果。转写结果层次清晰,左侧可自动生成会议纪要、思维导图等,右侧支持查看全部原文、全文翻译、语篇规整等,原文转写内容与录音进度对照,可根据实际需要二次编辑。
可通过右上角搜索框检索/替换转写全文内容,处理好的文档可以链接或二维码形式分享给用户,也下载为本地文件存储。如有文案优化需求,还可通过AI写作对转写结果进行进一步处理。
电脑端进入讯飞听见工作台后,点击【开始录音】,即可进行多场景实时录音转文字,记录您的会议或者直播课程等。工作台还可看到历史录音,并对历史录音进行关键词总结和摘要提炼。
转写页面概览
注意:实时转写仅支持在线实时转写,即网络畅通的情况下边录边转,无网络状态下可使用离线录音功能记录,联网后再转写。
适用于书面稿整理的场景,能够对转写后的文稿直接进行规范整理,去除口语词、语气词和重复内容,将一篇冗长杂乱的语音稿整理成重点突出的书面文稿。
如果转写场景中有多人参与会话,需要根据声纹区分说话人,可如图示在【设置】中打开【区分说话人】按钮。即可根据声音记录不同发言人讲话内容,便于会后记录核对查询。

默认名称为说话人姓名1/2/3,如需修改,可点击说话人编辑,保存编辑内容后,名称更新对当前修改的说话人全部生效。

会后还可根据说话人标识,只看特定发言人会议观点和内容,会议节奏一目了然。
热词优化包括【自定义热词】和【替换热词】两个功能。
自定义热词:输入需要提升转写准确率的词语,应用后可提高对应词语的转写准确率,支持保存、导入热词库。
替换热词:输入错误词语、正确结果并应用,将本次转写结果中的错误内容批量修改为正确内容,并在接下来的转写结果中提升相关词语的识别准确率。
AI纪要是基于录音转写内容、用户图片及笔记,自动生成的结构化内容总结,录音转写完成后,系统将自动生成AI纪要。
AI纪要包含结构化会议纪要与图文纪要两种模式,其中图文纪要以图文结合的模块化形式展示内容,信息层次清晰、排版错落有致。

实时录音转写时,页面左侧部分是AI洞察功能,它在录音转写文本的基础上,对内容做深度处理:不仅清晰梳理 “说了什么、发生了什么”,还能深挖背后原因、点明关键影响,甚至给出可落地的行动建议,帮用户从原始记录里提炼出能指导决策的核心认知,将客观信息转化为可指导实践的高价值认知与决策依据。
AI 洞察结论支持溯源定位,可关联对应的转写原文与录音音频。
在洞察页面底部,提供【chat】功能。用户可与 AI助手 进行对话,AI 将基于已有原文及笔记内容进行针对性回答,还能能够提供信息查询、文件总结、个性化建议与学习辅助。
讯飞听见提供【高精转写】功能,转写后准确率更高,说话人区分也会更加准确。点击【高精转写】之后,会生成一份新的准确率更高的高精转写文件方便使用,原来的转写结果不受影响。【高精转写】功能为付费会员专享
讯飞听见可对转写结果进行全文翻译,中文、英语、日语、俄语、法语等多种语言可供选择(具体语种以页面显示为准)。
实时录音转写过程中,翻译结果仅支持查看无法保存,如需翻译结果,请会后重新进行翻译。
讯飞听见支持多种语言输入,有中文、英语、日语、韩语以及我国多地的方言可供选择,支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语、阿拉伯语、 四川话、维吾尔语、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语。
个人和企业畅享包用户录音时还支持【方言免切换】【中英粤混合】
实时录音转写时,当声源语言选择【方言免切换】或者【中英粤混合】,录音语言将自动识别转写,轻松克服语言障碍,实现跨区域合作。
讯飞听见离线录音功能是一种依托讯飞听见电脑客户端,能够在无网络连接及不登录账号的状态下,实时捕捉并记录音频内容的功能,适用于户外采访、偏远地区会议、临时灵感捕捉等不便联网或无需登录账号的场景。录制完成后,当电脑恢复网络连接时,可一键将离线录音文件导入并转写为文字,转写过程需消耗账号内的导入转写时长。
录音过程中,可随时暂停继续和结束,笔记区也可以同步记录笔记内容(含文字、图片、表格等)
录音结束后,录制好的音频保将存在电脑本地,还可以在有网络的时候点击页面【转文字】按钮将录音转写成文稿,离线录音转文字需要消耗导入转写时长。
在实时录音转写过程中,如需对部分内容做重点标记,对文案位置进行标注,可使用【随记】功能。
无论是实时录音转写时还是转写已经完成,在转写原文处,划选转写原文案就能对选中内容进行标记,或点击页面下方随记符号对当前正在录音位置做标记。
随记后:
随记时的转写原文将被高亮显示;
录音音频将用显眼颜色显示各随记的音频位置。
随记内容如需去除,可再次选中原文,按页面提示取消即可。注意:随记一经取消,不可恢复。
悬浮字幕支持缩小转写页面,将实时录音转写文案以字幕/小窗形式呈现在桌面上,帮助用户一心多用,边看字幕边浏览操作其他页面。此功能限讯飞听见PC客户端使用。
悬浮字幕显示形式主要分为3种,字幕模式、小窗模式和小小窗模式。(首页【悬浮字幕】按钮打开后默认进入小窗模式)
字幕模式:将转写文本以字幕条的形式悬浮在电脑桌面,可调整字幕条大小并且拖动到任意位置,还可以在设置中调整字体大小颜色等。
小窗模式:转写字幕以悬浮小窗形式悬浮在桌面上,支持小窗内设置录音/翻译语言、高亮打点、截图,会后点击打点、截图预览都能定位至对应录音原文,帮助用户快速精准回顾重要信息。
小小窗模式:悬浮字幕的最小化状态,作为组件放在电脑屏幕,仅控制录音状态暂停/继续/停止,不展示转写结果,如需查看结果,可点击组件内最大化按钮返回转写主界面。
思维导图支持基于转写原文生成清晰脑图,可从语音中快速提取核心内容,自动梳理逻辑框架。无论是会议、学习还是创作,都能帮你高效整理思路、沉淀知识,让复杂信息一目了然。
AI纪要tab下点击右侧脑图图标即可查看,思维导图支持点击查看大图、一键复制。
录音转文字及实时翻译
1、一键录音,实时录音转文字、语音翻译
①录音实时转文字:准确率98%*,13种语言自由转写*。
②多语种实时翻译:高效精准翻译,8国语言随心互译。

2、录音过程,重点标记、拍照辅助记录
①记录过程中随时标记,不再遗漏任何重点。
②一键拍摄或插入图片,让记录更全面。

3、录音间隙,随想随记
①实时添加批注,记录迸发灵感。

4、轻松一刻,小窗悬浮字幕
①追影视作品、听播客记录、看爱豆直播。
②内录外录自由选择,再也不怕噪音干扰。

5、录音结束,转写结果智能编辑、文本翻译
①机器转写:1小时录音5-10分钟出稿,提升工作效率。
②人工精转:专业语音标注团队,多轮校验准确度更高。
③依据语义自动优化语气词,智能区分音频角色及段落。
④转写文本快速翻译,语种比对高效便捷。

6、语篇规整,转写结果智能精炼
①冗长语句精简,调整语序表达。
②语气词删除,去除多余口水话。
③书面语展示,提升文稿可读性。

7、Al融入,转写结果自动总结
①章节速览,根据文本结果快速归纳总结。
②一问一答,帮你深度理解文本内容。
③关键词匹配,快速展示文本重点。

8、录音结果,多格式快速分享
①重点内容选取,多格式输出,字音同步分享。
②产品通过【可信云】及AI企业自研技术认证,信息保存安全可靠。
