精选功能-讯飞听见 > 音视频转写
音视频转写

讯飞听见可以将导入的音视频转写为文字,1小时音频最快5分钟出稿,音质清晰、发音标准的普通话音频,转写准确率最高达98%,支持中文、英语、俄语、法语、德语等11种语音以及17个专业领域效果优化。

以PC端为例,导入音视频转文字可以点击此处直达官网入口→【导入音视频】,也可以下载讯飞听见客户端后在首页工作台选择【导入文件】。

导入文件.png

进入转写入口后,可选择上传音频的语言、专业领域、热词优化,完成选项后提交转写。

导入.jpg

音频语言:支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语 四川话、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语、维吾尔语

专业领域:涵盖通用、法律、金融、医疗、科技、体育、教育、运营商、政府、游戏、电商、军事、企业、生活、娱乐、人文历史、汽车
热词优化:若添加音频关键词,可提升转写的准确率。
注意: ①词与词之间用逗号隔开 ②最多可输入200个热词 ③单个热词1-16个字符 ④上限为1000个字符 ⑤仅限输入中文

以上设置项选择完成后,点击【+】上传音视频,选择提交转写即可。(用户也可根据操作习惯切换为旧版机器快转页面)

上传文件格式支持:mp3、wav、pcm、m4a、m4v、amr、wma、aac、mp4、mpg、3gp,单个文件最长5小时、最大2GB,单次支持上传100个 。

热词优化.jpg

步骤 4

转写完成后,打开文件即可查看音频及转写结果。转写结果层次清晰,AI智能生成会议纪要、全文摘要、章节速览,更能支持全文翻译、语篇规整,原文转写内容与录音进度对照,可根据实际需要二次编辑。

AI功能按钮.jpg

可通过右上角搜索框检索转写全文内容,处理好的文档可以链接或二维码形式分享给用户,也下载为本地文件存储。如有文案优化需求,还可通过AI写作对转写结果进行进一步处理。

分享下载去写作.jpg



实时转写

电脑端进入讯飞听见工作台后,点击【开始录音】,即可进行多场景实时录音转文字,记录您的会议或者直播课程等。工作台还可看到历史录音,并对历史录音进行关键词总结和摘要提炼。

录音场景.jpg

转写页面概览

录音结果页.jpg


注意:实时转写仅支持在线实时转写,即网络畅通的情况下边录边转,无网络状态下不支持转写。



语篇规整

适用于书面稿整理的场景,能够对转写后的文稿直接进行规范整理,去除口语词、语气词和重复内容,将一篇冗长杂乱的语音稿整理成重点突出的书面文稿。

语篇规整 (2).jpg



区分说话人

如果转写场景中有多人参与会话,需要根据声纹区分说话人,可如图示在【设置】中打开【区分说话人】按钮。会后还可根据说话人标识,只看特定发言人会议观点和内容,会议节奏一目了然。

如果是较为嘈杂的收音场景,还可以通过【微信收音】功能,用手机微信小程序收音提升收音转写效果。


录音设置.jpg




热词优化

热词优化包括【自定义热词】和【替换热词】两个功能。

自定义热词:输入需要提升转写准确率的词语,应用后可提高对应词语的转写准确率,支持保存、导入热词库。

替换热词:输入错误词语、正确结果并应用,将本次转写结果中的错误内容批量修改为正确内容,并在接下来的转写结果中提升相关词语的识别准确率。

热词优化.jpg



AI会议纪要

AI纪要功能适用于录音结束后,对完整录音的AI总结梳理,有利于快速回顾录音内容,对重要内容,待办事项等梳理一目了然,大大缩短整理时间。

操作:①会议结束后,点击“结束录音”按钮后,点击右侧【AI 纪要】即可生成一篇完整的会议纪要。

微信图片_20241017103131.png



②讯飞听见【AI纪要】功能AI纪要功能现提供【标准】版、【DeepSeek】版和【星火X1】版多模式服务。


ai纪要.jpg

其中,星火X1版本的AI纪要,支持引用【用户记录】和【用户图片】生成内容纪要,即除了结合录音内容,还将结合用户记录和用户图片ocr内容共同生成AI纪要。

【用户记录】包含高亮打点、标记、记笔记的内容
【用户图片】内容指的是插入的图片里的ocr提取的文案内容

小红书 5@2x.png




全文概览

一键生成全文摘要、章节速览以及各说话人总结,帮助用户快速浏览、理解全文内容。

注意,需开启【高精转写】后才能说话人总结

全文摘要.jpg



高精转写

讯飞听见提供【高精转写】功能,转写后准确率更高,说话人区分也会更加准确点击【高精转写】之后,会生成一份新的准确率更高的高精转写文件方便使用,原来的转写结果不受影响。【高精转写】功能为付费会员专享

高精转写.jpg



全文翻译

讯飞听见可对转写结果进行全文翻译,中文、英语、日语、俄语、法语等多种语言可供选择(具体语种以页面显示为准)

注意:

实时录音转写过程中翻译按钮名为【语音翻译】,翻译结果仅支持查看无法保存,如需翻译结果,请会后重新进行翻译。

翻译.jpg



思维导图

讯飞听见的录音转文字结合AI生成思维导图功能,支持将语音信息快速转化为结构化知识体系,自动提取核心内容并生成可视化导图,显著提升学习、会议、创作等场景的信息处理效率,辅助用户高效梳理逻辑、管理知识及制定决策,适用于教育、商务、医疗等多领域复杂信息的智能化整理与深度分析。

 AI创作智能体长图浅色-09.jpg

此功能同时支持导入音视频和实时录音转写场景,均在转写结果右侧展示。

01.png

导入音视频转写时,讯飞听见将在转写完成后,AI智能生成思维导图,同时支持查看大图、一键复制、下载和重新生成

03.png 

实时录音转写时,讯飞听见既能一边录音一边转写,还能根据当前录音内容输出思维框架。实时录音转写时,思维导图也支持查看大图、复制和下载。

02.png

在录音结束后,讯飞听见将根据完整录音调整内容框架,自动刷新思维导图。

04.png

讯飞听见的录音转文字与AI生成思维导图功能结合,能够显著提升信息处理效率,适用于多场景的知识管理与思维整理。打开讯飞听见PC客户端点击开始录音/导入文件,或点击链接【思维导图】,立即体验~




多种语言识别实时录音转写

讯飞听见支持多种语言输入,有中文、英语、日语、韩语以及我国多地的方言可供选择,支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语、阿拉伯语、 四川话、维吾尔语、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语。

个人和企业畅享包用户录音时还支持【方言免切换】【中英粤混合】

实时录音转写时,当声源语言选择【方言免切换】或者【中英粤混合】,录音语言将自动识别转写,轻松克服语言障碍,实现跨区域合作。

小红书 4@2x.png



随身语音记录助手(讯飞听见APP)

录音转文字及实时翻译

1、一键录音,实时录音转文字、语音翻译

①录音实时转文字:准确率98%*,13种语言自由转写*。

②多语种实时翻译:高效精准翻译,8国语言随心互译。

11.png



2、录音过程,重点标记、拍照辅助记录

①记录过程中随时标记,不再遗漏任何重点。

②一键拍摄或插入图片,让记录更全面。

12.png



3、录音间隙,随想随记

①实时添加批注,记录迸发灵感。

13.png



4、轻松一刻,小窗悬浮字幕

①追影视作品、听播客记录、看爱豆直播。

②内录外录自由选择,再也不怕噪音干扰。

14.png



5、录音结束,转写结果智能编辑、文本翻译

①机器转写:1小时录音5-10分钟出稿,提升工作效率。

②人工精转:专业语音标注团队,多轮校验准确度更高。

③依据语义自动优化语气词,智能区分音频角色及段落。

④转写文本快速翻译,语种比对高效便捷。

15.png



6、语篇规整,转写结果智能精炼

①冗长语句精简,调整语序表达。

②语气词删除,去除多余口水话。

③书面语展示,提升文稿可读性。

16.png



7、Al融入,转写结果自动总结

①章节速览,根据文本结果快速归纳总结。

②一问一答,帮你深度理解文本内容。

③关键词匹配,快速展示文本重点。

17.png



8、录音结果,多格式快速分享

①重点内容选取,多格式输出,字音同步分享。

②产品通过【可信云】及AI企业自研技术认证,信息保存安全可靠。


18.png


讯飞听见 2025-07-18 16:56:52