讯飞听见可以将导入的音视频转写为文字,1小时音频最快5分钟出稿,音质清晰、发音标准的普通话音频,转写准确率最高达98%,支持中文、英语、俄语、法语、德语等11种语音以及17个专业领域效果优化。
以PC端为例,导入音视频转文字可以点击此处直达官网入口→【导入音视频】,也可以下载讯飞听见客户端后在首页工作台选择【导入文件】。

进入转写入口后,可选择上传音频的语言、说话人数量和声纹、热词优化和领域选择,完成选项后提交转写。

音频语言:支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语 四川话、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语、维吾尔语
专业领域:涵盖通用、法律、金融、医疗、科技、体育、教育、运营商、政府、游戏、电商、军事、企业、生活、娱乐、人文历史、汽车
热词优化:若添加音频关键词,可提升转写的准确率。
注意: ①词与词之间用逗号隔开 ②最多可输入200个热词 ③单个热词1-16个字符 ④上限为1000个字符 ⑤仅限输入中文
以上设置项选择完成后,点击【+】上传音视频,选择提交转写即可。(用户也可根据操作习惯切换为旧版机器快转页面)
上传文件格式支持:mp3、wav、pcm、m4a、m4v、amr、wma、aac、mp4、mpg、3gp,单个文件最长5小时、最大2GB,单次支持上传100个 。

转写完成后,打开文件即可查看音频及转写结果。转写结果层次清晰,AI智能生成会议纪要、全文摘要、章节速览,更能支持全文翻译、语篇规整,原文转写内容与录音进度对照,可根据实际需要二次编辑。

可通过右上角搜索框检索转写全文内容,处理好的文档可以链接或二维码形式分享给用户,也下载为本地文件存储。如有文案优化需求,还可通过AI写作对转写结果进行进一步处理。

电脑端进入讯飞听见工作台后,点击【开始录音】,即可进行多场景实时录音转文字,记录您的会议或者直播课程等。工作台还可看到历史录音,并对历史录音进行关键词总结和摘要提炼。

转写页面概览

注意:实时转写仅支持在线实时转写,即网络畅通的情况下边录边转,无网络状态下可使用离线录音功能记录,联网后再转写。
适用于书面稿整理的场景,能够对转写后的文稿直接进行规范整理,去除口语词、语气词和重复内容,将一篇冗长杂乱的语音稿整理成重点突出的书面文稿。

如果转写场景中有多人参与会话,需要根据声纹区分说话人,可如图示在【设置】中打开【区分说话人】按钮。会后还可根据说话人标识,只看特定发言人会议观点和内容,会议节奏一目了然。
如果是较为嘈杂的收音场景,还可以通过【微信收音】功能,用手机微信小程序收音提升收音转写效果。

为有效提升转写操作的便捷性和准确性,讯飞听见还支持管理说话人声纹信息(支持声纹录入、修改、删除操作),适用于导入文件转写、实时转写等需要精准匹配说话人身份的场景。使用该功能后,用户在导入文件转写时可快速选择对应声纹,实时转写时可默认应用预设声纹,无需反复手动设置,。
声纹录入路径:
客户端:点击账号-说话人管理-新增说话人-按指引设置名称、录入声纹-提交
网页+客户端:录音结束后,划选转写内容(内容>10秒)-保存说话人-修改名称-确定
原文中保存说话人声纹≠应用说话人名称,如需修改名称,可以点击说话人-修改名称或应用已保存说话人。
热词优化包括【自定义热词】和【替换热词】两个功能。
自定义热词:输入需要提升转写准确率的词语,应用后可提高对应词语的转写准确率,支持保存、导入热词库。
替换热词:输入错误词语、正确结果并应用,将本次转写结果中的错误内容批量修改为正确内容,并在接下来的转写结果中提升相关词语的识别准确率。

AI纪要支持根据场景筛选后多模式生成内容,当前支持场景包含会议纪要、课堂笔记、采访问答以及去AI写作生成更多场景内容。AI纪要功能现提供【标准】版、【DeepSeek】版和【星火X1】版多风格服务,突破传统会议记录边界,从信息整理到价值提炼,打造智能办公新范式。
讯飞听见【AI纪要】功能适用于商务、教育、医疗等多行业场景,兼顾重点记录与高阶洞察需求,用户可按需灵活切换场景和模式。

操作步骤及图示:
转写结束后,依次选择页面右侧功能栏【AI纪要】-【场景】-【风格】-【立即生成】,即可生成条理清晰的会议纪要内容。
自适应AI纪要可结合录音内容、图片、笔记生成纪要,智能总结会议内容,且输出文本内容可交互、可溯源、可推荐。
智能交互:用户可以直接对会议内容提问,AI会结合录音原文给出精准回答,比如生成表格、精简或者扩充内容等。

智能溯源:AI纪要生成内容都有依据可以追溯,点击纪要内容的图标,能够快速定位到对应的录音原文、图片、笔记,让信息核实精准又轻松。
智能推荐:基于对录音内容的理解,AI会主动建议优化方向,引导用户通过提问输出更完善的方案。在多人讨论时,还能选择总结归纳每位发言者的观点,并一键提取待办事项加入日程。

星火X1版本的AI纪要,支持引用【用户记录】和【用户图片】生成内容纪要,即除了结合录音内容,还将结合用户记录和用户图片内容共同生成AI纪要。
【用户记录】包含高亮打点、标记、记笔记内容
【用户图片】指的是结合插入的图片里的文案内容

按钮设置项保存后,下一次触发此功能时,将自动应用。
注意事项:
1.AI 纪要生成的内容,不支持直接在AI纪要区改动。如需修改,请先保存到笔记区之后再二次编辑。
2.仅会议纪要场景支持生成4种风格纪要(星火、deepseek、速览、自适应),且【自适应】风格仅支持会记权益包+畅享包+ABC企业套餐 的用户使用。课堂笔记和采访问答都仅支持生成星火风格纪要。
一键生成全文摘要、章节速览以及各说话人总结,帮助用户快速浏览、理解全文内容。
注意,需开启【高精转写】后才能说话人总结

讯飞听见提供【高精转写】功能,转写后准确率更高,说话人区分也会更加准确。点击【高精转写】之后,会生成一份新的准确率更高的高精转写文件方便使用,原来的转写结果不受影响。【高精转写】功能为付费会员专享

讯飞听见可对转写结果进行全文翻译,中文、英语、日语、俄语、法语等多种语言可供选择(具体语种以页面显示为准)。
注意:
实时录音转写过程中翻译按钮名为【语音翻译】,翻译结果仅支持查看无法保存,如需翻译结果,请会后重新进行翻译。

组队模式支持用户发起协作,将实时转写结果分享给其他成员(含队长在内最多5人)。成员可同步查看转写内容并独立记录笔记,会议结束后自动获取录音及转写文件。具体应用详见场景应用

发起组队(队长操作)
1.在讯飞听见PC客户端或网页端,开启【实时录音转写】。
2.在转写界面右上角,点击【发起组队】按钮。
3.系统会自动生成一个邀请链接和邀请码。将其复制并分享给需要加入的成员。
加入组队(成员操作)
方式一(通过链接):直接点击队长分享的邀请链接即可自动加入。
方式二(通过邀请码):
1.打开讯飞听见PC客户端或网页端。
2.进入【工作台】->【加入组队】。
3.在弹出的窗口中输入队长提供的邀请码,点击加入即可。
界面与协作
成功加入后,所有成员界面左侧将显示同步的实时转写结果。
右侧笔记区为独立编辑区域,每位成员记录的内容仅自己可见。

注意:
1)仅个人/企业会记权益包或畅享包用户可以发起组队功能。 即队长必须有会记权或者畅享包权益,成员身份不做限制。
2)含队长在内最多支持5人同时在线,队长一旦结束录音,组队自动结束。
3)成员加入组队后,可以中途退出查看,但是不会退出组队,无论是否持续在线查看,会议结束后都将获得完整录音文件。
3)支持成员同时加入组队和开启实时录音,如果队员在加入组队前已经开启录音,仍然可通过链接加入组队,两场会议互不干扰。
【说话人管理】功能是一种能够管理说话人声纹信息(支持声纹录入、修改、删除操作)的功能,适用于导入文件转写、实时转写等需要精准匹配说话人身份的场景。使用该功能后,用户在导入文件转写时可快速选择对应声纹,实时转写时可默认应用预设声纹,无需反复手动设置,有效提升转写操作的便捷性和准确性。
声纹录入路径:
客户端:点击账号-说话人管理-新增说话人-按指引设置名称、录入声纹-提交
网页+客户端:录音结束后,划选转写内容(内容>10秒)-保存说话人-修改名称-确定
原文中保存说话人声纹≠应用说话人名称,如需修改名称,可以点击说话人-修改名称或应用已保存说话人。
温馨提示:
网页端和客户端保存说话人最大支持录入10条;
网页端不支持针对录入说话人信息进行编辑(删除、重命名);
版本号25.10.2400及以上客户端支持录入、删除、重命名操作;
兼容版客户端无说话人管理功能。
讯飞听见支持多种语言输入,有中文、英语、日语、韩语以及我国多地的方言可供选择,支持中文(普通话)、英语、中英混合、日语、法语、意大利语、西班牙语、俄语、韩语、越南语、德语、阿拉伯语、 四川话、维吾尔语、天津话、重庆话、云南话、贵州话、甘肃话、太原话、河南话、河北话、山东话、东北话、粤语、藏语。
个人和企业畅享包用户录音时还支持【方言免切换】【中英粤混合】
实时录音转写时,当声源语言选择【方言免切换】或者【中英粤混合】,录音语言将自动识别转写,轻松克服语言障碍,实现跨区域合作。
讯飞听见离线录音功能是一种依托讯飞听见电脑客户端,能够在无网络连接及不登录账号的状态下,实时捕捉并记录音频内容的功能,适用于户外采访、偏远地区会议、临时灵感捕捉等不便联网或无需登录账号的场景。录制完成后,当电脑恢复网络连接时,可一键将离线录音文件导入并转写为文字,转写过程需消耗账号内的导入转写时长。
录音过程中,可随时暂停继续和结束,笔记区也可以同步记录笔记内容(含文字、图片、表格等)
录音结束后,录制好的音频保将存在电脑本地,还可以在有网络的时候点击页面【转文字】按钮将录音转写成文稿,离线录音转文字需要消耗导入转写时长。
在实时录音转写过程中,如需对部分内容做重点标记,对文案位置进行标注,可使用【高亮打点】功能。
无论是实时录音转写时还是转写已经完成,在转写原文处,划选内容或点击段落前【+】,就能对选中内容高亮打点,或点击页面下方高亮打点符号对当前正在录音位置打点。
高亮打点后:
打点位置的转写原文将被高亮显示
在笔记区显示打点记录,点击记录中【定位】可以快速匹配到当前打点记录和所在的原文位置,还能智能匹配、复制、高亮和添加日程。
录音音频将用显眼颜色突出显示各高亮打点的音频位置。
高亮打点内容如需去除,可点击下方图标,选择对应时间点取消即可。注意:高亮打点一经取消,不可恢复。
悬浮字幕支持缩小转写页面,将实时录音转写文案以字幕/小窗形式将实时录音转写结果呈现在桌面上,帮助用户一心多用,边看字幕边浏览操作其他页面。此功能限讯飞听见PC客户端使用。
悬浮字幕显示形式主要分为3种,字幕模式、小窗模式和小小窗模式。(首页【悬浮字幕】按钮打开后默认进入小窗模式)
字幕模式:将转写文本以字幕条的形式悬浮在电脑桌面,可调整字幕条大小并且拖动到任意位置,还可以在设置中调整字体大小颜色等。
小窗模式:转写字幕以悬浮小窗形式悬浮在桌面上,支持小窗内设置录音/翻译语言、高亮打点、截图,会后点击打点、截图预览都能定位至对应录音原文,帮助用户快速精准回顾重要信息。
小小窗模式:悬浮字幕的最小化状态,作为组件放在电脑屏幕,仅控制录音状态暂停/继续/停止,不展示转写结果,如需查看结果,可点击组件内最大化按钮返回转写主界面。
切换字幕形式路径:回到讯飞听见客户端转写主界面,再次点击悬浮字幕按需切换即可。
讯飞听见的录音转文字结合AI生成思维导图功能,支持将语音信息快速转化为结构化知识体系,自动提取核心内容并生成可视化导图,显著提升学习、会议、创作等场景的信息处理效率,辅助用户高效梳理逻辑、管理知识及制定决策,适用于教育、商务、医疗等多领域复杂信息的智能化整理与深度分析。

此功能同时支持导入音视频和实时录音转写场景,均在转写结果右侧展示。

导入音视频转写时,讯飞听见将在转写完成后,AI智能生成思维导图,同时支持查看大图、一键复制、下载和重新生成。
实时录音转写时,讯飞听见既能一边录音一边转写,还能根据当前录音内容输出思维框架。实时录音转写时,思维导图也支持查看大图、复制和下载。

在录音结束后,讯飞听见将根据完整录音调整内容框架,自动刷新思维导图。

讯飞听见的录音转文字与AI生成思维导图功能结合,能够显著提升信息处理效率,适用于多场景的知识管理与思维整理。打开讯飞听见PC客户端点击开始录音/导入文件,或点击链接【思维导图】,立即体验~
录音转文字及实时翻译
1、一键录音,实时录音转文字、语音翻译
①录音实时转文字:准确率98%*,13种语言自由转写*。
②多语种实时翻译:高效精准翻译,8国语言随心互译。

2、录音过程,重点标记、拍照辅助记录
①记录过程中随时标记,不再遗漏任何重点。
②一键拍摄或插入图片,让记录更全面。

3、录音间隙,随想随记
①实时添加批注,记录迸发灵感。

4、轻松一刻,小窗悬浮字幕
①追影视作品、听播客记录、看爱豆直播。
②内录外录自由选择,再也不怕噪音干扰。

5、录音结束,转写结果智能编辑、文本翻译
①机器转写:1小时录音5-10分钟出稿,提升工作效率。
②人工精转:专业语音标注团队,多轮校验准确度更高。
③依据语义自动优化语气词,智能区分音频角色及段落。
④转写文本快速翻译,语种比对高效便捷。

6、语篇规整,转写结果智能精炼
①冗长语句精简,调整语序表达。
②语气词删除,去除多余口水话。
③书面语展示,提升文稿可读性。

7、Al融入,转写结果自动总结
①章节速览,根据文本结果快速归纳总结。
②一问一答,帮你深度理解文本内容。
③关键词匹配,快速展示文本重点。

8、录音结果,多格式快速分享
①重点内容选取,多格式输出,字音同步分享。
②产品通过【可信云】及AI企业自研技术认证,信息保存安全可靠。
