语音秒记查询任务
语音秒记查询任务
0
语音秒记提交任务
基于先进的语音识别模型和大语言模型能力,结合在会议、培训、销售通话、访谈等多种场景中的业务经验,我们对企业音视频数据进行了深度适配与调优。系统能够针对不同场景、不同音色与口音实现高精度语音转文字,并对音频内容进行多维度结构化理解。 在完成准确的转写基础上,系统还能自动生成全文总结、分段总结、流程与要点提取、问答提取、待办提取、关键词抽取、翻译等结构化内容,使音视频资料可被检索、可被问答、可被分析。通过上述能力,帮助企业大幅提升音视频内容的消费效率,实现数据的结构化管理及二次价值挖掘。
0.00064
自动字幕打轴-查询任务
支持视频创作者同时上传音视频和对应的文本内容,无需识别转文字,直接给字幕配时间轴,使其随原声滚动,便宜高效。自动字幕打轴支持说话打轴和歌词打轴两种模式,可自动输出文本分句和每个词、分句的时间戳结果,适用于已有文本场景下的视频创作场景。
0
自动字幕打轴-提交任务
支持视频创作者同时上传音视频和对应的文本内容,无需识别转文字,直接给字幕配时间轴,使其随原声滚动,便宜高效。自动字幕打轴支持说话打轴和歌词打轴两种模式,可自动输出文本分句和每个词、分句的时间戳结果,适用于已有文本场景下的视频创作场景。
0.00083
大模型录音文件识别闲时版-查询结果
大模型录音文件识别闲时版,查询任务接口。
0
大模型录音文件识别闲时版
本接口适用于批量/非实时场景,作业将进入闲时算力队列按调度,系统在资源空闲时自动拉起识别任务。
0.01667
大模型流式语音识别
支持将长音频实时识别成文字,达到“边说话边出文字”的效果,适用于实时语音识别的场景,如实时会议字幕、直播字幕、智能外呼等。
0.00031
录音文件识别极速版(阿里云)
录音文件识别极速版支持使用者通过HTTPS POST方式上传一段短音频,并在短时间内(一般来说,30分钟的音频可以在10秒内完成识别)同步获取识别结果,满足音视频字幕、准实时质检等场景下对语音文件识别时效性要求。
0.00069
大模型录音文件极速版
本接口适用于录音文件极速识别场景,基于大模型能力提供识别效果更佳、返回更快的体验。
0.00042
录音文件识别-查询结果
查询录音文件识别结果
0
录音文件识别-提交任务
提交录音文件识别任务
0.00041
大模型录音文件识别-查询结果
查询大模型录音文件识别结果
0
大模型录音文件识别-提交任务
提交大模型录音文件识别
0.0001
音视频字幕生成-查询结果
查询“音视频字幕生成”结果
0
音视频字幕生成-提交任务
音视频字幕生成 提交音频文件,支持 binary 和 url 方式提交
0.00013
一句话识别
一句话识别接口支持以 HTTP POST 方式整段上传不超过一分钟的语音文件。识别结果将以 JSON 格式在请求响应中一次性返回,开发者需要保证在识别结果返回之前连接不中断。
0.00333
语音文件识别结果查询
语音文件识别结果查询
0
创建语音文件识别任务
创建语音文件识别任务
0.02
流式语音识别
支持将长音频实时识别成文字,达到“边说话边出文字”的效果,适用于实时语音识别的场景,如实时会议字幕、直播字幕、智能外呼等。
0.00031
相关知识
食谱类API
医疗服务类API
api无缝钢管
一文汇总全球热门新闻API
健康知识API接口
疾病API服务:数字医疗的桥梁
健康小提示API接口
河南健康码开放api接口(河南健康码开放api接口是什么)
AI+Data+MCP 重新定义API——「百递云・API 开放平台」新品发布会@GIAC邀您共探
健康小提示api怎么使用?健康小提示api功能有哪些?
网址: API市场 https://m.trfsz.com/newsview1890420.html