API市场

泰然健康网
2026-01-21 20:05

语音秒记查询任务

语音秒记提交任务

基于先进的语音识别模型和大语言模型能力，结合在会议、培训、销售通话、访谈等多种场景中的业务经验，我们对企业音视频数据进行了深度适配与调优。系统能够针对不同场景、不同音色与口音实现高精度语音转文字，并对音频内容进行多维度结构化理解。在完成准确的转写基础上，系统还能自动生成全文总结、分段总结、流程与要点提取、问答提取、待办提取、关键词抽取、翻译等结构化内容，使音视频资料可被检索、可被问答、可被分析。通过上述能力，帮助企业大幅提升音视频内容的消费效率，实现数据的结构化管理及二次价值挖掘。

0.00064

自动字幕打轴-查询任务

支持视频创作者同时上传音视频和对应的文本内容，无需识别转文字，直接给字幕配时间轴，使其随原声滚动，便宜高效。自动字幕打轴支持说话打轴和歌词打轴两种模式，可自动输出文本分句和每个词、分句的时间戳结果，适用于已有文本场景下的视频创作场景。

自动字幕打轴-提交任务

0.00083

大模型录音文件识别闲时版-查询结果

大模型录音文件识别闲时版，查询任务接口。

大模型录音文件识别闲时版

本接口适用于批量/非实时场景，作业将进入闲时算力队列按调度，系统在资源空闲时自动拉起识别任务。

0.01667

大模型流式语音识别

支持将长音频实时识别成文字，达到“边说话边出文字”的效果，适用于实时语音识别的场景，如实时会议字幕、直播字幕、智能外呼等。

0.00031

录音文件识别极速版(阿里云)

录音文件识别极速版支持使用者通过HTTPS POST方式上传一段短音频，并在短时间内（一般来说，30分钟的音频可以在10秒内完成识别）同步获取识别结果，满足音视频字幕、准实时质检等场景下对语音文件识别时效性要求。

0.00069

大模型录音文件极速版

本接口适用于录音文件极速识别场景，基于大模型能力提供识别效果更佳、返回更快的体验。

0.00042

录音文件识别-查询结果

查询录音文件识别结果

录音文件识别-提交任务

提交录音文件识别任务

0.00041

大模型录音文件识别-查询结果

查询大模型录音文件识别结果

大模型录音文件识别-提交任务

提交大模型录音文件识别

0.0001

音视频字幕生成-查询结果

查询“音视频字幕生成”结果

音视频字幕生成-提交任务

音视频字幕生成提交音频文件，支持 binary 和 url 方式提交

0.00013

一句话识别

一句话识别接口支持以 HTTP POST 方式整段上传不超过一分钟的语音文件。识别结果将以 JSON 格式在请求响应中一次性返回，开发者需要保证在识别结果返回之前连接不中断。

0.00333

语音文件识别结果查询

创建语音文件识别任务

0.02

流式语音识别

支持将长音频实时识别成文字，达到“边说话边出文字”的效果，适用于实时语音识别的场景，如实时会议字幕、直播字幕、智能外呼等。

0.00031

墨鱼与鱿鱼的区别营养价值与功效

福利来喽！鲜美的姜葱鱿鱼卷，一点都不会发胖哦！

热点资讯

五大原因危害女性健康如何保护心脏健康

我们都知道，越来越多的女性，年纪不大，可是心脏却不是那么健康...

习惯造就健康影响健康的习惯大盘点

生活中许多的健康问题都是由于不良的生活习惯导致的，相反一些人...

推荐资讯

从出汗看健康出汗透露你的健康信号

夏天来临，大汗淋漓自然少不了，由于个人体质不同，汗多汗少会有...

早上怎么喝水最健康？

放久的开水和纯净水　　开水久置以后，其中含氮的有机物会不断被...

热门点击排行

发朋友圈对老公彻底失望的心情说说，吐槽失败的婚姻文案人生坎坷

BMI体重指数计算公式是什么

资讯分类导航

热点

行业

大健康

泰然生活