audio / by UGK Official

Whisper Audio To Text

给定本地音视频文件,使用本机 Whisper large-v3-turbo 转写,产出可继续用于字幕优化和配音流程的 SRT/VTT/TXT/JSON。

Install

ugk task install whisper-audio-to-text

This task installs 7 files from the official manifest, including 2 script files.

Runtime input

file_path必填,本地音视频文件绝对路径。必须原样提取为路径字符串。
filePath兼容字段,等同 file_path。
language可选,Whisper 语言代码,如 ru/en/ja/zh。不填则自动识别。
task可选,transcribe 或 translate。默认 transcribe。
model可选,Whisper 模型名。默认 large-v3-turbo,模型目录固定 E:\\AII\\.cache\\whisper。

Acceptance

checktranscript.txt 存在且非空。
checktranscript.srt 存在且包含至少一个时间码。
checktranscript.vtt 存在且包含 WEBVTT。
checktranscription.json 存在且为有效 JSON。
checkwhisper-summary.json 存在且记录 inputFilePath、model、modelDir、language、task。