音频数据在现代数据处理和多模态应用中具有越来越重要的地位。Supametas.AI 提供了直观且高效的本地音频导入功能,帮助用户轻松将音频数据整合到数据集中进行后续处理。本文将逐步介绍从任务创建到数据导入的整个流程。
1. 创建新任务
首先,在数据集详情页中选择“导入数据来源”中的本地音频导入选项,然后点击“新建任务”按钮。
- 任务命名: 为任务输入一个不超过 20 个字符的名称,这将帮助您在任务列表中快速识别和管理任务。
2. 上传本地音频文件
完成任务命名后,进入音频文件上传阶段:
- 上传方式:
- 通过拖拽文件到上传区域,或点击上传按钮选择本地音频文件。
- 支持文件格式:
- 平台支持
.mp3
和.WAV
格式的音频文件。
- 平台支持
- 文件限制:
- 每个任务最多可上传 50 个文件;
- 每个文件大小不得超过 200MB。
- 提示:
- 请确保同一任务中上传的文件内容相似,以便后续参数获取和输出处理更为准确。
3. 任务设置
任务设置阶段与其他导入任务类似,主要目的是确保系统能够正确解析和处理上传的音频数据:
- 根据音频文件类型选择合适的解析方式。
- 配置必要的字段信息,确保数据能够被准确提取。
4. 获取参数
在这一环节,您需要配置系统如何从音频内容中提取关键信息,常见的默认字段包括:
- 时间轴: 系统会尝试从音频内容中提取各个片段的时间信息。
- 文本详情: 通过语音识别技术,系统将提取音频中的对话或描述文本。
- 文本语言: 系统还会检测并记录音频中的语言类型。
如果需要对某些特定数据进行分类,可以启用自定义字段:
- 添加自定义字段时,请使用全英文输入字段名称,并提供详细描述以提高抓取准确性。
5. 输出设置
配置完获取参数后,下一步是设置输出方式,以决定抓取到的数据将如何保存和导出:
- 输出格式选择:
- JSON 格式: 适合后续 API 程序调用处理。
- Markdown 格式: 更有利于构建知识库和文档展示。
6. 保存或立即执行任务
最后,您可以根据实际需求选择任务执行方式:
- 保存并稍后执行:
- 将任务保存到任务列表中,待后续手动启动。
- 立即执行任务:
- 如果配置无误且准备就绪,点击“立即执行任务”按钮,系统将开始处理上传的音频文件,并将提取的数据导入指定的数据集中。
通过直观的任务创建、文件上传、参数获取和输出设置流程,帮助用户高效整合和处理音频数据,为多模态数据处理和智能应用奠定坚实基础。