数据导入是数据清洗和处理的重要环节。在 Supametas.AI 平台上,无论是文本、图片、音频还是视频,只要是需要清洗处理的原始数据,都可以通过导入功能纳入数据集进行管理。本文将为您详细解读如何导入元数据,并简单介绍任务管理与进度查看的操作步骤。
1. 导入元数据
在您创建数据集之后,就可以将各类原始数据导入该数据集进行后续清洗处理。平台不仅支持从 API 导入,还支持多种文件格式及数据来源的直接导入,让数据处理变得更加灵活与高效。
2. 选择导入方式
在导入页面,您可以根据数据来源选择合适的导入方式,包括但不限于:
-
从 API 导入:
- 适用于具备开发能力的用户,通过调用 API 接口将数据导入。
- 详细配置请参考相关 API 文档。
-
从网页导入:
- 支持以
https://
开头的网页数据抓取,适合直接从互联网采集数据。
- 支持以
-
从本地文本导入:
- 支持
.docx
、.pdf
、.txt
、.md
、.json
等文件格式,方便导入各种文档数据。
- 支持
-
从音频导入:
- 支持
.mp3
、.wav
等音频文件,适合音频数据的处理。
- 支持
-
从图片导入:
- 支持
.png
、.jpg
格式的图片文件,便于图像数据的管理。
- 支持
-
从视频导入:
- 支持
.mov
、.mp4
、.mpv
等视频文件,助您快速整合视频数据。
- 支持
选择合适的导入方式不仅能够确保数据以正确格式进入数据集,还能提高后续清洗和处理的效率。
3. 筛选和管理任务
为了更好地管理导入任务,Supametas.AI 提供了灵活的任务筛选功能,帮助您快速定位和管理任务:
-
任务状态筛选:
- 根据任务状态(如“未开始”、“正在导入”、“已完成”、“导入失败”)快速查找目标任务。
-
搜索任务:
- 通过输入任务名称快速定位特定任务,方便管理大量任务时的查找操作。
这种高效的任务管理机制,确保您能及时了解每个任务的状态,便于在数据导入过程中作出相应调整。
4. 查看导入进度
导入页面会实时显示所有任务的进度,帮助您全面掌控数据导入流程。主要功能包括:
-
开始按钮 (▶️):
- 启动已配置但尚未开始的导入任务。启动后,系统会按照预设规则自动抓取和导入数据。
-
停止按钮 (⏸️):
- 用于中断正在进行中的任务,适用于发现配置错误或需要临时暂停任务时。停止后任务状态将显示为“已停止”。
-
删除按钮 (❌️):
- 永久删除任务及其相关上传数据。请注意,删除操作不可逆,使用前请确保任务不再需要。
通过这些直观的操作按钮,您可以随时调整和控制数据导入任务,确保整个数据处理过程顺畅高效。
导入元数据是 Supametas.AI 云服务的重要环节。通过灵活选择数据导入方式,以及高效的任务管理与实时进度查看功能,您可以轻松掌控数据清洗全过程。