Supametas.AI Logo
Return to blog list 返回博客列表
教程

2. 如何导入元数据到 Supametas.AI 数据集

本文详细解析在 Supametas.AI 云服务平台上创建数据集后如何导入元数据,帮助您高效掌控数据清洗过程

Supametas's avatar
Supametas · 2025-02-22
Share to X 分享到 X
Share to LinkedIn 分享到领英
Share to Facebook
Share to Hacker News

数据导入是数据清洗和处理的重要环节。在 Supametas.AI 平台上,无论是文本、图片、音频还是视频,只要是需要清洗处理的原始数据,都可以通过导入功能纳入数据集进行管理。本文将为您详细解读如何导入元数据,并简单介绍任务管理与进度查看的操作步骤。

1. 导入元数据

在您创建数据集之后,就可以将各类原始数据导入该数据集进行后续清洗处理。平台不仅支持从 API 导入,还支持多种文件格式及数据来源的直接导入,让数据处理变得更加灵活与高效。

2. 选择导入方式

Dataset.png

在导入页面,您可以根据数据来源选择合适的导入方式,包括但不限于:

  • 从 API 导入:

    • 适用于具备开发能力的用户,通过调用 API 接口将数据导入。
    • 详细配置请参考相关 API 文档。
  • 从网页导入:

    • 支持以 https:// 开头的网页数据抓取,适合直接从互联网采集数据。
  • 从本地文本导入:

    • 支持 .docx.pdf.txt.md.json 等文件格式,方便导入各种文档数据。
  • 从音频导入:

    • 支持 .mp3.wav 等音频文件,适合音频数据的处理。
  • 从图片导入:

    • 支持 .png.jpg 格式的图片文件,便于图像数据的管理。
  • 从视频导入:

    • 支持 .mov.mp4.mpv 等视频文件,助您快速整合视频数据。

选择合适的导入方式不仅能够确保数据以正确格式进入数据集,还能提高后续清洗和处理的效率。

3. 筛选和管理任务

为了更好地管理导入任务,Supametas.AI 提供了灵活的任务筛选功能,帮助您快速定位和管理任务:

  • 任务状态筛选:

    • 根据任务状态(如“未开始”、“正在导入”、“已完成”、“导入失败”)快速查找目标任务。
  • 搜索任务:

    • 通过输入任务名称快速定位特定任务,方便管理大量任务时的查找操作。

这种高效的任务管理机制,确保您能及时了解每个任务的状态,便于在数据导入过程中作出相应调整。

4. 查看导入进度

导入页面会实时显示所有任务的进度,帮助您全面掌控数据导入流程。主要功能包括:

  • 开始按钮 (▶️):

    • 启动已配置但尚未开始的导入任务。启动后,系统会按照预设规则自动抓取和导入数据。
  • 停止按钮 (⏸️):

    • 用于中断正在进行中的任务,适用于发现配置错误或需要临时暂停任务时。停止后任务状态将显示为“已停止”。
  • 删除按钮 (❌️):

    • 永久删除任务及其相关上传数据。请注意,删除操作不可逆,使用前请确保任务不再需要。

通过这些直观的操作按钮,您可以随时调整和控制数据导入任务,确保整个数据处理过程顺畅高效。

导入元数据是 Supametas.AI 云服务的重要环节。通过灵活选择数据导入方式,以及高效的任务管理与实时进度查看功能,您可以轻松掌控数据清洗全过程。

不要再在数据处理上浪费时间

开始您的SaaS版本试用,免费,0门槛,开箱即用

不要再在数据处理上浪费时间
开始您的SaaS版本试用,免费,0门槛,开箱即用
开始使用

私有化部署

我们已经了解到企业的数据隐私需求,除SaaS版外,Docker部署版本也在紧锣密布的筹备

私有化部署
我们已经了解到企业的数据隐私需求,除SaaS版外,Docker部署版本也在紧锣密布的筹备
即将到来…
Supametas.AI Logo - Footer
Supametas.AI 致力于成为行业领先的LLM数据结构化处理开发平台
0
© 2025 kazudata, Inc. 版权所有