Supametas.AI Logo
Return to blog list 返回博客列表
教程

1. 如何在 Supametas.AI 云服务中创建数据集

本文详细解析了在 Supametas.AI 云服务中创建数据集的全流程,从数据集的基本概念、命名规则到 API 模型配置等步骤,帮助您快速上手

Supametas's avatar
Supametas · 2025-02-22
Share to X 分享到 X
Share to LinkedIn 分享到领英
Share to Facebook
Share to Hacker News

在数据清洗与处理的过程中,数据集扮演着非常重要的角色。对于使用 Supametas.AI 云服务的用户来说,数据集不仅仅是存储数据的空间,更是管理和调用多模态大模型 API 的基础。

1. 数据集概述

在 Supametas.AI 平台上,每个数据集都是一个独立的存储空间,用户可以在这里存放经过清洗后的数据。创建数据集是开始使用云服务的第一步,您可以在平台主页面看到已创建的数据集,并通过点击 “+ Click to create a dataset” 按钮进入数据集创建向导。

2. 创建数据集的前期准备

在开始创建数据集前,请确保您已经准备好多模态大模型 API。目前平台支持使用 OpenAI-gpt4o 的多模态模型,您可以通过 OpenAI API Keys 获取所需的 API 密钥。同时,也可以选择第三方的 OpenAI 服务提供商。

3. 设置向导步骤详解

Create a new dataset.png

在创建数据集的过程中,您将依次完成以下配置项:

3.1 输入数据集名称

  • 要求: 为新的数据集设置一个名称,名称长度限制为 20 个字符以内。
  • 提示: 名称应简洁明了,便于后续管理与识别。

3.2 添加数据集介绍(可选)

  • 要求: 您可以为数据集添加一个简短的介绍,介绍内容限制为 50 个字符以内。
  • 建议: 介绍可以包含数据集用途、数据来源或其它相关信息。

3.3 选择模型类型

在“模型设置”区域,您需要决定使用哪种类型的模型:

  • 系统内置模型: 使用平台默认配置的模型,但其额度有限,用完后将无法继续使用。
  • 配置外部模型: 推荐自行配置外部模型(如 OpenAI/OneAPI),可以更灵活地控制使用量和费用。

3.4 API 配置(针对外部模型)

如果选择使用外部模型,您需要配置以下信息:

  • API KEY: 输入您获取的 API 密钥。
  • BaseUrl: 填写 API 的基础 URL 地址。
  • 渠道选择: 从下拉列表中选择对应的 API 渠道,例如 OpenAI。
  • 模型选择: 根据需要选择具体的模型版本,例如 gpt-4-turbo。

3.5 保存配置并创建数据集

  • 操作: 完成以上设置后,点击页面底部的“下一步”按钮进行保存。
  • 验证: 系统会自动校验您填写的 API 配置是否正确,若有错误将提示您重新输入;配置正确后,即可自动创建数据集。

温馨提示: 当前数据集使用的是您配置的 API 模型,每次创建或修改数据集时均可指定不同的 API 模型,从而更好地控制用量和消耗费用。对于系统内置模型,因额度有限,建议尽可能使用您自己的 API,如有特殊需求,也可通过邮件联系 Supametas.AI 定制额度(Email: [email protected])。

创建数据集是使用 Supametas.AI 云服务的第一步,也是后续数据清洗、元数据导入等操作的基础。通过本文的详细讲解,希望能帮助您顺利完成数据集的创建,并对 API 配置等关键步骤有更清晰的认识。无论是初学者还是有经验的用户,都能快速上手,充分利用 Supametas.AI 提供的多模态大模型服务。

不要再在数据处理上浪费时间

开始您的SaaS版本试用,免费,0门槛,开箱即用

不要再在数据处理上浪费时间
开始您的SaaS版本试用,免费,0门槛,开箱即用
开始使用

私有化部署

我们已经了解到企业的数据隐私需求,除SaaS版外,Docker部署版本也在紧锣密布的筹备

私有化部署
我们已经了解到企业的数据隐私需求,除SaaS版外,Docker部署版本也在紧锣密布的筹备
即将到来…
Supametas.AI Logo - Footer
Supametas.AI 致力于成为行业领先的LLM数据结构化处理开发平台
0
© 2025 kazudata, Inc. 版权所有