在数据清洗与处理的过程中,数据集扮演着非常重要的角色。对于使用 Supametas.AI 云服务的用户来说,数据集不仅仅是存储数据的空间,更是管理和调用多模态大模型 API 的基础。
1. 数据集概述
在 Supametas.AI 平台上,每个数据集都是一个独立的存储空间,用户可以在这里存放经过清洗后的数据。创建数据集是开始使用云服务的第一步,您可以在平台主页面看到已创建的数据集,并通过点击 “+ Click to create a dataset” 按钮进入数据集创建向导。
2. 创建数据集的前期准备
在开始创建数据集前,请确保您已经准备好多模态大模型 API。目前平台支持使用 OpenAI-gpt4o 的多模态模型,您可以通过 OpenAI API Keys 获取所需的 API 密钥。同时,也可以选择第三方的 OpenAI 服务提供商。
3. 设置向导步骤详解
在创建数据集的过程中,您将依次完成以下配置项:
3.1 输入数据集名称
- 要求: 为新的数据集设置一个名称,名称长度限制为 20 个字符以内。
- 提示: 名称应简洁明了,便于后续管理与识别。
3.2 添加数据集介绍(可选)
- 要求: 您可以为数据集添加一个简短的介绍,介绍内容限制为 50 个字符以内。
- 建议: 介绍可以包含数据集用途、数据来源或其它相关信息。
3.3 选择模型类型
在“模型设置”区域,您需要决定使用哪种类型的模型:
- 系统内置模型: 使用平台默认配置的模型,但其额度有限,用完后将无法继续使用。
- 配置外部模型: 推荐自行配置外部模型(如 OpenAI/OneAPI),可以更灵活地控制使用量和费用。
3.4 API 配置(针对外部模型)
如果选择使用外部模型,您需要配置以下信息:
- API KEY: 输入您获取的 API 密钥。
- BaseUrl: 填写 API 的基础 URL 地址。
- 渠道选择: 从下拉列表中选择对应的 API 渠道,例如 OpenAI。
- 模型选择: 根据需要选择具体的模型版本,例如 gpt-4-turbo。
3.5 保存配置并创建数据集
- 操作: 完成以上设置后,点击页面底部的“下一步”按钮进行保存。
- 验证: 系统会自动校验您填写的 API 配置是否正确,若有错误将提示您重新输入;配置正确后,即可自动创建数据集。
温馨提示: 当前数据集使用的是您配置的 API 模型,每次创建或修改数据集时均可指定不同的 API 模型,从而更好地控制用量和消耗费用。对于系统内置模型,因额度有限,建议尽可能使用您自己的 API,如有特殊需求,也可通过邮件联系 Supametas.AI 定制额度(Email: [email protected])。
创建数据集是使用 Supametas.AI 云服务的第一步,也是后续数据清洗、元数据导入等操作的基础。通过本文的详细讲解,希望能帮助您顺利完成数据集的创建,并对 API 配置等关键步骤有更清晰的认识。无论是初学者还是有经验的用户,都能快速上手,充分利用 Supametas.AI 提供的多模态大模型服务。