你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

Azure OpenAI 服务中的新增功能有哪些

本文汇总了 Azure OpenAI 的最新版本和主要文档更新。

2024 年 5 月

GPT-4 Turbo 模型正式发布 (GA)

GPT-4 Turbo 的最新 GA 版本是:

  • gpt-4版本:turbo-2024-04-09

这是以下预览版模型的替代品:

  • gpt-4版本:1106-Preview
  • gpt-4版本:0125-Preview
  • gpt-4版本:vision-preview

OpenAI 与 Azure OpenAI GPT-4 Turbo GA 模型之间的差异

  • OpenAI 的最新 0409 turbo 模型的版本支持所有推理请求的 JSON 模式和函数调用。
  • Azure OpenAI 的最新 turbo-2024-04-09 的版本目前不支持在使用图像(视觉)输入发出推理请求时使用 JSON 模式和函数调用。 基于文本的输入请求(没有 image_url 和内联图像的请求)支持 JSON 模式和函数调用。

与 gpt-4 vision-preview 的差异

  • gpt-4 版本 turbo-2024-04-09 不支持将 Azure AI 的特定 Vision 增强功能与 GPT-4 Turbo with Vision 集成。 这包括光学字符识别 (OCR)、对象接地、视频提示以及改进的图像数据处理。

GPT-4 Turbo 预配的托管可用性

  • gpt-4版本:turbo-2024-04-09 可用于标准部署和预配部署。 目前,此模型的预配版本不支持图像/视觉推理请求。 此模型的预配部署仅接受文本输入。 标准模型部署同时接受文本和图像/视觉推理请求。

区域可用性

有关模型区域可用性的信息,请参阅标准预配部署的模型矩阵。

部署 GPT-4 Turbo with Vision GA

若要从 Studio UI 部署 GA 模型,请选择 GPT-4,然后从下拉菜单中选择 turbo-2024-04-09 版本。 gpt-4-turbo-2024-04-09 模型的默认配额将与 GPT-4-Turbo 的当前配额相同。 请参阅区域配额限制

2024 年 4 月

现在,两个新区域(美国东部 2 和瑞士西部)支持微调

现在可以进行微调并支持:

美国东部 2

  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

瑞士西部

  • babbage-002
  • davinci-002
  • gpt-35-turbo (0613)
  • gpt-35-turbo (1106)
  • gpt-35-turbo (0125)

请查看模型页面,获取有关每个地区模型可用性和微调支持的最新信息。

多轮次聊天训练示例

微调现在支持多轮次聊天训练示例

GPT-4 (0125) 适用于 Azure OpenAI On Your Data

现在可以在可用区域中将 GPT-4 (0125) 模型与 Azure OpenAI On Your Data 配合使用。

2024 年 3 月

Azure OpenAI Studio 中的风险和安全监视

Azure OpenAI Studio 现在为使用内容筛选器配置的每个部署提供风险和安全仪表板。 使用它可检查筛选活动的结果。 然后,可以调整筛选器配置,以更好地满足业务需求并满足负责任 AI 原则。

使用风险和安全监视

基于自有数据的 Azure OpenAI 更新

2024-02-01 正式发布 (GA) API 已发布

这是最新的 GA API 版本,是以前的2023-05-15 GA 版本的替代版本。 此版本增加了对最新 Azure OpenAI GA 功能(例如,Whisper、DALLE-3、微调、数据等)的支持。

仍以预览版提供的功能(例如,助手、文本转语音(TTS))- 数据数据源上的某些功能仍需要预览 API 版本。 有关详细信息,请查看API 版本生命周期指南

Whisper 正式发布 (GA)

Whisper 语音转文本模型现在是 REST 和 Python 的正式发布。 客户端库 SDK 目前仍以公共预览版提供。

按照快速入门试用 Whisper。

DALL-E 3 正式发布 (GA)

DALL-E 3 映像生成模型现已正式发布,适用于 REST 和 Python。 客户端库 SDK 目前仍以公共预览版提供。

按照快速入门试用 DALL-E 3。

对 DALL-E 3 的新区域支持

现在,除了SwedenCentral之外,还可以在East USAustraliaEastAzure 区域中使用 Azure OpenAI 资源访问 DALL-E 3。

模型弃用和停用

我们添加了一个页面用于跟踪 Azure OpenAI 服务中的模型弃用和停用。 此页面提供有关当前可用、已弃用和已停用模型的信息。

2024-03-01-preview API 已发布

2024-03-01-preview 具有与 2024-02-15-preview 相同的功能,并为嵌入添加了两个新参数:

  • encoding_format 允许指定在 floatbase64 中生成嵌入的格式。 默认为 float
  • dimensions 允许设置输出嵌入的数量。 此参数仅在新的第三代嵌入模型中受支持:text-embedding-3-largetext-embedding-3-small。 通常,从计算、内存和存储的角度来看,更大的嵌入成本更高。 调整维度数量的功能让你可以更好地控制总体成本和性能。 OpenAI 1.x Python 库的所有版本都不支持 dimensions 参数,为了利用此参数,我们建议升级到最新版本:pip install openai --upgrade

如果你当前正在使用预览版 API 来利用最新功能,我们建议参考 API 版本生命周期一文来跟踪当前 API 版本的支持时间。

更新到 GPT-4-1106-Preview 升级计划

原定于 2024 年 3 月 8 日进行的从 gpt-4 1106-Preview 到 gpt-4 0125-Preview 的部署升级将不再发生。 设置为“自动更新为默认版本”和“过期时升级”的 gpt-4 版本 1106-Preview 和 0125-Preview 部署将在模型稳定版本发布后开始升级。

有关升级过程的详细信息,请参阅模型页

2024 年 2 月

GPT-3.5-turbo-0125 模型可用

此模型进行了各种改进,包括提高响应请求格式的准确度,修复导致非英语函数调用的文本编码问题的 bug。

有关模型区域可用性和升级的信息,请参阅模型页面

第三代嵌入模型可用

  • text-embedding-3-large
  • text-embedding-3-small

在测试中,OpenAI 报告显示,大型和小型第三代嵌入模型在 MIRACL 基准中提供了更好的平均多语言检索性能,同时仍在 MTEB 基准中保持了比第二代 text-embedding-ada-002 模型更好的英语任务性能。

有关模型区域可用性和升级的信息,请参阅模型页面

GPT-3.5 Turbo 配额合并

为了简化不同版本的 GPT-3.5-Turbo 模型(包括 16k)之间的迁移,我们将所有 GPT-3.5-Turbo 配额合并为一个配额值。

  • 已批准增加配额的任何客户都将拥有反映之前增加的合并总配额。

  • 任何当前所有模型版本的总使用量低于默认值的客户都将默认获得新的合并总配额。

GPT-4-0125-preview 模型已可用

gpt-4 模型版本 0125-preview 目前在美国东部、美国中北部和美国中南部区域的 Azure OpenAI 服务中可用。 部署了 gpt-4 版本 1106-preview 的客户将在未来几周内自动升级到 0125-preview

有关模型区域可用性和升级的信息,请参阅模型页面

助手 API 公共预览版

Azure OpenAI 现在支持为 OpenAI 的 GPT 提供支持的 API。 使用 Azure OpenAI 助手(预览版),可以通过自定义说明和高级工具(如代码解释器和自定义函数)创建根据需求定制的 AI 助手。 若要了解更多信息,请参阅以下文章:

OpenAI 文本转语音声音公共预览版

Azure OpenAI 服务现在支持使用 OpenAI 声音的文本转语音 API。 从提供的文本中获取 AI 生成的语音。 要了解详细信息,请参阅概述指南并尝试快速入门

注意

Azure AI 语音还支持 OpenAI 文本转语音声音。 要了解详细信息,请参阅通过 Azure OpenAI 服务或通过 Azure AI 语音实现 OpenAI 文本转语音声音指南。

新的微调功能和模型支持

针对基于自有数据的 Azure OpenAI 的新区域支持

现在,可在以下 Azure 区域使用基于自有数据的 Azure OpenAI:

  • 南非北部

基于自有数据的 Azure OpenAI 已正式发布

2023 年12 月

基于自有数据的 Azure OpenAI

  • 对基于自有数据的 Azure OpenAI 的完整 VPN 和专用终结点支持,包括对存储帐户、Azure OpenAI 资源和 Azure AI 搜索服务资源的安全支持。
  • 有关通过使用虚拟网络和专用终结点保护数据来安全地使用基于自有数据的 Azure OpenAI 的新文章。

具有视觉的 GPT-4 Turbo 现已推出

Azure OpenAI 服务中具有视觉的 GPT-4 Turbo 现以公共预览版提供。 具有视觉的 GPT-4 Turbo 是 OpenAI 开发的一个大型多模态模型 (LMM),可以分析图像,并为有关图像的问题提供文本回应。 它结合了自然语言处理和视觉理解。 借助增强模式,你可以使用 Azure AI 视觉功能从图像中生成其他见解。

  • 使用 Azure OpenAI 操场在无代码体验中探索 GPT-4 Turbo with Vision 的功能。 在快速入门指南中了解详细信息。
  • 使用 GPT-4 Turbo with Vision 的视觉增强功能现已在 Azure OpenAI 操场中可用,其中包括对光学字符识别和对象接地的支持,对“添加数据”的图像支持,以及对视频提示的支持。
  • 使用 REST API 直接调用聊天 API。
  • 区域可用性目前仅限 SwitzerlandNorthSwedenCentralWestUSAustraliaEast
  • 详细了解具有视觉的 GPT-4 Turbo 的已知局限性和其他常见问题解答

2023 年 11 月

基于自有数据的 Azure OpenAI 中新的数据源支持

已发布 GPT-4 Turbo 预览版和 GPT-3.5-Turbo-1106

两个模型都是 OpenAI 的最新版本,并包含以下改进指令:JSON 模式可重现的输出和并行函数调用。

  • GPT-4 Turbo 预览版具有 128,000 个令牌的最大上下文窗口,可以生成 4,096 个输出令牌。 它拥有截至 2023 年 4 月的最新训练数据和知识。 此模型处于预览状态,不建议用于生产用途。 稳定版本可用后,此预览模型的所有部署将会自动更新。

  • GPT-3.5-Turbo-1106具有 16,385 个令牌的最大上下文窗口,可以生成 4,096 个输出令牌。

有关模型区域可用性的信息,请参阅模型页面

模型具有其唯一的每区域配额分配

DALL-E 3 公共预览版

DALL-E 3 是 OpenAI 的最新映像生成模型。 它在图像中呈现文本时具有增强的图像质量、更复杂的场景和改进的性能。 它还附带了更多纵横比选项。 可通过 OpenAI Studio 和 REST API 使用 DALL-E 3。 OpenAI 资源必须位于 SwedenCentral Azure 区域中。

DALL-E 3 包括内置的提示重写,以增强图像、减少偏差并增加自然变体。

按照快速入门试用 DALL-E 3。

负责任 AI

  • 扩展了客户可配置性:所有 Azure OpenAI 客户现在都可以为仇恨、暴力、性行为和自我伤害等类别配置所有严重性级别(低、中、高),包括仅筛选高严重性内容。 配置内容筛选器

  • 所有 DALL-E 模型中的内容凭据:来自所有 DALL-E 模型的 AI 生成的图像现在都包含一个数字凭据,用于披露内容是由 AI 生成的。 显示图像资产的应用程序可以利用开源的内容真实性计划 SDK 在 AI 生成的图像中显示凭据。 Azure OpenAI 中的内容凭据

  • 新的 RAI 模型

    • 越狱风险检测:越狱攻击是一种用户提示,旨在激发生成式 AI 模型表现出其所训练的行为,以避开或打破系统消息中设置的规则。 越狱风险检测模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在用户提示时运行。
    • 受保护的材料文本:受保护的材料文本将描述可由大型语言模型输出的已知文本内容(例如,歌词、文章、食谱和所选网络内容)。 受保护的材料文本模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在 LLM 完成时运行。
    • 受保护的材料代码:受保护的材料代码将描述与公共存储库中的一组源代码相匹配的源代码,这些源代码可由大型语言模型输出,而无需适当引用源存储库。 受保护的材料代码模型是可选的(默认关闭),可在注释和筛选模型中使用。 它在 LLM 完成时运行。

    配置内容筛选器

  • 阻止列表:客户现在可以通过在其筛选器中创建自定义阻止列表来快速进一步自定义针对提示和完成的内容筛选器行为。 自定义阻止列表允许筛选器对包含各种模式(例如特定术语或正则表达式模式)的自定义列表执行操作。 除了自定义阻止列表,我们还提供了 Microsoft 不雅内容阻止列表(英语)。 使用阻止列表

2023 年 10 月

新的微调模型(预览版)

基于自有数据的 Azure OpenAI

  • 用于确定检索的文档数和严格性的新自定义参数
    • 严格性设置设置将文档分类为与查询相关的阈值。
    • 检索的文档设置指定用于生成响应的数据索引中评分最高的文档数。
  • 可以在 Azure OpenAI Studio 中看到数据引入/上传状态。
  • 支持 Blob 容器的专用终结点和 VPN。

2023 年 9 月

GPT-4

GPT-4 和 GPT-4-32k 现已可供所有 Azure OpenAI 服务客户使用。 客户不再需要申请候补名单即可使用 GPT-4 和 GPT-4-32k(受限访问注册要求仍适用于所有 Azure OpenAI 模型)。 可用性可能因区域而异。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

GPT-3.5 Turbo 指令

Azure OpenAI 服务现在支持 GPT-3.5 Turbo 指令模型。 此模型的性能与 text-davinci-003 相当,并可搭配完成 API 使用。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

耳语公共预览版

Azure OpenAI 服务现在支持由 OpenAI 的耳语模型提供支持的语音转文本 API。 根据你提供的语音音频获取 AI 生成的文本。 若要了解详细信息,请查看快速入门

注意

Azure AI 语音还通过批量听录 API 支持 OpenAI 的耳语模型。 若要了解详细信息,请查看创建批量听录指南。 请查看什么是耳语模型?,详细了解何时使用 Azure AI 语音与 Azure OpenAI 服务。

新区域

  • 现也在瑞典中部和瑞士北部区域推出了 Azure OpenAI。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

区域配额限值提升

  • 某些模型和区域提高到了最大默认配额限值。 通过将工作负载迁移到这些模型和区域,可以利用更高的每分钟令牌数 (TPM)。

2023 年 8 月

基于自有数据的 Azure OpenAI(预览版)更新

2023 年 7 月

支持函数调用

嵌入输入数组增加

新区域

  • Azure OpenAI 现在也在加拿大东部、美国东部 2、日本东部和美国中北部区域中可用。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

2023 年 6 月

使用基于数据的 Azure OpenAI(预览版)

  • 基于自有数据的 Azure OpenAI 现在以预览版提供,你能够与 OpenAI 模型(如 GPT-35-Turbo 和 GPT-4)聊天,并收到根据你的数据做出的响应。

新版本的 gpt-35-turbo 和 gpt-4 型号

  • gpt-35-turbo(版本 0613)
  • gpt-35-turbo-16k(版本 0613)
  • gpt-4(版本 0613)
  • gpt-4-32k(版本 0613)

英国南部

  • Azure OpenAI 现已在英国南部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

配置筛选与注释(预览版)

  • 如何使用 Azure OpenAI 服务配置内容筛选器
  • 启用注释,以在基于 GPT 的补全和聊天补全调用过程中查看内容筛选类别和严重性信息。

Quota

2023 年 5 月

Java 与 JavaScript SDK 支持

  • 新的 Azure OpenAI 预览版 SDK 产品/服务支持 JavaScriptJava

Azure OpenAI 聊天补全正式发布 (GA)

  • 正式发布支持:
    • 聊天补全 API 版本 2023-05-15
    • GPT-35-Turbo 模型。
    • GPT-4 模型系列。

如果当前正在使用 2023-03-15-preview API,建议迁移到 GA 2023-05-15 API。 如果当前使用的是 API 版本 2022-12-01,此 API 仍为正式版,但不包括最新的聊天补全功能。

重要

将当前版本的 GPT-35-Turbo 模型与补全终结点结合使用的功能仍为预览版。

法国中部

  • Azure OpenAI 现已在法国中部地区推出。 请查看“模型”页面,获取有关每个地区模型可用性的最新信息。

2023 年 4 月

  • DALL-E 2 公共预览版。 Azure OpenAI 服务现在支持由 OpenAI 的 DALL-E 2 模型提供支持的图像生成 API。 根据你提供的描述性文本获取 AI 生成的图像。 若要了解详细信息,请查看快速入门。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请

  • 自定义模型的非活动部署现在将在 15 天后删除;模型将仍可用于重新部署。 如果自定义(微调)模型是在超过十五 (15) 天前部署的且在此期间未对其进行补全或聊天补全调用,则将自动删除部署(针对该部署,不会产生进一步的托管费用)。 基础自定义模型仍将可用,并且可以随时重新部署。 若要了解详细信息,请查看操作指南文章

2023 年 3 月

  • GPT-4 系列模型现已在 Azure OpenAI 上以预览版提供。 要请求访问权限,现有的 Azure OpenAI 客户可以通过填写此表单来提出申请。 上述模型目前在美国东部和美国中南部区域中可用。

  • 3 月 21 日在预览版中发布了适用于 GPT-35-Turbo 和 GPT-4 模型的新聊天完成 API。 要了解详细信息,请查看更新的快速入门操作指南文章

  • GPT-35-Turbo 预览版。 要了解详细信息,请查看操作指南文章

  • 提高了微调的训练限制:对于所有模型,最大训练作业大小(训练文件中的标记数)x(时期数)为 20 亿个标记数。 此外,我们还将最大训练作业时间从 120 小时延长到 720 小时。

  • 将其他用例添加到现有访问权限。  以前,添加新用例的过程要求客户重新应用到服务。 现在,我们将发布一个新流程,允许你快速添加新用例以使用服务。 此过程遵循 Azure AI 服务中既定的受限访问流程。 现有客户可以在此处证明任何和所有新用例。 请注意,每当你想要将服务用于最初未申请的新用例时,都需要这样做。

2023 年 2 月

新增功能

更新

  • 默认启用内容筛选。

以下主题的新文章:

新的培训课程:

2023 年 1 月

新功能

  • 服务 GA。 Azure OpenAI 服务现已正式发布。

  • 新模型 - 添加了最新的文本模型:text-davinci-003(美国东部、西欧)、text-ada-embeddings-002(美国东部、美国中南部、西欧)

2022 年 12 月

新增功能

  • OpenAI 中的最新模型。 Azure OpenAI 提供对所有最新模型(包括 GPT-3.5 系列)的访问权限。

  • 新的 API 版本 (2022-12-01)。 此更新包括几个请求的增强功能,其中包括 API 响应中的令牌使用情况信息、改进的文件错误消息、在微调创建数据结构上与 OpenAI 保持一致,以及对后缀参数的支持以允许微调作业的自定义命名。 ​

  • 每秒请求数的上限更高。 对于非 Davinci 模型,限制为 50。 对于 Davinci 模型,限制为 20。

  • 微调部署速度更快。 在 10 分钟内部署 Ada 和 Curie 微调模型。

  • 训练限制值更高:对于 Ada、Babbage 和 Curie,限制为 4,000 万个训练令牌。 对于 Davinci,限制为 1,000 万。

  • 请求修改滥用和误用数据日志记录和人工评审的过程。 目前,该服务记录请求/响应数据,以便进行滥用和误用检测,确保这些功能强大的模型不会被滥用。 但是,许多客户有严格的数据隐私和安全要求,需要对他们的数据进行更高级别的控制。 为了支持这些用例,我们将发布一个新流程,供客户修改内容筛选策略或关闭低风险用例的滥用日志记录。 此过程遵循 Azure AI 服务中既定的受限访问流程,现有 OpenAI 客户可在此处申请

  • 客户管理的密钥 (CMK) 加密。 CMK 通过提供客户自己的用于存储训练数据和自定义模型的加密密钥,让客户能够更好地控制在 Azure OpenAI 服务中管理其数据。 客户管理的密钥 (CMK)(也称为创建自己的密钥,BYOK)在创建、轮换、禁用和撤销访问控制方面可提供更大的灵活性。 此外,你还可以审核用于保护数据的加密密钥。 有关详细信息,请参阅静态加密文档

  • 密码箱支持

  • SOC-2 符合性

  • 通过 Azure 资源运行状况、成本分析以及指标和诊断设置进行日志记录和诊断

  • 工作室改进。 对工作室工作流进行了大量可用性改进,包括 Azure AD 角色支持,可以控制团队中的哪个成员有权创建微调的模型和部署。

变更(中断性)

微调创建 API 请求已更新,以匹配 OpenAI 的架构。

预览 API 版本:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "hyperparams": { ​
        "batch_size": 4,​
        "learning_rate_multiplier": 0.1,​
        "n_epochs": 4,​
        "prompt_loss_weight": 0.1,​
    }​
}

API version 2022-12-01:

{​
    "training_file": "file-XGinujblHPwGLSztz8cPS8XY",​
    "batch_size": 4,​
    "learning_rate_multiplier": 0.1,​
    "n_epochs": 4,​
    "prompt_loss_weight": 0.1,​
}

默认情况下,内容筛选暂时处于关闭状态。 Azure 内容审核的工作方式与 Azure OpenAI 不同。 Azure OpenAI 在生成调用期间运行内容筛选器,以检测有害或滥用的内容,并从响应中筛选它们。 了解详细信息​

这些模型将在 2023 年第 1 季度重新启用,并默认开启。 ​

客户操作

后续步骤

详细了解为 Azure OpenAI 提供支持的基础模型