偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<s id="xeowq"><var id="xeowq"></var></s>

<blockquote id="xeowq"><samp id="xeowq"></samp></blockquote>

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

賬號(hào)設(shè)置退出

GPT-4o加錢(qián)能變快！新功能7秒完成原先23秒的任務(wù)

作者：量子位 2024-11-06 15:20:00

人工智能新聞

這個(gè)功能叫做“預(yù)測(cè)輸出”（Predicted Outputs），在它的加持之下，GPT-4o可以比原先快至多5倍。

OpenAI出了個(gè)新功能，直接讓ChatGPT輸出的速度原地起飛！

這個(gè)功能叫做“預(yù)測(cè)輸出”（Predicted Outputs），在它的加持之下，GPT-4o可以比原先快至多5倍。

以編程為例，來(lái)感受一下這個(gè)feel：

為啥會(huì)這么快？用一句話(huà)來(lái)總結(jié)就是：

跳過(guò)已知內(nèi)容，不用從頭開(kāi)始重新生成。

因此，“預(yù)測(cè)輸出”就特別適合下面這些任務(wù)：

在文檔中更新博客文章
迭代先前的響應(yīng)
重寫(xiě)現(xiàn)有文件中的代碼

而且與OpenAI合作開(kāi)發(fā)這個(gè)功能的FactoryAI，也亮出了他們?cè)诰幊倘蝿?wù)上的數(shù)據(jù)：

從實(shí)驗(yàn)結(jié)果來(lái)看，“預(yù)測(cè)輸出”加持下的GPT-4o響應(yīng)時(shí)間比之前快了2-4倍，同時(shí)保持高精度。

并且官方還表示：

原先需要70秒完成的編程任務(wù)，現(xiàn)在只需要20秒。

值得注意的是，目前“預(yù)測(cè)輸出”功能僅支持GPT-4o和GPT-4o mini兩個(gè)模型，且是以API的形式。

對(duì)于開(kāi)發(fā)者而言，這可以說(shuō)是個(gè)利好消息了。

網(wǎng)友們?cè)诰€實(shí)測(cè)

消息一出，眾多網(wǎng)友也是坐不住了，反手就是實(shí)測(cè)一波。

例如Firecrawl創(chuàng)始人Eric Ciarla就用“預(yù)測(cè)輸出”體驗(yàn)了一把將博客文章轉(zhuǎn)為SEO（搜索引擎優(yōu)化）的內(nèi)容，然后他表示：

速度真的超級(jí)快。
它就像在API調(diào)用中添加一個(gè)預(yù)測(cè)參數(shù)一樣簡(jiǎn)單。

，時(shí)長(zhǎng)00:20

另一位網(wǎng)友則是在已有的代碼之上，“喂”了一句Prompt：

change the details to be random pieces of text.
將詳細(xì)信息更改為隨機(jī)文本片段。

來(lái)感受一下這個(gè)速度：

也有網(wǎng)友曬出了自己實(shí)測(cè)的數(shù)據(jù)：

總而言之，快，是真的快。

怎么做到的？

對(duì)于“預(yù)測(cè)輸出”的技術(shù)細(xì)節(jié)，OpenAI在官方文檔中也有所介紹。

OpenAI認(rèn)為，在某些情況下，LLM的大部分輸出都是提前知道的。

如果你要求模型僅對(duì)某些文本或代碼進(jìn)行細(xì)微修改，就可以通過(guò)“預(yù)測(cè)輸出”，將現(xiàn)有內(nèi)容作為預(yù)測(cè)輸入，讓延遲明顯降低。

例如，假設(shè)你想重構(gòu)一段 C# 代碼，將 Username 屬性更改為 Email

/// <summary>
/// Represents a user with a first name, last name, and username.
/// </summary>
public class User
{
    /// <summary>
    /// Gets or sets the user's first name.
    /// </summary>
    public string FirstName { get; set; }


    /// <summary>
    /// Gets or sets the user's last name.
    /// </summary>
    public string LastName { get; set; }


    /// <summary>
    /// Gets or sets the user's username.
    /// </summary>
    public string Username { get; set; }
}

你可以合理地假設(shè)文件的大部分內(nèi)容將不會(huì)被修改（例如類(lèi)的文檔字符串、一些現(xiàn)有的屬性等）。

通過(guò)將現(xiàn)有的類(lèi)文件作為預(yù)測(cè)文本傳入，你可以更快地重新生成整個(gè)文件。

import OpenAI from "openai";


const code = `
/// <summary>
/// Represents a user with a first name, last name, and username.
/// </summary>
public class User
{
    /// <summary>
    /// Gets or sets the user's first name.
    /// </summary>
    public string FirstName { get; set; }


    /// <summary>
    /// Gets or sets the user's last name.
    /// </summary>
    public string LastName { get; set; }


    /// <summary>
    /// Gets or sets the user's username.
    /// </summary>
    public string Username { get; set; }
}
`;


const openai = new OpenAI();


const completion = await openai.chat.completions.create({
  model: "gpt-4o",
  messages: [
    {
      role: "user",
      content: "Replace the Username property with an Email property. Respond only with code, and with no markdown formatting."
    },
    {
      role: "user",
      content: code
    }
  ],
  prediction: {
    type: "content",
    content: code
  }
});


// Inspect returned data
console.log(completion);

使用“預(yù)測(cè)輸出”生成tokens會(huì)大大降低這些類(lèi)型請(qǐng)求的延遲。

不過(guò)對(duì)于“預(yù)測(cè)輸出”的使用，OpenAI官方也給出了幾點(diǎn)注意事項(xiàng)。

首先就是我們剛才提到的僅支持GPT-4o和GPT-4o-mini系列模型。

其次，以下API參數(shù)在使用預(yù)測(cè)輸出時(shí)是不受支持的：

n
logprobs
presence_penalty
frequency_penalty
audio
modalities
max_completion_tokens
tools

除此之外，在這份文檔中，OpenAI還總結(jié)了除“預(yù)測(cè)輸出”之外的幾個(gè)延遲優(yōu)化的方法。

包括“加速處理token”、“生成更少的token”、“使用更少的輸入token”、“減少請(qǐng)求”、“并行化”等等。

文檔鏈接放在文末了，感興趣的小伙伴可以查閱哦~

One More Thing

雖然輸出的速度變快了，但OpenAI還有一個(gè)注意事項(xiàng)引發(fā)了網(wǎng)友們的討論：

When providing a prediction, any tokens provided that are not part of the final completion are charged at completion token rates.
在提供預(yù)測(cè)時(shí)，所提供的任何非最終完成部分的tokens都按完成tokens費(fèi)率收費(fèi)。

有網(wǎng)友也曬出了他的測(cè)試結(jié)果：

未采用“預(yù)測(cè)輸出”：5.2秒，0.1555美分
采用了“預(yù)測(cè)輸出”：3.3秒，0.2675美分

嗯，快了，也貴了。

OpenAI官方文檔：https://platform.openai.com/docs/guides/latency-optimization#use-predicted-outputs

責(zé)任編輯：張燕妮來(lái)源：量子位

模型數(shù)據(jù)

點(diǎn)贊

51CTO技術(shù)棧公眾號(hào)

業(yè)務(wù)
速覽

媒體

51CTO CIOAge HC3i

社區(qū)

51CTO博客鴻蒙開(kāi)發(fā)者社區(qū) AI.x社區(qū)

教育

51CTO學(xué)堂精培企業(yè)培訓(xùn) CTO訓(xùn)練營(yíng)

<blockquote id="0ofrl"></blockquote>

<em id="0ofrl"><samp id="0ofrl"></samp></em>

<strike id="0ofrl"><rt id="0ofrl"><form id="0ofrl"></form></rt></strike><wbr id="0ofrl"></wbr>

<wbr id="0ofrl"><var id="0ofrl"></var></wbr>

<blockquote id="0ofrl"></blockquote>