偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

51CTO首頁(yè)

AI.x社區(qū)

軟考社區(qū)

免費(fèi)課

企業(yè)培訓(xùn)

鴻蒙開(kāi)發(fā)者社區(qū)

信創(chuàng)認(rèn)證

公眾號(hào)矩陣

移動(dòng)端

視頻課免費(fèi)課排行榜短視頻直播課軟考學(xué)堂

全部課程軟考信創(chuàng)認(rèn)證華為認(rèn)證廠商認(rèn)證 IT技術(shù)PMP項(xiàng)目管理免費(fèi)題庫(kù)

在線學(xué)習(xí)

文章資源問(wèn)答課堂專(zhuān)欄直播

51CTO

鴻蒙開(kāi)發(fā)者社區(qū)

51CTO技術(shù)棧

51CTO官微

51CTO學(xué)堂

51CTO博客

CTO訓(xùn)練營(yíng)

鴻蒙開(kāi)發(fā)者社區(qū)訂閱號(hào)

51CTO軟考

51CTO學(xué)堂APP

51CTO學(xué)堂企業(yè)版APP

鴻蒙開(kāi)發(fā)者社區(qū)視頻號(hào)

51CTO軟考題庫(kù)

AI.x社區(qū)

登錄/注冊(cè)
51CTO

中國(guó)優(yōu)質(zhì)的IT技術(shù)網(wǎng)站

51CTO博客

專(zhuān)業(yè)IT技術(shù)創(chuàng)作平臺(tái)

51CTO學(xué)堂

IT職業(yè)在線教育平臺(tái)

Anthropic 升級(jí)版 Claude 3.5 Sonnet 模型，像人一樣操控電腦？

穿越時(shí)空111

發(fā)布于 2024-10-25 13:56

瀏覽

0收藏

在人工智能的創(chuàng)新之路上，Anthropic 公司再次成為焦點(diǎn)，其推出的升級(jí)版 Claude 3.5 Sonnet 模型引發(fā)了廣泛關(guān)注與熱議。一個(gè)核心問(wèn)題擺在我們面前：它真的能夠像人一樣操控電腦嗎？

Anthropic 升級(jí)版 Claude 3.5 Sonnet 模型，像人一樣操控電腦？-AI.x社區(qū)

一、模型發(fā)展與新特性亮相

Claude 3.5 Sonnet 模型有著清晰的發(fā)展脈絡(luò)。2024 年 6 月 21 日首次推出時(shí)，它就憑借在編碼、視覺(jué)和自然語(yǔ)言理解能力等方面的出色表現(xiàn)嶄露頭角，在基準(zhǔn)測(cè)試中超越了諸多競(jìng)爭(zhēng)對(duì)手。而 2024 年 10 月 22 日推出的升級(jí)版更是帶來(lái)了令人期待的新特性。

Anthropic 升級(jí)版 Claude 3.5 Sonnet 模型，像人一樣操控電腦？-AI.x社區(qū)

其中最引人矚目的當(dāng)屬“Computer Use”功能。這一功能的出現(xiàn)，使得 Claude 3.5 Sonnet 模型具備了前所未有的能力——可以像人類(lèi)用戶一樣操作計(jì)算機(jī)。它能夠理解并執(zhí)行諸如移動(dòng)光標(biāo)、點(diǎn)擊按鈕、輸入文本等操作指令，通過(guò)屏幕觀察獲取信息，進(jìn)而與各種軟件和應(yīng)用進(jìn)行交互。這意味著，理論上它可以幫助用戶完成一系列復(fù)雜的電腦操作任務(wù)，從簡(jiǎn)單的數(shù)據(jù)錄入到復(fù)雜的多步驟流程處理，如在線填寫(xiě)冗長(zhǎng)的表格、精準(zhǔn)搜索特定數(shù)據(jù)、提交格式規(guī)范的報(bào)告等。

二、編程能力與性能提升

在編程領(lǐng)域，升級(jí)版 Claude 3.5 Sonnet 模型展現(xiàn)出了強(qiáng)大的實(shí)力提升。在 SWE - Bench Verified 測(cè)試中，其性能從原來(lái)的 33.4%大幅躍升至 49.0%，成功超越了包括 OpenAI O1 - preview 等在內(nèi)的所有公開(kāi)可用模型。這一成績(jī)的取得，不僅體現(xiàn)了模型在編碼準(zhǔn)確性上的進(jìn)步，更預(yù)示著它在智能體編碼、工具使用任務(wù)等方面將發(fā)揮更大的作用。

Anthropic 升級(jí)版 Claude 3.5 Sonnet 模型，像人一樣操控電腦？-AI.x社區(qū)

早期客戶反饋也充分證實(shí)了這一提升的價(jià)值。GitLab 在針對(duì) DevSecOps 任務(wù)的測(cè)試中發(fā)現(xiàn)，該模型推理能力顯著增強(qiáng)（在不同用例中提升幅度高達(dá) 10%），且沒(méi)有增加延遲，非常適合為多步驟軟件開(kāi)發(fā)流程提供支持。Cognition 利用其進(jìn)行自主 AI 評(píng)估，在編碼、規(guī)劃和問(wèn)題解決能力方面相比之前版本有了大幅改進(jìn)。The Browser Company 在將該模型用于自動(dòng)化基于網(wǎng)絡(luò)的工作流程時(shí)，也指出 Claude 3.5 Sonnet 的表現(xiàn)超越了他們此前測(cè)試過(guò)的所有模型。

三、實(shí)際應(yīng)用與行業(yè)探索

諸多企業(yè)已經(jīng)敏銳地察覺(jué)到了 Claude 3.5 Sonnet 模型的潛力，并開(kāi)始積極探索其應(yīng)用可能性。Asana、Canva、Cognition、DoorDash、Replit 和 The Browser Company 等公司走在了前列。例如，Replit 正在利用 Claude 3.5 Sonnet 的電腦操控和 UI 導(dǎo)航能力，為其 Replit Agent 產(chǎn)品開(kāi)發(fā)一項(xiàng)關(guān)鍵功能，該功能可在應(yīng)用構(gòu)建過(guò)程中對(duì)其進(jìn)行評(píng)估。

然而，我們也必須清醒地認(rèn)識(shí)到，盡管該模型具備了像人一樣操控電腦的潛力，但目前其應(yīng)用仍處于探索階段，存在一定的局限性。在實(shí)際使用過(guò)程中，模型的操作速度和準(zhǔn)確性還有待進(jìn)一步提高。例如，它觀察屏幕的方式類(lèi)似于快速翻閱畫(huà)冊(cè)，通過(guò)連續(xù)截圖并拼接來(lái)獲取信息，而非像人類(lèi)一樣實(shí)時(shí)感知連續(xù)的視頻流，這就可能導(dǎo)致它錯(cuò)過(guò)一些短暫出現(xiàn)的動(dòng)作或通知，從而影響任務(wù)執(zhí)行的準(zhǔn)確性和效率。

四、安全性與可靠性考量

隨著模型具備操控電腦的能力，安全性和可靠性成為了至關(guān)重要的問(wèn)題。一方面，人們擔(dān)心模型在訪問(wèn)個(gè)人電腦文件和使用網(wǎng)絡(luò)瀏覽器時(shí)，可能會(huì)導(dǎo)致隱私泄露、數(shù)據(jù)安全受到威脅。另一方面，人工智能模型本身的可靠性也面臨挑戰(zhàn)，例如模型可能會(huì)出現(xiàn)錯(cuò)誤的操作指令解讀，進(jìn)而引發(fā)系統(tǒng)故障或數(shù)據(jù)錯(cuò)誤。

為了應(yīng)對(duì)這些潛在風(fēng)險(xiǎn)，Anthropic 公司采取了一系列積極措施。他們開(kāi)發(fā)了新的分類(lèi)器，用于識(shí)別模型何時(shí)在進(jìn)行電腦操控操作以及是否存在潛在危害。同時(shí)，在模型的開(kāi)發(fā)過(guò)程中，也對(duì)其進(jìn)行了針對(duì)災(zāi)難性風(fēng)險(xiǎn)的評(píng)估，確保其符合公司制定的負(fù)責(zé)任擴(kuò)展政策中的 ASL - 2 標(biāo)準(zhǔn)。

五、模型的潛力與未來(lái)展望

盡管存在諸多挑戰(zhàn)，但升級(jí)版 Claude 3.5 Sonnet 模型無(wú)疑為人工智能領(lǐng)域開(kāi)辟了新的發(fā)展方向。它代表了人工智能從單純的信息處理向與物理世界更深入交互的轉(zhuǎn)變，為未來(lái)的智能辦公、自動(dòng)化流程處理等提供了新的想象空間。

隨著技術(shù)的不斷發(fā)展和改進(jìn)，我們有理由相信，Claude 3.5 Sonnet 模型在電腦操控方面的能力將不斷完善，其應(yīng)用場(chǎng)景也將不斷拓展。但在這個(gè)過(guò)程中，我們必須始終保持謹(jǐn)慎態(tài)度，在充分發(fā)揮其潛力的同時(shí)，確保其安全、可靠、可控，以實(shí)現(xiàn)人工智能與人類(lèi)社會(huì)的和諧共生。未來(lái)，我們期待看到更多的創(chuàng)新應(yīng)用從這個(gè)模型中誕生，同時(shí)也希望行業(yè)能夠共同努力，制定出更加完善的規(guī)范和標(biāo)準(zhǔn)，引導(dǎo)人工智能技術(shù)朝著造福人類(lèi)的方向穩(wěn)健發(fā)展。

總之，Anthropic 升級(jí)版 Claude 3.5 Sonnet 模型在像人一樣操控電腦方面已經(jīng)邁出了重要的一步，但前方的道路依然充滿挑戰(zhàn)與機(jī)遇。我們將持續(xù)關(guān)注其發(fā)展動(dòng)態(tài)，見(jiàn)證人工智能在這一領(lǐng)域的不斷演進(jìn)。

本文轉(zhuǎn)載自??小兵的AI視界??，作者：小兵 ????

標(biāo)簽

贊

收藏

回復(fù)

舉報(bào)

回復(fù)

相關(guān)推薦

開(kāi)源大模型AI代理操作系統(tǒng)：像Windos一樣，操控AI代理

Aceryt ? 4846瀏覽 ? 0回復(fù)
模塊化RAG：RAG新范式，像樂(lè)高一樣搭建

大語(yǔ)言模型論文跟蹤 ? 4703瀏覽 ? 0回復(fù)
最強(qiáng)AI程序員砸飯碗：84秒跑通代碼，像人一樣思考！團(tuán)隊(duì)僅5人

Crystalcxt ? 3493瀏覽 ? 0回復(fù)
必須為孩子存下來(lái)的提示詞，像玩RPG游戲一樣學(xué)習(xí)

ermulong ? 4025瀏覽 ? 0回復(fù)
像藝術(shù)家一樣畫(huà)畫(huà)：通過(guò)構(gòu)圖、繪畫(huà)和潤(rùn)色用擴(kuò)散模型生成復(fù)雜場(chǎng)景

angel ? 3640瀏覽 ? 0回復(fù)
TOT(Tree of Thought) | 讓GPT-4像人類(lèi)一樣思考

arnoldzhw ? 4609瀏覽 ? 0回復(fù)
超級(jí)Agent：像人一樣操控電腦！

PaperAgent ? 4031瀏覽 ? 0回復(fù)
Claude 3.5超預(yù)期炸場(chǎng)！編程能力超o1，像人類(lèi)一樣操作電腦，開(kāi)啟Agent新時(shí)代！

51CTO技術(shù)棧 ? 3887瀏覽 ? 0回復(fù)
Anthropic AI的Claude 3.5，讓機(jī)器更懂你

Halo咯咯 ? 3548瀏覽 ? 0回復(fù)
Gemini Exp 1114：有史以來(lái)最好的大模型！擊敗 o1-Preview + Claude 3.5 Sonnet！

老蛀蟲(chóng) ? 3509瀏覽 ? 0回復(fù)
AI像人一樣操控電腦：多模態(tài)AI Agents和屏幕交互新范式

Baihai_IDP ? 3819瀏覽 ? 0回復(fù)
GPT-4和GPT-4V能否像人類(lèi)一樣進(jìn)行抽象推理

lintoms ? 3208瀏覽 ? 0回復(fù)
谷歌發(fā)布雙思維AI Agent：像人類(lèi)一樣思考，重大技術(shù)突破！

Aceryt ? 3230瀏覽 ? 0回復(fù)
Meta楊立昆引燃全民大討論：美政府有些人被洗腦了，監(jiān)管讓開(kāi)源變得像非法一樣！

51CTO技術(shù)棧 ? 3399瀏覽 ? 0回復(fù)
讓模型像人一樣思考

zhcs333 ? 3390瀏覽 ? 0回復(fù)
像Sora一樣，用物理模擬方式生成視頻

Aceryt ? 3278瀏覽 ? 0回復(fù)
LLM-Reasoner：讓任何大模型都能像DeepSeek R1一樣深入思考

PyTorch研習(xí)社 ? 3303瀏覽 ? 0回復(fù)
Hugging Face 推出 AI Sheets，讓你像用 Excel 一樣用大模型處理數(shù)據(jù)

Halo咯咯 ? 5082瀏覽 ? 0回復(fù)
讓AI像人一樣動(dòng)手！大模型是怎么學(xué)會(huì)使用工具的？

AI探索時(shí)代 ? 586瀏覽 ? 0回復(fù)

穿越時(shí)空111

這個(gè)用戶很懶，還沒(méi)有個(gè)人簡(jiǎn)介

帖子

聲望

粉絲

關(guān)注

最近發(fā)布

Ling-1T：萬(wàn)億參數(shù)的高效推理非思考模型 1天前發(fā)布
DeepSeek-OCR：開(kāi)啟OCR 2.0時(shí)代，智能文檔處理新標(biāo)桿 1天前發(fā)布

熱門(mén)推薦

10分鐘搞定PPT！ALLWEONE開(kāi)源Presentation-AI，一鍵生成+智能配圖，打工人直接下班 0回復(fù)

語(yǔ)音技術(shù)新突破：Ming-UniAudio 一模多能，理解生成編輯全搞定！ 0回復(fù)

別再怪AI“聽(tīng)不懂人話”了，90%的返工和錯(cuò)誤，都錯(cuò)在你下達(dá)指令的第一句話 0回復(fù)

阿里新一代企業(yè)級(jí)多 AI 智能體開(kāi)發(fā)框架 AgentScope 技術(shù)架構(gòu)全解析 0回復(fù)

Deepseek發(fā)布最新OCR模型在實(shí)測(cè)中展現(xiàn)出驚人效率，僅用15秒便將百頁(yè)P(yáng)DF完整轉(zhuǎn)換為Markdown格式 0回復(fù)

上一篇：人工智能新高度：GLM-4-Plus，智譜AI打造媲美GPT-4o的基座大模型

下一篇： Unsloth揭秘：如何將模型微調(diào)效率提升2-5倍

社區(qū)精華內(nèi)容

目錄

<sub id="ovc6q"></sub>

<sub id="ovc6q"></sub>

<cite id="ovc6q"></cite>