Fellou AI 瀏覽器 2.0來了!架構(gòu)重大更新!很快取消邀請碼機制!生產(chǎn)級復雜任務(wù)成功率超80%
作者 | 謝揚
在漫威電影宇宙中,Jarvis 是鋼鐵俠托尼·斯塔克的私人人工智能助手,幾乎無處不在,隨時隨地為托尼提供支持和幫助。Jarvis 不僅僅是一個簡單的語音助手,它深入融入了托尼的生活,管理他的日常事務(wù),控制他的高科技設(shè)備,甚至在戰(zhàn)斗中提供實時的戰(zhàn)術(shù)建議。Jarvis 的存在讓托尼能夠?qū)W⒂诟匾氖虑椋驗樗烙幸粋€可靠的助手在背后支持他。
在過去的一個月里,我們對 Fellou 瀏覽器進行了深層次的架構(gòu)調(diào)整和全面優(yōu)化。這一系列的改進不僅提升了性能和穩(wěn)定性,還為用戶帶來了更流暢的體驗。今天,我們非常自豪地宣布,F(xiàn)ellou 2.0 已經(jīng)向我們夢想中的類 Jarvis 通用智能體邁出了重要的一步。
我們希望 Fellou 不僅僅是一個工具,而是一個可以融入用戶日常生活的智能伙伴。我們的愿景是讓 Fellou 成為用戶生活中不可或缺的一部分,隨時隨地為用戶提供幫助和支持,而不僅僅是一個飄在云端的虛擬助手。
從這篇文章中,你將了解:
- 我們?yōu)槭裁匆?Agentic Browser 為中心構(gòu)建夢想中的 Jarvis?
- Fellou Browser 2.0:開啟 AI 的批量化生產(chǎn)
- Fellou 2.0 獲得成功的關(guān)鍵 —— Eko 2.0,一個關(guān)鍵的開源 Browseruse 基礎(chǔ)設(shè)施
- Fellou 的下一步計劃
一、Why Agentic Browser?
Agentic Browser 代表一種以瀏覽器為載體的通用智能體,不僅能訪問互聯(lián)網(wǎng),更能夠理解用戶的需求,并自動拆解復雜的任務(wù)。其設(shè)計初衷是為了讓智能體在擁有用戶完整上下文的前提下為用戶交付更好的結(jié)果,我們希望徹底改變用戶與網(wǎng)絡(luò)和計算機互動的方式。
Fellou 依賴其獨特的 Browser + Workflow + Agent 架構(gòu),開創(chuàng)了 Agentic Browser 這一新品類,打造了一個像「自動駕駛汽車」一樣可以「自動沖浪」的瀏覽器智能體。
想象一下,你不再需要在多個應用程序之間切換來完成一項任務(wù)。Fellou 可以為你自動化整個流程,從信息收集、數(shù)據(jù)分析,到最終的任務(wù)執(zhí)行和結(jié)果交付。無論是進行市場調(diào)研、報告生成,還是制作音樂、生成 3D 設(shè)計環(huán)境、制作 Logo,F(xiàn)ellou 都能為你提供端到端的解決方案。
Fellou 的目標是讓用戶能因為 Fellou 的存在而找到幸福,這種幸福是釋放雙手的幸福,解放重復勞動的幸福,脫困于格子間、電腦前和寫字樓的幸福 —— 但并非不勞動。人們會從勞動中獲得滿足感,F(xiàn)ellou 的存在是讓人們?nèi)プ鲇懈喽喟桶返墓ぷ?,而那些消磨精神、耐心和體力的工作都可以留給 Fellou。
圖片
時間對于每個人來說都是不可再生資源,讓人有時間且有做自己的自由 —— 是 Fellou 的初心。
這也是我們設(shè)計開發(fā) Fellou,以及堅持 Agentic Browser 方向的最基礎(chǔ)原因 —— 我們相信 AI 的發(fā)展會加速更多人的創(chuàng)造需求,而不是減少人們的工作機會,人類和 AI 是協(xié)作與成就的關(guān)系而非對立的關(guān)系,而 Fellou 作為一個瀏覽器客戶端,在用戶本地的設(shè)備里,就是那個有人們最多記憶、最多偏好、最了解用戶、無處不在、有求必應的、融入用戶生活的通用智能體。
我們帶著這份期許,為了給用戶交付更多更好的結(jié)果,完成了 Fellou 2.0 的升級。
二、Fellou Browser 2.0:開啟 AI 的批量化生產(chǎn)
總結(jié)下 2.0 的升級概要為:
- 更快:減少等待,多任務(wù)并行,交付更多;
- 更驚人:多樣任務(wù)交付,7 * 24 全天候執(zhí)行;
- 更可靠:生產(chǎn)級多樣化場景覆蓋,成功率大幅提升,從 31% 到 80%。
三、更快:減少等待,多任務(wù)并行,交付更多
得益于大量、全面、多維度優(yōu)化,F(xiàn)ellou 2.0 在速度上取得了突破性進展,相比 Fellou 1.x 的版本,F(xiàn)ellou 在不同任務(wù)的執(zhí)行速度上提升了 1.3 - 1.5 倍,相比較某些通用 Agent,我們在不同任務(wù)上皆有非常大的速度優(yōu)勢,如:
任務(wù) 1:生成一個 3D minecraft 的場景,里面有埃菲爾鐵塔。
Fellou 耗時:1 分 20 秒
Fellou 交付物:
https://chat.fellou.ai/sites/3d-minecraft-eiffel-tower-NdSWZGi_
某通用 Agent 耗時:4 分 30 秒
任務(wù) 2:把“Fellou 是世界首個 Agentic Browser” 轉(zhuǎn)化成摩斯密碼,然后生成一個音頻,用 MP3 格式。
Fellou 耗時:1 分 30 秒
Fellou 交付物:
某通用 Agent 耗時:2 分 30 秒
任務(wù) 3:用 HTML 做一個貪吃蛇游戲
Fellou 耗時:1 分 20 秒
Fellou 交付物:
https://chat.fellou.ai/sites/snake-game-classic-retro-fun-aiz5HkaM
某通用 Agent 耗時:6 分鐘
Marketing 任務(wù)(跨應用生產(chǎn)力 Workflow):搜索 Reddit/ Twitter / Youtube / Tiktok 上近 1 個星期發(fā)布的關(guān)于瀏覽器的帖子,在帖子下發(fā)布評論安利 Fellou AI。
Fellou 成功執(zhí)行。
某些通用 Agent 執(zhí)行失敗,沒有能將生成的推廣信息分別發(fā)布到 Twitter、Linkedin 、等平臺中,只生成了推廣信息。
同時,我們優(yōu)化了多任務(wù)并行的功能,使得用戶能同時給 Fellou 下達多個任務(wù),大大提升用戶的多線程工作能力:
任務(wù) A:根據(jù){@Youtube AI 相關(guān)視頻},創(chuàng)建為一個網(wǎng)站,網(wǎng)站內(nèi)總結(jié)這段視頻的核心知識,內(nèi)容包括視頻的主要觀點、他是如何解釋 AI Agents 和 Agentic Reasoning 的,以及這在 AI 發(fā)展的意義和應用趨勢。網(wǎng)站最后需要出幾個考題,來檢驗是否習得了這些知識。
任務(wù) B:將這個{@Google Sheet 賬單}作為數(shù)據(jù)源, 并生成一個賬單分析網(wǎng)站。網(wǎng)站需要可以從各個維度做自定義篩選。
注:并行任務(wù)目前仍處于 Alpha 階段,在正式版本中會大不一樣。
四、更驚人:多樣化任務(wù)交付,全天候 7 * 24 執(zhí)行
通過提供多樣化 Agent (如 Browser Agent、Coding Agent、File Agent、Shell Agent、Computer-use Agent等)協(xié)作,提供除跨應用生產(chǎn)力 Workflow 之外的文本、圖片、網(wǎng)站、PPT、CSV、Excel、Word、MP3、視頻轉(zhuǎn)語音、Logo 生成以及總結(jié) Youtube 視頻等多樣化的交付物。
音樂交付任務(wù):今天晚上我們要開 Party,大家想唱周杰倫的歌,所以幫我找?guī)资姿臒衢T歌曲,然后在中間寫點串聯(lián)和弦之類的,把這些歌串起來,最后返回串好的完整伴奏。需要鋼琴版。加點復雜音效,我喜歡實驗性音效比如 Pink Floyd,或者 Nujabes喜歡用的那些。
音頻交付任務(wù):為智能家居設(shè)備生成整一套反饋音效。
(因公眾號限制原因此任務(wù)不提供視頻)
圖片
Logo 交付任務(wù):搜索尤溪縣的建筑風格、文化和形象,幫我做一個 logo,文字:尤溪縣城市文旅,元素包含朱熹的形象,金柑的造型,八山一水一分田的山水風光形象,最好的是一個元素里體現(xiàn)三個意思。元素要少,避免復雜像徽章,背景白色扁平簡潔。中文的占比是 2x,英文是 1x,圖形是 6x。顏色嚴格控制在 2 色以內(nèi),矢量,扁平,美觀,產(chǎn)出 10 個陳幼堅的設(shè)計風格,其中一個要有 尤溪縣 的文化底蘊和形象在其中,另外一個要有劉伯溫故居的 logo 設(shè)計風格,再有一個把朱熹的頭像融入進去。
Fellou 交付物:
https://chat.fellou.ai/sites/youxi-county-urban-tourism-logo-design-bLN_gEIw
除此之外,F(xiàn)ellou 2.0 還提供了超長上下文管理,特別是監(jiān)聽類任務(wù)(如:Slack、Discord 新消息監(jiān)聽、郵件監(jiān)聽、網(wǎng)頁內(nèi)容變化監(jiān)聽)實現(xiàn)了無限步長,真正解決長流程和復雜場景的問題。
監(jiān)控 Gmail 任務(wù):監(jiān)控我的 gmail,當有用戶產(chǎn)品反饋相關(guān)的郵件時,用友好的方式回復郵件表達感謝。同時拆解用戶郵件中提到的需求和 Bug,并填充在 {airtable 的反饋表} 中。
跨境電商監(jiān)控談價任務(wù):監(jiān)控 SalesSmartly,回答用戶的問題,引導用戶完成下單,當用戶詢問價格的時候,按價格表給到報價,當用戶詢問物流時間的時候,根據(jù)物流時間表給到預計的配送時間,當用戶砍價的時候,不能低于我們的底價,預計低價持續(xù)的和用戶溝通,用戶確認訂單后立刻生成一個下單的 csv 表(包含:商品名稱 + 商品數(shù)量 + 商品的單價)。
五、更可靠:生產(chǎn)級多樣化場景覆蓋,成功率大幅提升,從 31% 到 80%
生產(chǎn)級的意思是更加貼近用戶的實際需求,更加端到端,更加無人化,更貼近“現(xiàn)實”,比如:信息填報、信息搬運、社媒運營、招聘流程閉環(huán)、跨境電商自動談單等多樣化場景應用。
1. 找人任務(wù):找到我上傳的 PDF 里面前五個的 Author,再幫我找到他們的全部背景信息和聯(lián)系方式,背景信息包括 Homepage、GoogleScholar 鏈接、Github 鏈接,聯(lián)系方式包括郵箱以及電話,你可以通過他們的 Github Repo 提交歷史 URL 和 .patch 拼接后找他們的提交 Email,以及在 contact out(www.contactout.com) 上找他們的 Email 和電話,所有的鏈接要求是完整的 URL。
受限于公眾號,以下案例無法提供視頻或 GIF,可供參考:
2. Marketing 任務(wù):找到 Twitter / Instragram / Youtube / Tiktok 上分別找到粉絲數(shù)量在 10k+ 的 20 個寵物博主,同時私信詢問她們是否可以合作推廣 A 品牌貓糧。YouTube無法私信忽略。把博主信息整理成網(wǎng)頁報告。
3. 找工作任務(wù):在 BOSS 直聘上找到最新發(fā)布的前端工程師的崗位,結(jié)合對應的崗位描述和我上傳的簡歷內(nèi)容寫一段自我介紹,并通過“立即溝通”將自我介紹發(fā)送給招聘者,發(fā)送 10 次。
以上任務(wù)還只是冰山一角,更多任務(wù)等待發(fā)現(xiàn),這來自于Eko 2.0 的新架構(gòu),在 Online-mind2web 榜單中,任務(wù)完成率從 31% 提升到了 80%。
圖片
Fellou 2.0 獲得成功的關(guān)鍵 —— Eko 2.0,一個關(guān)鍵的開源 Browseruse 基礎(chǔ)設(shè)施
圖片
基于全新 Eko 2.0 架構(gòu),任務(wù)成功率由 31% 提升至 80%(在 Online-Mind2web 基準測試中實現(xiàn) SOTA 表現(xiàn))。
Eko 的定位是一個 Browseruse 和 Computeruse 的框架,在 Eko 2.0 中,我們提供了 Multi Agent,DOM 狀態(tài)變化監(jiān)聽、Loop Tasks 管理、Workflow 規(guī)劃等多項必須的基建能力,開源 Eko 2.0 給社區(qū)的決定深深植根于我們的技術(shù)信仰,這種信仰不僅僅是對技術(shù)本身的熱愛,更是對更好的塑造 GUI Agent 未來的堅定信念。
六、Fellou 的下一步計劃
Fellou 正在加速變得更加聰明。
如果以少量總結(jié),則是:
- Fellou 很快會推出 Windows 版本;
- Fellou 很快會取消邀請碼機制;
- Fellou 的模型智能會飛快提升,將會有更豐富的交付物;
- Fellou 將持續(xù)優(yōu)化用戶體驗,體現(xiàn)在:·更快的速度,Agentic Workflow 和瀏覽器性能兩者兼?zhèn)?;·更好的交互,更完整的對話上下文感?/ 理解 / 記憶 / 多輪對話,以及更好融合 AI 能力的交互界面;·更多大家期待功能的補齊,比如遷移工具、密碼管理器等;
關(guān)于你的下一步:
- 對于未使用過 Fellou 的用戶,可訪問 fellou.ai 申請使用 Fellou,我們會持續(xù)發(fā)放邀請碼;
- 對于 Fellou 的老用戶:
- 本次升級架構(gòu)更新較大,2.0 以下的版本已不可用,打開已經(jīng)安裝好的 Fellou 將收到我們逐步推送的更新,也可以到官網(wǎng)(fellou.ai/download)手動下載最新版本;
- 目前 Fellou 2.0 仍處于內(nèi)測階段,在對話框中可使用 "Use Workflow: " 啟用最新版能力;
- 在執(zhí)行長任務(wù)時,推薦提示 Fellou 進行搜索,搜索的東西越多、提示詞越精確產(chǎn)出效果會越好;