偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

Le Chat全方面對標ChatGPT,歐洲AI新貴窮追不舍

人工智能 新聞
Mistral AI只是想做歐洲版的OpenAI?

最近幾個月,由谷歌和 Meta 前研究人員建立的歐洲的 AI 初創(chuàng)公司 Mistral AI 有些躁動不安。

他們接連發(fā)布了好些個開源模型,覆蓋不同的領域,包含號稱「世界上最優(yōu)秀」的 OCR 模型、「對標 Claude」的多模態(tài)模型、首個推理大模型 Magistral 以及兩天前發(fā)布的「全球最佳」的開源語音模型 Voxtral。

這樣似乎也很難讓這位歐洲 AI「新貴」感到滿意,他們還想在應用層面好好地卷一卷 OpenAI。

他們將 Le Chat 再一次升級,引入了一些強大的新功能,使其更強大、更直觀,也更有趣,在功能上幾乎全方位對標 ChatGPT。

image.png

Le Chat 的新功能

  • 深度研究模式:即使是復雜主題,也能快速生成結構化的研究報告。
  • 語音模式:使用我們的新 Voxtral 模型與 Le Chat 對話,而不是用鍵盤輸入。
  • 原生多語言推理:借助我們的推理模型 ——Magistral,獲取深思熟慮的答案。
  • 項目管理:將您的對話組織到內容豐富的文件夾中。
  • 高級圖像編輯,在 Le Chat 中直接進行,與 Black Forest Labs 合作。

Le Chat 新功能宣傳片

研究模式可將 Le Chat 轉變?yōu)橐粋€協(xié)調的研究助手,能夠規(guī)劃、明確需求、搜索和綜合信息。提出一個有深度的問題,它會將其分解,收集可靠的資料,并構建一個結構清晰、有參考文獻支持且易于理解的報告。

它由工具增強型深度研究 Agent 驅動,但設計得簡單、透明且真正有幫助,仿佛與一個組織良好的研究伙伴合作。

Mistral AI 也在官網展示了一些用例。深度研究模式能夠追蹤市場趨勢、撰寫商業(yè)策略書、做個人計劃以及最重要的、進行學術研究。

image.png

語音模式可以像和人聊天一樣與 Le Chat 交流 —— 無需打字。你可以在散步時頭腦風暴、在處理雜事時快速獲取答案或轉錄會議內容。它由 Mistral 新的語音輸入模型 Voxtral 驅動,專為自然、低延遲的語音識別而構建,能跟上用戶的工作速度。

但目前 Le Chat 僅支持語音轉文字的輸入,該功能并非實時語音對話。

所以,跟電子助手聊天的功能依舊沒有實現,更別提 Grok 4 Ani 那樣的數字伴侶了。

圖像編輯功能方面,可以通過「移除物體」或「將我放置在另一個城市」等簡單提示來創(chuàng)建并編輯圖像。模型支持轉換場景,同時保留角色和細節(jié)。這有助于保證編輯的一致性:可以保持人物、物體和設計元素在圖像之間的不會變得認不出來。

圖像編輯這塊,Le Chat 似乎做得出人意料的好。網友在論壇分享了使用體驗,認為 Le Chat 做得比 OpenAI 更好。

「OpenAI 的模型在編輯時會改變整個圖像,導致無關區(qū)域出現細節(jié)錯誤。(Le Chat)似乎完美地保留了與查詢無關的圖像部分,并選擇性地應用編輯,這令人印象深刻!」

image.png

網友上傳了一張家庭辦公室的照片,并提出了以下提示:「修復照片底部略微撕裂的灰色面板,讓它們看起來像全新的」,編輯結果非常令人滿意。

image.png

image.png

上圖為原始圖像,下圖為編輯后圖像

對于這些新功能,我們的讀者想必已經非常熟悉。在這一次的大更新之后,Le Chat 在功能上基本實現了與 ChatGPT 等行業(yè)領先的產品保持一致。

最近 Mistral AI 的動作確實讓人看到了歐洲在大模型領域保持追趕的勢頭。對此,網友們表達了對 Mistral 快速追趕的興奮。

image.png

image.png

值得分享的是,Le Chat 在法語中意為「貓」,而 Mistral AI 的主頁底部就有一只像素貓咪,Mistral AI 圖標也形似一只貓貓頭,非??蓯?。

image.png

Mistral AI 的語音識別模型

7 月 15 日,Mistral AI 發(fā)布了全新的語音識別模型 Voxtral,號稱是「全球最佳(且開源)」的語音識別模型。

image.png

Voxtral 在語音轉寫方面全面超越了 Whisper large-v3,當前領先的開放源代碼語音轉寫模型。它在所有任務中都擊敗了 GPT-4o mini Transcribe 和 Gemini 2.5 Flash,并在英語短形式和 Mozilla Common Voice 上取得了最先進的結果,超越了 ElevenLabs Scribe,展示了其強大的多語言能力。

image.png

Voxtral 3B 和 Voxtral 24B 模型不僅僅具備語音轉錄功能,還具備以下能力:

  • 超長上下文理解:支持最長 32k token 的上下文,轉錄最長達 30 分鐘音頻,理解可達 40 分鐘;
  • 內置問答與摘要功能:無需將語音識別與語言模型串聯,即可直接針對音頻內容提問或生成結構化摘要;
  • 原生多語種支持:具備自動語言識別功能,在全球主流語言(如英語、西班牙語、法語、葡萄牙語、印地語、德語、荷蘭語、意大利語等)中均達到業(yè)內領先表現,助力團隊以單一系統(tǒng)服務全球用戶;
  • 從語音直接觸發(fā)函數調用:可根據用戶的語音意圖直接觸發(fā)后端函數、工作流或 API 調用,無需中間解析步驟,實現語音到系統(tǒng)指令的無縫轉換;
  • 強大的文本理解能力:延續(xù)其語言模型基礎(Mistral Small 3.1)在文本處理方面的高性能表現。
責任編輯:張燕妮 來源: 機器之心
相關推薦

2010-03-19 10:52:28

谷歌黑客Google

2025-02-08 08:50:00

2024-11-19 12:17:15

2024-02-27 18:45:11

聊天機器人ChatGPT

2009-09-15 17:35:56

BSM

2025-04-15 07:30:00

AICIO影子AI

2010-07-01 15:06:23

SNMP服務配置

2011-09-05 18:39:41

2011-09-05 17:05:03

2010-09-01 10:08:20

DHCP服務器

2017-08-06 11:48:24

2012-04-23 10:35:24

51CTO技術周刊

2023-12-21 15:58:38

2015-03-20 13:20:11

PHP框架全方面了解PHP

2010-05-13 17:49:57

2010-01-19 13:27:41

交換機端口

2010-01-14 10:43:11

交換機端口級聯

2022-12-16 15:37:15

2023-07-10 21:30:57

2025-05-06 06:37:40

點贊
收藏

51CTO技術棧公眾號