偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質的IT技術網站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技

發(fā)布于 2025-8-18 06:49

瀏覽

0收藏

實話實說，本來沒有這篇稿子，我并沒有太關注Baichuan-M2這個模型，因為最近開源社區(qū)太火爆了，各家都在卷。

7月份見?開源模型盤點，而8月剛過半，已經有Qwen-Image、dots.vlm1、MiniCPM-V 4.0、GLM4.5V等等等。

那么，Baichuan-M2這個垂域模型就顯得不那么驚艷了（很多人都更關心通用模型），還有百川上次開源M1已經是五六個月前了，當時在群里發(fā)AI日報，一眾小伙伴都驚訝百川還在發(fā)模型。

PS：不過我群里有個內應，說他們項目挺多的~

細節(jié)決定成敗！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

不過，因為看到極客公園采訪王小川的稿子，我對百川的這個模型又提起了興趣。同時M2在healthbench hard 上的表現也超過了32分，實屬不易。

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

https://mp.weixin.qq.com/s/BeowHiFg3otIcfEIufredw

PS：推薦大家看一下這個采訪，里面對垂域模型、領域壁壘等一些內容說的蠻好的，當然也是很多做領域大模型的人都遇到的困局、及面臨的選擇。

說回醫(yī)療大模型，其實醫(yī)療AI一直很有市場，不過真正落地有很多困難，大模型效果、幻覺、信任度等等，說實話，百川在2024年就ALL IN醫(yī)療，挺有魄力的。

關注技術本身，看了Baichuan-M2的技術報告，發(fā)現里面還是有很多細節(jié)在的，同時這也是一個做垂域模型很好的例子，在小參數下，達到甚至超越大參數模型的效果。

而我也是一直在做這樣的事情，因為落地成本真是很大的問題，只不過我在做ToB，王小川是要做ToC。

Blog：https://www.baichuan-ai.com/blog/baichuan-M2
HF：https://huggingface.co/baichuan-inc/Baichuan-M2-32B

整體流程應該涉及兩個部分Mid-Training 和 Post-Training。

Mid Training 就是向通用大模型中注入領域知識的過程，感覺說是Continue Pre-train也可以，不過Baichuan這里用了領域自約束持續(xù)預訓練方法，在維護通用模型的知識，確保保留通用任務解決能力的前提下，使訓練模型能夠獲取領域特定的知識。

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

https://arxiv.org/abs/2412.15270

高質量醫(yī)療數據、其他通用數據和數學推理數據的比例為 2:2:1 ，基模是Qwen2.5-32B模型，哈哈哈，Qwen在開源社區(qū)的含金量依舊很高。

重點在RL部分，整體流程如下：

細節(jié)決定成?。∩罡t(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

其實我們都知道RL部分獎勵機制是關鍵，其實在真實使用時找到好的獎勵很難，日常任務一般考獎勵模型，不像數學、代碼等有明確的獎勵。

M2這里設計了一個Verifier系統(tǒng)，對模型在多輪交互中的整體表現進行持續(xù)、動態(tài)的量化評估，評估診斷準確性、問診的邏輯連貫性、治療方案的合理性、溝通和共情能力以及醫(yī)學倫理等關鍵維度。

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

從M2的回答上來看，可以看出溝通和共情能力很強。大多數人，在詢問醫(yī)療問題的時候，是很焦慮的，溝通和共情就是很關鍵的內容，這也是AI醫(yī)生的關鍵所在。

因為我們需要的并不是冷冰冰的機器，我們需要可以跟我們交流的、讓我們感受到溫暖的伙伴醫(yī)生。它需要能理解我們的病情，更能讀懂我們的情緒，在解釋病因、分析檢查結果、提出治療建議時，既有專業(yè)的嚴謹，又有耐心的關懷。

做RL都知道，獎勵做的好，RL成一半！M2還采用Multi-Stage RL策略，復雜任務拆解，逐步提高模型能力。

同時最有意思的一個東西，就是AI患者模擬器，這個我真是才知道，不過這個已經是Baichuan今年1月份發(fā)的論文了。

Paper：Exploring the Inquiry-Diagnosis Relationship with Advanced Patient Simulators

AI患者模擬器可以模擬真實患者的情緒（如焦慮）、主動提問和非合作行為，最大程度還原了真實醫(yī)療場景，從而可以進一步提高整個的問診質量。

同時經過實驗發(fā)現，醫(yī)療問診和診斷是存在木桶效應的，問診質量直接決定診斷上限。同時提供4類問診動作分布分析，幫助定位醫(yī)生模型的提問短板，為模型訓練提供高質量素材。

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

然后RL的算法采用GRPO，同時做了以下修改：去除 KL 散度、Clip-higher、損失歸一化、優(yōu)勢歸一化、動態(tài)長度獎勵等。

我沒部署，直接用的官方鏈接，

https://platform.baichuan-ai.com/playground?initialmodel=Baichuan-M2

為了更貼近臨床場景，我先找了一個真實問診案例，對比了擅長醫(yī)學的 GPT-5，結果發(fā)現 M2 在信息覆蓋度和細節(jié)處理上都很突出。

細節(jié)決定成?。∩罡t(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

同樣，百川的回答像一份系患者就診指南，信息覆蓋全面，幫助患者梳理了相關情況，又引導患者高效、安全地就醫(yī)，風險提示十分明確，對潛在危險做了很好的預警。

細節(jié)決定成敗！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

很多垂域大模型一旦跳出專業(yè)范圍，就容易掉線，而 M2 在通用任務上的能力依然在線。就用了我之前常測的通用題來看看它的效果。

Prompt: 用水來兌水，得到的是濃水還是稀水

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

Prompt: 小紅有2個兄弟，3個姐妹，那么小紅的兄弟有幾個姐妹

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

Prompt：2024年年高考全國甲卷數學（文）試題

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

雖然在 RL 訓練后的表現中，回答稍微有些偏長，但邏輯性和準確性依舊可圈可點。這說明它的領域優(yōu)化并沒有犧牲掉太多通用能力，在實際落地中更具彈性和適配性。

最后想說，

想要做一個AI醫(yī)療產品，光有一個大模型當然是遠遠不夠的，

大模型只是基礎能力的起點，要真正走進臨床場景，權威醫(yī)學資料構建的底層知識庫是必不可少的，

還需要多層次的知識校驗體系，確保每一次診斷和建議都經過嚴謹驗證，減少錯誤與偏差。

只有當這些環(huán)節(jié)環(huán)環(huán)相扣，AI醫(yī)生才能既有溫度，又有精準度，既讓患者感到被理解，也能讓醫(yī)生在臨床決策中安心依賴。

這條路注定艱難，但我們依舊向前~

細節(jié)決定成??！深耕醫(yī)療的Baichuan-M2用了哪些黑科技-AI.x社區(qū)

PS：現在AI醫(yī)療產品也有不少，看看最后誰能跑出來吧~

本文轉載自????????NLP工作站????????，作者：NLP工作站

標簽

贊

收藏

回復

舉報

回復

相關推薦

【科技前沿】揭秘DeDoDe v2：如何革新關鍵點檢測技術，讓AI“眼”更明亮？

sword_hero ? 4661瀏覽 ? 0回復
ChatGLM3、Qwen、Baichuan2、ChatGPT

PaperAgent ? 7952瀏覽 ? 0回復
數據合成方法-讓模型自己說出用了哪些指令對齊數據

NLP工作站 ? 5381瀏覽 ? 0回復
數據合成方法-讓模型自己說出用了哪些指令對齊數據

NLP工作站 ? 4386瀏覽 ? 0回復
光與AI：視障玩家的《黑神話：悟空》挑戰(zhàn)

ermulong ? 3931瀏覽 ? 0回復
AI進化驚現"作弊"黑科技？

zhishan15 ? 4583瀏覽 ? 0回復
DeepSeek開源FlashMLA，小白也能看懂的GPU黑科技

Bx玩AI ? 3622瀏覽 ? 0回復
字節(jié)等發(fā)布黑科技X-Dancer：零樣本音樂驅動，真實感碾壓3D方案

angel ? 3955瀏覽 ? 0回復
騰訊&港中文發(fā)布影視后期黑科技！VideoPainter：視頻編輯修復8項SOTA!

angel ? 4005瀏覽 ? 0回復
V2Edit零訓練黑科技：指令級視頻魔法+3D場景大改，原畫質無損秒變爆款

angel ? 2645瀏覽 ? 0回復
AI Hospital(人工智能醫(yī)院)：在多智能體醫(yī)療互動模擬器中評估大模型的表現 - 阿里、華中科技等

知識圖譜科技 ? 3145瀏覽 ? 0回復
AI鏡頭控制黑科技喜提多項SOTA！浙大&上交等發(fā)布統(tǒng)一多模態(tài)視頻生成框架OmniCam

angel ? 3118瀏覽 ? 0回復
騰訊最新FlexIP黑科技：身份保持和個性化我都要！

angel ? 2422瀏覽 ? 0回復
【LLM合集】視頻創(chuàng)作黑科技！Any2Caption讓"任意條件"秒變大片，所想即所得

AIPaperDaily ? 2049瀏覽 ? 0回復
字節(jié)跳動發(fā)布AI同傳黑科技：2秒延遲實時翻譯，0樣本克隆你的聲音

算家計算 ? 3451瀏覽 ? 0回復
國產醫(yī)療增強大模型Baichuan-M2醫(yī)療能力全球登頂

算家計算 ? 1305瀏覽 ? 0回復
通俗理解RoPE、2D-RoPE、M-RoPE

大模型自然語言處理 ? 3068瀏覽 ? 0回復
7B小模型竟超越72B巨頭勇奪SOTA，北航、字節(jié)等聯合發(fā)布長視頻理解黑科技——DATE

zhangyannni ? 1602瀏覽 ? 0回復
記一次智能問答系統(tǒng)的review過程——細節(jié)決定成敗

AI探索時代 ? 497瀏覽 ? 0回復

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

DeepSeek又開源，這次是OCR模型！附論文解讀！ 2025-10-21 00:36:13發(fā)布
美團龍貓再開源LongCat-Flash-Thinking模型，細節(jié)滿滿！ 2025-09-24 07:07:05發(fā)布

熱門推薦

DeepSeek又開源，這次是OCR模型！附論文解讀！ 0回復

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術架構全解析 0回復

Deepseek發(fā)布最新OCR模型在實測中展現出驚人效率，僅用15秒便將百頁PDF完整轉換為Markdown格式 0回復

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復

上一篇：騰訊HunYuan跟阿里Qwen在開源上干起來了？

下一篇：智譜開源的GLM4.5V到底行不行？掏出祖?zhèn)鞫嗄B(tài)理解測試！

社區(qū)精華內容

目錄

<u id="vmeiy"><li id="vmeiy"></li></u>

<u id="vmeiy"><form id="vmeiy"><em id="vmeiy"></em></form></u>

<tfoot id="vmeiy"></tfoot>

<s id="vmeiy"></s>