偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

<abbr id="olipp"></abbr>

AI.x社區(qū)

軟考社區(qū)

企業(yè)培訓

鴻蒙開發(fā)者社區(qū)

信創(chuàng)認證

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創(chuàng)認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

文章資源問答課堂專欄直播

51CTO

鴻蒙開發(fā)者社區(qū)

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發(fā)者社區(qū)訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業(yè)版APP

鴻蒙開發(fā)者社區(qū)視頻號

51CTO軟考題庫

AI.x社區(qū)

登錄/注冊
51CTO

中國優(yōu)質(zhì)的IT技術網(wǎng)站

51CTO博客

專業(yè)IT技術創(chuàng)作平臺

51CTO學堂

IT職業(yè)在線教育平臺

估值超200億的AI醫(yī)生OpenEvidence已上崗：40%美國醫(yī)生在使用的通過USMLE的臨床級大模型精華

知識圖譜科技

發(fā)布于 2025-7-24 07:49

瀏覽

0收藏

摘要&前言：

近日，AI醫(yī)療公司OpenEvidence獲得了2.1億美元的B輪融資，估值飆升至35億美元（約合人民幣251億元）。OpenEvidence成立于2022年，總部位于美國邁阿密，致力于為醫(yī)生提供臨床級診斷工具。公司由Daniel Nadler創(chuàng)辦，他是一名哈佛大學經(jīng)濟學博士，也是一位非常成功的連續(xù)創(chuàng)業(yè)者。曾經(jīng)創(chuàng)立了知名AI金融公司Kensho并被標普以5.5億美元收購。

本文深入解讀通過USMLE（美國醫(yī)師執(zhí)照考試）的臨床級大模型OpenEvidence如何為醫(yī)療領域帶來革命性變革。文章詳細拆解其架構創(chuàng)新、數(shù)據(jù)飛輪、模型精調(diào)與安全可信機制，并展望這一技術范式向法律、金融、網(wǎng)絡安全等高風險領域復制的可能性。閱讀后，你將理解“以證據(jù)為本”的智能是醫(yī)療等高風險行業(yè)AI落地的未來。

1. 場景設定：凌晨2點的急診室

一位患有心房顫動且合并復雜基礎病的患者被送至急診。主治醫(yī)生面對兩種抗凝藥物的選擇，標準指南雖明確，但最新發(fā)表（僅一個月前）的研究論文提示：對于該患者特定遺傳標記，應采用另一種方案。這篇論文是當日全球新發(fā)4000篇生物醫(yī)學文獻之一，要在有限時間內(nèi)準確找到、閱讀并解釋其臨床意義，幾乎不可能。

這正是2025年各類高風險專業(yè)的普遍危機：數(shù)據(jù)淹沒，洞察匱乏。通用型大語言模型（LLM）或許能為我們提供某種“救命稻草”，但也暗藏風險。

在當前跨高風險領域的 LLM 部署浪潮中，OpenEvidence 脫穎而出，成為第一個為現(xiàn)實世界的醫(yī)療保健工作流程構建的可靠臨床推理系統(tǒng)。與依賴隨機流暢性的通用模型不同，OpenEvidence 的結構是為認識可追溯性而構建的：每個答案都基于檢索到的、經(jīng)過同行評審的證據(jù)，通過研究設計進行過濾，并通過領域微調(diào)推理引擎進行綜合。

2. OpenEvidence：醫(yī)療領域的首個可信推理系統(tǒng)

OpenEvidence以臨床現(xiàn)實工作流為導向，強調(diào)“知識溯源”，區(qū)別于依賴“流暢言辭”的通用模型。每一個答案都基于可檢索的、同行評議的證據(jù)，按研究設計過濾，并通過行業(yè)化優(yōu)化的推理引擎綜合得出。

在模擬USMLE Step 2臨床病例、多項選擇題測試中，OpenEvidence準確率超90%。雖然并非真實考場，但這些受控評測模擬了醫(yī)生在不確定環(huán)境下的決策力——成績甚至和持證醫(yī)生相當。

更核心的競爭力，其實是信息篩選和證據(jù)提取的極致效率。

3.架構創(chuàng)新：專科大模型的崛起

3.1 通用型與?？菩椭?/h3>
GPT-4、LLaMA等模型是“語言全才”，但難以勝任專業(yè)推理。例如問及具體藥物交互，通用LLM可能會“幻覺”出不存在的論文，甚至誤解重要藥理機制，給出“自信而致命”的建議。
終極分岔：用提示微調(diào)通才，還是重鑄其“神經(jīng)網(wǎng)絡”成專業(yè)選手？OpenEvidence選擇了后者。

3.2 為什么“RAG檢索增強”遠遠不夠

RAG（Retrieval-Augmented Generation）——即為LLM接入動態(tài)學術數(shù)據(jù)庫，讓它在回答問題時可檢索海量文獻。但要是“學生”根本看不懂專業(yè)論文，檢索再準也無用。例如：“A藥患者能否安全服用B藥嗎？”

檢索：RAG 系統(tǒng)正確檢索了兩份文件：藥物 B 的臨床試驗顯示出低副作用，以及一篇指出藥物 A 是 CYP3A4 酶的有效抑制劑的藥理學論文。

生成（失?。悍轮扑幏▽W碩士看到藥物B試驗呈陽性，不了解神秘的藥理學，自信地回應道：“是的，根據(jù)臨床試驗數(shù)據(jù)，藥物B總體耐受性良好。

檢索正確論文后，通用LLM卻忽視了A藥嚴重抑制B藥代謝的風險，導致毒性過量，給出錯誤判斷。這種情況下，RAG帶來了信息，但通用模型缺乏專業(yè)理解。

3.3 精調(diào)與“人類數(shù)據(jù)飛輪”

對LLM的精調(diào)不是“死記硬背”，而是通過領域數(shù)據(jù)微調(diào)其概率分布，讓推理方式趨近行業(yè)專家。

大規(guī)模高質(zhì)量“專家數(shù)據(jù)”難以依靠人工。OpenEvidence首創(chuàng)“人-機循環(huán)”數(shù)據(jù)飛輪：用強大的通用LLM先生成大批Q&A，由專家快速驗證/修正，再反哺模型精調(diào)。新一輪模型又更擅長生成高質(zhì)量數(shù)據(jù)，形成正向飛輪。

3.4 LoRA輕量精調(diào)，“多腦可插拔”

傳統(tǒng)全參精調(diào)像“錘子砸腦子”，易遺忘通識能力且算力成本驚人。OpenEvidence采用LoRA（低秩適配）——只對模型部分參數(shù)注入可訓練小矩陣，實現(xiàn)高效、可控、微損耗的領域微調(diào)。不止成本低，還可快速切換“多科專家大腦”。

技術公式：W = W? + BA（W?為原模型權重，B與A為小型自適應矩陣，通常僅需訓練總參數(shù)的0.1%）

4. 第二代架構：多智能體協(xié)作

OpenEvidence已超越RAG+精調(diào)，全面引入多智能體（Multi-Agent）協(xié)作，每個子智能體各司其職：

調(diào)度員代理（Dispatcher）：解析用戶意圖，分流到不同工作鏈條。接收初始查詢并確定用戶的意圖。這是關于治療效果、副作用或作用機制的問題嗎？它將任務路由到相應的工作流。
檢索代理（Retrieval）：多庫檢索（如PubMed、ClinicalTrials、院內(nèi)知識庫），理解各自檢索語法
摘要代理（Summarization）：將檢索到的復雜文獻抽取為結構化摘要（如受試者規(guī)模、p值、主要結論等）?
綜合代理（Synthesis）：這是核心的、經(jīng)過 LoRA 調(diào)整的“專家推理器”。它看不到完整、凌亂的文檔。它只看到 Summarizer 中干凈、結構化的摘要，使其能夠在多項研究中比較蘋果，并綜合出連貫的、基于證據(jù)的答案。只接收結構化摘要，比較多篇證據(jù)，輸出嚴謹推理結論
安全代理（Safety）：全流程末端校驗，不允許未被證實的信息或暗示

這種“模塊化?？茍F隊+專家大腦”方式，比單一大模型更穩(wěn)健、可解釋、易擴展。

5. 信任架構：合規(guī)AI與Red Team攻防

Constitutional AI（合規(guī)人工智能）先制定“憲法”原則（如不直接給診斷建議僅提供引文證據(jù)；必聲明證據(jù)局限性例如，樣本量小、非隨機試驗；碰到證據(jù)矛盾不站隊），再讓一個AI寫答案，另一個AI嚴格依照合規(guī)要求批評指正，強化安全與透明。?
專業(yè)Red Team攻擊測試組建專家“黑客團隊”，專門設計容易誘使AI出錯的測試題，持續(xù)迭代安全邊界。這也是高風險領域最有效的安全機制。?
源數(shù)據(jù)溯源每條輸出均嚴密追溯到有時戳的學術來源，杜絕“幻覺”造假，真正實現(xiàn)“以證據(jù)為依據(jù)”。?

6. 藍圖復制：法律、金融、網(wǎng)絡安全下一個風口

法律行業(yè)專有代理監(jiān)控最新判例、識別活案沖突，憲法規(guī)定嚴禁主動給出法律建議，僅可說明“某判例為約束性先例”等。?
網(wǎng)絡安全模型專精CVEs和事故日志，主動預警新威脅，如：“檢測到與Cobalt Strike相關的新C2服務器IP，已于過去24小時映射你的服務器流量?！?
金融領域對SEC公告、財報電話會轉錄精調(diào)，主動推送如“企業(yè)最新8-K披露新債務條款，可能影響并購擴張”的動態(tài)，堅守“不做投資建議”紅線。?

7. 總結：從醫(yī)學檢索問答工具到真正數(shù)字智能分身

OpenEvidence代表了企業(yè)級大模型飛躍的四個階段：

Phase 1（全才模型）：智能玩具
Phase 2（RAG）：信息搜索引擎
Phase 3（RAG+精調(diào)）：擁有專業(yè)推理力的助手
Phase 4（多智能體&憲法AI）：安全、可信、協(xié)作式專家系統(tǒng)

估值超200億的AI醫(yī)生OpenEvidence已上崗：40%美國醫(yī)生在使用的通過USMLE的臨床級大模型-AI.x社區(qū)

估值超200億的AI醫(yī)生OpenEvidence已上崗：40%美國醫(yī)生在使用的通過USMLE的臨床級大模型-AI.x社區(qū)

估值超200億的AI醫(yī)生OpenEvidence已上崗：40%美國醫(yī)生在使用的通過USMLE的臨床級大模型-AI.x社區(qū)

真正的終局，是從被動響應轉向主動預警的數(shù)字孿生體。系統(tǒng)自動追蹤海量上下文，針對你的患者、案件、網(wǎng)絡環(huán)境，主動推送關鍵信號，實現(xiàn)“危中見機”。

OpenEvidence證明了面向“高證據(jù)可追溯性”的智能已可落地——而這只會加速蔓延至每一個高風險專業(yè)。

編譯自:

??https://medium.com/@karlaortizflores/the-ai-doctor-is-in-deconstructing-the-llm-that-passed-the-medical-boards-fa608a6a256d??

作者：Karla Ortiz-Flores科技從業(yè)者，兼具講故事的靈性，關注人性連接與行業(yè)進化。

本文轉載自??知識圖譜科技??，作者：KGGPT

標簽

已于2025-7-24 07:49:36修改

贊

收藏

回復

舉報

回復

相關推薦

什么是超參數(shù)？大模型的超參數(shù)是做什么用的？超參數(shù)和大模型參數(shù)有什么關系？

AI探索時代 ? 8653瀏覽 ? 0回復
大模型訓練完成之后可以直接使用嗎？該怎么使用訓練好的大模型？

AI探索時代 ? 6781瀏覽 ? 0回復
斯坦福炒蝦團隊打造自主「AI達芬奇」，苦練神指當外科醫(yī)生

duhorse ? 3590瀏覽 ? 0回復
DuQuant：通過正交變換分散 LLM 離群值，實現(xiàn) SOTA 4bit 量化

amei2000go ? 5039瀏覽 ? 0回復
關于大模型的使用——提示詞工程

AI探索時代 ? 4968瀏覽 ? 0回復
7大頂尖AI修bug系統(tǒng)大PK，誰才是"代碼醫(yī)生"？ | 法語版BERT CamemBERT 2.0讓AI更懂"法式幽默"

sbf_2000 ? 3627瀏覽 ? 0回復
剖析BadGPT-40背后的真相：一個從GPT模型中移除護欄的模型

51CTO技術棧 ? 3132瀏覽 ? 0回復
新來的妹子不懂大模型中的token！已勸退...

丁師兄大模型 ? 7457瀏覽 ? 0回復
DeepSeek被曝估值1500億達OpenAI一半？巴黎地鐵70歲老人都在聊！

duhorse ? 4106瀏覽 ? 0回復
o1模型醫(yī)學推理驚人，超過人類醫(yī)生

Aceryt ? 3188瀏覽 ? 0回復
Anthropic 狂攬融資 35 億美元，估值達到 615 億美元；去年收入猛增10倍，近60倍估值溢價

51CTO技術棧 ? 4032瀏覽 ? 0回復
QuantAgent：通過自我改進的大語言模型尋找交易中的圣杯

靈度智能 ? 3054瀏覽 ? 0回復
大模型調(diào)參技巧—如何實現(xiàn)超參的跨模型尺度遷移

shizhi02 ? 3825瀏覽 ? 0回復
LawLLM：面向美國法律體系的法律大語言模型

AIRoobt ? 3633瀏覽 ? 0回復
怎么學習使用大模型？論大模型和汽車的關系

AI探索時代 ? 2219瀏覽 ? 0回復
谷歌新型 AI 系統(tǒng)在復雜診斷中表現(xiàn)超越醫(yī)生

51CTO內(nèi)容精選 ? 2441瀏覽 ? 0回復
阿里推出 LingShu AI醫(yī)生：統(tǒng)一多模態(tài)醫(yī)學理解與推理的通用基礎模型

知識圖譜科技 ? 3514瀏覽 ? 0回復
AI革命下的放射科醫(yī)生：年薪52萬美元的真相，AI沒有“干掉”放射科醫(yī)生

知識圖譜科技 ? 909瀏覽 ? 0回復
從800行代碼到12.5億估值：LangChain的三年AI革命之路

ermulong ? 925瀏覽 ? 0回復

知識圖譜科技

這個用戶很懶，還沒有個人簡介

帖子

聲望

粉絲

關注

最近發(fā)布

Anthropic 重磅推出Claude AI for life science：生命科學領域革命性加速器，從藥物發(fā)現(xiàn)到臨床應用 2025-10-23 00:17:45發(fā)布
突破性技術：DeepSeek-OCR通過光學壓縮解決大語言模型長上下文挑戰(zhàn) 2025-10-23 00:15:24發(fā)布

熱門推薦

NeurIPS 2025 ｜給?模型“裝上先驗”的可信推理：DP 框架讓知識圖譜上的問答更準更穩(wěn) 0回復

阿里新一代企業(yè)級多 AI 智能體開發(fā)框架 AgentScope 技術架構全解析 0回復

Deepseek發(fā)布最新OCR模型在實測中展現(xiàn)出驚人效率，僅用15秒便將百頁PDF完整轉換為Markdown格式 0回復

代碼41%由AI生成！2025七大編程工具深度對比，你的選擇是？ 0回復

DeepSeek 成長史：從量化投資到 AI 革命的一個 “非主流” 量化大佬的 AI 夢 0回復

上一篇：什么是“本體論”？——LLM驅動的自動本體生成、數(shù)據(jù)建模新范式與AI語義層全解

下一篇： GPT-5智能工作新時代革命：OpenAI重磅發(fā)布最新AI模型，500萬用戶已體驗ChatGPT商業(yè)版

社區(qū)精華內(nèi)容

目錄

<cite id="mpgl7"></cite>