偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p

如何極大增加 AI 輸出的準(zhǔn)確性

人工智能
最近在推上看到??@Tz_2022??巧妙將??Mom Test??方法論遷移到“與AI對話”上,獲得不錯效果。整個理念非常有意思,今天就將這一方法論分享給大家。

大家好,我卡頌。

經(jīng)常與 AI 進(jìn)行專業(yè)討論(比如需求分析、方案討論…)的朋友會發(fā)現(xiàn),即使再先進(jìn)的 AI,都有兩個問題:

  • 輸出內(nèi)容有幻覺
  • 經(jīng)常說恭維話

常見的解決辦法通常是「工程化方案」,比如「對生成內(nèi)容進(jìn)行事實核查」。

最近在推上看到@Tz_2022巧妙將Mom Test方法論遷移到“與AI對話”上,獲得不錯效果。

整個理念非常有意思,今天就將這一方法論分享給大家。

The Mom Test

Mom Test(媽媽測試)是一套由「Rob Fitzpatrick」提出的,用于「評估創(chuàng)業(yè)想法和獲取真實客戶反饋」的框架。

Rob Fitzpatrick

其核心思想是:「你無法通過詢問他人(即使是你媽)是否喜歡你的創(chuàng)業(yè)點子來獲得真實反饋,因為人們出于禮貌或避免沖突,往往會說“好話”而不是“真話”。」

這個測試的目的是教你如何提出正確的問題,從而繞過這種“社交禮貌”,挖掘出用戶真實的行為、痛點和需求,避免在錯誤的想法上浪費時間和金錢。

方法論的核心可以總結(jié)為3個基本原則:

原則1:談?wù)撍麄兊纳?,而不是你的想?/span>

不要一上來就激動地描述你的產(chǎn)品創(chuàng)意,因為這會立刻將對方置于一個“評審員”的角色,他們只會對你的想法做出反應(yīng)(通常是鼓勵性的),而不是透露自己的真實情況。

  • 錯誤示范:“我有一個做XX的App創(chuàng)意,你覺得怎么樣?”
  • 正確示范:“你平時是怎么處理「某個問題」的?”、“能跟我聊聊你上次遇到「某個問題」時的具體情況嗎?”

通過聚焦于「他們過去的經(jīng)歷、行為和痛點」,你能獲得客觀、真實的數(shù)據(jù)。

原則2:詢問具體的事實和行為,而不是泛泛的意見和假設(shè)

人們的意見和未來的承諾(“我可能會用”)是廉價且不可靠的。過去的具體行為和事實才是可靠的證據(jù)。

  • 錯誤示范:“你會使用一個能解決這個問題的產(chǎn)品嗎?”

這是一個關(guān)于未來的假設(shè),答案很可能是“會的”

  • 正確示范:“你目前是怎么解決這個問題的?”、“你為此嘗試過哪些工具或方法?”

這些是關(guān)于過去事實的問題

原則3:傾聽“壞消息”和痛點

創(chuàng)業(yè)的寶貴洞察往往隱藏在用戶的挫折、抱怨和不滿意中。你的目標(biāo)是發(fā)現(xiàn)并理解這些痛點,因為它們才是你產(chǎn)品存在的理由。

方法論遷移

聰明的朋友已經(jīng)發(fā)現(xiàn)了,如果將Mom Test的提問技巧用在 AI 上,天然就有如下效果:

  • 反幻覺:基于用戶的經(jīng)歷、行為等真實發(fā)生的事提問
  • 反恭維:傾聽壞消息、不滿

以下是@Tz_2022總結(jié)的「適用于 AI 的Mom Test提問技巧」

1. 避免問意見,改問證據(jù)

錯誤示范:

  • 你覺得這個方案好不好?
  • 這樣設(shè)計是不是很合理?

分析:模型會傾向于說更多泛泛的恭維話。

正確示范:

  • 請給我 3 個具體反例,說明這個方案可能失敗的場景
  • 請基于已知的事實/數(shù)據(jù),列出這個設(shè)計可能遇到的限制

2. 避免未來假設(shè),追問過去表現(xiàn)

錯誤示范:

  • 如果遇到X問題,你會怎么處理?

分析:模型輸出沒有依據(jù),可能會產(chǎn)生幻覺。

正確示例:

  • 請列舉你在訓(xùn)練語料中學(xué)到的、已經(jīng)出現(xiàn)過的X問題解決案例
  • 在過去的研究或歷史記錄中,X是如何被解決的?

分析:基于「已發(fā)生的事實」輸出。

3. 避免模糊,要求具體

錯誤示范:

  • 幫我優(yōu)化這個文案
  • 給我一些改進(jìn)建議

正確示范:

  • 請將這個文案重寫成3個版本:① 面向投資人,② 面向工程師,③ 面向普通用戶,每個版本100字
  • 請逐句指出文案中哪些地方含糊,并給出更清晰的替代表達(dá)

4. 用行為驅(qū)動而不是態(tài)度驅(qū)動

錯誤示范:

  • 如果你是用戶,你會不會喜歡這個產(chǎn)品?

正確示范:

  • 假設(shè)你是目標(biāo)用戶,請模擬一次實際使用過程,并逐步寫出你會點擊、輸入、猶豫的步驟

5. 驗證而非求贊美

錯誤示范:

  • 你能確認(rèn)我這個邏輯是對的嗎?

正確示例:

  • 請檢查我這個邏輯,找出其中至少一個可能的錯誤,并解釋理由。
  • 如果必須反駁我,請站在反方角度給出3點論證。

總結(jié)

掌握5個基于Mom Test的提示詞技巧,有效減少模型輸出的幻覺與恭維。

以下是推友@JerryBobAI制作的總結(jié):

如果你覺得5個技巧記憶起來有點難,也可以記住一個關(guān)鍵詞「brutal」。

使用方式很簡單,在與 AI 進(jìn)行專業(yè)討論時,帶上這個關(guān)鍵詞,能讓輸出更犀利,有效減少恭維。

比如:

以下是我的網(wǎng)站功能描述,
分析他的前景如何,
如何主動驗證用戶需求?
請使用最 brutal 的方式評估一下

[網(wǎng)站功能描述]
責(zé)任編輯:姜華 來源: 魔術(shù)師卡頌
相關(guān)推薦

2022-08-19 09:53:20

人工智能大數(shù)據(jù)風(fēng)險

2011-05-23 17:14:39

Fedora 15

2024-08-06 08:43:17

2024-01-19 10:33:41

AI達(dá)沃斯論壇人工智能

2014-08-25 13:39:29

光纜故障

2015-04-28 10:31:35

SQL格式化查詢

2023-07-27 13:27:06

2024-12-09 09:20:00

MySQLNULL 值

2024-12-09 13:20:50

2009-08-12 09:27:31

Google搜索

2021-05-10 17:40:14

AI 數(shù)據(jù)人工智能

2025-01-23 09:00:00

2025-06-09 09:17:44

2024-12-23 13:28:22

2024-12-11 08:12:24

2024-06-11 09:19:00

2011-07-18 22:46:36

投影機評測

2023-12-26 18:54:22

2023-08-02 10:17:04

物聯(lián)網(wǎng)庫存管理

2024-09-11 16:36:39

點贊
收藏

51CTO技術(shù)棧公眾號