微軟發(fā)布 Data Formulator:AI 顛覆數據可視化,讓數據“說話”更輕松
IT之家 2 月 17 日消息,科技媒體 marktechpost 昨日(2 月 14 日)發(fā)布博文,報道稱微軟 Microsoft Research 團隊提出 Data Formulator,通過概念驅動的方法有效地解決了數據轉換的持續(xù)挑戰(zhàn)。
現有挑戰(zhàn)
IT之家注:Charticulator、Data Illustrator、Lyra 等現代可視化工具,以及 ggplot2、VegaLite 等庫,通常需要“整潔數據”作為輸入,意味著每個可視化變量都是一列,每個觀察值都是一行。
如果不是這種格式,用戶就需要進行數據轉換,即使原始數據完整無缺。這需要編程專業(yè)知識以及 tidyverse、pandas 或 Wrangler 等專業(yè)工具,導致工作流程低效,不斷切換數據轉換和可視化步驟。
Data Formulator
Data Formulator 引入“概念綁定”范式,用戶將數據“概念”綁定到可視化通道。概念可以來自現有列,也可以按需創(chuàng)建。
創(chuàng)建新概念有兩種方法:自然語言提示(用于數據推導)和基于示例的輸入(用于數據重塑)。用戶選擇圖表類型并映射所需概念后,Data Formulator 的 AI 后端會推斷必要的數據轉換并生成候選可視化結果。
系統(tǒng)為多個候選結果提供解釋性反饋,用戶可以通過直觀的界面檢查、優(yōu)化和迭代可視化結果。結合自然語言和編程示例,用戶可以使用熟悉的配置工具,同時訪問強大的轉換功能。
測試結果
用戶測試結果表明 Data Formulator 在任務完成度和可用性方面表現出色。參與者平均在 20 分鐘內完成所有分配可視化任務,其中任務 6 由于涉及 7 天移動平均值計算而耗時最長。
展望未來,這種概念驅動的可視化方法有望影響下一代可視化數據探索和創(chuàng)作工具,有可能消除可視化創(chuàng)建中長期存在的數據轉換障礙。
參考
- Data Formulator 2: Iteratively Creating Rich Visualizations with AI
- GitHub