數據分析師,即將從工業領域“消失”?

數據分析師,即將從工業領域“消失”?
作者 | 王一鵬
2023 年底 , 一則 Google 裁撤數據科學家的新聞引起業內關注 。 有媒體猜測 , Google 計劃用 AI 自動化取代部分人力 , 導致數據科學家崗位減少 。 而在最近兩年 , 隨著 AI+BI 的產品形態逐漸普及 , 這種崗位裁撤風潮大有蔓延趨勢 , 從新零售到金融 , 最終傳遞到工業領域 。
尤其是在工業領域 , 行業壁壘較高 , 數據分析師本就是稀缺物種 。 如今 , 這一崗位的編制或面臨進一步縮減 。
AI 沖擊數據分析師崗位的第一步 , 是將取數、做報表、給出分析結論等一系列工作 , 通過自然語言自助化完成 , 將任務交付時間壓縮至分鐘級 。
到了 2025 年 , AI 的職能邊界進一步擴張 。 甚至不需要老板下命令 , 就能根據企業所在的領域、所積累的數據 , 將合適的數據以恰當的方式 , 主動推送給對應的負責人 。
可以說 , 數據的消費范式 , 已經變了 。
本質上 , 老板需要的不是數據 , 而是業務洞察 , 且洞察方向隨著業務的開展 , 會不斷出現變化 。 但崗位職能不同 , 接收到的上下文也不同 , 員工絞盡腦汁 , 耗時數天至數周給出的報表 , 通常也很難令老板滿意 。 從前 , 企業被迫接受這一事實 , 苦惱的是業務一號位以及 HR;現在 , AI 正在重新制定“游戲玩法” 。
數據找人、無問智推?數據分析師會在多大程度上被 AI 取代?InfoQ 特別采訪了濤思數據創始人 &CEO 陶建輝 , 聊了聊濤思數據最新的發布 , 以及 BI 類產品正在發生的變化 。
1 人找數據 , 從未簡單過
2025 年 7 月 29 日晚 , TDengine 發布了一款全新產品 —— TDengine IDMP(Industrial Data Management Platform , 工業數據管理平臺) , 以“用 AI 改變數據消費范式”為主題 , 主打讓數據自己說話 , 不用提問或拉取數據 , 而是將實時業務洞察所需要的可視化面板、實時分析任務主動推送給你 。
在筆者眼中 , 陶建輝老師始終是一位情緒非常飽滿的持續創業者 。 自 2008 年開啟移動互聯網領域 IP Push 與 IP 實時消息服務的創業之路起 , 到后來深耕時序數據庫 TDengine , 他一路走來始終保持著充沛激情 。 而當發布 TDengine IDMP 產品時 , 他的興奮之情尤為強烈 —— 尤其是對其核心功能 “無問智推” , 更是寄予厚望 , 堅定認為這是在 AI 時代下 , 足以帶來 “范式革命” 的關鍵產品 。
要回溯這種興奮的源頭 , 我們必須要明白 BI 類產品在數據的供給和消費問題上 , 長期以來所面臨的問題 。
我們可以將 BI 產品的發展 , 簡單概括為三個階段:
報表式 BI 最早于上個世紀就出現了 , 是最原始的形態:IT 人員先建模、后出表 , 通過郵件進行分發 , 業務人員僅負責提出需求和查看結果 。 這種 BI 本質上只是在解決“沒有數據可看”的問題 , 是信息化的早期產物 。
除了功能受限 , 報表式 BI 的另一大問題在于 , 技術人員完全不理解業務 , 建模速度也跟不上業務發展 。 于是自助式敏捷 BI 出現了 , 主打一個“還政于民” , 建模的主體變成了業務人員 , 建模的方式是拖拉拽 , 同時通過實時連接數據倉庫或大數據引擎 , 解決“數據時效性差”的問題 。
不過 , “還政于民” , 初衷是好的 , 結果卻不盡如人意 。 太多的人有權限進行數據建模 , 導致“數據沼澤”出現了 , 企業經營數據甚至做不到口徑上的統一——同樣叫做“毛利率” , 但在銷售部門和運營部門是完全不同的算法 。
于是大約 2019 年之后 , 指標化 BI 產品開始出現 。 指標化 BI 是在數據倉庫 / 數據湖與 BI 工具之間構建一個“統一指標語義層” , 意思就是要對基礎的指標和計算口徑進行共識 , 比如:銷售額 = 含稅成交總額 - 退貨額 , 這一公式只允許存儲一次 。 數據維度、修改歷史都做好限制和記錄 。
指標化 BI, 等于在一定的限制下 , “還政于民” 。 那么 , 指標化 BI 解決得了產業的問題嗎?Gartner 等研究機構并未針對指標化 BI 產品做單獨的落地成功率統計 , 但 2021-2023 年對“整體 BI/ 數據分析項目”的統計區間顯示 , 超過 60% 的 BI 項目未能達到預期效果 。
拋開紛繁復雜的大數據技術名詞 , BI 類產品進化與拉扯 , 始終是在解決“人”的問題 。
人無法做數據化決策 , 所以出現了報表式 BI ;技術人不懂業務 , 所以出現了自助式敏捷 BI ;業務人自說自話 , 所以出現了指標化 BI。 而在任何一家公司內 , 具備深度業務認知 , 且能緊跟業務發展 , 用數據建模的思維組織材料 , 敏捷生產洞察報告的人才 , 都是極少的 。 所以即便我們發明了“數據分析師”這個崗位 , 也依然不能將 BI 落地的成功率提高 。
當這一問題出現在新零售領域時 , 其嚴峻程度或多或少是被沖淡了 。 畢竟 , 像庫存周轉率、訂單滿足率這類數據指標 , 即便不明確計算公式 , 多少也能理解其反映的業務情況 。 但在工業領域 , 許多數據指標是與工藝聯系在一起的 , 理解成本驟然上升 。
比如在煙草行業 , 需要關注的指標有:回潮溫度、打葉效率、葉絲填充值、蒸汽單耗等 , 不但要理解其含義、計算方式 , 還要意識到 , 這些指標在數值上 , 是有參考標準和取值范圍的 。
每一年隨著工藝和法律法規的變化 , 相關指標的參考標準都有可能發生變化 。 比如 AI 視覺檢測技術成熟后 , 煙草行業的殘次頻率已經從 0.8% 降到了 0.12% 。 不要以為這一數據變化只有匯報價值 , 據煙草行業測算 , 一家中型煙廠每年可因此節省原料成本超過 222 萬美元 。
一個普通業務人員 , 很難做到對這些工藝指標、取值范圍、每年變化了如指掌 , 甚至即時調整數據建模 , 產出對應的報告 。
這是數智化轉型的核心困局:人的能力即是瓶頸 , 軟件只能輔助 , 不能根除 。
直到 2022 年 ,AI 打破了這一邏輯 , AI 的知識量與工作效率 , 對于人而言是“降維打擊” 。 到了 2025 年 , AI Agent 端到端任務平均通過率已經突破 70% , 對 Level-1 級難度的任務通過率已經突破 85% 。
從前在企業內缺位的數據專家 , 今天可以由 AI Agent 出任 , 這是 TDengine IDMP 所做的事情 , 也是陶建輝老師為何如此興奮 。
2 數據找人 , 濤思數據的解決思路
那么 , 所謂的由 AI Agent 出任數據專家 , 實現“數據找人” , 是對 ChatBot 進行簡單套殼嗎?是單純地集成一個 DeepSeek 嗎?
當然不是 , 在發布日 , 濤思數據公布的 IDMP 架構如下:
大數據平臺 , 尤其是工業領域的大數據平臺 , 不光是解決數據分析問題 , 也是在解決數據的采集和治理問題 。 濤思數據的前置技術積累是充分的 , 在時序數據庫上 , 有性能強大且具備開源口碑的 TSDB 做支撐 。
TDengine TSDB 單個集群可以支撐起 10 億級測點 , 配合高效的存儲引擎 , 整體成本是通用平臺的十分之一 。 它具備良好的系統開放性 , 支持 JDBC、ODBC、REST API 等接口 , 能夠與 MES、ERP、AI 等企業系統無縫集成;支持數據訂閱 , 數據不僅能流進來 , 還能實時流出去 , 不被廠商綁定;部署方式也更靈活 , 兼容 Windows、Linux、虛擬機、容器等多種環境 , 適配各種工業現場需求 。
TDengine TSDB 是一個基礎 , 保證 TDengine IDMP 可以高效獲得業務數據 。 接下來 ,TDengine IDMP 基于采集到的實時數據 , 創建數據目錄 , 做好數據標準化、數據情景化 。
數據目錄其實是數據孿生會涉及的概念 , 解決“數據在哪、屬于誰、長什么樣”的問題 , AI/BI 工具可直接按目錄路徑調用數據 , 無需再寫復雜 SQL 。
數據標準化的目標是為了讓跨系統數據可比、可用、可信 , 價值接近我們前面提到的“統一指標語義層” 。
數據情景化 , 是為了讓任何一條時序數據都能回答“它代表什么、在什么場景下、跟誰有關” , 解決前面提到的“取值范圍”問題 。
接下來 , TDengine IDMP 會通過內置的 Agentic AI , 配合業務知識庫 , 感知具體應用場景 , 自動生成指標、報表和分析任務 , 并主動推送業務洞察 。 其他核心能力還包括:

  • 智能可視化:“無問智推”能夠驅動 AI 根據當前業務場景自動生成可視化看板 , 告別手動配置
  • 實時分析:支持多模態觸發的流式計算 , 毫秒級反饋分析結果
  • 事件管理:將分析結果轉化為可執行事件 , 提供全鏈路根因分析能力
此外 , IDMP 也率先將 Git 思維引入到數據建模與治理中 , 支持多人協同建模、版本追溯 , 使工業數據管理像管理代碼一樣高效、可控 。
實際上 , TDengine IDMP 的野心很大 , 它并非想單純給工業大數據平臺加一個 ChatBI , 而是希望提升從數據采集到業務決策的整個鏈路的效率 。 濤思團隊技術人員 , 在官方博客上 , 也對這種針對性設計做了解讀:
“在不同的工業場景里 , 有八個痛點彼此關聯、相互放大:
  1. 數據在采集環節就因為廠商和協議不同而被割裂;
  2. 進入系統后 , 又因缺少語義和上下文而“失去身份”;
  3. 質量問題無法在入口階段解決 , 導致后續分析精度下降;
  4. 出于安全考慮 , 數據流動受限 , 價值被鎖?。 ?
  5. 海量數據積壓在庫里 , 缺乏實時處理能力;
  6. 新算法、新模型難以及時落地;
  7. 業務人員缺乏直接獲取洞察的途徑 , 實時決策受阻;
  8. 行業知識門檻高 , 新人難以快速勝任 。 ”
“IDMP 的目標 , 是讓數據從進入平臺的第一刻起就‘有名有姓’ , 并沿著同一條語義化管道 , 穩定流向實時分析、事件管理和業務決策 。 ”
陶建輝老師本人對 TDengine IDMP 的期待甚至還要更宏大:數據的消費范式正因此出現變革 。
另有接近濤思數據的人士透露 , 目前團隊圍繞 TDengine IDMP 和智能制造領域企業的合作 , 如煙草、光伏、電力 , 已經在洽談和推進中 , 來自客戶側的反饋和需求可能會進一步加快 TDengine IDMP 的迭代速度 。
3 數據消費范式轉變:工業領域或將開始下一次進化
從 TDengine IDMP 發布 , 到“數據找人”逐步成為業界的新風潮 , 智能制造正在逐步邁入新階段 。 過去 , 人們對制造業存在某種“偏見” , 認為其:薄利、固化、封閉、缺少標準 , 因而轉型困難 。
但隨著如 TDengine IDMP 般的產品進入 , 制造業攜移動互聯網時代積累的通信、大數據技術 , 跑步進入智能化時代 。 整個產業因此變得更加靈動 , 變得更具生命力 。 產業進化的信號 , 即是發生在 2025 年的數據消費范式轉移:從“人定義問題→找數據→等洞察”到“AI 定義場景→推數據→給行動” , 傳統數據分析師的職能被三個不可逆的結構性變化徹底消解:
  • 技術替代:像 IDMP 般的工業大數據平臺 , 將“業務認知 + 數據建模 + 實時推送”封裝成基礎設施 , 使 90% 的常規分析需求無需人工干預 。
  • 成本重構:當 AI 能以工程師 1% 的成本完成設備預測性維護分析(國家電網案例) , “招一個分析師”從投資變成冗余 。
  • 權力轉移:數據消費權從集中化的分析團隊下沉至一線操作員——AI 用自然語言告訴工人“第 3 號鍋爐需降負荷” , 而非等待分析師的周報 。
最終形態或許是 , 工業領域將出現真正的“數據零接觸”組織——數據分析師的崗位描述從“提取洞察”變為“訓練 AI 的業務規則” , 而其編制規模隨自動化率提升呈指數級萎縮 。
至少 , 未來業務人員使用大數據平臺 , 既不需要集中培訓 , 也不需要排隊等待 IT 人員定制 SQL 。
AI Agent , 會自己找上門來 , 融入工業體系的每一個流程 。
【數據分析師,即將從工業領域“消失”?】今日好文推薦

    推薦閱讀