生成式AI發展至今,已展開各種不同的領域應用,包含像是知識管理(KM)、智能客服(Chatbot)、會議記錄,或是智慧程式(coding)上使用。而在近期的國外學術研究,也有利用生成式AI在多種任務主題進行時序性數據(Time Series)預測,甚至結合生成式AI時序性數據的預測結果與外部資料庫或文本知識,再透過大語言模型進行更深更廣的洞察分析 – LLM BI Knowledge Applications。
在這個數據爆炸時代,預測分析成為各行各業不可或缺的工具,透過洞察歷史數據中隱藏的寶貴資訊,企業可以預測像是客戶流失、設備故障等重要問題,並採取相對的因應措施,大幅提升營運效率。然而,傳統的預測分析技術卻存在諸多挑戰,例如:模型建構過程複雜、選擇演算法與訓練模型過程的大量實驗、資料維度過多、資料格式與資料來源多樣化、專業人才短缺等,這就為Predictive GenAI(預測型生成式人工智慧)新興技術帶來令人期待的應用前景。
什麼是Predictive GenAI?Predictive GenAI 將Predictive AI(預測型人工智慧)與Generative AI(生成式人工智慧)這兩種AI結合,發揮雙方關鍵優勢,利用機器學習演算法從訓練數據中獲取信息,並基於這些分析結果對新數據做出預測;而GenAI則是指基於大量文本訓練而產生的大型語言模型(LLM),具有數十億到千億等級的模型參數,擁有理解和生成人類語言的驚人能力。Predictive GenAI徹底解決傳統預測分析面臨的種種難題,像是預測時序性資料(Time Series)。時序性資料是指按照時間順序排列的數據序列,在時序性資料數據分析中,將收集到的數據按照時間點的先後順序排列,而時序性資料數據通常以規律的時間間隔採集,因此數據量的累積速度往往相當驚人,例如智慧工廠IoT感測器收集的遙測數據(Telemetry Data)。
在處理時序性數據時,數據量確實是一個重要的考慮因素。一旦資料量累積數年甚至數十年,同時處理高維度、多變量、多樣化的資料格式與來源時,對傳統機器學習的方法將是一大挑戰。而Predictive GenAI透過生成式 AI 的能力,可以從大量資料中自動找出模式和規則,並快速利用這些模式和規則來預測未來的情況或生成新的內容,協助我們完成更複雜的任務。透過將所有歷史資料依據大語言模型的對話格式進行Time Series模型的微調訓練(Fine-tuning),透過目前市場上AIHPC的高速算力,在短短 3 – 5 小時內即可完成規模千萬到數億tokens歷史資料的模型訓練,之後就可直接以ChatBot的對話方式提問Time Series預測的項目。
此外,Predictive GenAI也有別於傳統規則式標註的機器學習,傳統AI主要採用規則式編程,需要經由人工設定規則和邏輯,因此,過去想要構建一個準確的預測模型時,往往需要數據分析師甚至是數據科學家的大量參與,這需要企業投入大量的人力和財力成本。現在只需與Predictive GenAI對話,以自然語言描述所要預測的業務難題,Predictive GenAI就能夠自主學習、理解、獲得知識,並自動構建出合適的預測模型,搭配No-code平台無需編寫程式代碼,任何人都能輕鬆地完成預測建模任務。
在實作上,台智雲運用FFM-Llama2-7B的語言模型,微調訓練(Fine-tuning)預防性保修預測的Predictive GenAI(平均絕對誤差(MAE)=2.7),以及在S&P500指數股價的漲跌區間預測的實驗上,打造了金融股價預測的Predictive GenAI(平均絕對誤差(MAE)=1.41~2.78),兩個案例從資料收集到微調訓練的過程,完全沒有資料科學家的參與,僅花費數小時及快速完成模型建立,並獲得不錯的預測成果。
儘管Predictive GenAI的誕生為預測分析開啟了嶄新的大門,然而生成式AI技術仍在飛速發展中,這項技術仍存在可解釋性的問題,由於模型內部運作機制的”黑盒子”特性,用戶可能難以理解某些預測結果背後的邏輯原因,我們仍需持續關注資料的安全性與是否有潛在鮮為人知的風險。台智雲本次使用Predictive GenAI在預測主題的實驗上是一個成功嘗試,當然這項創新技術也為決策者和相關技術人員帶來全新的思維和方法,相信只要妥善利用Predictive GenAI的強大洞察力,即能為企業賦能商業智慧決策,實現品牌目標,創造更好的營運效率和商機。
>> 打造企業專屬洞察預測大模型,立即申請「Predictive GenAI 試用計畫」