
消費者委員會於3月15日發佈一份有關洗滌劑的調查報告,消費者委員會測試市面上35款洗潔精,當中包括「一般」、「濃縮」和「超濃縮」配方的產品,結果顯示不同測試樣本的清潔能力相差甚廣,清洗碟子數量最多相差近五倍,而「一般」配方表現最為參差,同時有六成樣本(21款)驗出含可致敏防腐劑。清潔劑與大數據在不同場景設定下都會擦出不同火花,以下將就洗碗工廠和清潔劑製造商兩方面討論大數據如何為他們帶來衝擊的。
洗碗工廠

洗碗工廠每天需要清洗成千上萬的碗碟,並必須確保清潔水平達至一定標準,而清潔劑和水是他們最主要的運作成本,而大數據可以為廠商訂立最佳運作模式。洗碗機上可以安裝感應器和設立物聯網,實時監察洗碗機中污水與清潔劑的混合、機器溫度,並分析出清潔能力最高,而又使用最少清潔劑的組合,此舉可以最少化清潔劑使用量,同時確保出品質素,又可以節省能源消耗。這些數據不僅有助於日常運作,還可以為在不同地立設立工廠的廠商訂立一個參考指標,讓不同工廠都能達至成本效益極大化。大數據同時可以優化採購過程,收集及分析清潔劑使用模式,例如聖誕節或復活節等節日會有較多碗碟需要清洗,運用大數據的預測分析術,使廠商能在合適時間購入清潔劑,以至清潔劑不會出現缺貨或積存太多的現象。
清潔劑製造商

這份報告受影響人士,清潔劑製造商首當其衝,各大媒體上充斥著對清潔劑和各大品牌的評論,大數據中的社交聆聽 (Social Listening) 在消費者委員會報告公佈後馬上派上用場,實時收集市民在社交媒體上對自家品牌討論,如果有太多壞消息或惡意評論,公司的公關部可以馬上作出回應,例如作出澄清、道歉、承諾改善配方等,同時公司可以留意市民對清潔劑的要求是否有改變,並在生產清潔劑的原材料和配方上作出改善。你可以想像沒有了實時數據,半年後才收到相關資訊,恐怕已經為時已晚。至於表現好的清潔劑製造商亦可藉此機會大加推廣,增加銷售額。
數據清洗

我們的碗碟當然要清潔乾淨,但原來大數據未也需要清潔,我們稱之為數據清洗 (data cleansing)。我們所收集到的數據未必完全正確無誤,當中因為人手輸入錯誤,格式問題,時區差異等,都會做成「骯髒」的數據,而大數據分析講求就是一致性(consistent)、凖確性(accuracy)和可信性(trustworthiness ),正確無誤的數據才能給予公司一個清晰的方向作出決策,否則錯誤的數據會引致公司決策出錯,降低競爭力。數據清洗有三種方法,包括錯誤檢測、數據修復和數據清洗系統。錯誤檢測是指檢查每個數據值是否處於合理範圍,如果超出合理範圍便是錯誤的數據,例如體重出現負數,問卷調查中5級評分制,出現六分的數據值,這些錯誤都可以靠一些程式或計算法來找出,然後作出修正。修正數據的過程就是數據修復,過程中除了把數據值糾正,也包括尋回遺失的數據值。清潔劑有不同特性,清潔力高、護膚、抗敏等,市面上亦有很多數據清洗系統軟件出售,公司可以按自己需要來揀選最合適的產品。