很多餐廳老闆第一次問「OCR 入單準確率如何驗證」,通常不是因為想研究演算法,而是因為前線已經被紙單、手寫單、WhatsApp 截圖和 Excel 拖慢了。真正的問題從來不是 OCR 能不能讀,而是讀出來的數據,能不能直接進採購、庫存、對帳和利潤分析,達到少返工、少出錯、查得到責任的目標。
如果驗證方法錯了,99.8% 這種數字毫無意義。因為餐飲業看重的不是「看懂一張單」,而是「把一張單變成可用數據」。同樣一張採購單,供應商名稱識別錯一個字,影響可能不大;但數量、單位、單價、稅額、送貨日期錯了,後面庫存、應付帳、菜單成本都會一起偏掉。所以,驗證 OCR 入單準確率,不能只看總分,必須看欄位、場景和業務後果。
為什麼餐飲業驗證 OCR 入單準確率不能只看一個百分比
市面上很多準確率說法,問題在於口徑不統一。有的按「字元準確率」算,有的按「欄位準確率」算,有的按「整單準確率」算。對餐飲企業來說,字元準確率參考價值最低。因為財務和營運不會因為系統把「凍雞翼」看成「凍雞翼」就停工,但會因為「10箱」被讀成「100箱」直接影響採購判斷和庫存盤差。
更實際的做法,是先定義你要驗證什麼。通常至少分三層:第一層是圖像識別能力,即能不能從發票、送貨單、手寫單裡抓到文字;第二層是欄位提取能力,例如供應商、日期、品名、規格、數量、單位、單價、金額;第三層是業務匹配能力,也就是這些欄位能不能被正確映射到系統裡的供應商檔案、商品主數據、採購記錄和成本報表。
如果只拿一批乾淨、拍得正、光線好的樣本來測,結果一定偏高。但餐廳真實環境不是辦公室掃描機,而是後門收貨區、廚房檯面、店長手機、晚上補單。驗證必須貼近現場,否則上線後還是要人手改單。
OCR 入單準確率如何驗證:先把標準定清楚
要讓測試結果有參考價值,第一步不是上傳單據,而是先定「算對」的標準。建議把欄位分成三類:
- 關鍵欄位:錯一個就會影響成本和對帳,包括供應商名稱、單據日期、品項、數量、單位、單價、總金額。
- 重要欄位:例如稅額、折扣、付款條件、送貨單號。
- 輔助欄位:例如地址、電話、備註。
接著要定義容錯規則,例如簡繁體差異、全形半形差異是否算對;品名匹配是否自動歸一。沒有這些規則,不同人複核同一批單,會得出不同結論。此外,對餐飲團隊最實用的指標有三個:欄位準確率、整單可用率、人工干預率。後兩項,往往比單純的 OCR 百分比更接近真實價值。
樣本怎麼抽,才不會測出「好看但沒用」的結果
樣本如果只挑最標準的發票,測試就失真。餐飲業建議按來源(正式發票、手寫單、WhatsApp 圖片)與難度(折皺、模糊、手寫修改、表格)進行分層抽樣。一個務實的做法,是收集最近一到兩個月的真實單據,按門店、供應商分組隨機抽樣。若是初步選型,100 到 300 張真實單據已足夠;若準備導入,建議把高頻供應商和高金額品類單獨拉出來測。
驗證時不能只看識別,還要看能否進入管理流程
很多團隊測試 OCR 只停在「系統有沒有讀出字」。但餐飲業真正需要的是,讀出的數據能不能進採購、庫存、應付和成本分析流程。舉例來說,送貨單寫「雞蛋 12 板」,OCR 認出字了,但如果系統沒把「板」對應到庫存單位,這張單仍然不能用。
驗證時至少要追蹤三個結果:欄位讀對了嗎?欄位映射對了嗎?映射後能生成可複核、可追溯的採購記錄嗎?這也是為什麼真正可落地的方案,通常不只是 OCR 引擎,而是一套包含規則、主數據、例外處理與複核機制的流程。像 Costflows 這類專注餐飲場景的系統,價值在於把入單、對帳與成本控制整合在同一條數據鏈。
怎麼判斷供應商給出的 99.8% 是否可信?
先問三個問題:這 99.8% 是怎麼算出來的?測試樣本是否包含真實手寫單與非標準格式?是否包含人工複核後的可用率?
如果對方無法說明關鍵欄位表現與人工干預比例,這個數字只能當行銷宣傳。更穩妥的做法,是要求用您自己的真實單據做兩週試測,統計關鍵欄位準確率與修正時間。
驗證之後,怎麼把準確率變成穩定的營運能力
準確率驗證不應只是導入前的動作,而應成為持續監控的一部分。每月追蹤關鍵欄位準確率、人工修正率與異常排行,能幫您及時發現是供應商改版、門店拍照習慣不良,還是商品主數據沒維護。
當這套機制建立起來,OCR 才不是單純的「省時間工具」,而是數據紀律的一部分。數據鏈一旦打通,採購、廚房、經理和會計講的都是同一套數字,不再各自記一本帳。準備評估 OCR 前,別急著問「能不能識別」,先問「識別後能不能直接用於經營」。真正有價值的準確率,必須經得起真實單據、真實流程與對帳的檢驗。

.png)

