測量方法
Scale for Grams 如何驗證精度
Scale for Grams 在 200 件家用物品的私有基準上進行測試,每件物品都用 Mettler Toledo MS204TS 分析天平(讀數精度 0.1mg)秤重。每次發布前,我們會在該基準上測試新的視覺模型或提示詞版本。當被問到「準確度有多高」,這裡公布的數字就是答案。
基準構成
基準包含 200 件物體,分成 4 個類目,對應 Scale for Grams 的 4 種模式:
- 一般 (50 件) — 水果、書籍、雜物、手作品、家用品。
- 黃金 (50 件) — K18、K22、K24 珠寶(戒指、項鍊、手鐲)、實心和中空鍊條、金幣(克魯格、楓葉、維也納愛樂),有刻印和無刻印。
- 廚房 (50 件) — 肉、魚、水果、蔬菜、米、麵、麵包、起司、雞蛋、典型菜餚份量。
- 盲盒 (50 件) — 未開封收藏品(POP MART、卡片包、公仔系列)。
結果(模型:GPT-5.1 視覺,2026 年 3 月)
| 模式 | 中位誤差 | ±10% 內 | ±20% 內 |
|---|---|---|---|
| 一般 | 7.2% | 62% | 89% |
| 黃金 | 5.8% | 71% | 94% |
| 廚房 | 6.4% | 68% | 91% |
| 盲盒 | 4.9% | 78% | 96% |
| 總體 | 6.1% | 70% | 92% |
什麼提升精度
- 參照物體。 在畫面中放一個已知尺寸的物體(NT$10 硬幣 = 26mm、7.5g、NT$50 硬幣 = 28mm、10g、信用卡 = 85.6×53.98mm)。這是單一最大精度提升因素,把典型誤差從 20-30% 降到 8-12%。
- 簡單背景。 白紙、光滑木面、光滑石面。
- 均勻漫射光。 白天窗光最佳。LED 頂燈也可以。
- 正確角度。 平面物體從上方拍,高物體從上方 45 度,長物體(鍊條)從上方且全物體入框。
- 選對模式。 一般提示詞在貴金屬上始終輸給黃金提示詞。
什麼惡化精度
- 有花紋的桌布(增加 5-15% 誤差)。
- 暗光或黃光(增加 5-10% 誤差)。
- 傾斜或側拍(增加 8-15% 誤差)。
- 一個畫面裡多個重疊物體(增加 10-20% 誤差)。
- 對物體用錯模式(可能造成 5-10 倍誤差,貴金屬上尤其明顯)。
限制
- 不能取代校準。 化學、精密烘焙以及貴重物品最終交易前請用校準過的秤。
- 5g 以下誤差擴大。 輕物體相對誤差較大(輕量香草 15-25%)。
- 透明 / 反光物體精度下降。 玻璃、拋光金屬、透明塑膠可能干擾表面偵測。
- 不能測量身體。 App 不測量人體重量。聲稱如此的 App 是假的。
更新政策
每次更新視覺模型、提示詞或密度邏輯,我們都會重跑整個基準,如果結果低於此處公布的數字就不發布。如果發現回歸,我們保留舊版直到修復。新基準結果會在引發變更的發布之後更新到本頁。
更多詳情見部落格:拍照最佳實踐見照片秤重:7 個錯誤。手機秤 App 的工作原理見把 iPhone 當秤用 2026。