Scale for Grams Scale for Grams
測量方法

Scale for Grams 如何驗證精度

Scale for Grams 在 200 件家用物品的私有基準上進行測試,每件物品都用 Mettler Toledo MS204TS 分析天平(讀數精度 0.1mg)秤重。每次發布前,我們會在該基準上測試新的視覺模型或提示詞版本。當被問到「準確度有多高」,這裡公布的數字就是答案。

基準構成

基準包含 200 件物體,分成 4 個類目,對應 Scale for Grams 的 4 種模式:

  • 一般 (50 件) — 水果、書籍、雜物、手作品、家用品。
  • 黃金 (50 件) — K18、K22、K24 珠寶(戒指、項鍊、手鐲)、實心和中空鍊條、金幣(克魯格、楓葉、維也納愛樂),有刻印和無刻印。
  • 廚房 (50 件) — 肉、魚、水果、蔬菜、米、麵、麵包、起司、雞蛋、典型菜餚份量。
  • 盲盒 (50 件) — 未開封收藏品(POP MART、卡片包、公仔系列)。

結果(模型:GPT-5.1 視覺,2026 年 3 月)

模式中位誤差±10% 內±20% 內
一般7.2%62%89%
黃金5.8%71%94%
廚房6.4%68%91%
盲盒4.9%78%96%
總體6.1%70%92%

什麼提升精度

  • 參照物體。 在畫面中放一個已知尺寸的物體(NT$10 硬幣 = 26mm、7.5g、NT$50 硬幣 = 28mm、10g、信用卡 = 85.6×53.98mm)。這是單一最大精度提升因素,把典型誤差從 20-30% 降到 8-12%。
  • 簡單背景。 白紙、光滑木面、光滑石面。
  • 均勻漫射光。 白天窗光最佳。LED 頂燈也可以。
  • 正確角度。 平面物體從上方拍,高物體從上方 45 度,長物體(鍊條)從上方且全物體入框。
  • 選對模式。 一般提示詞在貴金屬上始終輸給黃金提示詞。

什麼惡化精度

  • 有花紋的桌布(增加 5-15% 誤差)。
  • 暗光或黃光(增加 5-10% 誤差)。
  • 傾斜或側拍(增加 8-15% 誤差)。
  • 一個畫面裡多個重疊物體(增加 10-20% 誤差)。
  • 對物體用錯模式(可能造成 5-10 倍誤差,貴金屬上尤其明顯)。

限制

  • 不能取代校準。 化學、精密烘焙以及貴重物品最終交易前請用校準過的秤。
  • 5g 以下誤差擴大。 輕物體相對誤差較大(輕量香草 15-25%)。
  • 透明 / 反光物體精度下降。 玻璃、拋光金屬、透明塑膠可能干擾表面偵測。
  • 不能測量身體。 App 不測量人體重量。聲稱如此的 App 是假的。

更新政策

每次更新視覺模型、提示詞或密度邏輯,我們都會重跑整個基準,如果結果低於此處公布的數字就不發布。如果發現回歸,我們保留舊版直到修復。新基準結果會在引發變更的發布之後更新到本頁。

更多詳情見部落格:拍照最佳實踐見照片秤重:7 個錯誤。手機秤 App 的工作原理見把 iPhone 當秤用 2026