星期四, 11月 04, 2010

Precision and Recall

Definition:

  • Source = 被尋找的資料庫
  • Target = 在 Source 內 某一種同類型的資料
  • ALLFind = 找出來的所有資料
  • GoldenFind = AllFind 裡跟 Target Match 的資料
Precision = GoldenFind / AllFind
Recall = GoldenFind / Target


結論:
  • 跟 Source 多少一點關系都沒有。
  • 找資來的資料,命中越高越好,如果找錯......只影響Precision,但至少保住了 Recall。
  • 也就是說 Precison & Recall 都為1時最佳。.
  • Precision = 1 比 Recall =1 簡單.


Reference 2nd 提到一個有趣的比喻:
要「一言既出駟馬難追」的precision就要高,要「寧可錯殺一人也不願放過一百」的recall值就必須要高


Reference 1st 舉的例子
舉個例子:假設現在資料庫中有10000筆資料,和美食有關的文章有500篇。使用者在輸入美食的關鍵字後,回傳的文章有4000篇,其中有400篇是和美食有關的。Precision = 400 / 4000 = 10%
Recall = 400 / 500 = 80%

Reference:

沒有留言: