股票
市盈率。- 傳播和異常值
公司的平均市盈率為 55(只是一個假設)。市盈率是可比公司樣本的平均值,但市盈率的差值是多少,是否排除了異常值?
現在我的問題是這裡的“傳播”一詞是什麼意思。最重要的是,這裡的“異常值”一詞是什麼意思?為什麼我們需要排除異常值?如果可能,請舉例說明。
點差通常是兩個值之間的差異。在這種情況下,它是值的範圍,或最大值和最小值之間的差異。因此,如果您的數據集中有 3 家公司的市盈率分別為 3、5.5 和 4,則價差為 2.5 (
5.5 - 3
)。統計中的“異常值”通常是與大多數其他值的異常差異的一些觀察結果。因此,如果您的市盈率分別為 3、4、5.5 和 10,那麼 10 可能會被視為“異常值”。有時在統計分析中,如果異常值以不希望的方式扭曲某些測量值(如範圍),則異常值會被排除在分析之外。在不理解為什麼該值是異常值的情況下排除異常值時必須小心。是測量誤差嗎?是否有一些特殊情況可以解釋其價值?
最重要的是,這裡的“異常值”一詞是什麼意思?
在電子表格中列出所有公司及其市盈率的列表(例如,來自 VTI ETF)。按市盈率對列表進行排序,然後按頻率繪製數字(有多少股票的市盈率為 10.1、10.2、10.3 等)。
您會看到大多數集中在一個廣泛的“中心”,而有些(具有非常低或非常高的市盈率)離中心非常遠。
你可以猜到……那些是異常值。
計算平均值時,消除異常值很重要。異常值離中心很遠,列表中的元素數量相對較少。
正因為如此,“中位數”通常是更好的統計量度,因為影響均值的異常值(“平均”的花哨詞)對中位數的影響最小”。(這也是為什麼您會聽到諸如“家庭收入中位數”之類的參考” 而不是“平均家庭收入”:所有這些億萬富翁對“平均收入”的影響遠大於對“中位數收入”的影響。)