وردایی [ ۱] یا واریانس (به انگلیسی : Variance ) در نظریه احتمالات و آمار ، نوعی سنجش پراکندگی است.
مقدار واریانس با میانگینگیری از مربع فاصله مقدار محتمل یا مشاهده شده با مقدار مورد انتظار محاسبه میشود. در مقایسه با میانگین میتوان گفت که میانگین مکان توزیع را نشان میدهد، در حالی که واریانس مقیاسی است که نشان میدهد که دادهها حول میانگین چگونه پخش شدهاند. واریانس کمتر بدین معنا است که انتظار میرود که اگر نمونهای از توزیع مزبور انتخاب شود مقدار آن به میانگین نزدیک باشد. یکای واریانس مربع یکای کمیت اولیه میباشد. ریشه دوم واریانس که انحراف معیار نامیده میشود دارای واحدی یکسان با متغیر اولیه است.
واریانس یا وردایی عددی است که نشان میدهد چگونه یک سری داده حول مقدار میانگین پخش میشوند. برای تعریف واریانس اگر فرض کنیم که متغیر تکی
X
{\displaystyle X}
دارای توزیع
p
(
x
)
{\displaystyle p(x)}
است و متوسط توزیع جمعیت آن را با
μ
{\displaystyle \mu }
نشان دهیم آنگاه واریانس این جمعیت به صورت زیر تعیین میشود:
V
a
r
(
X
)
=
σ
2
≡
⟨
(
X
−
μ
)
2
⟩
{\displaystyle Var(X)=\sigma ^{2}\equiv \left\langle (X-\mu )^{2}\right\rangle }
حال اگر یک توزیع مجزا داشته باشیم که هر مجموعه داده در آن، دارای احتمال
p
(
x
)
{\displaystyle p(x)}
باشد، واریانس به صورت زیر محاسبه میشود:
σ
2
=
∑
i
=
1
N
p
(
x
i
)
(
x
i
−
μ
)
2
{\displaystyle \sigma ^{2}=\sum _{i=1}^{N}p(x_{i})(x_{i}-\mu )^{2}}
اما در بیشتر موارد توزیع حاکم بر دادهها مشخص نیست در این حالت واریانس را به صورت زیر تخمین میزنیم:
S
N
2
≡
1
N
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N}^{2}\equiv {\frac {1}{N}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
در این رابطه
x
¯
{\displaystyle {\overline {x}}}
میانگین (امید ریاضی ) دادههاست که خود از رابطهٔ زیر حساب میشود:
x
¯
=
1
N
∑
i
=
1
N
x
i
=
x
1
+
x
2
+
⋯
+
x
N
N
{\displaystyle {\overline {x}}={\frac {1}{N}}\sum _{i=1}^{N}x_{i}={\frac {x_{1}+x_{2}+\cdots +x_{N}}{N}}}
البته باید توجه داشت که تخمین فوق یک تخمین دقیق و بدون خطا برای واریانس نیست لذا برای از بین بردن این خطا در تخمین از واریانس تصحیح شدهاستفاده میکنیم که به صورت زیر تعریف میگردد
S
N
−
1
2
≡
1
N
−
1
∑
i
=
1
N
(
x
i
−
x
¯
)
2
{\displaystyle S_{N-1}^{2}\equiv {\frac {1}{N-1}}\sum _{i=1}^{N}(x_{i}-{\overline {x}})^{2}}
اگر
μ
=
E
(
X
)
{\displaystyle \mu =\operatorname {E} (X)}
، امید ریاضی (میانگین ) متغیر کاتورهای
X
{\displaystyle X}
باشد، آنگاه واریانس
X
{\displaystyle X}
برابر خواهد بود با:
Var
(
X
)
=
E
[
(
X
−
μ
)
2
]
=
E
[
X
2
−
2
μ
X
+
μ
2
]
=
E
[
X
2
]
−
2
μ
E
[
X
]
+
μ
2
=
E
[
X
2
]
−
2
μ
2
+
μ
2
=
E
[
X
2
]
−
μ
2
=
E
[
X
2
]
−
(
E
[
X
]
)
2
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} [(X-\mu )^{2}]\\&=\operatorname {E} [X^{2}-2\mu X+\mu ^{2}]\\&=\operatorname {E} [X^{2}]-2\mu \,\operatorname {E} [X]+\mu ^{2}\\&=\operatorname {E} [X^{2}]-2\mu ^{2}+\mu ^{2}\\&=\operatorname {E} [X^{2}]-\mu ^{2}\\&=\operatorname {E} [X^{2}]-(\operatorname {E} [X])^{2}.\end{aligned}}}
برای به خاطر سپردن راحتتر این فرمول گفتهمیشود واریانس برابر است با «میانگین مجذور، منهای مجذور میانگین». واریانس متغیر کاتورهای X را معمولاً با Var(X ) یا
σ
X
2
{\displaystyle \scriptstyle \sigma _{X}^{2}}
یا به صورت سادهتر σ2 (تلفظ میشود سیگما -دو) نمایش میدهند.
اگر
X
{\displaystyle X}
یک متغیر کاتورهای با تابع جرم احتمال به این شکل باشد
x
1
↦
p
1
,
x
2
↦
p
2
,
…
,
x
n
↦
p
n
{\displaystyle x_{1}\mapsto p_{1},x_{2}\mapsto p_{2},\ldots ,x_{n}\mapsto p_{n}}
آنگاه واریانس آن به این شکل محاسبه میشود.
Var
(
X
)
=
∑
i
=
1
n
p
i
⋅
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)=\sum _{i=1}^{n}p_{i}\cdot (x_{i}-\mu )^{2},}
عبارت پیشین با معادله پایین معادل است:
Var
(
X
)
=
(
∑
i
=
1
n
p
i
x
i
2
)
−
μ
2
,
{\displaystyle \operatorname {Var} (X)=\left(\sum _{i=1}^{n}p_{i}x_{i}^{2}\right)-\mu ^{2},}
در اینجا
μ
{\displaystyle \mu }
امید ریاضی
X
{\displaystyle X}
است.
μ
=
∑
i
=
1
n
p
i
x
i
.
{\displaystyle \mu =\sum _{i=1}^{n}p_{i}x_{i}.}
واریانس
n
{\displaystyle n}
مقدار که از لحاظ احتمال با یکدیگر برابرند با عبارت پایین برابر خواهد بود:
Var
(
X
)
=
1
n
∑
i
=
1
n
(
x
i
−
μ
)
2
,
{\displaystyle \operatorname {Var} (X)={\frac {1}{n}}\sum _{i=1}^{n}(x_{i}-\mu )^{2},}
در اینجا
μ
{\displaystyle \mu }
میانگین
n
{\displaystyle n}
دادهاست:
μ
=
1
n
∑
i
=
1
n
x
i
.
{\displaystyle \mu ={\frac {1}{n}}\sum _{i=1}^{n}x_{i}.}
البته واریانس این
n
{\displaystyle n}
داده را بدون در نظرگرفتن میانگین آنها هم میشود به شکل پایین محاسبه کرد:[ ۲]
Var
(
X
)
=
1
n
2
∑
i
=
1
n
∑
j
=
1
n
1
2
(
x
i
−
x
j
)
2
=
1
n
2
∑
i
∑
j
>
i
(
x
i
−
x
j
)
2
.
{\displaystyle \operatorname {Var} (X)={\frac {1}{n^{2}}}\sum _{i=1}^{n}\sum _{j=1}^{n}{\frac {1}{2}}(x_{i}-x_{j})^{2}={\frac {1}{n^{2}}}\sum _{i}\sum _{j>i}(x_{i}-x_{j})^{2}.}
Var
(
X
)
=
σ
2
=
∫
(
x
−
μ
)
2
f
(
x
)
d
x
=
∫
x
2
f
(
x
)
d
x
−
2
μ
∫
x
f
(
x
)
d
x
+
∫
μ
2
f
(
x
)
d
x
=
∫
x
2
d
F
(
x
)
−
2
μ
∫
x
d
F
(
x
)
+
μ
2
∫
d
F
(
x
)
=
∫
x
2
d
F
(
x
)
−
2
μ
⋅
μ
+
μ
2
⋅
1
=
∫
x
2
d
F
(
x
)
−
μ
2
,
{\displaystyle {\begin{aligned}\operatorname {Var} (X)=\sigma ^{2}&=\int (x-\mu )^{2}f(x)\,dx\\[4pt]&=\int x^{2}f(x)\,dx-2\mu \int xf(x)\,dx+\int \mu ^{2}f(x)\,dx\\[4pt]&=\int x^{2}\,dF(x)-2\mu \int x\,dF(x)+\mu ^{2}\int \,dF(x)\\[4pt]&=\int x^{2}\,dF(x)-2\mu \cdot \mu +\mu ^{2}\cdot 1\\[4pt]&=\int x^{2}\,dF(x)-\mu ^{2},\end{aligned}}}
در اینجا میانگین یا
μ
{\displaystyle \mu }
به این شکل محاسبه میشود:
μ
=
∫
x
f
(
x
)
d
x
,
{\displaystyle \mu =\int x\,f(x)\,dx\,,}
واریانس همیشه نامنفی است:
Var
(
X
)
≥
0.
{\displaystyle \operatorname {Var} (X)\geq 0.}
واریانس متغیر کاتورهای ثابت همیشه صفر است به این معنی که:
P
(
X
=
a
)
=
1
⟺
Var
(
X
)
=
0.
{\displaystyle P(X=a)=1\iff \operatorname {Var} (X)=0.}
اگر به متغیر کاتورهای مقداری ثابت اضافه شود در واریانس متغیر کاتورهای جدید تغییری ایجاد نمیشود:
Var
(
X
+
a
)
=
Var
(
X
)
.
{\displaystyle \operatorname {Var} (X+a)=\operatorname {Var} (X).}
اگر متغیر کاتورهای در مقداری ثابت ضرب شود، واریانس متغیر کاتورهای جدید در مربع مقدار ثابت قبلی ضرب میشود:
Var
(
a
X
)
=
a
2
Var
(
X
)
.
{\displaystyle \operatorname {Var} (aX)=a^{2}\operatorname {Var} (X).}
واریانس ترکیب خطی دو متغیر کاتورهای به این شکل محاسبه میشود:
Var
(
a
X
+
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
+
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX+bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)+2ab\,\operatorname {Cov} (X,Y),}
Var
(
a
X
−
b
Y
)
=
a
2
Var
(
X
)
+
b
2
Var
(
Y
)
−
2
a
b
Cov
(
X
,
Y
)
,
{\displaystyle \operatorname {Var} (aX-bY)=a^{2}\operatorname {Var} (X)+b^{2}\operatorname {Var} (Y)-2ab\,\operatorname {Cov} (X,Y),}
به صورت کلی واریانس جمع
N
{\displaystyle N}
متغیر کاتورهای به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
,
j
=
1
N
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
Var
(
X
i
)
+
∑
i
≠
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i,j=1}^{N}\operatorname {Cov} (X_{i},X_{j})=\sum _{i=1}^{N}\operatorname {Var} (X_{i})+\sum _{i\neq j}\operatorname {Cov} (X_{i},X_{j}).}
واریانس ترکیب خطی
N
{\displaystyle N}
متغیر کاتورهای به شکل پایین محاسبه میشود:
Var
(
∑
i
=
1
N
a
i
X
i
)
=
∑
i
,
j
=
1
N
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
∑
i
≠
j
a
i
a
j
Cov
(
X
i
,
X
j
)
=
∑
i
=
1
N
a
i
2
Var
(
X
i
)
+
2
∑
1
≤
i
<
j
≤
N
a
i
a
j
Cov
(
X
i
,
X
j
)
.
{\displaystyle {\begin{aligned}\operatorname {Var} \left(\sum _{i=1}^{N}a_{i}X_{i}\right)&=\sum _{i,j=1}^{N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+\sum _{i\not =j}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j})\\&=\sum _{i=1}^{N}a_{i}^{2}\operatorname {Var} (X_{i})+2\sum _{1\leq i<j\leq N}a_{i}a_{j}\operatorname {Cov} (X_{i},X_{j}).\end{aligned}}}
اگر کوواریانس این متغیرهای کاتورهای نسبت به هم صفر باشد یعنی
Cov
(
X
i
,
X
j
)
=
0
,
∀
(
i
≠
j
)
,
{\displaystyle \operatorname {Cov} (X_{i},X_{j})=0\ ,\ \forall \ (i\neq j),}
آنگاه:
Var
(
∑
i
=
1
N
X
i
)
=
∑
i
=
1
N
Var
(
X
i
)
.
{\displaystyle \operatorname {Var} \left(\sum _{i=1}^{N}X_{i}\right)=\sum _{i=1}^{N}\operatorname {Var} (X_{i}).}
اگر یک تاس داشته باشیم که احتمال آمدن هر عدد
1
6
{\displaystyle {\frac {1}{6}}}
باشد، آنگاه امید ریاضی تاس با
(
1
+
2
+
3
+
4
+
5
+
6
)
6
{\displaystyle {\frac {(1+2+3+4+5+6)}{6}}}
برابر خواهد بود و واریانس تاس میشود:
Var
(
X
)
=
∑
i
=
1
6
1
6
(
i
−
7
2
)
2
=
1
6
(
(
−
5
/
2
)
2
+
(
−
3
/
2
)
2
+
(
−
1
/
2
)
2
+
(
1
/
2
)
2
+
(
3
/
2
)
2
+
(
5
/
2
)
2
)
=
35
12
≈
2.92.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\sum _{i=1}^{6}{\frac {1}{6}}\left(i-{\frac {7}{2}}\right)^{2}\\[5pt]&={\frac {1}{6}}\left((-5/2)^{2}+(-3/2)^{2}+(-1/2)^{2}+(1/2)^{2}+(3/2)^{2}+(5/2)^{2}\right)\\[5pt]&={\frac {35}{12}}\approx 2.92.\end{aligned}}}
به صورت کلیتر اگر یک متغیر گسسته کاتورهای داشته باشیم که
n
{\displaystyle n}
مقدار بگیرد و احتمال هر کدام از این مقادیر
1
n
{\displaystyle {\frac {1}{n}}}
باشد، واریانس متغیر کاتورهای ما برابر خواهد بود با:
Var
(
X
)
=
E
(
X
2
)
−
(
E
(
X
)
)
2
=
1
n
∑
i
=
1
n
i
2
−
(
1
n
∑
i
=
1
n
i
)
2
=
(
n
+
1
)
(
2
n
+
1
)
6
−
(
n
+
1
2
)
2
=
n
2
−
1
12
.
{\displaystyle {\begin{aligned}\operatorname {Var} (X)&=\operatorname {E} (X^{2})-(\operatorname {E} (X))^{2}\\[5pt]&={\frac {1}{n}}\sum _{i=1}^{n}i^{2}-\left({\frac {1}{n}}\sum _{i=1}^{n}i\right)^{2}\\[5pt]&={\frac {(n+1)(2n+1)}{6}}-\left({\frac {n+1}{2}}\right)^{2}\\[4pt]&={\frac {n^{2}-1}{12}}.\end{aligned}}}
توزیع نرمال با تابع چگالی احتمال
f
(
x
)
=
1
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
{\displaystyle f(x)={\frac {1}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}}
و پارامترهای
μ
{\displaystyle \mu }
و
σ
{\displaystyle \sigma }
به شکل زیر محاسبه میشود:
Var
(
X
)
=
∫
−
∞
∞
x
2
2
π
σ
2
e
−
(
x
−
μ
)
2
2
σ
2
d
x
−
μ
2
=
σ
2
{\displaystyle \operatorname {Var} (X)=\int _{-\infty }^{\infty }{\frac {x^{2}}{\sqrt {2\pi \sigma ^{2}}}}e^{-{\frac {(x-\mu )^{2}}{2\sigma ^{2}}}}\,dx-\mu ^{2}=\sigma ^{2}}
توزیع نمایی با تابع چگالی احتمال
f
(
x
)
=
λ
e
−
λ
x
{\displaystyle f(x)=\lambda e^{-\lambda x}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
λ
−
1
{\displaystyle \mu =\lambda ^{-1}}
:
Var
(
X
)
=
∫
0
∞
x
2
λ
e
−
λ
x
d
x
−
μ
2
=
λ
−
2
{\displaystyle \operatorname {Var} (X)=\int _{0}^{\infty }x^{2}\lambda e^{-\lambda x}\,dx-\mu ^{2}=\lambda ^{-2}}
توزیع پواسون با تابع چگالی احتمال
p
(
k
)
=
λ
k
k
!
e
−
λ
{\displaystyle {\displaystyle p(k)={\frac {\lambda ^{k}}{k!}}e^{-\lambda }}}
و پارامتر
λ
{\displaystyle \lambda }
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
λ
{\displaystyle \mu =\lambda }
:
Var
(
X
)
=
(
∑
k
=
0
∞
k
2
λ
k
k
!
e
−
λ
)
−
μ
2
=
λ
{\displaystyle \operatorname {Var} (X)=\left(\sum _{k=0}^{\infty }k^{2}{\frac {\lambda ^{k}}{k!}}e^{-\lambda }\right)-\mu ^{2}=\lambda }
توزیع دوجملهای با تابع چگالی احتمال
p
(
k
)
=
(
n
k
)
p
k
(
1
−
p
)
n
−
k
{\displaystyle p(k)={n \choose k}p^{k}(1-p)^{n-k}}
و پارامتر
n
{\displaystyle n}
و
p
{\displaystyle p}
به شکل زیر محاسبه میشود، در این محاسبه
μ
=
n
p
{\displaystyle \mu =np}
:
Var
(
X
)
=
(
∑
k
=
0
n
k
2
(
n
k
)
p
k
(
1
−
p
)
n
−
k
)
−
μ
2
=
n
p
(
1
−
p
)
{\displaystyle \operatorname {Var} (X)=\left(\sum _{k=0}^{n}k^{2}{n \choose k}p^{k}(1-p)^{n-k}\right)-\mu ^{2}=np(1-p)}
فرهنگستان زبان فارسی ، وردیدن از ریشه باستانی ورت (ورتیدن)، را بجای فعل to vary برگزیده است و از این فعل مشتقات وردایی (variance)،وردش (variation)، وردا (variant)، هموردا (covariant)، هم وردایی (covariance)، ناوردا (invariant)، ناوردایی (invariance)، پادوردا (contravariance) را برساخته است.
برای تخمین واریانس یک تابع از بسط تیلور آن به صورت پایین استفاده میکنند:
Var
[
f
(
X
)
]
≈
(
f
′
(
E
[
X
]
)
)
2
Var
[
X
]
{\displaystyle \operatorname {Var} \left[f(X)\right]\approx \left(f'(\operatorname {E} \left[X\right])\right)^{2}\operatorname {Var} \left[X\right]}
page ۱۱۷٬۴۳ introduction to probabilities models by Sheldon M.Ross
↑ «وردایی، واریانس » [آمار، ریاضی ] همارزِ «variance »؛ منبع: گروه واژهگزینی . جواد میرشکاری، ویراستار. دفتر ششم . فرهنگ واژههای مصوب فرهنگستان. تهران : انتشارات فرهنگستان زبان و ادب فارسی . شابک ۹۷۸-۹۶۴-۷۵۳۱-۸۵-۶ (ذیل سرواژهٔ وردایی )
↑ Yuli Zhang, Huaiyu Wu, Lei Cheng (June 2012). Some new deformation formulas about variance and covariance . Proceedings of 4th International Conference on Modelling, Identification and Control(ICMIC2012). pp. 987–992. {{cite conference }}
: نگهداری یادکرد:استفاده از پارامتر نویسندگان (link )
مشارکتکنندگان ویکیپدیا. «Variance ». در دانشنامهٔ ویکیپدیای انگلیسی ، بازبینیشده در ۲۲ فوریه ۲۰۰۸.