学习资料
X independent variableY dependent variable
上图,每一个饲料下的小猪体重是相同的 (点击查看绘图代码)
E(y_i)=104.1+0.71x_i\beta_0 =104.1: 对于BMI=0的人,收缩压是104.1 mmHg\beta_1=0.71:BMI没增加一单位,收缩压增加0.71 mmHg(正的就是增加)
由于不存在BMI=0的人,为了使\beta_0更有意义,我们需要x_i减去一个值
\hat{\beta_1}= \sum_{n}^{i=1}y_i\omega_i,其中\omega_i=\omega_i(x_1,\cdots , x_n)\hat{\beta_0}= \sum_{n}^{i=1}y_i\gamma_i,其中\gamma_i=\gamma_i(x_1,\cdots , x_n)
当要对\beta_1做假设检验,我们需要知道\beta_1的variance
当进行两组比较时,或者说当X等于0或1时,回归分析中的\hat{\beta_1}的值与t检验的分子相同,\hat{\beta_1}方差的估计值与t检验的分母相同
这里假设y_1 \cdots y_n都是服从常态分布,并且y_1 \cdots y_n都是独立的,所以likelihood就是所有观察到y的几率相乘
这里要找出哪一组\beta_0、\beta_1和\sigma^2使得likelihood的值最大
注意:在一般的线性回归里,就是当随机变量y服从常态分布时,使用least-squares estimators与maximum likelihood估计的\beta是完全一样的,这只针对y是连续的值有效,当y是1或0时,这两个估计的结果不同
方式一:F test (SST=SSR+SSE)方式二: t test (t= \frac{var-E(var)}{\sigma} )