The Perceptron Algorithm

Note

Published

January 19, 2026

2.2 The Perceptron Algorithm

感知机是最早的线性分类算法之一（Rosenblatt, 1958），其重要性不在于性能，而在于：

定义硬阈值激活函数： \[ g(z)= \begin{cases} 1, & z \ge 0 \\ 0, & z < 0 \end{cases} \]

感知机假设函数： \[ h_\theta(x)=g(\theta^T x) \]

注意：这里的 \(h_\theta(x)\) 不再是概率，只是一个分类决策。

对单个样本 \((x^{(i)},y^{(i)})\)，更新为： \[ \boxed{ \theta := \theta + \alpha\,(y^{(i)} - h_\theta(x^{(i)}))\,x^{(i)} } \]

关键点：Perceptron 的更新公式看起来与 logistic regression 极其相似，但这是”形式相似”，而不是”理论等价”。

用 \(y^*\in\{\pm1\}\)，定义 margin： \[ m = y^*(\theta^T x) \]

Perceptron 的隐式 loss 可以写为： \[ \ell_{\text{perc}}(m)=\max(0,-m) \]

性质：

Perceptron Convergence Theorem：

深层理解：

感知机没有概率模型 ⇒ 没有似然 ⇒ 没有”最优解”的概念；

它只是一个”错误修正机制”，不是统计估计器。

Perceptron 是 logistic regression 的”硬阈值极限版本”：
它共享相同的线性判别结构，但放弃了概率语义、可微性与统计最优性。