计算学习理论

时间：2023-02-11 理论教育版权反馈

【摘要】：在第18.2节中提出而未回答的主要问题是：如何能确信学习算法产生了正确预测未来的理论？本节所采用的方法是建立在计算学习理论基础上的，这是一个人工智能、统计学以及理论计算科学的交叉点。任何能够返回可能近似正确的假设的学习算法被称为PAC-学习算法。在前面的讨论中还有一些副题。如果没有稳态假定，那么理论根本不能对未来进行任何断言，因为在未来和过去之间没有任何必然联系。

在第18.2节中提出而未回答的主要问题是：如何能确信学习算法产生了正确预测未来的理论？形式化地说，如果我们不知道目标函数f是什么，那么我们如何能够知道假设h是否接近f呢？这些问题已经被思考了数个世纪。除非我们找到这些问题的答案，否则机器学习仍然会被自己取得成功的原因所困扰。

本节所采用的方法是建立在计算学习理论基础上的，这是一个人工智能、统计学以及理论计算科学的交叉点。它的基础原则是：任何一个有严重错误的假设都几乎肯定在用于少量实例之后以较高的概率被“发现”，因为它将做出不正确的预测。于是，任何与足够大的训练实例集相一致的假设都不太可能是有严重错误的：也就是说，它一定是可能近似正确的（probably approximately correct）。任何能够返回可能近似正确的假设的学习算法被称为PAC-学习算法。

在前面的讨论中还有一些副题。主要问题就是训练实例和测试实例之间的关系；毕竟，我们希望假设在测试集上近似正确，而不仅是在训练集上近似正确。关键的假定是训练集和测试集都是从相同的实例群体中以同样的概率分布随机而独立地抽取出来的。这被称为稳态假定。如果没有稳态假定，那么理论根本不能对未来进行任何断言，因为在未来和过去之间没有任何必然联系。稳态假定实际上等于设想选取实例的过程是无恶意的。显然，如果训练集仅仅包含一些古怪的实例——例如，两个头的狗——那么学习算法无法避免做出关于如何识别狗的错误概括。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈