您的位置：首页 >聚焦 >

机器学习经典算法：k-SVD 前面为什么加个 k?

2022-02-26 23:06:42 来源：程序员客栈

11、字典学习思想

人类知识的发展历程比较复杂，我们简单点将其看成一个迭代过程：一代人的知识积累下来，再传授给下一代，下一代人除了使用已有知识外，还会对知识作进一步提升和扩展，然后继续传授给下一代。如此往复，不断进步。

然而知识从广义上看非常宽泛，我们不妨将其作一个简化，假设知识可以用一个字典来表示，那么知识的形成和应用也简化为两个步骤：建字典和查字典。

这里隐藏着如下一些大致要求，

字典尽量建得全面完备，以满足各个方面各个角度的不同应用。概括地说，就是具有完备性甚至允许冗余性。

而查字典往往是为了解决某一个特定问题，因此涉及到的具体知识点会比较有限，反映在所谓的稀疏性上。概括地说，就是具有稀疏性而不失精准。

从机器学习的角度来看，我们需要将这两点数学化，那么该如何办到呢？

¸转化为数学问题

我们将上面的所提到的几个关键点用简单的数学概念表示如下：

数据矩阵，用

表示，每一列表示一个样本；字典矩阵，用

表示，而列向量

表示字典中的词条，称为原子（atom）；稀疏表示，即查字典，用矩阵乘法表示，即

，其中

的列表示一个样本的系数向量。2k-SVD 方法

我们的出发点是观察到的

个随机变量根据线性模型用

个潜在变量表示

\mathbf{y}=\mathbf{D} \mathbf{x}, \quad \mathbf{y} \in \mathbb{R}^{l}, \quad \mathbf{x} \in \mathbb{R}^{m}, \;m>l