二、扩充的例子
6)作用于两个向量的矩阵函数
假设我们要计算两个变量的函数F
F(x,y) = x*exp(-x^2 - y^2)
我们有一系列x值,保存在x向量中,同时我们还有一系列y值。
我们要对向量x上的每个点和向量y上的每个点计算F值。换句话
说,我们要计算对于给定向量x和y的所确定的网格上的F值。
使用meshgrid,我们可以复制x和y来建立合适的输入向量。然后
可以使用第2节中的方法来计算这个函数。
x = (-2:.2:2);
y = (-1.5:.2:1.5)';
[X,Y] = meshgrid(x, y);
F = X .* exp(-X.^2 - Y.^2);
如果函数F具有某些性质,你甚至可以不用meshgrid,比如
F(x,y) = x*y ,则可以直接用向量外积
x = (-2:2);
y = (-1.5:.5:1.5);
x'*y
在用两个向量建立矩阵时,在有些情况下,稀疏矩阵可以更加有
效地利用存储空间,并实现有效的算法。我们将在第8节中以一个
实例来进行更详细地讨论.
7)排序、设置和计数(Ordering, Setting, and Counting Operations)
在迄今为止讨论过的例子中,对向量中一个元素的计算都是独立
于同一向量的其他元素的。但是,在许多应用中,你要做的计算
则可能与其它元素密切相关。例如,假设你用一个向量x来表示一
个集合。不观察向量的其他元素,你并不知道某个元素是不是一
个冗余元素,并应该被去掉。如何在不使用循环语句的情况下删除
冗余元素,至少在现在,并不是一个明显可以解决的问题。
解决这类问题需要相当的智巧。以下介绍一些可用的基本工具
max 最大元素
min 最小元素
sort 递增排序
unique 寻找集合中互异元素(去掉相同元素)
diff 差分运算符[X(2) - X(1), X(3) - X(2), ... X(n) - X(n-1)]
find 查找非零、非NaN元素的索引值
union 集合并
intersect 集合交
setdiff 集合差
setxor 集合异或
继续我们的实例,消除向量中的多余元素。注意:一旦向量排序后,
任何多余的元素就是相邻的了。同时,在任何相等的相邻元素在向量
diff运算时变为零。这是我们能够应用以下策略达到目的。我们现在
在已排序向量中,选取那些差分非零的元素。
% 初次尝试。不太正确!
x = sort(x(:));
difference = diff(x);
y = x(difference~=0);
这离正确结果很近了,但是我们忘了diff函数返回向量的元素个数比
输入向量少1。在我们的初次尝试中,没有考虑到最后一个元素也可能
是相异的。为了解决这个问题,我们可以在进行差分之前给向量x加入
一个元素,并且使得它与以前的元素一定不同。一种实现的方法是增
加一个NaN。
% 最终的版本。
x = sort(x(:));
difference = diff([x;NaN]);
y = x(difference~=0);
我们使用(:)运算来保证x是一个向量。我们使用~=0运算,而不用find
函数,因为find函数不返回NaN元素的索引值,而我们操作中差分的最
后元素一定是NaN。这一实例还有另一种实现方式:
y=unique(x);
后者当然很简单,但是前者作为一个练习并非无用,它是为了练习使用
矢量化技术,并示范如何编写你自己的高效代码。此外,前者还有一个
作用:Unique函数提供了一些超出我们要求的额外功能,这可能降低代
码的执行速度。
假设我们不只是要返回集合x,而且要知道在原始的矩阵里每个相异元素
出现了多少个“复本”。一旦我们对x排序并进行了差分,我们可以用
find来确定差分变化的位置。再将这个变化位置进行差分,就可以得到
复本的数目。这就是"diff of find of diff"的技巧。基于以上的讨论,
我们有:
% Find the redundancy in a vector x
x = sort(x(:));
difference = diff([x;max(x)+1]);
count = diff(find([1;difference]));
y = x(find(difference));
plot(y,count)
这个图画出了x中每个相异元素出现的复本数。注意,在这里我们避开了
NaN,因为find不返回NaN元素的索引值。但是,作为特例,NaN和Inf
的复本数可以容易地计算出来:
count_nans = sum(isnan(x(:)));
count_infs = sum(isinf(x(:)));
另一个用于求和或者计数运算的矢量化技巧是用类似建立稀疏矩阵的方
法实现的。这还将在第9节中作更加详细的讨论.
8)稀疏矩阵结构(Sparse Matrix Structures)
在某些情况下,你可以使用稀疏矩阵来增加计算的效率。如果你构造一
个大的中间矩阵,通常矢量化更加容易。在某些情况下,你可以充分利
用稀疏矩阵结构来矢量化代码,而对于这个中间矩阵不需要大的存储空
间。
假设在上一个例子中,你事先知道集合y的域是整数的子集,
{k+1,k+2,...k+n};即,
y = (1:n) + k
例如,这样的数据可能代表一个调色板的索引值。然后,你就可以对集
合中每个元素的出现进行计数(构建色彩直方图?译者)。这是对上一
节中"diff of find of diff"技巧的一种变形。
现在让我们来构造一个大的m x n矩阵A,这里m是原始x向量中的元素数,
n是集合y中的元素数。
A(i,j) = 1 if x(i) = y(j)
0 otherwise
回想一下第3节和第4节,你可能认为我们需要从x和y来构造矩阵A。如果
当然可以,但要消耗许多存储空间。我们可以做得更好,因为我们知道,
矩阵A中的多数元素为0,x中的每个元素对应的行上只有一个值为1。
以下就是构造矩阵的方法(注意到y(j) = k+j,根据以上的公式):
x = sort(x(:));
A = sparse(1:length(x), x+k, 1, length(x), n);
现在我们对A的列进行求和,得到出现次数。
count = sum(A);
在这种情况下,我们不必明确地形成排序向量y,因为我们事先知道
y = 1:n + k.
这里的关键是使用数据,(也就是说,用x控制矩阵A的结构)。由于x在
一个已知范围内取整数值,我们可以更加有效地构造矩阵。
假设你要给一个很大矩阵的每一列乘以相同的向量。使用稀疏矩阵,不仅
可以节省空间,并且要比在第5节介绍的方法更加快速. 下面是它的工作
方式:
F = rand(1024,1024);
x = rand(1024,1);
% 对F的所有行进行点型乘法.
Y = F * diag(sparse(x));
% 对F的所有列进行点型乘法.
Y = diag(sparse(x)) * F;
我们充分利用矩阵乘法算符来执行大规模运算,并使用稀疏矩阵以防止临
时变量变得太大。
9)附加的例子(Additional Examples)
下面的例子使用一些在本技术手册中讨论过的方法,以及其它一些相关方
法。请尝试使用tic 和toc(或t=cputime和cputime-t),看一下速度加快
的效果。
用于计算数组的双重for循环。
使用的工具:数组乘法
优化前:
A = magic(100);
B = pascal(100);
for j = 1:100
for k = 1:100;
X(j,k) = sqrt(A(j,k)) * (B(j,k) - 1);
end
end
优化后:
A = magic(100);
B = pascal(100);
X = sqrt(A).*(B-1);
用一个循环建立一个向量,其元素依赖于前一个元素
使用的工具:FILTER, CUMSUM, CUMPROD
优化前:
A = 1;
L = 1000;
for i = 1:L
A(i+1) = 2*A(i)+1;
end
优化后:
L = 1000;
A = filter([1],[1 -2],ones(1,L+1));
如果你的向量构造只使用加法或乘法,你可使用cumsum或cumprod函数。
优化前:
n=10000;
V_B=100*ones(1,n);
V_B2=100*ones(1,n);
ScaleFactor=rand(1,n-1);
for i = 2:n
V_B(i) = V_B(i-1)*(1+ScaleFactor(i-1));
end
for i=2:n
V_B2(i) = V_B2(i-1)+3;
end
优化后:
n=10000;
V_A=100*ones(1,n);
V_A2 = 100*ones(1,n);
ScaleFactor=rand(1,n-1);
V_A=cumprod([100 1+ScaleFactor]);
V_A2=cumsum([100 3*ones(1,n-1)]);
向量累加,每5个元素进行一次:
工具:CUMSUM , 向量索引
优化前:
% Use an arbitrary vector, x
x = 1:10000;
y = [];
for n = 5:5:length(x)
y = [y sum(x(1:n))];
end
优化后(使用预分配):
x = 1:10000;
ylength = (length(x) - mod(length(x),5))/5;
% Avoid using ZEROS command during preallocation
y(1:ylength) = 0;
for n = 5:5:length(x)
y(n/5) = sum(x(1:n));
end
优化后(使用矢量化,不再需要预分配):
x = 1:10000;
cums = cumsum(x);
y = cums(5:5:length(x));
操作一个向量,当某个元素的后继元素为0时,重复这个元素:
工具:FIND, CUMSUM, DIFF
任务:我们要操作一个由非零数值和零组成的向量,要求把零替换成为
它前面的非零数值。例如,我们要转换下面的向量:
a=2; b=3; c=5; d=15; e=11;
x = [a 0 0 0 b 0 0 c 0 0 0 0 d 0 e 0 0 0 0 0];
为:
x = [a a a a b b b c c c c c d d e e e e e e];
解(diff和cumsum是反函数):
valind = find(x);
x(valind(2:end)) = diff(x(valind));
x = cumsum(x);
将向量的元素累加到特定位置上
工具:SPARSE
优化前:
% The values we are summing at designated indices
values = [20 15 45 50 75 10 15 15 35 40 10];
% The indices associated with the values are summed cumulatively
indices = [2 4 4 1 3 4 2 1 3 3 1];
totals = zeros(max(indices),1);
for n = 1:length(indices)
totals(indices(n)) = totals(indices(n)) + values(n);
end
优化后:
indices = [2 4 4 1 3 4 2 1 3 3 1];
totals = full(sparse(indices,1,values));
注意:这一方法开辟了稀疏矩阵的新用途。在使用sparse命令创建稀疏矩阵
时,它是对分配到同一个索引的所有值求和,而不是替代已有的数值。这称
为"向量累加",是MATLAB处理稀疏矩阵的方式。