MATLAB 数据\数组操作神器之setdiff 函数的强大用法，你会用吗？-51CTO.COM

在 MATLAB 的数据或者数组处理操作中，有一个经常被忽视的小函数——setdiff，却能帮我们解决许多日常的“集合差异”问题。无论是数据去重、筛选，还是在多组数据中找出独有值，setdiff 都大显身手。今天这篇推文，我们就带大家轻松掌握 setdiff 的强大用法，学会让它成为你的 MATLAB 数据处理“神器”！

什么是 setdiff 函数？

简单来说，setdiff 用于返回两个数组的差异。它会找出在第一个数组中出现但不在第二个数组中的所有独特元素。setdiff(A, B) 会返回一个包含在 A 中但不在 B 中的值，结果是去重并按升序排列的。

举个例子，假设我们有两组数据：

A = [1 2 3 4];
B = [3 4 5 6];
result = setdiff(A, B);
disp(result);  % 输出: [1 2]

这个结果告诉我们，[1 2] 是 A 中独有的元素，在 B 中并不存在。

用法 1：筛选独特数据

当我们有两个数据组，并希望知道第一个数据组中的独特值时，setdiff 非常方便。例如，在数据分析中，我们可能需要知道哪些数据在老数据库中有，而在新数据库中没有：

old_data = [10, 20, 30, 40];
new_data = [30, 40, 50, 60];
unique_old = setdiff(old_data, new_data);
disp(unique_old);  % 输出: [10 20]

输出告诉我们，旧数据库中 10 和 20 不在新数据中，可以根据这些结果进行筛选和更新操作。

用法 2：移除指定数据

setdiff 也可以用来移除不需要的值，比如我们在一个数据列表中有些“无效”值（如特定的 ID、默认值等），可以直接从数据集中去掉这些值。

data = [1, 2, 3, 4, 5, 3, 4];
remove_vals = [3, 4];
cleaned_data = setdiff(data, remove_vals);
disp(cleaned_data);  % 输出: [1 2 5]

在这个例子中，我们轻松地去掉了值 3 和 4，获得了干净的 data。

用法 3：处理多行多列数据

setdiff 还支持多行和多列数据的处理！对于二维数组，它会将每一行看成一个整体，返回在 A 中独有的行。

A = [1 2; 3 4; 5 6];
B = [3 4; 7 8];
unique_rows = setdiff(A, B, 'rows');
disp(unique_rows);  
% 输出:
% 1 2
% 5 6

在这个例子中，[1 2] 和 [5 6] 是 A 中独有的行，在 B 中找不到。

用法 4：返回索引位置

setdiff 还可以返回差异元素在原数组中的索引位置。只需添加一个输出参数即可：

A = [10, 20, 30, 40];
B = [20, 40];
[unique_A, idx] = setdiff(A, B);
disp(unique_A);  % 输出: [10 30]
disp(idx);       % 输出: [1 3]

这个结果告诉我们，不在 B 中的 10 和 30 分别位于 A 的第 1 和第 3 位。这样我们可以轻松定位和操作这些值！

小结：setdiff，你的数据“筛选专家”

setdiff 函数可以帮助我们快速查找差异、移除无用数据、处理多维数组，还可以获得位置索引。无论是简单的向量操作，还是复杂的数据表筛选，setdiff 都能高效解决问题。