std::set_union

来自cppreference.com
< cpp‎ | algorithm
 
 
算法库
受约束算法及范围上的算法 (C++20)
包含算法例如 ranges::copy, ranges::sort, ...
执行策略 (C++17)
排序和相关操作
划分操作
排序操作
二分搜索操作(在已划分范围上)
集合操作(在有序范围上)
归并操作(在有序范围上)
堆操作
最小/最大操作
(C++11)
(C++17)
字典序比较操作
排列操作
C 库

数值运算
(C++11)                       
在未初始化内存上的操作
 
在标头 <algorithm> 定义
template< class InputIt1, class InputIt2, class OutputIt >

OutputIt set_union( InputIt1 first1, InputIt1 last1,
                    InputIt2 first2, InputIt2 last2,

                    OutputIt d_first );
(1) (C++20 起为 constexpr)
template< class ExecutionPolicy,

          class ForwardIt1, class ForwardIt2, class ForwardIt3 >
ForwardIt3 set_union( ExecutionPolicy&& policy,
                      ForwardIt1 first1, ForwardIt1 last1,
                      ForwardIt2 first2, ForwardIt2 last2,

                      ForwardIt3 d_first );
(2) (C++17 起)
template< class InputIt1, class InputIt2,

          class OutputIt, class Compare >
OutputIt set_union( InputIt1 first1, InputIt1 last1,
                    InputIt2 first2, InputIt2 last2,

                    OutputIt d_first, Compare comp );
(3) (C++20 起为 constexpr)
template< class ExecutionPolicy,

          class ForwardIt1, class ForwardIt2,
          class ForwardIt3, class Compare >
ForwardIt3 set_union( ExecutionPolicy&& policy,
                      ForwardIt1 first1, ForwardIt1 last1,
                      ForwardIt2 first2, ForwardIt2 last2,

                      ForwardIt3 d_first, Compare comp );
(4) (C++17 起)

构造从 d_first 开始的有序并集,由存在于有序范围 [first1last1)[first2last2) 之一或二者中的所有元素构成。

如果 [first1last1) 中有 m 个互相等价的元素,并且 [first2last2) 中有 n 个与它们等价的元素,那么将从 [first1last1) 保持顺序地复制全部 m 个元素到输出范围,然后从 [first2last2) 保持顺序地复制最后 std::max(n - m, 0) 个元素到输出范围。

1) 如果 [first1last1)[first2last2) 没有按 operator< (C++20 前)std::less{} (C++20 起) 排序,那么行为未定义。
3) 如果 [first1last1)[first2last2) 没有按 comp 排序,那么行为未定义。
2,4)(1,3),但按照 policy 执行。
这些重载只有在

std::is_execution_policy_v<std::decay_t<ExecutionPolicy>>

(C++20 前)

std::is_execution_policy_v<std::remove_cvref_t<ExecutionPolicy>>

(C++20 起)
true 时时才会参与重载决议。

如果输出范围与 [first1last1)[first2last2) 重叠,那么行为未定义。

参数

first1, last1 - 第一个输入的已排序范围
first2, last2 - 第二个输入的已排序范围
d_first - 输出范围的起始
policy - 所用的执行策略。细节见执行策略
comp - 比较函数对象(即满足比较 (Compare) 概念的对象),在第一参数小于(即 序于)第二参数时返回 ​true

比较函数的签名应等价于如下:

bool cmp(const Type1 &a, const Type2 &b);

虽然签名不必有 const&,函数也不能修改传递给它的对象,而且必须接受(可为 const 的)类型 Type1Type2 的值,无关乎值类别(从而不允许 Type1& ,也不允许 Type1,除非 Type1 的移动等价于复制 (C++11 起))。
类型 Type1Type2 必须使得 InputIt1InputIt2 类型的对象在解引用后能隐式转换到 Type1Type2 两者。 ​

类型要求
-
InputIt1, InputIt2 必须满足老式输入迭代器 (LegacyInputIterator)
-
ForwardIt1, ForwardIt2, ForwardIt3 必须满足老式向前迭代器 (LegacyForwardIterator)
-
OutputIt 必须满足老式输出迭代器 (LegacyOutputIterator)
-
Compare 必须满足比较 (Compare)

返回值

所构造范围的尾后迭代器。

复杂度

给定 N
1
std::distance(first1, last1)N
2
std::distance(first2, last2)

1,2) 最多应用 2⋅(N
1
+N
2
)-1
operator< (C++20 前)std::less{} (C++20 起) 进行比较。
3,4) 最多应用 2⋅(N
1
+N
2
)-1
次比较函数 comp

异常

拥有名为 ExecutionPolicy 的模板形参的重载按下列方式报告错误:

  • 如果作为算法一部分调用的函数的执行抛出异常,且 ExecutionPolicy标准策略之一,那么调用 std::terminate。对于任何其他 ExecutionPolicy,行为由实现定义。
  • 如果算法无法分配内存,那么抛出 std::bad_alloc

可能的实现

set_union (1)
template<class InputIt1, class InputIt2, class OutputIt>
OutputIt set_union(InputIt1 first1, InputIt1 last1,
                   InputIt2 first2, InputIt2 last2, OutputIt d_first)
{
    for (; first1 != last1; ++d_first)
    {
        if (first2 == last2)
            return std::copy(first1, last1, d_first);
 
        if (*first2 < *first1)
            *d_first = *first2++;
        else
        {
            *d_first = *first1;
            if (!(*first1 < *first2))
                ++first2;
            ++first1;
        }
    }
    return std::copy(first2, last2, d_first);
}
set_union (3)
template<class InputIt1, class InputIt2, class OutputIt, class Compare>
OutputIt set_union(InputIt1 first1, InputIt1 last1,
                   InputIt2 first2, InputIt2 last2, OutputIt d_first, Compare comp)
{
    for (; first1 != last1; ++d_first)
    {
        if (first2 == last2)
            // 结束第二个范围,包含第一个范围的剩余:
            return std::copy(first1, last1, d_first);
 
        if (comp(*first2, *first1))
            *d_first = *first2++;
        else
        {
            *d_first = *first1;
            if (!comp(*first1, *first2)) // 等价 => 不需要包含 *first2.
                ++first2;
            ++first1;
        }
    }
    // 结束第二个范围,包含第二个范围的剩余:
    return std::copy(first2, last2, d_first);
}

注解

此算法进行与 std::merge 相似的任务。两个算法都会消耗两个输入范围,并以来自两个输入的元素产生一个有序输出。这两个算法间的区别在于如何处理来自两个输入范围的比较为等价的值(见可比较小于的注解)。如果任何等价的值在第一范围中出现 n 次,在第二范围中出现 m 次,那么 std::merge 会生成全部 n + m 次出现,而 std::set_union 只会输出 std::max(n, m) 次。所以 std::merge 恰好输入 std::distance(first1, last1) + std::distance(first2, last2) 个值,而 std::set_union 可能产生较少的值。

示例

#include <algorithm>
#include <iostream>
#include <iterator>
#include <vector>
 
void println(const std::vector<int>& v)
{
    for (int i : v)
        std::cout << i << ' ';
    std::cout << '\n';
}
 
int main()
{
    std::vector<int> v1, v2, dest;
 
    v1 = {1, 2, 3, 4, 5};
    v2 = {3, 4, 5, 6, 7};
 
    std::set_union(v1.cbegin(), v1.cend(),
                   v2.cbegin(), v2.cend(),
                   std::back_inserter(dest));
    println(dest);
 
    dest.clear();
 
    v1 = {1, 2, 3, 4, 5, 5, 5};
    v2 = {3, 4, 5, 6, 7};
 
    std::set_union(v1.cbegin(), v1.cend(),
                   v2.cbegin(), v2.cend(),
                   std::back_inserter(dest));
    println(dest);
}

输出:

1 2 3 4 5 6 7 
1 2 3 4 5 5 5 6 7

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
LWG 291 C++98 未指定如何处理输入范围中等价的值 已指定处理方法

参阅

若一个序列是另一个的子序列则返回 true
(函数模板)
合并两个有序范围
(函数模板)
计算两个集合的差集
(函数模板)
计算两个集合的交集
(函数模板)
计算两个集合的对称差
(函数模板)
计算两个集合的并集
(niebloid)