std::merge

来自cppreference.com
< cpp‎ | algorithm
 
 
算法库
受约束算法及范围上的算法 (C++20)
包含算法例如 ranges::copy, ranges::sort, ...
执行策略 (C++17)
排序和相关操作
划分操作
排序操作
二分搜索操作(在已划分范围上)
集合操作(在有序范围上)
归并操作(在有序范围上)
merge
堆操作
最小/最大操作
(C++11)
(C++17)
字典序比较操作
排列操作
C 库

数值运算
(C++11)                       
在未初始化内存上的操作
 
在标头 <algorithm> 定义
template< class InputIt1, class InputIt2, class OutputIt >

OutputIt merge( InputIt1 first1, InputIt1 last1,
                InputIt2 first2, InputIt2 last2,

                OutputIt d_first );
(1) (C++20 起为 constexpr)
template< class ExecutionPolicy,

          class ForwardIt1, class ForwardIt2, class ForwardIt3 >
ForwardIt3 merge( ExecutionPolicy&& policy,
                  ForwardIt1 first1, ForwardIt1 last1,
                  ForwardIt2 first2, ForwardIt2 last2,

                  ForwardIt3 d_first );
(2) (C++17 起)
template< class InputIt1, class InputIt2,

          class OutputIt, class Compare >
OutputIt merge( InputIt1 first1, InputIt1 last1,
                InputIt2 first2, InputIt2 last2,

                OutputIt d_first, Compare comp );
(3) (C++20 起为 constexpr)
template< class ExecutionPolicy,

          class ForwardIt1, class ForwardIt2,
          class ForwardIt3, class Compare >
ForwardIt3 merge( ExecutionPolicy&& policy,
                  ForwardIt1 first1, ForwardIt1 last1,
                  ForwardIt2 first2, ForwardIt2 last2,

                  ForwardIt3 d_first, Compare comp );
(4) (C++17 起)

将两个有序范围 [first1last1)[first2last2) 合并到始于 d_first 的一个有序范围中。

1) 如果 [first1last1)[first2last2) 没有按 operator< (C++20 前)std::less{} (C++20 起) 排序,那么行为未定义。
3) 如果 [first1last1)[first2last2) 没有按 comp 排序,那么行为未定义。
2,4)(1,3),但按照 policy 执行。
这些重载只有在

std::is_execution_policy_v<std::decay_t<ExecutionPolicy>>

(C++20 前)

std::is_execution_policy_v<std::remove_cvref_t<ExecutionPolicy>>

(C++20 起)
true 时时才会参与重载决议。

此合并函数是稳定的,意思是对于两个原范围中的等价元素,来自第一范围的元素(保持原来的顺序)先于来自第二范围的元素(保持原来的顺序)。

如果输出范围与 [first1last1)[first2last2) 重叠,那么行为未定义。

参数

first1, last1 - 要合并的第一个范围
first2, last2 - 要合并的第二个范围
d_first - 目标范围的起始
policy - 所用的执行策略。细节见执行策略
comp - 比较函数对象(即满足比较 (Compare) 概念的对象),在第一参数小于(即 序于)第二参数时返回 ​true

比较函数的签名应等价于如下:

bool cmp(const Type1 &a, const Type2 &b);

虽然签名不必有 const&,函数也不能修改传递给它的对象,而且必须接受(可为 const 的)类型 Type1Type2 的值,无关乎值类别(从而不允许 Type1& ,也不允许 Type1,除非 Type1 的移动等价于复制 (C++11 起))。
类型 Type1Type2 必须使得 InputIt1InputIt2 类型的对象在解引用后能隐式转换到 Type1Type2 两者。 ​

类型要求
-
InputIt1, InputIt2 必须满足老式输入迭代器 (LegacyInputIterator)
-
ForwardIt1, ForwardIt2, ForwardIt3 必须满足老式向前迭代器 (LegacyForwardIterator)
-
OutputIt 必须满足老式输出迭代器 (LegacyOutputIterator)
-
Compare 必须满足比较 (Compare)

返回值

指向最后被复制元素后一元素的迭代器。

复杂度

给定 N
1
std::distance(first1, last1)N
2
std::distance(first2, last2)

1) 最多应用 N
1
+N
2
-1
operator< (C++20 前)std::less{} (C++20 起) 进行比较。
2) 应用 O(N
1
+N
2
)
operator< (C++20 前)std::less{} (C++20 起) 进行比较。
3) 最多应用 N
1
+N
2
-1
次比较函数 comp
4) 应用 O(N
1
+N
2
)
次比较函数 comp

异常

拥有名为 ExecutionPolicy 的模板形参的重载按下列方式报告错误:

  • 如果作为算法一部分调用的函数的执行抛出异常,且 ExecutionPolicy标准策略之一,那么调用 std::terminate。对于任何其他 ExecutionPolicy,行为由实现定义。
  • 如果算法无法分配内存,那么抛出 std::bad_alloc

可能的实现

参阅 libstdc++libc++ 中的实现。

merge (1)
template<class InputIt1, class InputIt2, class OutputIt>
OutputIt merge(InputIt1 first1, InputIt1 last1,
               InputIt2 first2, InputIt2 last2,
               OutputIt d_first)
{
    for (; first1 != last1; ++d_first)
    {
        if (first2 == last2)
            return std::copy(first1, last1, d_first);
 
        if (*first2 < *first1)
        {
            *d_first = *first2;
            ++first2;
        }
        else
        {
            *d_first = *first1;
            ++first1;
        }
    }
    return std::copy(first2, last2, d_first);
}
merge (3)
template<class InputIt1, class InputIt2,
         class OutputIt, class Compare>
OutputIt merge(InputIt1 first1, InputIt1 last1,
               InputIt2 first2, InputIt2 last2,
               OutputIt d_first, Compare comp)
{
    for (; first1 != last1; ++d_first)
    {
        if (first2 == last2)
            return std::copy(first1, last1, d_first);
 
        if (comp(*first2, *first1))
        {
            *d_first = *first2;
            ++first2;
        }
        else
        {
            *d_first = *first1;
            ++first1;
        }
    }
    return std::copy(first2, last2, d_first);
}

注解

此算法所做的任务与 std::set_union 类似。它们都消耗两个有序输入范围,并产生拥有来自两个输入的元素的有序输出。此二算法的区别在于如何处理来自两个输入的比较等价(见可小于比较 (LessThanComparable) 的注解)的值。若任何等价的值在第一范围出现 n 次,在第二范围出现 m 次,则 std::merge 会输出所有 n+m 次出现,而 std::set_union 将只输出 std::max(n, m) 次。故 std::merge 恰好输出 std::distance(first1, last1) + std::distance(first2, last2) 个值,而 std::set_union 可能产生得更少。

示例

#include <algorithm>
#include <functional>
#include <iostream>
#include <iterator>
#include <random>
#include <vector>
 
auto print = [](const auto rem, const auto& v)
{
    std::cout << rem;
    std::copy(v.begin(), v.end(), std::ostream_iterator<int>(std::cout, " "));
    std::cout << '\n';
};
 
int main()
{
    // 以随机数填充 vector
    std::random_device rd;
    std::mt19937 mt(rd());
    std::uniform_int_distribution<> dis(0, 9);
 
    std::vector<int> v1(10), v2(10);
    std::generate(v1.begin(), v1.end(), std::bind(dis, std::ref(mt)));
    std::generate(v2.begin(), v2.end(), std::bind(dis, std::ref(mt)));
 
    print("原来:\nv1:", v1);
    print("v2:", v2);
 
    std::sort(v1.begin(), v1.end());
    std::sort(v2.begin(), v2.end());
 
    print("排序后:\nv1:", v1);
    print("v2:", v2);
 
    // 合并
    std::vector<int> dst;
    std::merge(v1.begin(), v1.end(), v2.begin(), v2.end(), std::back_inserter(dst));
 
    print("合并后:\ndst:", dst);
}

可能的输出:

原来:
v1:2 6 5 7 4 2 2 6 7 0
v2:8 3 2 5 0 1 9 6 5 0
排序后:
v1:0 2 2 2 4 5 6 6 7 7
v2:0 0 1 2 3 5 5 6 8 9
合并后:
dst:0 0 0 1 2 2 2 2 3 4 5 5 5 6 6 6 7 7 8 9

缺陷报告

下列更改行为的缺陷报告追溯地应用于以前出版的 C++ 标准。

缺陷报告 应用于 出版时的行为 正确行为
LWG 780 C++98 未定义合并运算 提供定义

参阅

就地合并两个有序范围
(函数模板)
(C++11)
检查范围是否已按升序排列
(函数模板)
计算两个集合的并集
(函数模板)
将范围按升序排序
(函数模板)
将范围内的元素排序,同时保持相等的元素之间的顺序
(函数模板)
归并两个有序范围
(niebloid)