Достаточно часто в программировании появляется необходимость использовать структуру данных поддерживающую операции добавления элемета, поиска минимума и удаления минимума. В C++ для этого есть несколько решений. Самый популярные из них это std::multiset
и std::priority_queue
, и менее известное __gnu_pbds::priority_queue
(Как и всё из __gnu_pbds
поддерживается только в GNU C++. Для использования этой структуры необходимо добавить #include <ext/pb_ds/priority_queue.hpp>
в программу).
Давайте кратко рассмотрим что из себя представляют эти структуры.
std::multiset
— структура данных хранящая элементы в отсортированном порядке. Отличается от std::set
возможностью хранить несколько вхождений равных элементов. Кроме интересных нам возможностей добавлять элемент, а также получать и удалять минимум, структура поддерживает возможность удаления любого элемента по значению и итератору, поиск следующего и предыдущего элемента, а также бинарный поиск. Все описанные операции выполняются за $$$O(\log{n})$$$.
std::priority_queue
— структура данных поддерживающая добавление элемента и удаление минимума за $$$O(\log{n})$$$, а получение минимума за $$$O(1)$$$. Она не поддерживает остальные описанные для std::multiset
операции, но операции которые эта структура поддерживает выполняются ей быстрее чем их выполняет std::multiset
.
__gnu_pbds::priority_queue
— намного более гибкий аналог std::priority_queue
. Может очень сильно меняться в зависимости от выбранного тега. О самой структуре и тегах можно почитать здесь. Для тегов __gnu_pbds::priority_queue
я использовал сокращения (BHT = binary_heap_tag
, PHT = pairing_heap_tag
, BiHT = binomial_heap_tag
, RCBiHT = rc_binomial_heap_tag
, THT = thin_heap_tag
).
Все тесты будут проведены на Codeforces на G++20 (64 bit). Для данных типа int
тесты будут проведены на 2 разных задачах. Также будет сравнение производительности на задаче связанной с поиском потока минимальной стоимости. Там рассматриваемые структуры будут применяться с std::pair<long long, int>
. При работе с типом int
не были рассмотрены почти все теги так как все они кроме двух работают с ним совсем медленно. Перейдем к результатам тестов.
Добавление всех элементов, а после доступ к минимумам и их удаление пока структура не пуста. Псевдокод:
while (q.size() != N):
q.push(rand())
while (q.size() != 0):
q.top()
q.pop()
Результат:
Равновероятный вызов доступа к минимуму и его удаления или добавления двух элементов. Псевдокод:
for (i < N):
if (rand() % 2):
q.push(rand())
q.push(rand())
else:
q.top()
q.pop()
Результат:
Поиск потока минимальной стоимости.
Результат:
В итоге std::priority_queue
работает быстрее остальных структур во всех проведенных мной тестах. std::multiset
является намного более гибкой структурой и поддерживает множество операций, но работает довольно медленно во многих случаях. __gnu_pbds::priority_queue
в зависимости от тега может работать примерно также быстро как и std::priority_queue
, а может работать намного медленнее с типами int
и std::pair<long long, int>
.
What operations does pbds queue support that std queue doesn't?
In __gnu_pbds::priority_queue push returns an iterator. This iterator can be used to erase or modify a value. There is also a join function that works in $$$O(1)$$$ in __gnu_pbds::priority_queue with pairing_heap_tag.
Here is the API doc
In which world
std::multiset
is more popular thanstd::priority_queue
? Especially in the given context