GNU C++ vs MS C++ — непонятные различия в быстродействии

»

andreyv

13 лет назад, скрыть # |

+8

Изменится ли что-то, если сделать

inline bool cmp(const pair<point, long>& a, const pair<point, long>& b)

?

→ Ответить

»

goo.gl_SsAhv

13 лет назад, скрыть # |

← Rev. 3 →

+8

или так еще попробуй

struct C {
    inline bool operator ()(const T& a, const T& b) const {
        //
    }
};

sort(v.begin(), v.end(), C());

А ну и причина в том, что происходит копирование объектов при передаче в функцию. а также вызов функции не инлайнится, поэтому долго получается.

→ Ответить

»

Monyura

13 лет назад, скрыть # ^ |

0

Кстати по поводу inline, есть пример, в котором добавление этого слова реально даёт выигрыш при включенном O2?

→ Ответить

»

riadwaw

13 лет назад, скрыть # ^ |

0

в рекурсиях нехило часто помогает

→ Ответить

»

vitar

13 лет назад, скрыть # ^ |

+3

Я не спорю с этим утверждением, но если это действительно так, то не мог бы кто-нибудь объяснить почему?

→ Ответить

»

riadwaw

13 лет назад, скрыть # ^ |

0

Ну видимо код инлайнится с некоторой глубиной, что позволяет сократить глубину рекурсии(читать кол-во вызовов функций) в эти несколько раз

→ Ответить

»

dalex

13 лет назад, скрыть # ^ |

← Rev. 2 →

+18

У меня есть такой пример. Некоторое время назад решали Московский четвертьфинал 2009, и там была задача I, решающаяся dfs-ом огромной глубины (хотя, я чувствую, существует нормальное решение). Отправили, получили ML (он был 128 МБ), дописали inline к dfs, отправили, получили AC. Потом посмотрели: решение работало примерно в 2 раза быстрее и кушало примерно на 30 метров меньше памяти.

→ Ответить

»

I_love_Tanya_Romanova

13 лет назад, скрыть # |

0

Если просто заинлайнить — никаких изменений.

Если изменить способ передачи в функцию, то очень заметное ускорение. Но все равно GCC далеко позади.

Для 500000 точек время выполнения было 0.45/3.5, стало 0.25/1.

→ Ответить

»

andreyv

13 лет назад, скрыть # ^ |

+3

Ну хорошо. Тогда предыдущие изменения + перед cmp добавить

#pragma GCC optimize ("fast-math")

Что теперь?

→ Ответить

»

I_love_Tanya_Romanova

13 лет назад, скрыть # ^ |

0

Без изменений.

Если есть желание что-то пробовать, менять и проверять — отослал полный исходник.

→ Ответить

»

nickitat

13 лет назад, скрыть # ^ |

0

Вы не могли бы дать какую-нибудь ссыль на материал о #pragma GCC optimize. Меня интересует, какого рода optimize можно делать.) И вообще, есть ли смысл делать их вручную?

→ Ответить

»

andreyv

13 лет назад, скрыть # ^ |

0

Это всего лишь механизм, как задать дополнительные -O или -f параметры, если нельзя поменять строку запуска компилятора. То есть, на своём компьютере вместо этой строчки можно было бы просто дописать -ffast-math к параметрам компилятора.

http://gcc.gnu.org/onlinedocs/gcc/Function-Attributes.html#index-g_t_0040code_007boptimize_007d-function-attribute-2663

Нет, смысла особого нет, за исключением случая, когда точно знаешь, какую конкретную оптимизацию хочешь включить/выключить.

→ Ответить

»

nickitat

13 лет назад, скрыть # ^ |

0

Спасибо.

→ Ответить

»

Gassa

13 лет назад, скрыть # |

← Rev. 2 →

+13

Возможно, Visual Studio с оптимизациями по умолчанию догадывается, что копирование point (1) не имеет побочных эффектов и (2) не требуется. И поэтому заменил объявление

bool cmp (pair <point, int> a, pair <point, int> b)

на

bool cmp (pair <point, int> const & a, pair <point, int> const & b)

У меня с mingw-g++ 4.7.2 это локально дало ускорение в несколько раз.

А по-хорошему, учитывая (1) и (2), можно заинлайнить всю функцию. Но у меня g++ наотрез отказывается это делать, даже с

inline bool cmp (pair <point, int> const & a, pair <point, int> const & b) __attribute__ ((always_inline));

профайлер показывает, что функция есть. Может, кто-то подскажет, как это делается правильно?

UPD: исходник тут.

→ Ответить

»

I_love_Tanya_Romanova

13 лет назад, скрыть # ^ |

0

Вот исходник после всех названных выше оптимизаций.

Теперь я не могу понять, чем же мой код принципиально отличается. Потому как в примере выше — время выполнения примерно одинаковое.

А мой код под студией все равно работает в 3.5 раза быстрее.

→ Ответить

»

blazerer

13 лет назад, скрыть # ^ |

0

Почему не inline bool cmp(const pair <point, int>& a, const pair <point, int>& b)? И почему это эквивалентное объявление дает ускорение небольшое ?:/

→ Ответить

»

Gassa

13 лет назад, скрыть # ^ |

← Rev. 2 →

+3

На всякий случай замечу, что const T действительно должно быть эквивалентно T const. Запись T const (исправил) понятнее: если слева от const есть тип, то величину этого типа запрещается менять. Например, int const * const * x означает, что нельзя менять ни int, ни int *, а int * * менять можно. Ну а если слева от const ничего нет, ему приходится взять следующий тип справа.

У меня const с любой стороны даёт одинаковую скорость. Возможно, случилась погрешность при измерении времени работы.

→ Ответить

»

blazerer

13 лет назад, скрыть # ^ |

0

Видимо, так оно и есть. У меня теперь тоже нет разницы.

→ Ответить

»

I-juice

13 лет назад, скрыть # |

0

Кажется, вот еще одно ускорение : stable_sort вместо sort. Видимо, дело в специфике данных.

→ Ответить

»

I_love_Tanya_Romanova

13 лет назад, скрыть # ^ |

0

Можно как-то более конкретно — какая здесь специфика, и в чем отличия между двумя семействами компиляторов в данных условиях? Был бы рад понять это на идейном уровне, ведь не хотелось бы наступать на эти грабли опять, как только условия немножко изменятся:)

→ Ответить

»

I-juice

13 лет назад, скрыть # ^ |

0

Ну, утверждать не берусь, смотреть лень, но, видимо, в MSC++ всегда используется merge_sort, а в g++ sort() начинается с quick_sort, в то время как stable_sort также реализован на merge_sort (про g++ уверен на 95%). В случае, если изначально данные не совершенно случайные — есть частичная отсортированность, много равных элементов, стоимость swap-а очень высока — stable_sort работает быстрее, на случайных же данных quick_sort все-таки быстрее. Можно еще делать вот так: static bool cmp(pnt * a, pnt * b), тогда, если я правильно понимаю, стоимость свопа падает (и, кстати, это действительно дает еще небольшое ускорение, теперь тормозят new), но все равно stable_sort быстрее (почему?...). Вот еще ссылочка http://attractivechaos.wordpress.com/2008/08/28/comparison-of-internal-sorting-algorithms/

→ Ответить

»

I_love_Tanya_Romanova

13 лет назад, скрыть # ^ |

+3

Спасибо:) Именно на ответ такого рода я и ждал. В свободное время надо будет поэкспериментировать — покормить ее сортированными/шафленными массивами и остальное в этом духе.

И статья интересная)

Остальным тоже спасибо, хоть я и спрашивал не "как ускорить то, что работает медленно", а "почему оно работает медленно", но тоже узнал много полезного.

→ Ответить

»

DAle

13 лет назад, скрыть # ^ |

0

Ну, утверждать не берусь, смотреть лень, но, видимо, в MSC++ всегда используется merge_sort Это не так. Везде в современных реализациях STL в std::sort используются вариации introsort.

→ Ответить

»

Anarivu

13 лет назад, скрыть # |

0

А почему нельзя в структуре переопределить оператор сравнения? На сколько я помню так должно быстрее вроде работать.
А еще некоторые компиляторы будут ругаться, если будешь передавать значения в него не по ссылке, так что такую ошибку уже не допустишь.

→ Ответить

»

Monyura

13 лет назад, скрыть # ^ |

+2

Тут пары сравниваются, так что в структуре не определишь. Да, и у меня почему-то перегруженный оператор< для пар работает дольше чем функция-компаратор.

→ Ответить

»

Anarivu

13 лет назад, скрыть # ^ |

0

так пара сравнивает с начала первый операнд, затем второй, а при сравнении в данном случае второй вообще не затрагивается

→ Ответить

»

EugeneBarsky

13 лет назад, скрыть # ^ |

← Rev. 2 →

0

если хочется скорости, то лучше вообще функтор делать

→ Ответить

»

andreyv

13 лет назад, скрыть # ^ |

0

А чем функтор лучше простой inline-функции с точки зрения оптимизации?

→ Ответить

»

EugeneBarsky

13 лет назад, скрыть # ^ |

0

а как ты инлайнить будешь указатель на функцию при компиляции?

template<class T>
f(T g)
{ g(); }

если T это конкретный класс, то всё понятно что инлайнить, а если T указатель на функцию void (*)()?

→ Ответить

»

andreyv

13 лет назад, скрыть # ^ |

0

То, что инлайнить, понятно из места вызова, ведь функция inline, а значит, определена в том же файле.

Код: http://pastie.org/7155607

Результат компиляции с gcc -O2:

_Z6test_av:
    movl    $42, %eax
    ret

_Z6test_bv:
    movl    $42, %eax
    ret

→ Ответить

»

pirevitch

13 лет назад, скрыть # |

+14

забавно, если перед вызовом sort поставить

srand(time(0));
random_shuffle(v.begin(), v.end());

то время выполнения становится одинаковым, то есть на GCC быстрее

→ Ответить

№	Пользователь	Рейтинг
1	Benq	3792
2	VivaciousAubergine	3647
3	Kevin114514	3603
4	jiangly	3583
5	turmax	3559
6	tourist	3541
7	strapple	3515
8	ksun48	3461
9	dXqwq	3436
10	Otomachi_Una	3413

№	Пользователь	Вклад
1	Qingyu	157
2	adamant	153
3	Um_nik	147
4	Proof_by_QED	146
5	Dominater069	145
6	errorgorn	141
7	cry	139
8	YuukiS	135
9	TheScrasse	134
10	chromate00	133

Блог пользователя I_love_Tanya_Romanova