Подумал, что может кому-то будет интересно.
В этом видео моего доклада на факультете компьютерных наук ВШЭ я сначала рассказываю, как искать ближайших соседей в высокой размерности с помощью Locality-Sensitive Hashing, а потом рассказываю про наше недавнее улучшение (2015 года), которое позволяет этот самый поиск существенно ускорить (в теории).
Довольно интересная тема, странно, что в задачах на контестах она практически не представлена (ведь сам по себе locality-sensitive hashing довольно простой и практичный).
А планируется (пытаться) делать практическую реализацию вашего улучшения? Думаю, в индустрии много где пригодилось бы.
странно, что в задачах на контестах она практически не представлена
Просто задачи на суффиксные структуры и потоки очень интересные, и никому еще не надоели.
Не забывай, что гарантии вероятностные, поэтому придется требовать, чтобы программа участника отвечала правильно на >= 80% запросов (что вобщем-то не проблема, но так наверное мало кто делает?).
Да, планируется, не буквально конечно, но кое-какие практические улучшения мы вроде умеем делать. Более подробно — в личном разговоре. :)
Я видел такие вероятностные задачи от Станкевича, Митричева и Ивана Казменко. То есть там идёт мультитест, а чекер проверяет, сколько ответов сошлось.
Вот еще вероятностная задача на тимусе. Кстати, там как раз почти 80% :)
Обещанные практические улучшения: - статья (to appear at NIPS 2015) http://arxiv.org/abs/1509.02897 - слайды часового доклада по ней http://ilyaraz.org/nips_1h.pdf