Всем привет. У меня одного в архиве текстов нет первого теста по задаче D1. В условии написано, что в D1 и D2 тексты взяты их архива и изменен только id. Первый тест выглядит так:
0
OFFICIAL WANTS ARAB FUND TO HELP LEBANESE POUND
ABU DHABI, March 28 — Lebanese central bank Vice Governor
Meguerditch Bouldikian called for the establishment of an Arab
fund to assist the Lebanese pound, which has lost more than 80
pct of its value...
1869890 В архиве есть только более полная версия этого текста.
Может быть train/1/011.txt ?
Там файл заметно большего размера и отличается не только id как сказано в условии
Здесь же тест не полностью показан. Многоточие в конце об этом и свидетельствует.
Тест совпадает с файлом train/1/011.txt с точностью до id и ведущих пробелов в строках. Последнее, вероятно, вызвано отметкой "well-formed" в полигоне. Тем не менее вполне можно утверждать, что это один и тот же документ :)
Т.е. количество пробелов может быть разным? Если так то все понятно. Просто у меня на контесте проверка по файлу не прошла а по заголовку прошла
Я убирал непечатаемые символы и хешировал документ — прошло. Обманули нас конечно, но на контестах всякое бывает :)
Я после 30 минут не понимания и вопроса жюри решил хешировать только заголовок и сильно удивился, когда прошло)))
Ага, там хоть и были совпадающие заголовки, но только внутри одной темы :)
Серьезно?))) Ржачно я и не заметил послал наудачу потому что вообще не понимал что происходит
Ржачно то что засылал товарищ nomearod на трансляции!