Блог пользователя ZPetrovich

Автор ZPetrovich, 10 лет назад, По-русски

Пытаюсь решить задачу. Есть матрица 2000x2000. Хочу представить ее ввиде графа и обходить с BFS/DFS. Есть лимит на время выполнения (2s). Простое создание вершин занимает более 2s! Но мне еще нужно создать Adjacency matrix + пройтись BFS/DFS + какая-то логика решения так что время еще будет увеличено! Вот так создаю вершины:

Map<Integer, Vertex> allVertices = new HashMap<>();

final long b = System.currentTimeMillis();
for (int i = 0; i < n; i++)
{
    for (int j = 0; j < m; j++)
    {
        final int id = i * m + j + 1;
        Vertex v = allVertices.get(id);
        if (v == null)
        {
            v = new Vertex(id);
            allVertices.put(id, v);
        }
    }
}
final long a = System.currentTimeMillis();
final long d = a &mdash; b;
System.out.println(String.format("took <%s> ms", d));

class Vertex
{
    Color color;
    final int id;

    public Vertex(final int id)
    {
        this.id = id;
    }   
}

Нормально ли это использовать ООП для представления больших графов или нужны исключительно массивы?

  • Проголосовать: нравится
  • +7
  • Проголосовать: не нравится

»
10 лет назад, # |
  Проголосовать: нравится -6 Проголосовать: не нравится

Для плотных графов используй матрицу смежности (boolean[][] для невзвешенных графов или int[][] для взвешенных), для разреженных — списки смежности (List<Integer>[] или List<Edge>[], где Edge — пара (конец ребра, вес))

  • »
    »
    10 лет назад, # ^ |
      Проголосовать: нравится 0 Проголосовать: не нравится

    Спасибо! А как к матрицам применять обход BFS/DFS? Хранить еще массив такой же размерности с цветами? А если еще какое-то свойство нужно для вершины — то заводить еще массив? Для разреженных — смотря какого размера, если использовать Edje то опять можно попасть на OutOfMemeory или сильно снизить скорость создавая объекты. Так ведь?

    • »
      »
      »
      10 лет назад, # ^ |
        Проголосовать: нравится 0 Проголосовать: не нравится

      Зачем вообще в явном виде хранить граф, если у нас матрица?.. Казалось бы, dfs(int x, int y) и вперёд

      • »
        »
        »
        »
        10 лет назад, # ^ |
          Проголосовать: нравится 0 Проголосовать: не нравится

        Но ведь нужно из матрицы полноценный граф соорудить сперва? В матрице только информация о связях (это не матрица смежности еще)

        • »
          »
          »
          »
          »
          10 лет назад, # ^ |
            Проголосовать: нравится 0 Проголосовать: не нравится

          Ну можно написать что-то в духе

          int dx[] = {1, 0, -1, 0};
          int dy[] = {0, 1, 0, -1};
          
          void dfs(int x, int y)
          {
              used[x][y] = 1;
              for(int i = 0; i < 4; i++)
                  if(can_go[x + dx[i]][y + dy[i]] && !used[x + dx[i]][y + dy[i]])
                      dfs(x + dx[i], y + dy[i]);
          }
          

          Или предполагается, что в матрице соединены произвольные клетки, а не соседние?

    • »
      »
      »
      10 лет назад, # ^ |
      Rev. 2   Проголосовать: нравится 0 Проголосовать: не нравится

      В задачах по программированию ребер в разреженном графе обычно максимум 500 тысяч, а чаще всего 100-200 тысяч, такое количество объектов не сильно снизит скорость.

      Также, если сильно напрягают коллекции чисел, их можно избежать (github link)

      • »
        »
        »
        »
        10 лет назад, # ^ |
          Проголосовать: нравится 0 Проголосовать: не нравится

        Хм... может я не верно придумал мат модель для решения... В матрице 2000х2000 каждая ячейка — это вершина графа, которая может иметь до 4-х ребер (соединена серху, снизу, слева, справа). Т.е. по сути у меня 4*10^6 вершин и максимум (примерно) 2*4*10^6 ребер. Это явно больше чем 500 000 :) Тут матрица связности не нужна, т.к. граф разрежжен, а список смежности будет состоять из 4 миллионов вершин! Может это плохая идея рассматривать матрицу как граф???

        • »
          »
          »
          »
          »
          10 лет назад, # ^ |
            Проголосовать: нравится 0 Проголосовать: не нравится

          Клетчатый лабиринт лучше всего не пытаться явно представить в виде графа, а обходить его, как выше написал adamant

»
10 лет назад, # |
Rev. 3   Проголосовать: нравится 0 Проголосовать: не нравится

Во-первых, в конструктор HashMap можно передавать capacity, иначе время на инициализацию будет не O(n), а O(n*logn)

Map<Integer, Vertex> allVertices = new HashMap<>(n*m);

Во-вторых, непонятно зачем тут HashMap, если все id будут иметь индексы от 0 до (n*m-1)... во всяком случае если делать int id = i * m + j; (непонятно зачем тут +1)

  • »
    »
    10 лет назад, # ^ |
      Проголосовать: нравится 0 Проголосовать: не нравится

    ОК, спасибо за совет! Но тут скорей проблема не в инициализации, а в самом подходе: надо ООП или нет. (а +1 в id _ это так, для веселости ;) )

    • »
      »
      »
      10 лет назад, # ^ |
        Проголосовать: нравится 0 Проголосовать: не нравится

      Нельзя сказать универсальное правило. Иногда использовать ООП нормально, иногда нет. При больших ограничениях злоупортеблять ооп конечно вредно, в вашем случае я думаю Vertex это норм, а Color лишнее... color в этой задаче думаю можно представить как int.

      • »
        »
        »
        »
        10 лет назад, # ^ |
          Проголосовать: нравится 0 Проголосовать: не нравится

        Замедляет ещё использование обёрток типа Integer, когда можно воспрользоваться int. Про ненужность HashMap я к тому, что можно использовать Vertex[], тогда код будет работать намного быстрее.

  • »
    »
    10 лет назад, # ^ |
    Rev. 2   Проголосовать: нравится +24 Проголосовать: не нравится

    иначе время на инициализацию будет не O(n), а O(n*logn)

    В обоих случаях O(n), просто константы разные.

    • »
      »
      »
      10 лет назад, # ^ |
        Проголосовать: нравится +5 Проголосовать: не нравится

      Создаётся хэш таблица с маленьким initial capacity. Потом всякий раз, когда количество элементов мало (стандартное пороговое значение это 3/4 capacity), размер таблицы увеличивается в 2 раза.... уууупс и где-то тут я понял что нужно 2n операций. Действительно, моя ошибка.

»
10 лет назад, # |
  Проголосовать: нравится 0 Проголосовать: не нравится

судя по попыткам, вы используете new Scanner(System.in) и System.out.print() для ввода/вывода. Это очень медленно. Большинство местных джавистов пишет свои классы для этих целей, см. например yaal by Egor