Мне нужно загрузить большой набор данных в производственную базу данных.
Необходимо загрузить по 15 файлов и вставить их в таблицу. Размер каждого составляет около 500 МБ.
У меня есть два столбца ID, которые нужно проиндексировать. Если я загружаю файлы с индексами, загрузка занимает около 3 часов. Если я удаляю индексы, загружаю локальный файл данных, а затем снова добавляю индексы, вся операция занимает около 30 минут.
Проблема в том, что отзывчивость базы данных сильно страдает при индексировании только что импортированных данных. Есть ли способ заставить индексирование работать с «низким приоритетом», чтобы другие запросы по-прежнему получали скорость 95-100%, а индексирование выполнялось в фоновом режиме?
Я использую Amazon RDS, поэтому у меня нет возможности просто загрузиться на другой сервер, а затем скопировать файлы таблицы.
Добавив к этому вознаграждение, я все еще хочу посмотреть, есть ли способ получить хорошую производительность при индексировании определенного поля.