FAILOVER-процедуры » История » Версия 12
Dmitry Chernyak, 13.11.2012 09:21
| 1 | 1 | Dmitry Chernyak | . |
|---|---|---|---|
| 2 | 1 | Dmitry Chernyak | |
| 3 | 1 | Dmitry Chernyak | {{>toc}} |
| 4 | 1 | Dmitry Chernyak | |
| 5 | 1 | Dmitry Chernyak | h1. FAILOVER-процедуры |
| 6 | 1 | Dmitry Chernyak | |
| 7 | 1 | Dmitry Chernyak | Обозначения: |
| 8 | 1 | Dmitry Chernyak | <pre> |
| 9 | 1 | Dmitry Chernyak | gnt# - запуск команды на мастер-узле |
| 10 | 1 | Dmitry Chernyak | gntX# - запуск команды на обычном узле |
| 11 | 1 | Dmitry Chernyak | gntY# - запуск команды на другом узле |
| 12 | 1 | Dmitry Chernyak | # - запуск команды на любом узле |
| 13 | 1 | Dmitry Chernyak | </pre> |
| 14 | 1 | Dmitry Chernyak | |
| 15 | 12 | Dmitry Chernyak | h2. Запуск на одном действующем мастер-узле |
| 16 | 1 | Dmitry Chernyak | |
| 17 | 1 | Dmitry Chernyak | При запуске на одном узле, управление кластером ganeti-masterd не стартует автоматически, даже на master-узле. |
| 18 | 1 | Dmitry Chernyak | Это связано с тем, что невозможно отличить крах второго узла от потери связи, когда на втором узле продолжают работать запущенные виртуалки. |
| 19 | 1 | Dmitry Chernyak | |
| 20 | 12 | Dmitry Chernyak | h3. Запуск управляющего демона: |
| 21 | 12 | Dmitry Chernyak | |
| 22 | 1 | Dmitry Chernyak | <pre> |
| 23 | 1 | Dmitry Chernyak | gnt# ganeti-masterd --no-voting |
| 24 | 11 | Dmitry Chernyak | </pre> |
| 25 | 11 | Dmitry Chernyak | |
| 26 | 11 | Dmitry Chernyak | h3. Перенос виртуальных машин с аварийного узла |
| 27 | 11 | Dmitry Chernyak | |
| 28 | 11 | Dmitry Chernyak | <pre> |
| 29 | 11 | Dmitry Chernyak | gnt# gnt-node failover --ignore-consistency gntX |
| 30 | 11 | Dmitry Chernyak | </pre> |
| 31 | 11 | Dmitry Chernyak | |
| 32 | 11 | Dmitry Chernyak | Перенесенные машины автоматически запустятся, если таково их состояние по-умолчанию. |
| 33 | 11 | Dmitry Chernyak | Операция выполняется один раз. Процедура failover меняет мастер-узел для виртуальной машины. |
| 34 | 11 | Dmitry Chernyak | |
| 35 | 11 | Dmitry Chernyak | h3. Запуск всех виртуальных машин |
| 36 | 11 | Dmitry Chernyak | |
| 37 | 11 | Dmitry Chernyak | <pre> |
| 38 | 11 | Dmitry Chernyak | gnt# gnt-instance startup --force --all |
| 39 | 11 | Dmitry Chernyak | </pre> |
| 40 | 11 | Dmitry Chernyak | |
| 41 | 1 | Dmitry Chernyak | h2. Штатное переключение master-узла |
| 42 | 1 | Dmitry Chernyak | |
| 43 | 1 | Dmitry Chernyak | Оба узла запущены, смена master-узла производится в штатном режиме. |
| 44 | 1 | Dmitry Chernyak | На master-candidate (gntX): |
| 45 | 1 | Dmitry Chernyak | <pre> |
| 46 | 1 | Dmitry Chernyak | gntX# gnt-cluster master-failover |
| 47 | 1 | Dmitry Chernyak | </pre> |
| 48 | 1 | Dmitry Chernyak | |
| 49 | 1 | Dmitry Chernyak | h2. Выход из строя master-узла |
| 50 | 1 | Dmitry Chernyak | |
| 51 | 1 | Dmitry Chernyak | Основной узел (в примере - gnt1) оказывается выключен в результате аппаратной аварии. |
| 52 | 1 | Dmitry Chernyak | |
| 53 | 1 | Dmitry Chernyak | Запустить управляющий демон на узле master-candidate (gntX): |
| 54 | 1 | Dmitry Chernyak | <pre> |
| 55 | 1 | Dmitry Chernyak | gntX# ganeti-masterd --no-voting |
| 56 | 1 | Dmitry Chernyak | </pre> |
| 57 | 1 | Dmitry Chernyak | |
| 58 | 1 | Dmitry Chernyak | Активировать новый master-узел: |
| 59 | 1 | Dmitry Chernyak | <pre> |
| 60 | 1 | Dmitry Chernyak | gntX# gnt-cluster master-failover --no-voting |
| 61 | 1 | Dmitry Chernyak | </pre> |
| 62 | 9 | Dmitry Chernyak | |
| 63 | 9 | Dmitry Chernyak | Пометить отключенный узел offline, чтобы master в него не долбился |
| 64 | 9 | Dmitry Chernyak | -С = master-candidate |
| 65 | 9 | Dmitry Chernyak | -O = offline |
| 66 | 9 | Dmitry Chernyak | <pre> |
| 67 | 9 | Dmitry Chernyak | gnt# gnt-node modify -C no -O yes gntY |
| 68 | 9 | Dmitry Chernyak | </pre> |
| 69 | 10 | Dmitry Chernyak | |
| 70 | 9 | Dmitry Chernyak | Запустить все виртуалки отключенного узла на резервном: |
| 71 | 9 | Dmitry Chernyak | <pre> |
| 72 | 9 | Dmitry Chernyak | gnt# gnt-node failover --ignore-consistency gnt1 |
| 73 | 9 | Dmitry Chernyak | </pre> |
| 74 | 9 | Dmitry Chernyak | |
| 75 | 1 | Dmitry Chernyak | h2. Возврат основного узла в строй |
| 76 | 1 | Dmitry Chernyak | |
| 77 | 1 | Dmitry Chernyak | Старый основной узел не будет автоматически запускать управляющего демона. |
| 78 | 1 | Dmitry Chernyak | * если не найдет парного узла, |
| 79 | 1 | Dmitry Chernyak | * если найдет парный узел и узнает, что он стал новым master-ом. |
| 80 | 1 | Dmitry Chernyak | |
| 81 | 1 | Dmitry Chernyak | Если на узле сохранились данные, то для включения его обратно в кластер: |
| 82 | 1 | Dmitry Chernyak | |
| 83 | 1 | Dmitry Chernyak | Скопировать на него свежую конфигурацию с нового master-а |
| 84 | 1 | Dmitry Chernyak | <pre> |
| 85 | 1 | Dmitry Chernyak | gnt# gnt-cluster redist-conf |
| 86 | 1 | Dmitry Chernyak | </pre> |
| 87 | 1 | Dmitry Chernyak | |
| 88 | 1 | Dmitry Chernyak | Запустить на нем ganeti-демоны |
| 89 | 1 | Dmitry Chernyak | <pre> |
| 90 | 1 | Dmitry Chernyak | gntX# /etc/init.d/ganeti restart |
| 91 | 1 | Dmitry Chernyak | </pre> |
| 92 | 1 | Dmitry Chernyak | |
| 93 | 2 | Владимир Ипатов | h2. Плановый вывод узла из эксплуатации |
| 94 | 3 | Владимир Ипатов | |
| 95 | 2 | Владимир Ипатов | Мигрируем виртуальные машины: |
| 96 | 2 | Владимир Ипатов | <pre> |
| 97 | 8 | Dmitry Chernyak | gnt# gnt-instance migrate имя_машины |
| 98 | 2 | Владимир Ипатов | </pre> |
| 99 | 2 | Владимир Ипатов | |
| 100 | 8 | Dmitry Chernyak | Если выводимый узел - мастер, то нужно назначить нового мастера(см. выше *Штатное переключение master узла*). |
| 101 | 1 | Dmitry Chernyak | |
| 102 | 8 | Dmitry Chernyak | Вывести узел из списка кандидатов на мастера и перевести его в режим offline (это предотвратит появление сообщений об "аварии"): |
| 103 | 2 | Владимир Ипатов | <pre> |
| 104 | 8 | Dmitry Chernyak | gnt# gnt-node modify -C no -O yes УЗЕЛ |
| 105 | 2 | Владимир Ипатов | </pre> |
| 106 | 2 | Владимир Ипатов | |
| 107 | 2 | Владимир Ипатов | Далее узел можно просто выключить. |
| 108 | 1 | Dmitry Chernyak | |
| 109 | 1 | Dmitry Chernyak | h3. Возврат узла в кластер |
| 110 | 1 | Dmitry Chernyak | |
| 111 | 8 | Dmitry Chernyak | После включения узла нужно сообщить кластеру, что узел вернулся в строй: |
| 112 | 1 | Dmitry Chernyak | <pre> |
| 113 | 8 | Dmitry Chernyak | gnt# gnt-node modify -C yes -O no УЗЕЛ |
| 114 | 8 | Dmitry Chernyak | </pre> |
| 115 | 8 | Dmitry Chernyak | |
| 116 | 8 | Dmitry Chernyak | Однако, если у вас имеются сомнения в том, что узел остался в рабочем состоянии, то лучше выполнить: |
| 117 | 8 | Dmitry Chernyak | <pre> |
| 118 | 8 | Dmitry Chernyak | gnt# gnt-node add --readd УЗЕЛ |
| 119 | 2 | Владимир Ипатов | </pre> |
| 120 | 8 | Dmitry Chernyak | |
| 121 | 8 | Dmitry Chernyak | В любом случае, после этого нужно подождать около 5 минут, чтобы демон watcher поднял drbd, либо инициировать процесс вручную: |
| 122 | 7 | Dmitry Chernyak | <pre> |
| 123 | 8 | Dmitry Chernyak | gnt# gnt-cluster verify-disks |
| 124 | 5 | Владимир Ипатов | </pre> |
| 125 | 8 | Dmitry Chernyak | |
| 126 | 2 | Владимир Ипатов | |
| 127 | 1 | Dmitry Chernyak | h2. Замена узла на новый |
| 128 | 1 | Dmitry Chernyak | |
| 129 | 1 | Dmitry Chernyak | Добавить узел в кластер |
| 130 | 1 | Dmitry Chernyak | <pre> |
| 131 | 1 | Dmitry Chernyak | gnt# gnt-node add --readd gntX |
| 132 | 1 | Dmitry Chernyak | </pre> |
| 133 | 1 | Dmitry Chernyak | |
| 134 | 5 | Владимир Ипатов | Для всех виртуалок, которые имеют secondary на подключенном узле: |
| 135 | 1 | Dmitry Chernyak | <pre> |
| 136 | 1 | Dmitry Chernyak | gnt# gnt-instance replace-disks --submit -s INSTANCE |
| 137 | 1 | Dmitry Chernyak | </pre> |
| 138 | 1 | Dmitry Chernyak | |
| 139 | 1 | Dmitry Chernyak | Перерегистрировать узел в puppet |
| 140 | 1 | Dmitry Chernyak | <pre> |
| 141 | 1 | Dmitry Chernyak | gnt# gnt-instance console sci |
| 142 | 1 | Dmitry Chernyak | sci# puppetca --clean gnt1.fqdn |
| 143 | 1 | Dmitry Chernyak | </pre> |
| 144 | 1 | Dmitry Chernyak | |
| 145 | 1 | Dmitry Chernyak | <pre> |
| 146 | 1 | Dmitry Chernyak | gntX# /var/lib/puppet/ssl/* |
| 147 | 1 | Dmitry Chernyak | gntX# /etc/init.d/puppet restart |
| 148 | 1 | Dmitry Chernyak | </pre> |
| 149 | 1 | Dmitry Chernyak | |
| 150 | 1 | Dmitry Chernyak | h2. Замена жесткого диска |
| 151 | 1 | Dmitry Chernyak | |
| 152 | 1 | Dmitry Chernyak | Скопировать разметку с существующего (только для дисков одной модели!) |
| 153 | 1 | Dmitry Chernyak | <pre> |
| 154 | 1 | Dmitry Chernyak | # sfdisk -d /dev/sda|sfdisk /dev/sdX |
| 155 | 1 | Dmitry Chernyak | </pre> |
| 156 | 1 | Dmitry Chernyak | Проверить |
| 157 | 1 | Dmitry Chernyak | <pre> |
| 158 | 1 | Dmitry Chernyak | # fdisk -l |
| 159 | 1 | Dmitry Chernyak | </pre> |
| 160 | 1 | Dmitry Chernyak | Добавить в RAID |
| 161 | 1 | Dmitry Chernyak | <pre> |
| 162 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md0 --add /dev/sdX1 |
| 163 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md1 --add /dev/sdX2 |
| 164 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md2 --add /dev/sdX3 |
| 165 | 1 | Dmitry Chernyak | </pre> |
| 166 | 1 | Dmitry Chernyak | Проверить |
| 167 | 1 | Dmitry Chernyak | <pre> |
| 168 | 1 | Dmitry Chernyak | cat /proc/mdstat |
| 169 | 1 | Dmitry Chernyak | </pre> |