FAILOVER-процедуры » История » Версия 31
Владимир Ипатов, 03.03.2018 19:45
1 | 27 | Dmitry Chernyak | h1. FAILOVER-процедуры |
---|---|---|---|
2 | 1 | Dmitry Chernyak | |
3 | 27 | Dmitry Chernyak | {{toc}} |
4 | 27 | Dmitry Chernyak | |
5 | 27 | Dmitry Chernyak | [[OVERVIEW]] | [[INSTALL]] | [[SETUP]] | [[OPERATIONS]] | [[LICENSE]] |
6 | 27 | Dmitry Chernyak | [[ОБЗОР]] | [[УСТАНОВКА]] | [[НАСТРОЙКА]] | [[ОПЕРАЦИИ]] | [[ЛИЦЕНЗИЯ]] |
7 | 1 | Dmitry Chernyak | |
8 | 1 | Dmitry Chernyak | h1. FAILOVER-процедуры |
9 | 1 | Dmitry Chernyak | |
10 | 1 | Dmitry Chernyak | Обозначения: |
11 | 1 | Dmitry Chernyak | <pre> |
12 | 1 | Dmitry Chernyak | gnt# - запуск команды на мастер-узле |
13 | 1 | Dmitry Chernyak | gntX# - запуск команды на обычном узле |
14 | 1 | Dmitry Chernyak | gntY# - запуск команды на другом узле |
15 | 1 | Dmitry Chernyak | # - запуск команды на любом узле |
16 | 1 | Dmitry Chernyak | </pre> |
17 | 1 | Dmitry Chernyak | |
18 | 12 | Dmitry Chernyak | h2. Запуск на одном действующем мастер-узле |
19 | 1 | Dmitry Chernyak | |
20 | 1 | Dmitry Chernyak | При запуске на одном узле, управление кластером ganeti-masterd не стартует автоматически, даже на master-узле. |
21 | 1 | Dmitry Chernyak | Это связано с тем, что невозможно отличить крах второго узла от потери связи, когда на втором узле продолжают работать запущенные виртуалки. |
22 | 1 | Dmitry Chernyak | |
23 | 12 | Dmitry Chernyak | h3. Запуск управляющего демона: |
24 | 12 | Dmitry Chernyak | |
25 | 1 | Dmitry Chernyak | <pre> |
26 | 31 | Владимир Ипатов | service ganeti restart |
27 | 31 | Владимир Ипатов | </pre> |
28 | 31 | Владимир Ипатов | |
29 | 31 | Владимир Ипатов | Если сервер не запускается по причине отсутствия второго узла в сети, то следует запустить его принудительно: |
30 | 31 | Владимир Ипатов | <pre> |
31 | 1 | Dmitry Chernyak | gnt# ganeti-masterd --no-voting |
32 | 11 | Dmitry Chernyak | </pre> |
33 | 24 | Владимир Ипатов | для ganeti 2.10: |
34 | 24 | Владимир Ипатов | <pre> |
35 | 25 | Владимир Ипатов | gnt-cluster master-failover --no-voting |
36 | 25 | Владимир Ипатов | </pre> |
37 | 25 | Владимир Ипатов | <pre> |
38 | 24 | Владимир Ипатов | su - gnt-masterd -s /bin/bash -c "/usr/sbin/ganeti-masterd --no-voting" |
39 | 24 | Владимир Ипатов | </pre> |
40 | 30 | Владимир Ипатов | для sci-3.0: |
41 | 30 | Владимир Ипатов | <pre> |
42 | 30 | Владимир Ипатов | su - gnt-masterd -s /bin/bash -c "/usr/sbin/ganeti-wconfd --no-voting --yes-do-it" |
43 | 30 | Владимир Ипатов | su - gnt-masterd -s /bin/bash -c "/usr/sbin/ganeti-luxid --no-voting --yes-do-it" |
44 | 30 | Владимир Ипатов | </pre> |
45 | 11 | Dmitry Chernyak | h3. Перенос виртуальных машин с аварийного узла |
46 | 11 | Dmitry Chernyak | |
47 | 13 | Dmitry Chernyak | Эта операция выполняется один раз. Она поменяет узел запуска для виртуальной машины. |
48 | 13 | Dmitry Chernyak | Перенесенные машины автоматически запустятся, если таково их состояние по-умолчанию. |
49 | 13 | Dmitry Chernyak | |
50 | 13 | Dmitry Chernyak | Лучше мигрировать или перезапустить виртуальные машины в штатном режиме, до того, как их узел будет отключен. |
51 | 13 | Dmitry Chernyak | Однако, если это случилось внезапно, тогда необходимо дать команду: |
52 | 13 | Dmitry Chernyak | |
53 | 11 | Dmitry Chernyak | <pre> |
54 | 11 | Dmitry Chernyak | gnt# gnt-node failover --ignore-consistency gntX |
55 | 11 | Dmitry Chernyak | </pre> |
56 | 11 | Dmitry Chernyak | |
57 | 11 | Dmitry Chernyak | |
58 | 11 | Dmitry Chernyak | h3. Запуск всех виртуальных машин |
59 | 11 | Dmitry Chernyak | |
60 | 11 | Dmitry Chernyak | <pre> |
61 | 11 | Dmitry Chernyak | gnt# gnt-instance startup --force --all |
62 | 11 | Dmitry Chernyak | </pre> |
63 | 11 | Dmitry Chernyak | |
64 | 1 | Dmitry Chernyak | h2. Штатное переключение master-узла |
65 | 1 | Dmitry Chernyak | |
66 | 1 | Dmitry Chernyak | Оба узла запущены, смена master-узла производится в штатном режиме. |
67 | 1 | Dmitry Chernyak | На master-candidate (gntX): |
68 | 1 | Dmitry Chernyak | <pre> |
69 | 1 | Dmitry Chernyak | gntX# gnt-cluster master-failover |
70 | 1 | Dmitry Chernyak | </pre> |
71 | 1 | Dmitry Chernyak | |
72 | 28 | Николай Алексеев | h2. Перевод виртуалки слейва дрбд на другую ноду |
73 | 28 | Николай Алексеев | |
74 | 28 | Николай Алексеев | Переносим слейв дрбд виртуалки на другую ноду gntX |
75 | 28 | Николай Алексеев | |
76 | 28 | Николай Алексеев | <pre> |
77 | 29 | Николай Алексеев | gnt-instance replace-disks --new-secondary gntX instance_name |
78 | 28 | Николай Алексеев | </pre> |
79 | 28 | Николай Алексеев | |
80 | 1 | Dmitry Chernyak | h2. Выход из строя master-узла |
81 | 1 | Dmitry Chernyak | |
82 | 1 | Dmitry Chernyak | Основной узел (в примере - gnt1) оказывается выключен в результате аппаратной аварии. |
83 | 1 | Dmitry Chernyak | |
84 | 1 | Dmitry Chernyak | Запустить управляющий демон на узле master-candidate (gntX): |
85 | 1 | Dmitry Chernyak | <pre> |
86 | 1 | Dmitry Chernyak | gntX# ganeti-masterd --no-voting |
87 | 1 | Dmitry Chernyak | </pre> |
88 | 1 | Dmitry Chernyak | |
89 | 1 | Dmitry Chernyak | Активировать новый master-узел: |
90 | 1 | Dmitry Chernyak | <pre> |
91 | 1 | Dmitry Chernyak | gntX# gnt-cluster master-failover --no-voting |
92 | 1 | Dmitry Chernyak | </pre> |
93 | 9 | Dmitry Chernyak | |
94 | 26 | Dmitry Chernyak | </pre> |
95 | 26 | Dmitry Chernyak | для ganeti 2.10: |
96 | 26 | Dmitry Chernyak | <pre> |
97 | 26 | Dmitry Chernyak | su - gnt-masterd -s /bin/bash -c "/usr/sbin/ganeti-masterd --no-voting" |
98 | 26 | Dmitry Chernyak | </pre> |
99 | 26 | Dmitry Chernyak | <pre> |
100 | 26 | Dmitry Chernyak | gnt-cluster master-failover --no-voting |
101 | 26 | Dmitry Chernyak | </pre> |
102 | 26 | Dmitry Chernyak | |
103 | 9 | Dmitry Chernyak | Пометить отключенный узел offline, чтобы master в него не долбился |
104 | 9 | Dmitry Chernyak | -С = master-candidate |
105 | 9 | Dmitry Chernyak | -O = offline |
106 | 9 | Dmitry Chernyak | <pre> |
107 | 9 | Dmitry Chernyak | gnt# gnt-node modify -C no -O yes gntY |
108 | 9 | Dmitry Chernyak | </pre> |
109 | 10 | Dmitry Chernyak | |
110 | 9 | Dmitry Chernyak | Запустить все виртуалки отключенного узла на резервном: |
111 | 9 | Dmitry Chernyak | <pre> |
112 | 9 | Dmitry Chernyak | gnt# gnt-node failover --ignore-consistency gnt1 |
113 | 9 | Dmitry Chernyak | </pre> |
114 | 9 | Dmitry Chernyak | |
115 | 1 | Dmitry Chernyak | h2. Возврат основного узла в строй |
116 | 1 | Dmitry Chernyak | |
117 | 1 | Dmitry Chernyak | Старый основной узел не будет автоматически запускать управляющего демона. |
118 | 1 | Dmitry Chernyak | * если не найдет парного узла, |
119 | 1 | Dmitry Chernyak | * если найдет парный узел и узнает, что он стал новым master-ом. |
120 | 1 | Dmitry Chernyak | |
121 | 15 | Dmitry Chernyak | Если при отключении узла он помечался как offline (см. выше), то надо вернуть его в строй: |
122 | 15 | Dmitry Chernyak | <pre> |
123 | 15 | Dmitry Chernyak | gnt# gnt-node modify -C yes -O no gntX |
124 | 15 | Dmitry Chernyak | </pre> |
125 | 15 | Dmitry Chernyak | |
126 | 1 | Dmitry Chernyak | Если на узле сохранились данные, то для включения его обратно в кластер: |
127 | 1 | Dmitry Chernyak | |
128 | 1 | Dmitry Chernyak | Скопировать на него свежую конфигурацию с нового master-а |
129 | 1 | Dmitry Chernyak | <pre> |
130 | 1 | Dmitry Chernyak | gnt# gnt-cluster redist-conf |
131 | 1 | Dmitry Chernyak | </pre> |
132 | 1 | Dmitry Chernyak | |
133 | 1 | Dmitry Chernyak | Запустить на нем ganeti-демоны |
134 | 1 | Dmitry Chernyak | <pre> |
135 | 1 | Dmitry Chernyak | gntX# /etc/init.d/ganeti restart |
136 | 1 | Dmitry Chernyak | </pre> |
137 | 1 | Dmitry Chernyak | |
138 | 2 | Владимир Ипатов | h2. Плановый вывод узла из эксплуатации |
139 | 3 | Владимир Ипатов | |
140 | 2 | Владимир Ипатов | Мигрируем виртуальные машины: |
141 | 2 | Владимир Ипатов | <pre> |
142 | 8 | Dmitry Chernyak | gnt# gnt-instance migrate имя_машины |
143 | 2 | Владимир Ипатов | </pre> |
144 | 2 | Владимир Ипатов | |
145 | 8 | Dmitry Chernyak | Если выводимый узел - мастер, то нужно назначить нового мастера(см. выше *Штатное переключение master узла*). |
146 | 1 | Dmitry Chernyak | |
147 | 8 | Dmitry Chernyak | Вывести узел из списка кандидатов на мастера и перевести его в режим offline (это предотвратит появление сообщений об "аварии"): |
148 | 2 | Владимир Ипатов | <pre> |
149 | 8 | Dmitry Chernyak | gnt# gnt-node modify -C no -O yes УЗЕЛ |
150 | 2 | Владимир Ипатов | </pre> |
151 | 2 | Владимир Ипатов | |
152 | 2 | Владимир Ипатов | Далее узел можно просто выключить. |
153 | 1 | Dmitry Chernyak | |
154 | 1 | Dmitry Chernyak | h3. Возврат узла в кластер |
155 | 1 | Dmitry Chernyak | |
156 | 8 | Dmitry Chernyak | После включения узла нужно сообщить кластеру, что узел вернулся в строй: |
157 | 1 | Dmitry Chernyak | <pre> |
158 | 8 | Dmitry Chernyak | gnt# gnt-node modify -C yes -O no УЗЕЛ |
159 | 8 | Dmitry Chernyak | </pre> |
160 | 8 | Dmitry Chernyak | |
161 | 8 | Dmitry Chernyak | Однако, если у вас имеются сомнения в том, что узел остался в рабочем состоянии, то лучше выполнить: |
162 | 8 | Dmitry Chernyak | <pre> |
163 | 2 | Владимир Ипатов | gnt# gnt-node add --readd УЗЕЛ |
164 | 8 | Dmitry Chernyak | </pre> |
165 | 8 | Dmitry Chernyak | |
166 | 7 | Dmitry Chernyak | В любом случае, после этого нужно подождать около 5 минут, чтобы демон watcher поднял drbd, либо инициировать процесс вручную: |
167 | 8 | Dmitry Chernyak | <pre> |
168 | 5 | Владимир Ипатов | gnt# gnt-cluster verify-disks |
169 | 8 | Dmitry Chernyak | </pre> |
170 | 1 | Dmitry Chernyak | |
171 | 1 | Dmitry Chernyak | h2. Замена узла на новый |
172 | 17 | Dmitry Chernyak | |
173 | 1 | Dmitry Chernyak | Удалить старый узел из /root/.ssh/known_hosts |
174 | 1 | Dmitry Chernyak | |
175 | 1 | Dmitry Chernyak | Добавить узел в кластер |
176 | 1 | Dmitry Chernyak | <pre> |
177 | 1 | Dmitry Chernyak | gnt# gnt-node add --readd gntX |
178 | 1 | Dmitry Chernyak | </pre> |
179 | 26 | Dmitry Chernyak | <pre> |
180 | 26 | Dmitry Chernyak | gnt# gnt-cluster redist-conf |
181 | 26 | Dmitry Chernyak | </pre> |
182 | 5 | Владимир Ипатов | Для всех виртуалок, которые имеют secondary на подключенном узле: |
183 | 1 | Dmitry Chernyak | <pre> |
184 | 26 | Dmitry Chernyak | gnt# gnt-instance replace-disks --auto INSTANCE |
185 | 18 | Dmitry Chernyak | </pre> |
186 | 18 | Dmitry Chernyak | |
187 | 1 | Dmitry Chernyak | Перерегистрировать узел в puppet |
188 | 1 | Dmitry Chernyak | <pre> |
189 | 1 | Dmitry Chernyak | gnt# gnt-instance console sci |
190 | 17 | Dmitry Chernyak | sci# puppetca --clean gntX.fqdn |
191 | 1 | Dmitry Chernyak | </pre> |
192 | 1 | Dmitry Chernyak | |
193 | 1 | Dmitry Chernyak | <pre> |
194 | 17 | Dmitry Chernyak | gntX# rm -r /var/lib/puppet/ssl/* |
195 | 1 | Dmitry Chernyak | gntX# /etc/init.d/puppet restart |
196 | 1 | Dmitry Chernyak | </pre> |
197 | 1 | Dmitry Chernyak | |
198 | 1 | Dmitry Chernyak | h2. Замена жесткого диска |
199 | 1 | Dmitry Chernyak | |
200 | 1 | Dmitry Chernyak | Скопировать разметку с существующего (только для дисков одной модели!) |
201 | 1 | Dmitry Chernyak | <pre> |
202 | 1 | Dmitry Chernyak | # sfdisk -d /dev/sda|sfdisk /dev/sdX |
203 | 1 | Dmitry Chernyak | </pre> |
204 | 1 | Dmitry Chernyak | Проверить |
205 | 1 | Dmitry Chernyak | <pre> |
206 | 1 | Dmitry Chernyak | # fdisk -l |
207 | 1 | Dmitry Chernyak | </pre> |
208 | 1 | Dmitry Chernyak | Добавить в RAID |
209 | 1 | Dmitry Chernyak | <pre> |
210 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md0 --add /dev/sdX1 |
211 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md1 --add /dev/sdX2 |
212 | 1 | Dmitry Chernyak | # mdadm --manage /dev/md2 --add /dev/sdX3 |
213 | 1 | Dmitry Chernyak | </pre> |
214 | 1 | Dmitry Chernyak | Проверить |
215 | 1 | Dmitry Chernyak | <pre> |
216 | 1 | Dmitry Chernyak | cat /proc/mdstat |
217 | 1 | Dmitry Chernyak | </pre> |
218 | 21 | Владимир Ипатов | |
219 | 21 | Владимир Ипатов | h2. Восстановление при split-brain: |
220 | 21 | Владимир Ипатов | |
221 | 21 | Владимир Ипатов | Если при activate-disks или при команде запуска/фейловера drbd ругается следующим образом в dmesg: |
222 | 21 | Владимир Ипатов | <pre> |
223 | 21 | Владимир Ипатов | [10893282.055705] block drbd21: Handshake successful: Agreed network protocol version 96 |
224 | 21 | Владимир Ипатов | [10893282.056003] block drbd21: Peer authenticated using 16 bytes of 'md5' HMAC |
225 | 21 | Владимир Ипатов | [10893282.056008] block drbd21: conn( WFConnection -> WFReportParams ) |
226 | 21 | Владимир Ипатов | [10893282.056031] block drbd21: Starting asender thread (from drbd21_receiver [20355]) |
227 | 21 | Владимир Ипатов | [10893282.056303] block drbd21: data-integrity-alg: <not-used> |
228 | 21 | Владимир Ипатов | [10893282.056319] block drbd21: drbd_sync_handshake: |
229 | 21 | Владимир Ипатов | [10893282.056322] block drbd21: self 5323ED521900E1F9:FCBCCB0FBF14BA04:480CD30FE2A601EA:480BD30FE2A601EB bits:46 flags:0 |
230 | 21 | Владимир Ипатов | [10893282.056324] block drbd21: peer F3B949426796C7F8:FCBCCB0FBF14BA05:480CD30FE2A601EB:480BD30FE2A601EB bits:12288 flags:2 |
231 | 21 | Владимир Ипатов | [10893282.056326] block drbd21: uuid_compare()=100 by rule 90 |
232 | 21 | Владимир Ипатов | [10893282.056329] block drbd21: helper command: /bin/true initial-split-brain minor-21 |
233 | 21 | Владимир Ипатов | [10893282.073918] block drbd21: meta connection shut down by peer. |
234 | 21 | Владимир Ипатов | [10893282.073976] block drbd21: conn( WFReportParams -> NetworkFailure ) |
235 | 21 | Владимир Ипатов | [10893282.073981] block drbd21: asender terminated |
236 | 21 | Владимир Ипатов | [10893282.073983] block drbd21: Terminating drbd21_asender |
237 | 21 | Владимир Ипатов | [10893282.080752] block drbd21: helper command: /bin/true initial-split-brain minor-21 exit code 0 (0x0) |
238 | 21 | Владимир Ипатов | [10893282.080754] block drbd21: Split-Brain detected but unresolved, dropping connection! |
239 | 21 | Владимир Ипатов | [10893282.080844] block drbd21: helper command: /bin/true split-brain minor-21 |
240 | 21 | Владимир Ипатов | [10893282.081481] block drbd21: helper command: /bin/true split-brain minor-21 exit code 0 (0x0) |
241 | 21 | Владимир Ипатов | [10893282.081484] block drbd21: conn( NetworkFailure -> Disconnecting ) |
242 | 21 | Владимир Ипатов | [10893282.081487] block drbd21: error receiving ReportState, l: 4! |
243 | 21 | Владимир Ипатов | [10893282.081577] block drbd21: Connection closed |
244 | 21 | Владимир Ипатов | [10893282.081582] block drbd21: conn( Disconnecting -> StandAlone ) |
245 | 21 | Владимир Ипатов | [10893282.081603] block drbd21: receiver terminated |
246 | 21 | Владимир Ипатов | [10893282.081604] block drbd21: Terminating drbd21_receiver |
247 | 21 | Владимир Ипатов | [10893282.711704] block drbd22: Handshake successful: Agreed network protocol version 96 |
248 | 21 | Владимир Ипатов | [10893282.712019] block drbd22: Peer authenticated using 16 bytes of 'md5' HMAC |
249 | 21 | Владимир Ипатов | [10893282.712024] block drbd22: conn( WFConnection -> WFReportParams ) |
250 | 21 | Владимир Ипатов | [10893282.712047] block drbd22: Starting asender thread (from drbd22_receiver [23709]) |
251 | 21 | Владимир Ипатов | [10893282.712301] block drbd22: data-integrity-alg: <not-used> |
252 | 21 | Владимир Ипатов | [10893282.712332] block drbd22: drbd_sync_handshake: |
253 | 21 | Владимир Ипатов | [10893282.712334] block drbd22: self CD794FB0989E2B95:DD71B308E6D3FE88:AD335B3ED83CE576:AD325B3ED83CE577 bits:7 flags:0 |
254 | 21 | Владимир Ипатов | [10893282.712336] block drbd22: peer 17B47E98FD204408:DD71B308E6D3FE89:AD335B3ED83CE577:AD325B3ED83CE577 bits:3072 flags:2 |
255 | 21 | Владимир Ипатов | [10893282.712338] block drbd22: uuid_compare()=100 by rule 90 |
256 | 21 | Владимир Ипатов | [10893282.712341] block drbd22: helper command: /bin/true initial-split-brain minor-22 |
257 | 21 | Владимир Ипатов | [10893282.713155] block drbd22: helper command: /bin/true initial-split-brain minor-22 exit code 0 (0x0) |
258 | 21 | Владимир Ипатов | [10893282.713157] block drbd22: Split-Brain detected but unresolved, dropping connection! |
259 | 21 | Владимир Ипатов | [10893282.713251] block drbd22: helper command: /bin/true split-brain minor-22 |
260 | 21 | Владимир Ипатов | [10893282.713820] block drbd22: meta connection shut down by peer. |
261 | 21 | Владимир Ипатов | [10893282.713889] block drbd22: conn( WFReportParams -> NetworkFailure ) |
262 | 21 | Владимир Ипатов | [10893282.713895] block drbd22: asender terminated |
263 | 21 | Владимир Ипатов | [10893282.713897] block drbd22: Terminating drbd22_asender |
264 | 21 | Владимир Ипатов | [10893282.713945] block drbd22: helper command: /bin/true split-brain minor-22 exit code 0 (0x0) |
265 | 21 | Владимир Ипатов | [10893282.713948] block drbd22: conn( NetworkFailure -> Disconnecting ) |
266 | 21 | Владимир Ипатов | [10893282.713952] block drbd22: error receiving ReportState, l: 4! |
267 | 21 | Владимир Ипатов | [10893282.714046] block drbd22: Connection closed |
268 | 21 | Владимир Ипатов | [10893282.714050] block drbd22: conn( Disconnecting -> StandAlone ) |
269 | 21 | Владимир Ипатов | [10893282.714070] block drbd22: receiver terminated |
270 | 21 | Владимир Ипатов | [10893282.714072] block drbd22: Terminating drbd22_receiver |
271 | 21 | Владимир Ипатов | [10893283.140310] block drbd21: conn( StandAlone -> Unconnected ) |
272 | 21 | Владимир Ипатов | [10893283.140323] block drbd21: Starting receiver thread (from drbd21_worker [23682]) |
273 | 21 | Владимир Ипатов | [10893283.140363] block drbd21: receiver (re)started |
274 | 21 | Владимир Ипатов | [10893283.140366] block drbd21: conn( Unconnected -> WFConnection ) |
275 | 21 | Владимир Ипатов | [10893283.498632] block drbd22: conn( StandAlone -> Unconnected ) |
276 | 21 | Владимир Ипатов | [10893283.498646] block drbd22: Starting receiver thread (from drbd22_worker [23702]) |
277 | 21 | Владимир Ипатов | [10893283.498705] block drbd22: receiver (re)started |
278 | 21 | Владимир Ипатов | [10893283.498710] block drbd22: conn( Unconnected -> WFConnection ) |
279 | 21 | Владимир Ипатов | </pre> |
280 | 21 | Владимир Ипатов | Здесь мы видим: |
281 | 21 | Владимир Ипатов | <pre> |
282 | 21 | Владимир Ипатов | [10893282.713155] block drbd22: helper command: /bin/true initial-split-brain minor-22 exit code 0 (0x0) |
283 | 21 | Владимир Ипатов | [10893282.713157] block drbd22: Split-Brain detected but unresolved, dropping connection! |
284 | 21 | Владимир Ипатов | </pre> |
285 | 21 | Владимир Ипатов | |
286 | 21 | Владимир Ипатов | то, во-первых, нужно установить, где находятся актуальные данные. |
287 | 21 | Владимир Ипатов | Когда когда точно установлено, где актуальные данные, мы идем на ноду, где данные *битые*, и там даем команду: |
288 | 21 | Владимир Ипатов | <pre> |
289 | 21 | Владимир Ипатов | drbdsetup /dev/drbd23 invalidate |
290 | 21 | Владимир Ипатов | </pre> |
291 | 21 | Владимир Ипатов | Затем на мастере дать activate-disks для этого инстанса, и проследить, что все drbd ресурсы отсинкались. |
292 | 22 | Dmitry Chernyak | |
293 | 22 | Dmitry Chernyak | h2. Восстановление outdated диска |
294 | 22 | Dmitry Chernyak | |
295 | 22 | Dmitry Chernyak | Ситуация: primary узел умер, диск на secondary узле считает себя outdated. |
296 | 22 | Dmitry Chernyak | Watcher пишет письма, содержащие в логе такую строку: |
297 | 22 | Dmitry Chernyak | <pre> |
298 | 23 | Dmitry Chernyak | Error while assembling disk: drbd7: can't make drbd device primary: |
299 | 23 | Dmitry Chernyak | /dev/drbd7: State change failed: (-2) Need access to UpToDate data\n |
300 | 22 | Dmitry Chernyak | </pre> |
301 | 22 | Dmitry Chernyak | |
302 | 22 | Dmitry Chernyak | Виртуалка не поднимается, диски не собираются (точнее собираются и отключаются обратно). |
303 | 22 | Dmitry Chernyak | Требуется собрать диск вручную и сказать ему что он primary |
304 | 22 | Dmitry Chernyak | |
305 | 22 | Dmitry Chernyak | <pre> |
306 | 22 | Dmitry Chernyak | root@gnt1:~# gnt-instance info ИНСТАНС |
307 | 22 | Dmitry Chernyak | [skip] |
308 | 22 | Dmitry Chernyak | - disk/0: drbd8, size 117.2G |
309 | 22 | Dmitry Chernyak | access mode: rw |
310 | 22 | Dmitry Chernyak | nodeA: gnt2.XXXX.ru, minor=2 |
311 | 22 | Dmitry Chernyak | nodeB: gnt3.XXXX.ru, minor=0 |
312 | 22 | Dmitry Chernyak | port: 11012 |
313 | 22 | Dmitry Chernyak | auth key: 06ca8046f1323d0b154c500f41c0d625cbd796c3 |
314 | 22 | Dmitry Chernyak | on primary: /dev/drbd2 (147:2) in sync, status *DEGRADED* |
315 | 22 | Dmitry Chernyak | child devices: |
316 | 22 | Dmitry Chernyak | - child 0: lvm, size 117.2G |
317 | 22 | Dmitry Chernyak | logical_id: xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_data |
318 | 22 | Dmitry Chernyak | on primary: /dev/xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_data (253:11) |
319 | 22 | Dmitry Chernyak | - child 1: lvm, size 128M |
320 | 22 | Dmitry Chernyak | logical_id: xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_meta |
321 | 22 | Dmitry Chernyak | on primary: /dev/xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_meta (253:12) |
322 | 22 | Dmitry Chernyak | |
323 | 22 | Dmitry Chernyak | </pre> |
324 | 1 | Dmitry Chernyak | |
325 | 1 | Dmitry Chernyak | <pre> |
326 | 23 | Dmitry Chernyak | root@gnt2:~# drbdsetup /dev/drbd8 disk /dev/xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_data \ |
327 | 23 | Dmitry Chernyak | /dev/xenvg/813feab3-f7a5-41bb-8a34-5b053ad1c8a6.disk0_meta 0 |
328 | 22 | Dmitry Chernyak | </pre> |
329 | 22 | Dmitry Chernyak | |
330 | 22 | Dmitry Chernyak | <pre> |
331 | 22 | Dmitry Chernyak | root@gnt2:~# drbd-overview |
332 | 22 | Dmitry Chernyak | 0:??not-found?? Connected Secondary/Primary UpToDate/UpToDate C r----- |
333 | 22 | Dmitry Chernyak | 8:??not-found?? StandAlone Secondary/Unknown Outdated/DUnknown r----- |
334 | 22 | Dmitry Chernyak | </pre> |
335 | 22 | Dmitry Chernyak | |
336 | 22 | Dmitry Chernyak | root@gnt2:~# drbdsetup /dev/drbd8 primary -f |
337 | 22 | Dmitry Chernyak | |
338 | 22 | Dmitry Chernyak | <pre> |
339 | 22 | Dmitry Chernyak | root@gnt2:~# drbd-overview |
340 | 22 | Dmitry Chernyak | 0:??not-found?? Connected Secondary/Primary UpToDate/UpToDate C r----- |
341 | 22 | Dmitry Chernyak | 8:??not-found?? StandAlone Primary/Unknown UpToDate/DUnknown r----- |
342 | 22 | Dmitry Chernyak | </pre> |
343 | 22 | Dmitry Chernyak | |
344 | 22 | Dmitry Chernyak | <pre> |
345 | 22 | Dmitry Chernyak | root@gnt2:~# drbdsetup /dev/drbd8 down |
346 | 22 | Dmitry Chernyak | </pre> |