Работы по ремонту сервера

Как правильно обслуживать сервер

Обслуживание сервера — это комплекс мер, направленных на обеспечение безотказной работы сервисов, которые работают на данном сервере, а также увеличение срока службы серверного оборудования. Для поддержания бесперебойной работы или минимизации сбоев необходимо выполнить работы, по крайней мере, в двух направлениях — поддержка работоспособности аппаратной части и безошибочной работы программного обеспечения (ПО).

1. Техническое обслуживание оборудования

  1. Электропитание. Необходимо убедиться в наличии источника бесперебойного питания (ИБП) и достаточном уровне заряда его аккумулятора. Желательно, чтобы ИБП мог отправить сигнал на выключение сервера, если заряда осталось очень мало.
  2. Пыль. Время от времени, необходимо чистить сервер от скопившейся пыли. Для этого рекомендуется использовать баллончики со сжатым воздухом. Особое внимание стоит уделить кулерам.
  3. Индикация. Визуально осмотреть сервер — если какой-либо из аппаратных компонентов работает со сбоем, можно увидеть горящую красную лампочку. Чаще всего выходят из строя жесткие диски. Необходимо вовремя заметить проблему, чтобы успеть выполнить замену комплектующих и избежать потери данных.
  4. Серверное помещение. В помещении, где находится серверное оборудование, должна быть невысокая температура воздуха — следите за работой системы кондиционирования. В помещении должно быть чисто.

2. Обслуживание программного обеспечения

  1. Установка обновлений. Они содержат исправления критических ошибок, а также новые возможности. Правильно, сначала устанавливать обновления на тестовом сервере, чтобы проверить их корректность. В противном случае, можно навредить системе.
  2. Проверка безопасности. Включает поиск обновлений безопасности системы и их установку. А также поддержание актуальности антивирусных баз и запуск сканирования на вирусы (желательно одноразовым антивирусом, например CureIt).
  3. Чтение системных журналов (логов). Самый лучший способ устранить проблему — не допустить ее. С помощью журналов можно отследить все ошибки и предупреждения, которые происходят в системе и предотвратить серьезные последствия. Необходимо обратить особое внимание на системные логи и сообщения критически важных приложений.
  4. Выполнение оптимизации. Во время обслуживания сервера, необходимо просматривать счетчики производительности для поиска процессов, которые перегружают систему. Также необходимо чистить систему от временных файлов, выполнять дефрагментацию диска и его логическую проверку.
  5. Проверка состояния жестких дисков. Дисковые накопители, по двум причинам, являются одним из важнейших объектов проверки — во-первых, на них самое ценное — данные, во-вторых, они часто выходят из строя. Необходимо проверять состояние поверхности диска с помощью специализированных утилит, например HD Tune.

Windows и Linux — в чем разница поддержки

Как правило, принципиальных различий в обслуживании серверов на базе Windows и Linux нет. Отличаются только команды, инструменты и их внешний вид. В Windows больше работаем мышкой, в Linux — клавиатурой.

Вот небольшой список различий, на которые стоит обратить внимание:

  • Linux нужно реже перезагружать после установки обновлений. Это важно учитывать для Windows и обновлять систему в нерабочее время.
  • Системы на базе Linux меньше подвержены вирусным атакам и взломам. Однако не стоит расслабляться — вирусы все-таки есть и предусмотреть это стоит. Таким образом, не стоит исключать из регламента антивирусную проверку — просто в системах Windows это нужно делать почаще.

3. Как принять в обслуживание сервер

В независимости, передал ли сервер другой специалист или Вы его видите впервые, действия должны быть следующие:

  1. Для доступа к системе получаем логин и пароль и меняем последний. Также не лишним будет сменить пароли всем учетным записям с привилегиями администратора. Если данных для авторизации нет, необходимо выполнить сброс пароля.
  2. Выполняем аудит ранее установленного программного обеспечения. Если обнаружено ПО для удаленного управления, удаляем или меняем данные для аутентификации.
  3. Проверяем планировщик заданий (в Windows) и cron (в системах на базе UNIX). Изучаем, что именно запускается и отключаем все лишнее и противоречащее безопасности.
  4. Выполняем действия по обслуживанию аппаратной и программной частей, описанные в данной инструкции выше (1-й, 2-й пункты).
Читайте также:  Ваз ремонт руководство 2104 2105

4. Мониторинг и резервное копирование

Две неотъемлемые составляющие профессионального подхода к обслуживанию серверов.

Мониторинг

Рекомендуется использовать выделенную систему мониторинга, при использовании 10 серверов и более.

В первую очередь, необходимо мониторить сетевую доступность оборудования. Если мониторинг позволяет, также стоит проверять статусы служб, коды ответов на запросы, наличие свободного дискового пространства.

Резервное копирование

В рамках периодического обслуживания сервера, важно проверять своевременное создание резервных копий, но что важнее — возможность восстановить из них данные.

5. Составление регламента

Для профессионального обслуживания серверного оборудования, необходимо заранее оговорить порядок проведения работ, другими словами — составить регламент. Он должен включать перечень выполняемых операций и частоту их выполнения. Также, в документе можно прописать скорость реагирования на возникающие проблемы.

Пример регламента для обслуживания серверов

Описание работ Периодичность
Тестирование ИБП 2 раза в год
Чистка от пыли 2 раза в год
Проверка состояния (индикации) 1 раз в месяц
Проверка серверного помещения 1 раз в месяц
Проверка обновлений безопасности 1 раз в неделю
Проверка обновлений системы и программного обеспечения 1 раз в месяц
Чтение журналов системы 1 раз в месяц
Чистка диска от временных данных 2 раза в месяц
Выполнение дефрагментации накопителей 4 раза в год
Проверка целостности дисковой системы 1 раз в квартал

6. Удаленное обслуживание

При таком варианте поддержки не получится выполнить задачи 1-о пункта. В таком случае есть три варианта:

  1. Заказчик обслуживает оборудование собственными силами.
  2. Исполнитель организовывает командировки.
  3. Исполнитель находит подрядчика для выполнения работ по обслуживанию оборудования.

Источник

Базовый чек-лист обслуживания серверов

Как часто, насколько тщательно и в каком режиме обслуживать сервера на colocation — зависит от количества, возраста и типа оборудования. Здесь как с техникой: регламент техобслуживания трехлетнего Hyundai Solaris один, а у годовалого YAMAHA FJR1300AE совсем другой. Но если усреднить, всю программу обслуживания серверов можно свести к простому списку рутинных операций.

Структура обслуживания

Сервер — это комплекс программного обеспечения, работающего на аппаратной части. Соответственно, в обслуживание сервера включается техническое обслуживание (ТО) «железа» и поддержка программной составляющей. Начнем с «железа»:

Очистка от пыли. У нас в машзалах настелены антистатические полы, на системе приточной вентиляции установлены фильтры, а уборка проводится ежедневно. Но пыль вездесуща и, рано или поздно, она забивается в зазоры и оседает на контактах. Тотальную чистку оборудования от пыли в среднем проводят 2 раза в год. В остальное время можно ограничиться визуальным контролем и ситуативными мерами.

Контроль индикаторов и замена комплектующих, требующих вскрытия корпуса. Чаще всего из строя выходят жесткие диски, но состояние выработавших ресурс RAM и процессора также может потребовать замены.

Проверка портов. Безопасности много не бывает, поэтому неиспользуемые открытые порты нужно время от времени просматривать на предмет посторонних подключений.

Внешний и внутренний осмотр, оценка температурных параметров.

Проверка аппаратной части

В программной части работы не меньше:

Обновление системы. Наша многолетняя практика показывает, что автоматические обновления не всегда устанавливаются чисто. Принудительная установка позволяет сначала проверить их корректность на тестовом сервере.

Плановая перезагрузка. В процессе чистятся логи и завершают работу фоновые задачи, невыполненные из-за сбоя.

Проверка безопасности, включая сканирование системы и выявление скрытых заражений.

Контроль корректности резервного копирования. Сбои происходят везде, даже в системе резервного копирования. Чтобы точно знать, что в запасе есть рабочая копия, регулярно проверяйте, делаются ли копии, правильно ли сохраняются, в нужном ли объеме. В этом же блоке работ имеет смысл проводить тестовое восстановление резервных копий и баз.

Чистка диска от временных файлов. Эта регулярная операция поддерживает системный диск в чистоте и освобождает место под нужные данные.

Отслеживание ошибок по журналу логов. По записям можно узнать о проблемных местах сервера и предотвратить возникновение критических ошибок, вместо того, чтобы впоследствии устранять их.

Контроль систем мониторинга. Мониторинг снимает массу рутинной работы с администратора, но излишнее доверие системе может привести к излишнему потреблению ресурсов сервера. Дело в том, что система не всегда успевает вовремя отреагировать на изменение ситуации и здесь нужен только личный контроль: просмотр отчетов потребляемых ресурсов, поиск критических точек, анализ тенденций.

Большая часть этих работ проводится с периодичностью раз в месяц, но чем больше серверный парк и чем масштабнее проект, тем чаще оборудование требуется контролировать и обслуживать.

Обслуживание сервера по регламенту

В идеале под обслуживание серверов составляется инструкция или регламент. Регламент может быть большим или сжатым, детально прописанным или общим — не важно. Важно, чтобы он стал опорным пунктом для любого, кто столкнется с администрированием вашего оборудования.

Источник

Регламентные операции при обслуживании серверов

Любой сервер, как и автомобиль, требует регулярного технического обслуживания, чтобы работать без сбоев и не подвести владельца в нужный момент. Для этого мы регулярно возим наших «железных коней» на станцию техобслуживания, где с ними выполняют определенные операции, позволяющие им и дальше не подводить своих хозяев. Аналогичные регулярные операции надо выполнять и на серверах, чтобы они не остановили работу компании.

Наши специалисты, основываясь на богатом опыте ИТ-обслуживания, сформировали список регламентных операций, оптимальных для Windows-серверов. Обычно в бизнесе применяют именно Windows , поэтому на таких серверах и делался акцент в этой статье. Исходя из соотношения трудозатрат и эффективности мы пришли к периоду регламентных операций — раз в 1 месяц. При таком периоде процедура не сильно напрягает клиента и позволяет достигнуть требуемых значений надежности работы серверов.

Еще одним важным преимуществом проведения регламентных операций – является сопутствующее выполнение функции мониторинга «здоровья» серверов. Очень часто во время проведения этих работ удается диагностировать скрытую проблему на сервере. Например, после плановой перезагрузки, он не загружается, или загружается с ошибками служб. Если такая неудачная перезагрузка произошла бы в рабочее время, то простой в работе был бы болезненным для компании клиента. Поэтому, когда такие проблемы всплывают во время регламентных операций, проводимых в рамках абонентского обслуживания серверов – это не критично для бизнеса, ведь процедуры проводятся в нерабочее время клиента и есть возможность своевременного устранения неисправности. (см. Таблица 1)

Принудительная установка обновлений через WindowsUpdate

Автоматическая установка обновлений на серверах очень нежелательна, потому что после обновления нужна перезагрузка сервера, а после чего — распаковка скачанных обновлений. Это занимает значительное время, которое недопустимо терять в рабочий день.

Кроме того, иногда обновления бывают «проблемными» и приводят к неработоспособности различных служб. Приходится откатывать такие обновления, а это тоже занимает время и получается простой сервера.

Операционная система Windows очень любит перезагрузки. Во время перезагрузок от «утечек» очищается оперативная память, чистятся логи и завершаются зависшие фоновые задания. Если не делать плановые перезагрузки Windows , то система может зависнуть и при этом в самый ответственный момент.

Запланированный полный антивирусный осмотр

Установленного на сервер фонового антивируса недостаточно, так как он проверяет только транзитные файлы и данные, проходящие через оперативную память и кэши. Необходимо регулярно проводить полную проверку всей файловой системы, чтобы выявлять «просочившиеся» вирусы.

Проверка системы на вирусы с помощью Dr.Web CureIt

Ни один антивирус не может обеспечить 100% защиты от вирусов. Для более эффективной защиты применяют несколько антивирусных ядер в целях проверки, это повышает вероятность обнаружения вируса.

Дефрагментация дисков утилитой MyDefrag

Это операция упорядочивания данных на диске. Её выполнение приводит к увеличению производительности дисковой подсистемы, особенно в показателях чтения данных.

Проверка создания backup`ов

Даже операции резервного копирования могут давать сбои. Поэтому важно вручную проверять что резервные копии делаются, их размер не нулевой и дата актуальная.

Проверка корректного восстановления резервных копий файлов и SQL-баз.

К сожалению, наличие резервной копии не гарантирует успешное восстановление данных. Поэтому необходимо обязательно проводить тестовое восстановление данных из резервной копии, чтобы быть на 100% уверенным в работоспособности этих данных.

Для баз MSSQL нами разработаны скрипты, которые позволяют одним нажатием кнопки мыши проводить разворачивание резервной копии в тестовую базу с последующей проверкой целостности данных. Это очень облегчает процесс проверки и резко повышает фактическую исполняемость этого пункта перечня регламентных операций.

Удаление temp -файлов и старых log -файлов — папки С:\ Windows \ system 32\ Logfiles, C:\Documents and settings\%user%

Регулярная чистка места от временных файлов позволяет не захламлять системный диск, чтобы в дальнейшем не столкнуться с ошибкой исчерпания свободного места на системном диске.

Контроль записей в системном журнале на предмет наличия ошибок.

Анализ данных мониторинга.

В системном журнале можно найти информацию о проблемных местах сервера, отследить динамику улучшения или ухудшения его «здоровья» и проактивно реагировать на потенциальные проблемы.

Контроль мониторинга – корректная работа службы, корректная отправка и доставка уведомлений.

Все серверы наших клиентов подключены к единой системе мониторинга. В данном пункте проверяется что агент этой системы работает корректно.

Проверка открытых портов

Данная проверка позволяет контролировать безопасность сети клиента на предмет открытых ненужных портов.

Таблица 1 — Описание регламентных операции

Во время проведения регламентных операций происходит подтормаживание сервера, а так же плановые перезагрузки, поэтому эти операции в рабочие время клиента выполнять нельзя. Мы выполняем их в нерабочее время клиента, обычно в пятницу вечером.

Пожалуй, самая большая проблема в проведении регламентных операций – это регулярность их выполнения сотрудниками. Пресловутый «человеческий» фактор может дать о себе знать. Для решения этой проблемы мы придумали следующее: задачи на проведение регламентных операций ставятся сотрудникам системой ERP . На основании этой задачи сотрудник заполняет чек-лист, сгенерированный системой конкретно по объекту проверки. Если эта задача проигнорирована сотрудником, то у него происходит блокировка ERP до выполнения задачи. Также об этом сразу уведомляется руководитель, что позволяет контролировать своевременность исполнения регламентных операций.

Для контроля качества выполнения регламентных операций мы разработали три автоматизированных алгоритма проверки («роботов») которые в фоновом режиме постоянно проверяют на всех серверах ряд параметров: наличие открытых портов, наличие актуальных ненулевых резервных копий и наличие установленных обновлений системы за последний месяц. Эти параметры позволяют сказать проводились ли регламентные операции по факту.

Эффект от внедрения регламентных операций

В результате внедрения культуры проведения регламентных операций при абонентском ИТ-обслуживании, нам удалось достигнуть весьма впечатляющих показателей повышения надежности работы серверов наших клиентов:

Поражение операционной системы вредоносным ПО снизилось — на 75%

Снижение факта отсутствия актуальной целостной резервной копии — на 95%

Снижение сбоев операционной системы после неудачной установки обновлений — на 80%

Снижение сбоев, проявляющихся после перезагрузки сервера — на 70%

Оставшиеся случаи происходят по причине обстоятельств, которые невозможно предусмотреть заранее и выявить с помощью профилактики — например, появление нового вируса, неадекватное поведение приложений и служб, действия пользователя и так далее.

На основании нашего опыта проведения технического обслуживания серверов организаций, включающего регламентные операции, можно сделать вывод, что польза от этих процедур значительно превосходит затраты времени и ресурсов на их выполнение. Это говорит о том, что проблему лучше предотвратить вовремя, чем бороться с ее последствиями в дальнейшем.

EFSOL Системная интеграция. Консалтинг

Источник

Читайте также:  Агрегатно узловой метод ремонта это
Оцените статью