FC2ブログ

システム屋さんの忘備録

訪問ありがとうございます。中小企業の社内システム管理者向けWindows情報とまれに京阪神の情報も発信しています。

古いサーバーのメンテナンスは手間がかかる

サポート先のサーバーはほとんどがWindows Server です。OSの古い機器から最新版まで色々あります。OSの古い機器はリプレイス費用を抑えるために部品を交換して使い続けています。今年になって小規模事業所においてもリプレイス費用はより高額になり基幹系ですと「億」の単位が頻繁に提示されます。数年前から倍増と言った感じです。そのためメンテナンス等によって長期間使用する機器が増えてきました。

古いサーバーの中には「再起動がうまくいかない」「サービスの自動起動ができない」「Windows Updateのあとは三回ほど再起動する」機器があります、リモートメンテナンス時の再起動時はオンサイト対応にならないか不安になります。様々なエラーを未然に防ぐためにSFC、DISMコマンドをよく使用します、サービスの自動起動などの問題は解消する場合があると実感しています。

server221127

先日最新のDELL PowerEdge T440においてBIOSアップデート時に起動しない現象が発生しました、ログには「The system board BP1 PG voltage is outside of range.」とありメーカー分析によると「VLT0204 The system board BP1 PG voltage is outside of range.」との事で基盤の交換ということになりました、、既知のエラー(ITIL定義)のときは自動車などのようにリコール対応してくれたらオンサイト対応しなくて済んだのにと思ってしまいます。既知のエラー(ITIL定義)になるまでに苦労したエンジニアは大変だったと思います。サーバーに関してはメーカーサポート無しの運用はリスクが大きいと思います。

The system board BP1 PG voltage is outside of range.
VLT0204 The system board BP1 PG voltage is outside of range.
Dell PowerEdge バックプレーン交換

サーバーHDDのファームウエア更新作業

先ほど Dell Technologies からSAS HDDのファームウエア更新の緊急案内がきました。現在でもSAS HDD、1.5K回転、RAID 1というような構成で稼働している機器が多く存在します。

「このカスタマー アドバイザリーは、特定のAL14SXハード ドライブを搭載したデル・テクノロジーズのエンタープライズ システムで、AL14SXハード ドライブ ファームウェアをアップデートしていない場合、ドライブがオフラインになり交換の必要性が生じるケースが予想以上の確率で発生することをお知らせするものです。」という通知でした。適用しないとHDDが故障する確率が高いですよという脅しにも近い内容です。サーバーHDD故障は致命的なインシデントになるのでまずは該当するサーバーを探します。

AL14SX_s

直近に導入したサーバーが該当し業務開始までに慎重に適用します、もちろん再起動が必要なるので関連するシステムも念のために再起動します。DELLのサーバーにはiDRACという管理ツールがあるので適用後の確認は容易です。最近SSD搭載サーバーが増えていますがまだまだ高価、保守の(要 Cold Boot)難しさからSAS HDDサーバーは当面現役と思います。

システム屋と台風

今年の9月の台風21号では関西では大きな被害が発生しました。特に今回は停電時間が長引きより被害を大きくしました。スーパー、コンビニなど冷凍食品・生鮮食品はすべて廃棄になり電気が無いので営業も出来ませんでした。システム関連では各社内に設置のサーバー類に接続しているUPSバッテリーは長期の停電により全量使い切りシステムはダウンしました。大抵の会社ではBCPと言う事業継続計画を作成していますがいざ実行時になると思うように行かなかった事例が多かったと思います。

台風24号

関西では多くの電柱倒壊によりネットが繋がらない状況が長期間続きました、毎月10日〆切りの国保連などの申請などは最近はネットを使用してるので通信が出来ない医療機関などは苦労していましたが国保連側の柔軟な対応でなんとか受理されました。

先週やっとバッテリー交換や復旧が一段落したと思ったら台風24号がやってきて先ほどまでクライアントに被害がないかチェックしていましたが今のところ正常に稼働しているようです。UPSバッテリー交換は重いので今回は腰を痛めないように慎重に行いました。

レンタルサーバーの変更

 先日のファーストサーバ Zenlogic の障害からレンタルサーバーの変更の相談が続いています。「もう大丈夫と思いますよ」と伝えても2012年に続いて今回の障害ですので継続利用される会社はほとんどありません。その理由はもし次に障害が発生したら法人としての判断に問題があると思われるからだそうです。ある会社の経営者は「二度目の不渡り」という表現をされていました。そのような理由から今回の障害対象外のZenlogic利用者からも問い合わせがあります。
https://zenlogic.jp/news/status/syogai/cause/

さくらインターネット
さくらレンタルサーバーの設定例

レンタルサーバー上ではホームページ、メール、ネットショップ、データベース等様々な機能が提供されています。サーバーの移行にあたっては業務に影響が出ないようにシステム管理者が活躍します。先日の障害発生時に1日でDNS変更から新サーバーへの移行を行った会社もありました、規模にもよりますが徹夜の対応されたと推測できます。

移行は仕組み(DNSなど)と用語をしっかり理解していればそれほど難しくありません、最近のレンタルサーバー会社は電話対応もしっかりしているのでサポートを利用すると誰でも移行可能です。レンタルサーバーを申し込むと○○ドメインと呼ばれるそのサーバー会社のサブドメインが取得されます。Zenlogic の場合は標準ドメイン、さくらインターネットの場合は初期ドメイン、○○○ネットの場合は○○○ネットドメインなどと各社呼び方がまちまちまですが同じ意味です。一方「独自ドメイン」は各社共通で同じ事を意味します。ホームページ、メールアカウント、メールソフト設定、ショップなどの移行と準備が終わると最後にDNSを変更して移行完了になります。


ファーストサーバ (Zenlogic) で障害 2018年7月

ファーストサーバを利用しているクライアントでサーバ障害が発生しています。この障害6月19日から発生しており未だに原因調査とか言っております。この会社は2012年にも大規模障害を発生しています。今やメール、ホームページなどは企業のインフラと言ってもいいほど重要になっています。ましてレンタルサーバなどではBCP対策ぐらいしていると思われるのですが今日現在メールの送受信が出来ないなどの障害が続いています。

Zenlogic
クリックで該当ページへ

元々はクボタシステム開発の社員が独立して立ち上げた技術者集団というイメージで人気が出て多くの法人が契約しましたがヤフーの子会社になってからはそのような技術者が離れていったと思われます。従って6/19日からの障害が今日になっても復旧しないという最悪の結果になっています。サポートに電話しても繋がらない、メールしても返事が無い状態で昨日やっとファーストサーバからお詫びのメールがきました。

今回の件でレンタルサーバの他社への切り替えについての相談も受けましたが企業で使うなら共有サーバー(費用が安い)では無く専用サーバーを使用することをお伝えしました。
今回の障害情報のサポートページでの公開方法ですがやはり鉄道会社が抜きん出ているように思われます、見習って欲しいものです。
共用サーバーとは

2018/07/06追記
高負荷障害に関して多くのお客様からいただくお問合せ

2018/07/06 8:23
8時までのメンテナンスがさらに延期、6月19日からだまされ続け、回復傾向ですとか言われそのたびに社内に報告していたシステム担当者のグチが聞こえて来そうです。サーバー乗り換えようにもDNS変更が出来ないので回復を待つしか無いでしょう。
このインシデントで社内システム管理者には責任はありませんが一番苦労しているのは確かでしょう。これを機に経営者に企業ならそれなりのホスティングサービスを選択させるように提案しましょう。

2018/07/07追記



2018/07/07追記
参考になった記事です。恐らく以前の機能を取り込みながら作ったので完成度が低かったかも知れません。昔のファーストサーバでもよく遅延が発生していました。2012年に続いて二度目です、障害対応のレベルの低さ、クライアントの苦労を見ると15年以上ファーストサーバを利用していますが他社サーバへ乗換を推奨します。また移行サポートも順次行って行きます。
「契約してはいけない Zenlogic」
https://nakoruru.jp/?p=1752


月別アーカイブ