昨日、わしが手掛けてきてた展示会サイトでプログラムのレベルダウンが起こってることが判明。
お客さんからのクレームで。。。
その対応で思い出したことを少し。
復旧と原因追究のはざまで
トラブルが起こった時に悩ましいのが、復旧しつつ原因追求のための作業をせなあかんということ。
本格的な原因追究ってのはログ追っかけたり、ダンプ見たりと専門家がやる。
で、現場でやるんは専門家に見てもらう資料の採取。ダンプとか、画面のスクリーンショット取ったり。
原因追究のための資料って、システムが自動で取ってくれてるもの(ログとか)もあれば、その瞬間に作業してる人が取っとかんとあかんもん(ダンプ、スクリーンショットとか)がある。
システムのログとかFTPのログとかは、サーバをレンタルしてる事業社から、「ほとんど提供できません。」と。「セキュリティの観点で。」と。
そうか。。。
この辺は前職の時と感覚ちゃうな。
前職の時は全部、サーバを自前で準備して管理者権限とかも持ってたから。
ま、しゃあない。
今の仕事はこういう環境でやってんやから。
今回取ったスクリーンショットは・・・
で、現場では復旧作業してる人から、サーバにあるプログラムの最終更新日時が古すぎると。
開発用PCからプログラムを再度サーバへアップロードするって言うんで、「今の状態をスクリーンショット取っといて」とお願い。
わしは状況のまとめとか、お客さんへの報告とかもろもろの対応。
後になって、取ってくれたスクリーンショット見たら。。。
めっちゃ最低限の領域しか取ってへん。。。
PC用のFTPソフトでサーバのフォルダ/ファイル状態を見てたんやけど、ほんまにファイルの一覧と最終更新日付が確認できるだけ。
スクリーンショットを取った日時、サーバ名(IPアドレス、ホスト名)、フォルダ名すら入ってへん。。。
何をするにも技術ってある
こういうのって慣れの問題ではあるんやが。
スクリーンショット取るって細かい作業一つにも、やっぱ技術が。
スクリーンショット取った日付を示すには、ウィンドウズの時計を一緒に取るとか。わしはブラウザで日本標準時のページを一緒に取ってた。
サーバ名、フォルダは、今回も使ってたFTPソフトにちゃんと表示されてるから、単にスクリーンショット取る領域を広げとけばええ。
複数枚のスクリーンショット取る時は、ちゃんと流れを意識して、マウスカーソルの位置にもこだわったり。
何でこんなことが必要かって言うと、厳しいお客さんやと、「ほんまにトラブル起こった時点のもんなんか?」とか、「テスト環境のファイル一覧ちゃうんか?」とか言われたりすんのよね。。。
で、それに対して「違います!」って言うのも労力かかるし。場合によっては、また別の資料用意したりとか。
お客さんにとっても時間の無駄やし。
あとは、お客さんとかサポートにスクリーンショットを見せる時。
そういった工夫がされてると、相手が「おっ!」って思う。
と、思う。
「あ、こいつは細かいとこまで見るヤツやな」と思わせることが、その後の調査とか報告とかでプラスに働く。
サポートには「油断できんな、ちゃんと調べな」と。お客さんには「ちゃんと見てくれてるから信用しよう」と思わせることができる。
と、思う。
ま、偉そうなこと言うても、今回、問題のスクリーンショットを取る時にちゃんと言えんかったから、わしも同罪やけど。
トラブル対応にはある程度慣れてるつもりやったけど、前職辞めて、やっぱ感度が鈍ってる感じするな。。。
あとはなんだかんだ、周りに助けられながらやってたってことやな。
その辺も含めてWeb屋としてリスタート。
あらためて。
がんばろ。
ほな。