Home –  Archive
Monthly Archives: 1月 2012

Crucial m4 64GB で5000時間以上使うとブルースクリーンとか

タイトルの通りCrucial m4 64GBというSSDを長時間(5000時間)以上つかっていると、動作がおかしくなるようですね(;´ρ`)

Windowsではブルースクリーンが発生するようです。というか、うちではなりました。

うちの場合は録画用に使用しているPCのシステムドライブになっていて24時間つけっ放しだったんですね。
おとといあたりから急に 気がついたらBIOSの設定画面とかが出ててどうしたんだろ?と思ってました。

30~1時間前後で発生して、何かトリガーになるような事をしたつもりはなかったのでまさかm4が問題だったとは・・・・。

丸一日掛けて、ディスクの不良セクタチェック、S.M.A.R.T情報の確認、Memtest86でのメモリチェックをしても何処もエラーがなくて、困って予備のディスクにパーティションごとコピーして動かしたので一応この情報に気づく前に現象は解決できてましたが・・・・。

先知ってれば無駄時間すごさなくて済んだのになぁとちょっぴり残念です。

というか5000時間使うとおかしくなるってなんだよ(;´ρ`) 個人的な感覚では「ありえねー」とか思うんだけど。

一応ファームのバージョンアップが予定されているみたいですが正直このまま使うかはちょっと様子見ですねぇ。

というか今後「crucial」のSSD使うかは個人的には微妙・・・・。安かったんだけどなぁ。安かろう悪かろうだったのか。

なお参考にしたのはこちらのサイトです。

http://www.newslogplus.com/2012/01/crucial-m45000.html
http://skyline798.blog118.fc2.com/blog-entry-3405.html
http://blog.livedoor.jp/amd646464/archives/52249945.html

Pacemakerでちょっと気になっている事

とりあえず、ボチボチとサンプルをコピペや改変をしながら何とか動作するようにはなっていますが、幾つか意味が分からず設定していたりして困っていたりします。

今回、特にどうしていいのか分からないような気になっている事を2点自分なりにまとめました。
要はメモ書きみたいなものですね。あと、通りかかった神様みたいな人が教えてくれることを祈って・・・。
過疎BLOGだからありえないと思いますがヽ(´ー`)ノ

 

 

サンプル設定そのままでもWARNINGが出てしまう

よくサンプルとかの設定をそのまま設定していると下記のようなWARNINGが表示されます。

WARNING: postgresql: specified timeout 60s for stop is smaller than the advised 120
WARNING: postgresql: specified timeout 60s for start is smaller than the advised 120
WARNING: postgresql: specified timeout 60s for notify is smaller than the advised 90
WARNING: postgresql: specified timeout 60s for demote is smaller than the advised 120
WARNING: postgresql: specified timeout 60s for promote is smaller than the advised 120

設定値が小さいぞとか警告掛けられていると思うんですがこの手の警告は普通に無視していいもんでしょうか?そもそもサンプル通りにやって警告が出るのが正直「こまったなぁ」と感じてしまいます。

この警告をどのように受け取っていいのか・・・・サンプルでも表示されるので「無視しても良いもの」と受け取っています。
実際に運用されている場合なのはどうなのか?というのは気になる所です。

 

 

location、 colocation、 order ってなんぞや?

サンプル見ながら適当に設定を↓のようにやってみたのですが、どうにもこうにもlocationだのcolocationだのorderとか雰囲気は分かるもののパッと見て設定の意味が分かりません。

crm configure location rsc_location-2 msPostgresql \
    rule role=master  200: uname eq postgres01 \
    rule role=master  100: uname eq postgres02 \
    rule role=master -inf: defined fail-count-vip-master \
    rule -inf: not_defined default_ping_set or default_ping_set lt 100

crm configure location rsc_location-1 vip-slave \
    rule  200: pgsql-status eq "HS:sync" \
    rule  100: pgsql-status eq "PRI" \
    rule  -inf: not_defined pgsql-status \
    rule  -inf: pgsql-status ne "HS:sync" and pgsql-status ne "PRI" 

crm configure colocation rsc_colocation-1 inf: msPostgresql        clnPingCheck
crm configure colocation rsc_colocation-2 inf: vip-master       msPostgresql:Master
crm configure order rsc_order-1 0: clnPingCheck          msPostgresql
crm configure order rsc_order-2 0: msPostgresql:promote  vip-master:start   symmetrical=false
crm configure order rsc_order-3 0: msPostgresql:demote   vip-master:stop    symmetrical=false

locationというのが、ruleの部分に指定されているものに合わせてリソースを振り分けるという指定だと思うんですね(´・ω・`)
rule部分の指定がイミフで(;´ρ`)

colocationってなんぞ?locationと何が違うのかな。構文も違いますが・・・。

そして最後にorder。 たぶん何かの順番を決めるものなんでしょうが、これは何の順番を決めているのでしょうか?

 

この辺の解説をやさしく詳しく丁寧に教えてくれるドキュメントとかないものだろうか(´;ω;`)

PacemakerとPostgreSQLの組み合わせがやっと出来ました。

最初わけがわからず挫折した、PacemakerとPostgreSQL 9.1の同期レプリケーションによるマスター・スレーブ構成の設定がなんとか完了しました。

未だに意味のわからない設定とか多々あるので、これから学習しなければ・・・と思います。

えと、使ったリソースエージョントは「PostgreSQL 9.1 ストリーミングレプリケーション対応 リソースエージェント」です。

さて設定についてですが基本的にPacemakerわかる人はすぐわかると思いますし、私がやった設定をここで書いても私自身解説できないのでなんの意味もないのでここでは書かない事とします(;´Д`)

個人的にハマったのは、nodeリストにうっかりホスト名を間違えて記載してしまって気がつかずに数時間・・・もしくは一日ぐらいはまってました(;´Д`)

あと、スレーブ側のPostgreSQLのpgsql-statusがHS:aloneのまま上手くいきませんでした。

これはどうやって直したのかよく覚えてないのですが、多分yumでインストールしたPostgreSQLではenable-nls設定されているためうまく動作せず、改めてソースから–enable-nlsオプションは付けずにコンパイルしたものを使いました。
たぶんそれで解決出来ると思います。

pg_controldataコマンドがローカライズされてしまって、うまく認識できないんじゃないかと推測しています。

まったくもって勘違いでした。もう一度やってみたら普通に動作しました。お騒がせいたしましたm(_ _)m

そうこうしてやった結果、なんとか動作しましたcrm_mon -fAをしてみるとこんな感じになりました。

============
Last updated: Sun Jan 8 18:40:50 2012
Stack: Heartbeat
Current DC: postgres02 (94f13cd6-969f-42e8-afb1-121484975bb3) - partition with quorum
Version: 1.0.11-1554a83db0d3c3e546cfd3aaff6af1184f79ee87
2 Nodes configured, unknown expected votes
4 Resources configured.
============

Online: [ postgres02 postgres01 ]

vip-master (ocf::heartbeat:IPaddr2): Started postgres02
vip-slave (ocf::heartbeat:IPaddr2): Started postgres01
 Master/Slave Set: msPostgresql
 Masters: [ postgres02 ]
 Slaves: [ postgres01 ]
 Clone Set: clnPingCheck
 Started: [ postgres02 postgres01 ]

Node Attributes:
* Node postgres02:
 + default_ping_set : 100
 + master-postgresql:0 : 1000
 + master-postgresql:1 : -INFINITY
 + pgsql-data-status : LATEST
 + pgsql-master-baseline : 11:0000000011000078
 + pgsql-status : PRI
* Node postgres01:
 + default_ping_set : 100
 + master-postgresql:0 : -INFINITY
 + master-postgresql:1 : 100
 + pgsql-data-status : STREAMING|SYNC
 + pgsql-status : HS:sync

Migration summary:
* Node postgres02:
* Node postgres01:

構成がサンプルと微妙に違うせいかcrm_mon -fAの結果も結構違うのが気になっていますが、幾つかやってみた感じだ問題なく動いているように感じます。

 

あとは色々試してみて問題無いことを確認するのと障害発生時の対応HOW TO集を準備できればよい・・・と。