Tag Archives: Raid

kubuntu 14.04 Desktop Install on Raid Disk

ubuntu or kubuntu desktop 版都不支援安裝在 raid 的設備上, 所以需要一些技巧繞過去.

目前看到寫的最簡單的就是這一篇了.

How to Install Ubuntu 14.04 with RAID 1 using desktop installer?

apt-get install mdadm
mdadm --create /dev/md0 --bitmap=internal --level=1 -n 2 /dev/sda1 missing
fdisk /dev/md0

會產生 /dev/md0p1 /dev/md0p2 /dev/md0p3

用 try ubuntu 在 console 下這個指令安裝, 要做點小手腳

ubiquity -b

安裝的時候要選 /dev/md0p1 /dev/md0p2 /dev/md0p3 不要選別的.

安裝完之後, 要重新安裝 grub

sudo -s
mount /dev/md0p1 /mnt
mount -o bind /dev /mnt/dev
mount -o bind /dev/pts /mnt/dev/pts
mount -o bind /sys /mnt/sys
mount -o bind /proc /mnt/proc
chroot /mnt
apt-get install mdadm
nano /etc/grub.d/10_linux  # change quick_boot to 0
grub-install /dev/sda
grub-install /dev/sdb
update-grub
exit

如果 /etc/grub.d/10_linux quick_boot 沒有設成 0
開機會出現

error:  Diskfilter writes are not supported

Raid 5 重建的機率很低嗎?

最近看到一篇文章講 Raid 5 重建的機率很低.

主要論述是因為計算 URE(uncorrectable read error or Non-recoverable read errors per bits read) 這個參數. 不過我認為他犯了一個很基礎的錯誤, 誤將機率當作一定會發生.
平均每讀取12.5TB,就會讀到1位元壞掉、且無法修復的資料。

不止他, 有些外國網站或文章也提到同樣的事情
ex: RAID failures

很抱歉的是, 我沒有查到 URE 的定義, 或是廠商怎麼測量他的, 目前只有在 WD 的 Datacenter Capacity HDD內. 找到一小段話. “No non-recoverable errors during operating tests or after non-operating tests”.
不過這個小標並沒有標在該標的位置, 所以我不確定是不是講該段. 不過也有可能是講整個測試過程.

當然, 如果是像原文講到 4TB Raid5 重建出錯的機率是 72.6% 的數字, 那做 Raid 的廠商早就罵翻天了. 合理的 failure rate 的應該是如何呢?
我認為這一篇比較合理 RAID array failure probabilities
這篇採用的是 MTBF, 所以估出來的數字是這樣

In terms of probability of failure over the life of the array (3 years):
RAID0 – 10.5%
RAID5 – 0.000105%
RAID10 – 0.0000525%
RAID6 – 0.00000000000105%

合理多了, 不是嗎?

那 URE 的定義是什麼呢? 為什麼明明沒有還是要生出一個數字.
我認為應該和泛科學這篇講核電廠危機的是相關的從好像不太準的千萬分之一,到有點危言聳聽的24%,核災機率到底怎麼算?

應該是從讀取, 線路, 元件, 控制器, 等等這一串, 每一個部份都有其出問題的機率, 綜合起來就是 10^-16 ~ 10^-18 了. 但是是不是會出問題呢? 不一定. 但是廠商就保證二個 bit 在這個區間不會出現 URE 了

這根本是一個對廠商放水的數字呀…

ref. http://www.raidtips.com/raid5-ure.aspx

[Gentoo] 電腦升級案 32bit -> 64bit Linux

最近發現有一台電腦己經有點舊了, 首先是電源供應器的風扇掛了, 這個電源供應該應該有十年了, 印像中還沒有支援新的 ATX 接頭, 當年好像是用很便宜的價格從瘋狂賣客買的.
將電源風扇換成磁浮風扇之後, 似乎有好一點, 不過問題是, 很難開機, 還好這一台是一開就不關的 Server.
但是最近工作型態改變, 而且我買了一個瓦特計(像這樣), 沒事就在量電腦的電量. 發現常常使用的測試用電腦瓦特數非常高, Intel Q6600 + ATI 4850 要耗用 200W 左右.

所以最近就在找下一代的解決方案. 目標高效低功耗PC.
Read more »

ubuntu 遷移到 raid 0 的問題.

最近在 compile 程式的時候, 一直出錯, 請同事幫我檢查(因為是他寫的, 要保留車禍現場).
結果發現是我用了二年的系統碟有點問題, 查了一下 S.M.A.R.T Log, 己經有一堆 sector relocate 和 Error Log.

Read more »

Linux Software Raid 系統轉移

現在硬碟價格愈來低, 但是穩定性也一直是為人所詬病的.
所以我目前系統大概是這樣做的

1) 新買的硬碟放不重要的資料, Offline Backup 資料
2) Item 1) 換下來的硬碟做 Raid 1 當作資料碟
3) Item 2) 換下來的硬碟做暫存碟
4) Item 3) 換下來的硬碟做其他電腦的系統碟
5) Item 4) 換下來的硬碟做動物碟和大量資料傳送碟

以這樣的更換頻率來看, Item 1) 和 Item 2) 是最常換的.
像是某 s 長輩搬東西都還要注意 md5 checksum 的問題, 不過我實在是沒有這麼多力氣去處理
所以都只是搬過去就好了.

如果只是 copy data, 那問題還算簡單, 但是 Linux Software Raid Copy 還是需要一些技巧.

我的 Raid 1 Disk 大概二到三年更換一次, 每次都需要查 Software Raid 相關的指令, 很大的機會還會連回到自己的 Blog, 乾脆這次記錄下來, 以後還可以用, 也可以給大家參考

Read more »