給奧組委做的郵件系統(tǒng)容災(zāi)方案
據(jù)說一共有5家廠商提供了方案,俺代表搜狐提的方案最后得到采納,現(xiàn)在殘奧會(huì)也已經(jīng)結(jié)束,按照當(dāng)初商定的合同,搜狐的支持服務(wù)在一周后也就是9/30將正式終止,我想現(xiàn)在講一下技術(shù)細(xì)節(jié)應(yīng)該不會(huì)有什么影響了。
要解決的問題簡(jiǎn)單說就是:萬一奧組委的郵件系統(tǒng)癱瘓,怎樣才能讓郵件系統(tǒng)盡快可用。
系統(tǒng)出問題有很多種,除了硬件故障、軟件故障外,網(wǎng)絡(luò)故障和機(jī)房故障也是需要考慮在內(nèi)的。我根據(jù)搜狐郵件中心所能做的工作,提出的是一個(gè)異地容災(zāi)方案:
災(zāi)備系統(tǒng)在我們這里,把它設(shè)為低級(jí)別的 MX,平時(shí)不啟動(dòng) 25 端口,一旦奧組委確認(rèn)需要啟動(dòng)該災(zāi)備系統(tǒng),則啟動(dòng) 25 端口。將所有收到的郵件,比如說發(fā)給 foo@beijing2008.cn 的,利用 Milter 協(xié)議的 addRcpt 功能,增加一個(gè) foo@vip.beijing2008.cn 的收件人。vip.beijing2008.cn 是本地 host 的一個(gè)郵件域,在緊急情況下,奧組委郵箱的原用戶可以登錄到這里查看并回復(fù)新收到的郵件。而發(fā)給 foo@beijing2008.cn 的郵件會(huì)在我們的 postfix 隊(duì)列里等待,一旦奧組委的故障恢復(fù),自然就能重新投遞過去。
技術(shù)核心就是 Postfix 的 Milter 支持能力,以及針對(duì) beijing2008.cn 的投遞不是 DNS 查詢而是 transport_table 指定。實(shí)施上最麻煩的是用戶數(shù)據(jù)問題,和郵件沒任何關(guān)系,卻花了大量的時(shí)間在上面。
災(zāi)備準(zhǔn)備好了,奧運(yùn)期間也沒有出現(xiàn)突發(fā)事件需要考驗(yàn)俺的這個(gè)方案。算是好消息,但也有點(diǎn)小遺憾。
最后要說的是,奧組委的IT部門,業(yè)務(wù)能力還是很不錯(cuò)的,比我以前做項(xiàng)目時(shí)接觸的幾個(gè)甲方單位強(qiáng)多了;還有一個(gè)首信的同仁,不知道是做項(xiàng)目監(jiān)理還是負(fù)責(zé)整個(gè)的項(xiàng)目集成,幾個(gè)電話打下來對(duì)他的敬業(yè)精神和認(rèn)真態(tài)度也是很佩服。從小見大,奧運(yùn)會(huì)本身怎么怎么樣不去評(píng)論,但確實(shí)是把中國最優(yōu)秀的人才集中在了一起去支持這個(gè) big project。。。