做一個合格的-Linux-運維工程師

做為一個運維工程師,你必須掌握最基本的技能方能勝任這份工作,否則,是沒有公司願意接納你,並繼續培養你。

1.     獨立安裝系統與軟體

在安裝系統時你更會去留心學習Linux的目錄結構和作用,學會系統的安裝方法和軟體安裝方式,對目錄與檔案的操作,呃,這些夠基礎嗎?

2. 選擇一本適合自己的書籍

學習Linux除了網上免費的視訊教程之外,還是要多看書,多理解、思考,將你不會、不懂的做好筆記,好記性不如爛筆頭。選擇一本適合自己的書籍,有人說《Linux就該這麼學》太扯、內容太簡單,而我看著這本書卻非常適合我自己,自己看其它書籍感覺看不懂,就扔那裡不在願意去看,適合自己的就是最好的書,只有入門了才能更好的往下面學習,合格的工程師更要學會自學。

3. 管理使用者

Linux是一個多使用者、多工的作業系統,允許許多使用者同時使用這個機器處理多個任務,必須管理好這些使用者,即使初學Linux的小白也知道,可以通過網路讓多人同時登入,而非使用機器上僅有的一個顯示器、一個鍵盤和滑鼠。比如 web伺服器,是不是多使用者?ftp伺服器也是多使用者。系統上可以開啟遠端登入ssh或者telnet,這樣幾個人同時登入到該Linux系統上面。而需要管理好每個服務後面的帳號(使用者),可以安全、合理使用Linux系統資源。

4. 磁碟的合理管理

做了運維才知道磁碟不是最值錢,而資料才是無價的。往往磁碟的空間是有大小的,根據業務需求合理分配磁碟變的非常重要,我單位的伺服器swap為66G使用1G,而/var空間為36G總是磁碟滿滿,不得不頻繁刪除產生的日誌,以空出空間,否則就會影響業務的正常使用。真是血的教訓,有那麼多空間卻不能拿來使用,而業務必須24小時*365工作。經常檢視磁碟利用率,檢視目錄大小和檔案大小,為在用或者新擴容的磁碟做一個更好的規劃。

5. 檢視系統健康狀態

經常有人問我的Linux系統怎麼變的這麼慢?重啟也變慢了?重啟慢可能是你載入的程式多,也可能磁碟有壞道,都需要你來檢測,系統變慢,有可能執行的程式佔滿記憶體,或者CPU跑慢,網路利用率佔滿,工程師拿起你的命令top 、sar、 netstat、ps等,檢視是什麼原因引起的。我們的RHEL 6.8伺服器多次發現登入系統收、卡,有一個CPU使用率超100%,程序殺死就可以恢復,是一個木馬,可是沒過多久系統掛了,系統提示繳納2個比特幣,呃不多說了。

6. 安全和備份

對於生產環境的系統,真是安全太重要了。比特幣冰毒出現後,最後的解決方法是重新安裝系統,但備份還是1個半月之前的資料,無論怎麼樣還是有備份,慘!!!因此發現安全問題,應首先停止相應的服務,檢視日誌,執行備份。Linux系統雖然說安全,但也不是百分百,及時打補丁,每天進行日常備份還是極為必要、重要,備份同時存放在多個地方,U盤、網路上面其它的計算機上。你做到了嗎?不然總有哭的一天,悲劇啊,真是不知道該如何向使用者解釋。只有最新的資料備份,即使系統出現問題,也可以將業務恢復到最新的狀態,降低最小的損失。安全和備份,我不是一個適合的管理員。。。

7. 網路服務

數以百萬臺的Linux伺服器承載著網際網路的繁榮,上網看新聞、視訊的Web服務,下載檔案的ftp服務,郵件的Sendmail,DNS域名的Bind域名解析服務,Squid代理服務,MariaDB資料庫業務……,各種服務的使用方法,你都得會,是不是好可憐啊。我們內部需要搭建一個Linux的流媒體服務(視訊伺服器)和VPN業務,正在搭建中,其實都很好玩、有意思。當你做完這些,一定會感覺到非常有成就感的。

8. 系統管理和日誌分析

將使用者管理、磁碟管理、網路服務合理使用和優化系統,將一些不需要的業務kill掉,Linux系統中通知執行著非常多的程序,但是CPU在統一時鐘週期內只能運算一個指令,程序優先順序決定了每個程序處理的先後順序,優化程序的優先順序,提升服務效率。系統定時任務crontab合理利用,提高工作效率。程式並不總是一直正常執行,出現的故障總會有一個log日誌,檢視日誌分析故障原因,變的同樣重要。比如遇到的各種惡意攻擊行為,比較常見的便是HTTP flood,也稱之為CC攻擊。如何快速的定位到攻擊,並迅速響應,成為運維人員必備的技能。查詢、定位故障最快的方法就是登陸到相應的應用,檢視相應的攻擊來源、log日誌及時進行處理。

啊,說了這麼多,歡迎小夥伴一起入坑!!!