工作職責:
1、負責線上系統(tǒng)的穩(wěn)定性維護,參與故障的響應(yīng)、跟蹤與定位,加入 on-call 輪值,確保快速響應(yīng)并高效處理線上故障。
2、規(guī)劃并執(zhí)行業(yè)務(wù)部署、版本更新、安全加固及自動化運維工作,推動運維自動化與故障自愈機制,持續(xù)提升系統(tǒng)可靠性。
3、負責監(jiān)控業(yè)務(wù)運行狀態(tài),及時排查和修復網(wǎng)絡(luò)故障,確保服務(wù)的高可用性。
4、參與系統(tǒng)架構(gòu)設(shè)計,提出優(yōu)化建議,推動技術(shù)方案的落地實施,確保系統(tǒng)穩(wěn)定運行。
5、負責內(nèi)部運維平臺和內(nèi)部工具的設(shè)計、開發(fā)迭代,提升運維效率。
任職要求:
1、精通 Linux 系統(tǒng)運維與管理、Shell/Python 腳本編寫,有數(shù)據(jù)庫運維和自動化工具開發(fā)經(jīng)驗優(yōu)先。
2、熟悉網(wǎng)絡(luò)原理,掌握 TCP/IP、子網(wǎng)劃分、VLAN、NAT、GRE 隧道、IPSec VPN 等技術(shù)。
3、熟練使用 tcpdump、wireshark、iproute2 等網(wǎng)絡(luò)工具,具備定位和排查解決問題的能力。
4、熟悉監(jiān)控與告警體系(如 Prometheus、Zabbix、Grafana),能夠獨立構(gòu)建和優(yōu)化監(jiān)控體系,實現(xiàn)對業(yè)務(wù)運行狀態(tài)的實時監(jiān)控與預警。
5、具備優(yōu)秀的故障分析與問題解決能力,能夠在復雜環(huán)境下快速定位并解決問題;同時具備良好的團隊協(xié)作和溝通能力,能夠與開發(fā)、測試等團隊緊密合作。
6、了解前端架構(gòu),具備一定 Go 語言開發(fā)能力,能夠進行運維工具與平臺開發(fā)維護。
7、持有 CCNA、RHCE、CKA 等認證者優(yōu)先,有云平臺(阿里云、騰訊云、AWS 等)實戰(zhàn)經(jīng)驗加分。
更新于 2026-01-02
查看更多崗位職責