-
运维之三大监控之间的差距
所属栏目:[经验] 日期:2021-05-28 热度:110
Falcon-agent是用Go语言开发的Daemon程序,运行在每台Linux服务器上,用于采集主机上的各种指标数据,主要包括CPU、内存、磁盘、文件系统、内核参数、Socket连接[详细]
-
分布式主动感知在智能运维中的应用
所属栏目:[经验] 日期:2021-05-28 热度:112
如图所示,横坐标代表服务规模。公司业务不断增长,服务规模也相应增长,此处我们简单理解为这是一个线性的变化,不考虑业务的暴增。 然而, 业务规模增长反映到[详细]
-
Linux运维:使用ss命令交换netstat
所属栏目:[经验] 日期:2021-05-28 热度:105
上面介绍了 netstat 的最最基本的一种用法,其他用法当然还有很多,但是先略过不表,如果想使用 ss 命令来代替 netstat 的话,我们怎样达到类似的效果呢? ss-at[详细]
-
运维DevOps体系解析与应用实践
所属栏目:[经验] 日期:2021-05-28 热度:72
为什么需要DevOps? 在回答这个问题之前,我们先了解一下什么是运维模式。所有模式是对待人和事物的态度后得到的方法论,比如我对人性是持悲观的态度,那么我就需[详细]
-
只需轻松2步,让你的SSH更加安全
所属栏目:[经验] 日期:2021-05-28 热度:148
OpenSSH 6.2 以后的版本多了一个配置项 AuthenticationMethods。该配置项可以让 OpenSSH 同时指定一个或多个认证方式,只有所有认证方式都通过后才会被认为是认[详细]
-
被变更伤害的码农,是如何成功自救的?
所属栏目:[经验] 日期:2021-05-27 热度:148
作为一个合格的码农,我们每时每刻都在为开发新功能、修复Bug、提升系统性能挥洒汗水。变更发布是产品迭代的必经之路,但是变化总伴随着风险,互联网公司轰动一[详细]
-
传授你一套秘籍,教你实现模拟弱网环境
所属栏目:[经验] 日期:2021-05-27 热度:194
运维过程中,最复杂的问题,莫过于网络的问题,而网络问题最烦的就是无法复现,这篇介绍一个强大的网络模拟工具Netem。 Netem是从linux 2.6以上内核版本开始提供[详细]
-
加薪,首先要提速,Linux shell的12个巧妙技巧让你运维熟练
所属栏目:[经验] 日期:2021-05-27 热度:113
对于管理员或用户而言,命令行不仅是可以完成所有任务的工具,而且还是可以永远开发的高度定制的工具。 最近,有一篇有关CLI中一些有用技巧的翻译文章。但是我觉[详细]
-
怎样利用cron任务在Linux中计划和方便任务
所属栏目:[经验] 日期:2021-05-27 热度:188
有时,你可能需要定期或以预定的时间间隔执行任务。这些任务包括备份数据库、更新系统、执行定期重新引导等。这些任务称为 cron 任务。cron 任务用于自动执行的[详细]
-
运维收藏:日志标准化必须面对的 4 类问题
所属栏目:[经验] 日期:2021-05-27 热度:66
在很多安全分析类产品建设的过程中都会涉及到关联分析,比如日志分析、soc、态势感知、风控等产品。之前的文章中阐述过五种最常见的关联分析模型,在文中也介绍[详细]
-
从25分钟到7分钟,我们用了这些技巧提升Rails CI的效率
所属栏目:[经验] 日期:2021-05-27 热度:62
我们的目标很简单,希望让测试套件的速度成为一个参数的函数,这个参数就是:我们愿意花多少钱?将基础架构简化到这个层面后,就更容易做成本效益分析,例如如果[详细]
-
老派运维,你还有多久会消失?
所属栏目:[经验] 日期:2021-05-27 热度:145
上图来自Gartner官网 。2019年11月13日,Gartner,Inc预测,到2020年,全球公共云服务市场将从2019年的2278亿美元增长到2664亿美元,增长17%。(这里指的公有云服[详细]
-
一个因 CA 根证书过期引起的血案,真相竟然是…
所属栏目:[经验] 日期:2021-05-27 热度:114
问题 10点左右,同事反馈咨询线上的Sentry 服务器现在是否正常。之后去检查 Sentry 服务,运行正常,但是该应用服务对接的Sentry频道已经很久没有事件进来了。[详细]
-
Cockpit及其网页用户界面的历史
所属栏目:[经验] 日期:2021-05-27 热度:96
本文将介绍它的用户界面的一些变化。还将探讨一些在网页界面中可用的通用工具,以简化那些单调的系统管理员任务。 Cockpit 驾驶舱安装 Cockpit 可以使用 dnf ins[详细]
-
关于故障复盘的一些经验
所属栏目:[经验] 日期:2021-05-27 热度:119
有句话说,常在河边走,哪有不湿鞋。我身边经常会看到不少数据故障。每每碰到这些问题,原因都是让人唏嘘不已。 而碰到故障的时候,除了通常都会说的后续改进,[详细]
-
怎样从基础思考设计你的 DevOps 运维服务体系?
所属栏目:[经验] 日期:2021-05-27 热度:133
原始阶段,运维工程师与各部门无数的磨合、探索下,慢慢形成了最初的体系,其无形的规范着运维的工作和注意事项,工程师通过这个纲领开展日常工作并保障业务的健[详细]
-
优秀的 Nginx 极简教程,覆盖了常用场景
所属栏目:[经验] 日期:2021-05-27 热度:180
nginx 的使用比较简单,就是几条命令。 常用到的命令如下: nginx-sstop快速关闭Nginx,可能不保存相关信息,并迅速终止web服务。 nginx-squit平稳关闭Nginx,保[详细]
-
浅谈监控,可观测性与数据存储
所属栏目:[经验] 日期:2021-05-27 热度:197
在实践中,所有这些概念/术语,目标都是增强工程师对于线上系统运行情况的了解。 对工程师而言,监控/可观测性工程存在的意义,是帮助工程师发现问题,定位问题[详细]
-
无数据,不上班!运维“数据思维”至关重要?
所属栏目:[经验] 日期:2021-05-27 热度:61
信通院的一些分析数据表明,企业IT的信息化历程逐渐完成,同时企业对IT的精益运行的需求越来越迫切,在这个场景下,数据的思维和使用能力成为制约提升IT生产效率[详细]
-
如何更好地做好运维管理?
所属栏目:[经验] 日期:2021-05-27 热度:184
如果你已经在做运维管理工作或是正想往运维管理方向发展,那么请搬上板凳,带好瓜子听我娓娓道来。我能给出一些个人的建议,让你在运维管理的道路上少走弯路。如[详细]
-
怎样在 CentOS/RHEL 系统中操作带 VLAN 标记的以太网卡
所属栏目:[经验] 日期:2021-05-27 热度:76
在某些场景中,我们希望在 Linux 服务器(CentOS/RHEL)的同一块以太网卡(NIC)上分配来自不同 VLAN 的多个 IP。这个可以通过使用 VLAN 标记接口来实现。但是要[详细]
-
Saltstack批量管理文件和实现
所属栏目:[经验] 日期:2021-05-27 热度:156
使用场景 在维护大量服务器的时候,系统一般初始化并上线以后,我们希望所有的服务器系统的某些配置文件一样,这时候我们需要一种工具来批量管理这些文件,保证[详细]
-
Kubernetes上对应用程序进行故障解决的方案
所属栏目:[经验] 日期:2021-05-27 热度:70
从 Docker 迁移到 Docker Swarm,再到 Kubernetes,然后处理了多年来的所有各种 API 更改之后,我非常乐意发现部署中出现的问题和把问题进行修复。我今天分享下[详细]
-
大数据理解:Docker虚拟化解析
所属栏目:[经验] 日期:2021-05-27 热度:81
一款产品从开发到上线,从操作系统,到运行环境,再到应用配置。作为开发+运维之间的协作我们需要关心很多东西,这也是很多互联网公司都不得不面对的问题,特别[详细]
-
你要偷偷学会排查线上CPU飙高的情况,然后吓坏所有人!
所属栏目:[经验] 日期:2021-05-26 热度:77
通过上面的堆栈信息,可以看出, 占用CPU资源的线程主要是卡在JDBC底层的TCP套接字读取上 。连续执行了很多次,发现很多线程都是卡在这个地方。 通过分析调用链[详细]