运维自动化发展历程及技术应用 IaaS基础设施即服务(相当于卖硬件) ,PaaS平台即服务(卖操作系统),SaaS软件即服务(卖软件) 企业实际应用场景分析 灰度环境(生产环境的一部分) 功能:在全量发布代码前将代码的功能面向少量精准用户发布的环境,可基于主机或用户执行灰度发布 案例:共100台生产服务器,先发布其中的10台服务器,这10台服务器就是灰度服务器 灰度环境:往往该版本功能变更较大,为保险起见特意先让一部分用户优化 体验该功能,待这部分用户使用没有重大问题的时候,再全量发布至所有服务器 程序发布 程序发布要求: 不能导致系统故障或造成系统完全不可用 不能影响用户体验 预发布验证: 新版本的代码先发布到服务器(跟线上环境配置完全相同,只是未接入到调度器) 灰度发布: 基于主机,用户,业务 发布路径: /webapp/tuangou /webapp/tuangou-1.1 /webapp/tuangou-1.2 发布过程:在调度器上下线一批主机(标记为maintanance状态) --> 关闭服务 --> 部署新版本的应用程序 --> 启动服务 --> 在调度器上启用这一批服务器 自动化灰度发布:脚本、发布   常用自动化运维工具 Ansible:python,Agentless,中小型应用环境 (管理上百台机器) 利用ssh协议远程来进行管理,基于key验证,把管理者的公钥传到被管理的主机上去, Saltstack:python,一般需部署agent(代理),执行效率更高 (管理上千台机器) Puppet:ruby, 功能强大,配置复杂,重型,适合大型环境 (管理上百台机器) Fabric:python,agentless Chef: ruby,国内应用少 Cfengine func Ansible简介 Ansible是一个简单的自动化运维管理工具,基于Python语言实现,由ParamikoPyYAML两个关键模块构建,可用于自动化部署应用、配置、编排task(持续交付、无宕机更等)。    Ansible官网:https://www.ansible.com/    github地址:https://github.com/Ansible 特性   模块化:调用特定的模块,完成特定任务, 一千多个模块   有Paramiko,PyYAML,Jinja2(模板语言)三个关键模块   支持自定义模块   基于Python语言实现   部署简单,基于python和SSH(默认已安装) 免代理,agentless   安全,基于OpenSSH   支持playbook编排任务 幂等性:一个任务执行1遍和执行n遍效果一样,不因重复执行带来意外情况   无需代理不依赖PKI(无需ssl)   可使用任何编程语言写模块   AML格式,编排任务,支持丰富的数据结构   较强大的多层解决方案 Ansible主要组成部分 1:ANSIBLE PLAYBOOKS:任务剧本(任务集),编排定义Ansible任务集的配置文件,由Ansible顺序 依次执行,通常是JSON格式的YML文件 2:INVENTORY: Ansible管理主机的清单/etc/ansible/hosts 3:MODULES:Ansible执行命令的功能模块,多数为内置核心模块,也可自定义 4:PLUGINS:模块功能的补充,如连接类型插件、循环插件、变量插件、过滤插件等,该功能不常用 5:API:供第三方程序调用的应用程序编程接口 6:ANSIBLE:组合INVENTORY、API、MODULES、PLUGINS的绿框,可以理解为是ansible命令工 具,其为核心执行工具 7:Ansible命令执行来源: U7SER,普通用户,即SYSTEM ADMINISTRATOR CMDB(配置管理数据库) API 调用 PUBLIC/PRIVATE CLOUD API调用 USER-> Ansible Playbook -> Ansibile 8:利用ansible实现管理的方式: Ad-Hoc 即ansible命令,主要用于临时命令使用场景 Ansible-playbook 主要用于长期规划好的,大型项目的场景,需要有前提的规划 9:Ansible-playbook(剧本)执行过程: 将已有编排好的任务集写入Ansible-Playbook 通过ansible-playbook命令分拆任务集至逐条ansible命令,按预定规则逐条执行 10:Ansible主要操作对象: HOSTS主机 NETWORKING网络设备 11:注意事项 执行ansible的主机一般称为主控端,中控,master或堡垒机 主控端Python版本需要2.6或以上 被控端Python版本小于2.4需要安装python-simplejson 被控端如开启SELinux需要安装libselinux-python windows不能做为主控端 安装 rpm包安装: EPEL源 yum install ansible 编译安装: yum -y install python-jinja2 PyYAML python-paramiko python-babel python-crypto tar xf ansible-1.5.4.tar.gz cd ansible-1.5.4 python setup.py build python setup.py install mkdir /etc/ansible cp -r examples/* /etc/ansible Git方式: git clone git://github.com/ansible/ansible.git --recursive cd ./ansible source ./hacking/env-setup pip安装: pip是安装Python包的管理器,类似yum yum install python-pip python-devel yum install gcc glibc-devel zibl-devel rpm-bulid openssl-devel pip install --upgrade pip pip install ansible --upgrade 确认安装: ansible --version 配置文件 /etc/ansible/ansible.cfg 主配置文件,配置ansible工作特性,( 软连接指向新版本,方便) /etc/ansible/hosts 主机清单 , /etc/ansible/roles/ 存放角色的目录 程序 /usr/bin/ansible 主程序,临时命令执行工具 /usr/bin/ansible-doc 查看配置文档,模块功能查看工具, 相当于man命令 /usr/bin/ansible-galaxy (银河) 下载/上传优秀代码或Roles模块的官网平台 /usr/bin/ansible-playbook 定制自动化任务,编排剧本工具/usr/bin/ansible- pull (拉取)远程执行命令的工具 /usr/bin/ansible-vault 文件加密工具 /usr/bin/ansible-console 基于Console界面与用户交互的执行工具 主机清单inventory Inventory 主机清单 ansible的主要功用在于批量主机操作,为了便捷地使用其中的部分主机,可以在inventory file中 将其分组命名 /etc/ansible/hosts文件格式 inventory文件遵循INI文件风格,中括号中的字符为组名。可以将同一个主机同时归并到多个不同的组中;此外,当如若目标主机使用了非默认的SSH端口,还可以在主机名称之后使用冒号加端口号来标明 ntp.magedu.com [webservers] www1.magedu.com:2222 www2.magedu.com [dbservers] db1.magedu.com db2.magedu.com db3.magedu.com 如果主机名称遵循相似的命名模式,还可以使用列表的方式标识各主机 · 示例: [websrvs] www[01:100].example.com [dbsrvs] db-[a:f].example.com ansible 配置文件 Ansible 配置文件/etc/ansible/ansible.cfg (一般保持默认) [defaults] #inventory = /etc/ansible/hosts # 主机列表配置文件 #library = /usr/share/my_modules/ # 库文件存放目录 #remote_tmp = $HOME/.ansible/tmp #临时py命令文件存放在远程主机目录 #local_tmp = $HOME/.ansible/tmp # 本机的临时命令执行目录 #forks = 5 # 默认并发数 #sudo_user = root # 默认sudo 用户 #ask_sudo_pass = True #每次执行ansible命令是否询问ssh密码 #ask_pass = True #remote_port = 22 #host_key_checking = False # 检查对应服务器的host_key,建议取消注释 #log_path=/var/log/ansible.log #日志文件   Ansible系列命令 ansible ansible-doc ansible-playbook ansible-vault   ansible-console ansible-galaxy ansible-pull   ansible-doc: 显示模块帮助 ansible-doc [options] [module...] -a 显示所有模块的文档 -l, --list 列出可用模块 -s, --snippet显示指定模块的playbook片段 示例: ansible-doc –l 列出所有模块 ansible-doc ping 查看指定模块帮助用法 ansible-doc –s ping 查看指定模块帮助用法   ansible ansible通过ssh实现配置管理、应用部署、任务执行等功能,建议配置ansible端能基于密钥认证的方式联系各被管理节点 ansible <host-pattern> [-m module_name] [-a args] (-a加参数) --version 显示版本 -m module 指定模块,默认为command -v 详细过程 –vv -vvv更详细 --list-hosts 显示主机列表,可简写—list -k, --ask-pass 提示输入ssh连接密码,默认Key验证 -K, --ask-become-pass 提示输入 sudo时的口令 -C, --check 检查,并不执行 (测试) -T, --timeout=TIMEOUT 执行命令的超时时间,默认10s -u, --user=REMOTE_USER 执行远程执行的用户     -b, --become 代替旧版的sudo 切换 运维自动化------ansible搭建 Linux 第1张 一、环境准备 centos7 192.168.30.110做主控端 192.168.30.100 、192.168.30.107 192.168.30.114 做被控端 二、搭建配置ansible [root@centos7 ~]# yum -y install ansible 运维自动化------ansible搭建 Linux 第2张 查看版本信息 运维自动化------ansible搭建 Linux 第3张 这里面的ping是ansible的ping模块; 清单列表不包括本机; 运维自动化------ansible搭建 Linux 第4张 把要管理的主机加入到主机清单中 etc/ansible/hosts 运维自动化------ansible搭建 Linux 第5张   [root@centos7 ~]# ansible 192.168.30.100 -m ping 测试存活性是基于ssh服务的,基于密码和key验证,通常是基于key验证;部署是把ssh的可以验证做好 运维自动化------ansible搭建 Linux 第6张   运维自动化------ansible搭建 Linux 第7张   建议:在控制主机登录主机的同时,如果不要每次都通过验证登录,则修改配置文件,默认提供YES启动日志的功能,手动注释取消就行了 [root@centos7 ~]# vim /etc/ansible/ansible.cfg 运维自动化------ansible搭建 Linux 第8张   在控制端主机生成公钥,把公钥传到三台被控制端主机上去,实现key验证 运维自动化------ansible搭建 Linux 第9张   可以对主机清单做分组 运维自动化------ansible搭建 Linux 第10张     ansible的Host-pattern(主机列表) 匹配主机的列表 All :表示所有Inventory(主机清单)中的所有主机 ansible all –m ping * :通配符 ansible “*” -m ping ansible 192.168.1.* -m ping ansible “*srvs” -m ping 或关系 ansible “websrvs:appsrvs” -m ping ansible “192.168.1.10:192.168.1.20” -m ping 逻辑与 ansible “websrvs:&dbsrvs” –m ping 在websrvs组并且在dbsrvs组中的主机 逻辑非 ansible ‘websrvs:!dbsrvs’ –m ping 在websrvs组,但不在dbsrvs组中的主机 注意:此处为单引号 综合逻辑 ansible ‘websrvs:dbsrvs:&appsrvs:!ftpsrvs’ –m ping 正则表达式 ansible “websrvs:&dbsrvs” –m ping ansible “~(web|db).*\.magedu\.com” –m ping 运维自动化------ansible搭建 Linux 第11张 逻辑与 运维自动化------ansible搭建 Linux 第12张   ansible命令执行过程 ansible命令执行过程 1. 加载自己的配置文件 默认/etc/ansible/ansible.cfg 2. 加载自己对应的模块文件,如command 3. 通过ansible将模块或命令生成对应的临时py文件,并将该 文件传输至远程服务器的对应执行用户$HOME/.ansible/tmp/ansible-tmp-数字/XXX.PY文件 4. 给文件+x执行 5. 执行并返回结果 6. 删除临时py文件,sleep 0退出 执行状态: 绿色:执行成功并且不需要做改变的操作 黄色:执行成功并且对目标主机做变更 红色:执行失败   ansible使用示例 示例 sudo 切换身份默认就是root, 以wang用户执行ping存活检测 ansible all -m ping -u wang -k 以wang sudo至root执行ping存活检测 (用wang用户连接对方后,sudo到root身份执行操作) ansible all -m ping -u wang –b -k 以wang sudo至mage用户执行ping存活检测 ansible all -m ping -u wang –b -k --become-user mage 以wang sudo至root用户执行ls ansible all -m command -u wang --become-user=root -a 'ls /root' -b –k -K ansible常用模块 Command:在远程主机执行命令,默认模块,可忽略-m选项 ansible srvs -m command -a ‘service vsftpd start’ ansible srvs -m command -a ‘echo magedu |passwd --stdin wang’ 不成功此命令 运维自动化------ansible搭建 Linux 第13张 不支持 $VARNAME < > | ; & 等,用shell模块实现 运维自动化------ansible搭建 Linux 第14张   Shell:和command相似,用shell执行命令 vim /etc/ansible/ansible.cfg 运维自动化------ansible搭建 Linux 第15张 1:ansible srv -m shell -a ‘echo magedu |passwd –stdin wang’ :2:调用bash执行命令 类似 cat /tmp/stanley.md | awk -F‘|’ ‘{print $1,$2}’ &>/tmp/example.txt 这些复杂命令,即使使用shell也可能会失败,解决办法:写到脚本时,copy到远程,执行,再把需要的结果拉回执行命令的机器   Script:运行脚本 脚本模式、用于批量执行脚本 -a "/PATH/TO/SCRIPT_FILE“ snsible websrvs -m script -a f1.sh 在控制端的主机上编写一个脚本,但是运行是在被控制端的主机上 运维自动化------ansible搭建 Linux 第16张   Copy:从服务器复制文件到客户端, ansible srv -m copy -a “src=/root/f1.sh dest=/tmp/f2.sh owner=wang mode=600,backup=yes”   如目标存在,默认覆盖,此处指定先备份 ansible srv -m copy -a “content=‘test content\n’ dest=/tmp/f1.txt” 利用内容,直接生成目标文件 复制模块、批量复制,拷贝文件到远程主机 ansible [主机ip、主机组] -m copy -a "src=源文件 dest=目标路径 owner=所有者 mode=权限 backup=yes/no是否备份" 运维自动化------ansible搭建 Linux 第17张   运维自动化------ansible搭建 Linux 第18张 备份文件名称比较长的 运维自动化------ansible搭建 Linux 第19张   Fetch(抓取):把远程的主机文件抓取到控住端的主机上,copy相反,目录可先tar ansible srv -m fetch -a ‘src=/root/a.sh dest=/data/scripts’ 运维自动化------ansible搭建 Linux 第20张   运维自动化------ansible搭建 Linux 第21张   File:设置文件属性 (删除文件的效果,创建软硬连接) ansible srv -m file -a "path(管理的文件)=/root/a.sh owner=wang mode=755“ ansible web -m file -a ‘src=/app/testfile dest=/app/testfile-link state=link (软连接) ansible all -m file -a 'path(管理的文件)=/data state=absent(递归的删除,缺席)' 运维自动化------ansible搭建 Linux 第22张 已经删除data文件夹 运维自动化------ansible搭建 Linux 第23张 还可以[root@centos7 ~]# ansible all -m file -a 'path=/data/test.txt state=touch' 在被控制端的主机上创建test.txt 文件 创建软连接 运维自动化------ansible搭建 Linux 第24张   运维自动化------ansible搭建 Linux 第25张   Hostname:管理主机名 ansible node1 -m hostname -a “name=websrv” 运维自动化------ansible搭建 Linux 第26张 永久生效,但hosts文件没有被改   Cron:计划任务 [root@centos7 ~]# ansible-doc -s cron 调用模块 支持时间:minute,hour,day,month,weekday ansible srv -m cron -a “minute=*/5 (每5分钟) job(后跟执行的命令)=‘/usr/sbin/ntpdate 172.16.0.1 &>/dev/null’ 运维自动化------ansible搭建 Linux 第27张   运维自动化------ansible搭建 Linux 第28张   name=Synctime” 创建任务 运维自动化------ansible搭建 Linux 第29张   运维自动化------ansible搭建 Linux 第30张 ansible srv -m cron -a ‘state=absent name=Synctime’ 删除任务 运维自动化------ansible搭建 Linux 第31张 结果 运维自动化------ansible搭建 Linux 第32张   Yum:管理包 ansible srv( all) -m yum -a ‘name=httpd state=latest(最新版)’ 安装 [root@centos7 ~]# scp /etc/yum.repos.d/media.repo 192.168.30.107:/etc/yum. repos.d/media.repo 100% 140 64.3KB/s 00:00 [root@centos7 ~]# ansible all -m yum -a 'name=httpd state=present' 运维自动化------ansible搭建 Linux 第33张 ansible srv -m yum -a ‘name=httpd state=absent’ 删除 运维自动化------ansible搭建 Linux 第34张 ansible常用模块   Service:管理服务 ansible-doc -s service ansible all -m service -a 'name=httpd state=stopped' ansible all -m service -a 'name=httpd state=started' 运维自动化------ansible搭建 Linux 第35张   ansible all –m service –a ‘name=httpd state=reloaded’ ansible all -m service -a 'name=httpd state=restarted'   User:管理用户 ansible all-m user -a 'name=user1 comment=“test user” uid=2048 home=/app/user1 group=root‘ ansible all -m user -a 'name=sysuser1 system=yes home=/app/sysuser1 ’ ansible all -m user -a ‘name=user1 state=absent remove=yes‘ 删除用户及家目录等数据 [root@centos7 ~]# ansible all -m user -a 'name=testuser(用户名) system=yes(系统账号) groups(组)=wang,bin shell=/bin/csh' (shell类型) 运维自动化------ansible搭建 Linux 第36张   运维自动化------ansible搭建 Linux 第37张   Group:管理组 ansible srv -m group -a "name=testgroup(组名) system=yes“ ansible srv -m group -a "name=testgroup state= absen(删除组)   ansible系列命令 ansible-galaxy (人们写的剧本,下载ansible剧本框架工具,根据自己的需求下载相关的角色) 连接 https://galaxy.ansible.com 下载相应的roles 列出所有已安装的galaxy ansible-galaxy list(列出有哪些装好的角色) 安装galaxy ansible-galaxy install geerlingguy.redis 删除galaxy ansible-galaxy remove geerlingguy.redis ansible-pull 推送命令至远程,效率无限提升,对运维要求较高 Ansible-playbook(剧本) ansible-playbook hello.yml (剧本文件)   cat hello.yml #hello world yml file       - hosts( 主机清单): websrvs (主机清单的分组名)         remote_user: root (远程连接以root身份)   tasks: (任务)       - name: hello world (之后要做的事)         ommand: /usr/bin/wall hello world (是-a后的所有的操作)   [root@centos7 ~]# vim hello.yml 运维自动化------ansible搭建 Linux 第38张 [root@centos7 ~]# ansible-playbook hello.yml 用次命令执行     Ansible-vault 功能:管理加密解密yml文件 ansible-vault [create|decrypt|edit|encrypt|rekey|view] ansible-vault encrypt hello.yml 加密 ansible-vault decrypt hello.yml 解密 ansible-vault view hello.yml 查看 ansible-vault edit hello.yml 编辑加密文件 ansible-vault rekey hello.yml 修改口令 ansible-vault create new.yml 创建新文件 Ansible-console:2.0+新增,可交互执行命令,支持tab root@test (2)[f:10] $ 执行用户@当前操作的主机组 (当前组的主机数量)[f:并发数]$ 设置并发数: forks n 例如: forks 10 切换组: cd 主机组 例如: cd web 列出当前组主机列表: list 列出所有的内置命令: ?或help 示例: root@all (2)[f:5]$ list root@all (2)[f:5]$ cd appsrvs root@appsrvs (2)[f:5]$ list root@appsrvs (2)[f:5]$ yum name=httpd state=present root@appsrvs (2)[f:5]$ service name=httpd state=started              

 

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。
扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄