Pulpito :: Results Dashboard

Posted	Started	Updated	Runtime	Duration	In Waiting	Machine	Teuthology Branch	OS Type	OS Version	Nodes	Status
2021-10-19 12:02:58	2021-10-19 12:05:03	2021-10-19 14:28:50	2:23:47	2:12:40	0:11:07	smithi	master	centos	8.4	3	fail

Nodes: smithi101 smithi175 smithi183

Description: upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml

Log: http://qa-proxy.ceph.com/teuthology/mchangir-2021-10-19_12:02:52-upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml-pacific-distro-basic-smithi/6451037/teuthology.log

Sentry event: https://sentry.ceph.com/organizations/ceph/?query=a4c3bdc1aa684529a8be3bf0aed80e90

Failure Reason:

Command failed on smithi101 with status 124: 'sudo adjust-ulimits ceph-coverage /home/ubuntu/cephtest/archive/coverage timeout 120 ceph --cluster ceph osd dump --format=json'

All Details...

log_href: http://qa-proxy.ceph.com/teuthology/mchangir-2021-10-19_12:02:52-upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml-pacific-distro-basic-smithi/6451037/teuthology.log
archive_path: /home/teuthworker/archive/mchangir-2021-10-19_12:02:52-upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml-pacific-distro-basic-smithi/6451037
description: upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml
duration: 2:12:40
email:
failure_reason: Command failed on smithi101 with status 124: 'sudo adjust-ulimits ceph-coverage /home/ubuntu/cephtest/archive/coverage timeout 120 ceph --cluster ceph osd dump --format=json'
flavor: default
job_id: 6451037
kernel:
- kdb: True
- sha1: distro
last_in_suite: False
machine_type: smithi
name: mchangir-2021-10-19_12:02:52-upgrade:nautilus-x:onetime:upgrade-nautilus-to-pacific.yaml-pacific-distro-basic-smithi
nuke_on_error: True
os_type: centos
os_version: 8.4
overrides:
- admin_socket:
  - branch: pacific
- ceph:
  - conf:
    - client:
      - admin socket: /var/run/ceph/$cluster-$name.$pid.asok
      - client mount timeout: 600
      - pid file: /var/run/ceph/$cluster-$name.pid
      - rados mon op timeout: 15m
      - rados osd op timeout: 15m
    - global:
      - bluestore warn on legacy statfs: False
      - bluestore warn on no per pool omap: False
      - mon pg warn min per osd: 0
      - mon warn on pool no app: False
      - ms bind msgr2: False
    - mds:
      - mds bal frag: True
      - mds bal fragment size max: 10000
      - mds bal merge size: 5
      - mds bal split bits: 3
      - mds bal split size: 100
      - mds op complaint time: 180
      - mds verify scatter: True
      - mds_max_snaps_per_dir: 4096
      - osd op complaint time: 180
      - rados mon op timeout: 900
      - rados osd op timeout: 900
    - mgr:
      - debug mgr: 20
      - debug ms: 1
    - mon:
      - debug mon: 20
      - debug ms: 1
      - debug paxos: 20
      - mon op complaint time: 180
      - mon warn on legacy crush tunables: False
      - mon warn on osd down out interval zero: False
    - osd:
      - bdev async discard: True
      - bdev enable discard: True
      - bluestore allocator: bitmap
      - bluestore block size: 96636764160
      - bluestore fsck on mount: True
      - debug ms: 1
      - debug osd: 20
      - mon osd backfillfull_ratio: 0.85
      - mon osd full ratio: 0.9
      - mon osd nearfull ratio: 0.8
      - osd failsafe full ratio: 0.95
      - osd objectstore: bluestore
      - osd op complaint time: 180
  - fs: xfs
  - log-ignorelist:
    - $MDS_ALL_DOWN$
    - $MDS_UP_LESS_THAN_MAX$
    - failed to encode map
    - overall HEALTH_
    - $FS_
    - \(MDS_
    - \(OSD_
    - \(MON_DOWN$
    - $CACHE_POOL_
    - \(POOL_
    - \(MGR_DOWN$
    - $PG_
    - \(SMALLER_PGP_NUM$
    - Monitor daemon marked osd
    - Behind on trimming
    - Manager daemon
    - Not found or unloadable
    - evicting unresponsive client
    - reporting legacy $not per-pool$ BlueStore omap usage stats
  - log-whitelist:
    - $MDS_ALL_DOWN$
    - $MDS_UP_LESS_THAN_MAX$
  - sha1: 3421e020f56da2c05e2520bcaad85667848b330a
- ceph-deploy:
  - bluestore: True
  - conf:
    - client:
      - log file: /var/log/ceph/ceph-$name.$pid.log
    - mon:
      - osd default pool size: 2
    - osd:
      - bdev async discard: True
      - bdev enable discard: True
      - bluestore block size: 96636764160
      - bluestore fsck on mount: True
      - mon osd backfillfull_ratio: 0.85
      - mon osd full ratio: 0.9
      - mon osd nearfull ratio: 0.8
      - osd failsafe full ratio: 0.95
      - osd objectstore: bluestore
  - fs: xfs
- install:
  - ceph:
    - sha1: 3421e020f56da2c05e2520bcaad85667848b330a
- selinux:
  - whitelist:
    - scontext=system_u:system_r:logrotate_t:s0
- workunit:
  - branch: wip-mchangir-mds-fix-nautilus-to-pacific-upgrade-issue-pacific
  - sha1: 50697c6787badec56cdd7a80c50c1d8d4f6688cd
owner: scheduled_mchangir@teuthology
pid:
roles:
- ['mon.a', 'mon.b', 'mon.c', 'mgr.x', 'mgr.y', 'mds.a', 'mds.b', 'mds.c', 'osd.0', 'osd.1', 'osd.2', 'osd.3']
- ['client.0']
- ['client.1']
sentry_event: https://sentry.ceph.com/organizations/ceph/?query=a4c3bdc1aa684529a8be3bf0aed80e90
status: fail
success: False
branch: pacific
seed:
sha1: 3421e020f56da2c05e2520bcaad85667848b330a
subset:
suite:
suite_branch: wip-mchangir-mds-fix-nautilus-to-pacific-upgrade-issue-pacific
suite_path:
suite_relpath:
suite_repo:
suite_sha1: 50697c6787badec56cdd7a80c50c1d8d4f6688cd
targets:
- smithi101.front.sepia.ceph.com: ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABgQDcCT5WOsjs2lD5htWekK+GaUd+uwixyKvAq4J2ecP20NzDiOnCNAEptEoSAvpFPalo72kQ31O7wu4yerZksrcHIiFzkpa28KGCd7MgLY/ztpJbmeapTIWCbk8OycrTbJ1Bpmu2Xt4QyJsG+FoEzBzCMryCkml4md2ptaF0OblWGpM0kFDNC44vdJC3jBnmd3fifC9fX53Fedn0E3UOqy/o2QDYXlRv8hMx6hlHKW0C0hQqueDZL7FVd4Cvdv1bt6SNl7pQ1CAmmuGWN3rKh7JTUdmosphaxL8sECpWq2e+qfZOfsf+EXMSTLRN1ur34mmpBlwzThKvkInGwG5c/1kVqjI7xksiVA0uqQ0CTIjoAOtvLSqUHJa1cNzN6s8AnMEQLcyQ3RpsQ7vbQqGA9lhORHbjuW9sWszSKZTtOQdgrGAsomwAbC35O/VLzTVsAF4GbLznSsX93w7OvlrVVpEk6fYg8oArrKn/4XgalVK26RjILltYzqc+TXKCWs7Z1P8=
- smithi175.front.sepia.ceph.com: ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABgQDYjB8H0K2ofMBeSy8LMh9BgRV8p2egTAVaHWfDlly2Z4dAsWoS56ZG0raL6+QNHDx5vIdrzHT+gcR3/vxZwxujSzVJlDTMj1j1GvnQ4km5xJh+ZDvfJhsw/MqhhmqDyAhei+izfQCfrDH+l9yHj+wcHx+rI4bATkDOeTh82lndFMbez0H96LykRWC/HH+8wd+SwQaArlzCulIOi9REbujP737ZwYJNKp+dtfyuCW/SpwFvXmkDw4FYGoiJkYl3FN9Vo4q+UVP51O5ssYbHIZXUlXUhVcmegyEIur4EIltqC7UaUtKSPjdyVz4mVciQcGAY9tDqRGSusa0M9gNy+ikw4RyXOhCSO7jHGk+EB4ZvPtO2oZPnKy2OJA8TkBfSPXqGCNUMQkJDU0wdd9CO5sVXHEyINIjvEEi+R4tbogowwkhZSFZc3kMt/eyAfhhdn/WVWHAL+MnDc4f+OZ1hlrQjQ6q4qwzbJ3CbH9hGzlRC61RXF+SIcNDZiH0KFfcO/s0=
- smithi183.front.sepia.ceph.com: ssh-rsa AAAAB3NzaC1yc2EAAAADAQABAAABgQC8msewLKGdcHcpfYit3xgRa9N11uEVTipp6VdnZpts3uM1DXzZTvpyCi+ERKDT3idWxmjE3v+c2VFX6XAAErGxJ2HuwOXidIMNxcjmEegnuYs3WKlVrdgQSSvXCXd96LzlFFgdHtoCpK+oLORoQBNK0XNVqShjRb7s7qHRd1SNDGt8OtaGAj1D9rv2sSYzNp3qdjz4xVzXUnDgEQgNA24fjcb7kBy65OJmDV7O/+NVRGg9F52uidnBHZWSBNpmiNFgf7yelmKHR/rx7owVHOQn+vAaaJj02EC3CVnXhdidSSJCI4nPEqVGYIh2o7xmdKAzEWCrJHtRiovVKDlusH0WFCtgijWLrU39Yc3REhn6vmebYv9XYxZuqtCdLwcOHVaKrPnOwRW53t/eKH9Pp9q9XEJyl6avkUv18Aa4yBNMYP8MGLGP+SW6Y5/xqxh48haAb8TEP0ZZFOBsagzyaMTcEYOmfmZL6tzNhJQ2vVJBYUY6BjCOIJzKCb/xSbiUauU=
tasks:
- internal.check_packages:
- internal.buildpackages_prep:
- internal.save_config:
- internal.check_lock:
- internal.add_remotes:
- console_log:
- internal.connect:
- internal.push_inventory:
- internal.serialize_remote_roles:
- internal.check_conflict:
- internal.check_ceph_data:
- internal.vm_setup:
- kernel:
  - kdb: True
  - sha1: distro
- internal.base:
- internal.archive_upload:
- internal.archive:
- internal.coredump:
- internal.sudo:
- internal.syslog:
- internal.timer:
- pcp:
- selinux:
- ansible.cephlab:
- clock:
- exec:
  - mon.a:
    - mkdir -p /var/log/ceph
- install:
  - branch: nautilus
  - exclude_packages:
    - libcephfs-dev
    - librados3
    - ceph-mgr-dashboard
    - ceph-mgr-diskprediction-local
    - ceph-mgr-rook
    - ceph-mgr-cephadm
    - cephadm
    - ceph-immutable-object-cache
    - python3-rados
    - python3-rgw
    - python3-rbd
    - python3-cephfs
  - extra_packages:
    - librados2
  - extra_system_packages:
    - deb:
      - bison
      - flex
      - libelf-dev
      - libssl-dev
      - network-manager
      - iproute2
      - util-linux
      - dump
      - indent
      - libaio-dev
      - libtool-bin
      - uuid-dev
      - xfslibs-dev
    - rpm:
      - bison
      - flex
      - elfutils-libelf-devel
      - openssl-devel
      - NetworkManager
      - iproute
      - util-linux
      - libacl-devel
      - libaio-devel
      - libattr-devel
      - libtool
      - libuuid-devel
      - xfsdump
      - xfsprogs
      - xfsprogs-devel
      - libaio-devel
      - libtool
      - libuuid-devel
      - xfsprogs-devel
  - sha1: 3421e020f56da2c05e2520bcaad85667848b330a
- print: **** done installing nautilus
- print: **** starting ceph daemons
- ceph:
  - create_rbd_pool: False
  - mon.a:
  - conf:
    - client:
      - admin socket: /var/run/ceph/$cluster-$name.$pid.asok
      - client mount timeout: 600
      - pid file: /var/run/ceph/$cluster-$name.pid
      - rados mon op timeout: 15m
      - rados osd op timeout: 15m
    - global:
      - bluestore warn on legacy statfs: False
      - bluestore warn on no per pool omap: False
      - mon pg warn min per osd: 0
      - mon warn on pool no app: False
      - ms bind msgr2: False
    - mds:
      - mds bal frag: True
      - mds bal fragment size max: 10000
      - mds bal merge size: 5
      - mds bal split bits: 3
      - mds bal split size: 100
      - mds op complaint time: 180
      - mds verify scatter: True
      - mds_max_snaps_per_dir: 4096
      - osd op complaint time: 180
      - rados mon op timeout: 900
      - rados osd op timeout: 900
    - mgr:
      - debug mgr: 20
      - debug ms: 1
    - mon:
      - debug mon: 20
      - debug ms: 1
      - debug paxos: 20
      - mon op complaint time: 180
      - mon warn on legacy crush tunables: False
      - mon warn on osd down out interval zero: False
    - osd:
      - bdev async discard: True
      - bdev enable discard: True
      - bluestore allocator: bitmap
      - bluestore block size: 96636764160
      - bluestore fsck on mount: True
      - debug ms: 1
      - debug osd: 20
      - mon osd backfillfull_ratio: 0.85
      - mon osd full ratio: 0.9
      - mon osd nearfull ratio: 0.8
      - osd failsafe full ratio: 0.95
      - osd objectstore: bluestore
      - osd op complaint time: 180
  - fs: xfs
  - log-ignorelist:
    - $MDS_ALL_DOWN$
    - $MDS_UP_LESS_THAN_MAX$
    - failed to encode map
    - overall HEALTH_
    - $FS_
    - \(MDS_
    - \(OSD_
    - \(MON_DOWN$
    - $CACHE_POOL_
    - \(POOL_
    - \(MGR_DOWN$
    - $PG_
    - \(SMALLER_PGP_NUM$
    - Monitor daemon marked osd
    - Behind on trimming
    - Manager daemon
    - Not found or unloadable
    - evicting unresponsive client
    - reporting legacy $not per-pool$ BlueStore omap usage stats
  - log-whitelist:
    - $MDS_ALL_DOWN$
    - $MDS_UP_LESS_THAN_MAX$
  - sha1: 3421e020f56da2c05e2520bcaad85667848b330a
  - cluster: ceph
- exec:
  - mon.a:
    - pgrep -a ceph
- print: **** done starting ceph daemons
- print: **** starting ceph-fuse
- ceph-fuse:
  - client.0:
- exec:
  - client.0:
    - pgrep -a ceph
- print: **** done starting ceph-fuse
- parallel:
  - workunit:
    - clients:
      - client.0:
        
        kernel_untar_build.sh
    - branch: wip-mchangir-mds-fix-nautilus-to-pacific-upgrade-issue-pacific
    - sha1: 50697c6787badec56cdd7a80c50c1d8d4f6688cd
  - exec:
    - mon.a:
      - for ((i = 0; i < 15; i++)); do ceph --cluster ceph -s --format=json; sleep 60; done
  - exec:
    - client.0:
      - for ((i = 1; i <= 1260; i++)); do mkdir /home/ubuntu/cephtest/mnt.0/.snap/snap${i}; sleep 5; done
- exec:
  - client.0:
    - for ((i = 1; i <= 1260; i++)); do rmdir /home/ubuntu/cephtest/mnt.0/.snap/snap${i}; done
    - sleep 120
  - mon.a:
    - pgrep -a ceph
- exec:
  - mon.a:
    - pgrep -a ceph
- parallel:
  - install-upgrade-tasks
- sleep:
  - duration: 120
- ceph.stop:
  - daemons:
    - mds.a
    - mds.b
    - mds.c
    - osd.0
    - osd.1
    - osd.2
    - osd.3
    - mgr.x
    - mgr.y
    - mon.a
    - mon.b
    - mon.c
- ceph-fuse:
  - client.0:
    - mounted: False
- print: **** client.0 unmounted
- sleep:
  - duration: 60
- print: **** about to restart mon.a
- ceph.restart:
  - daemons:
    - mon.a
  - wait-for-healthy: True
- print: **** mon.a is healthy
- print: **** about to restart mon.b
- ceph.restart:
  - daemons:
    - mon.b
  - wait-for-healthy: True
- print: **** mon.b is healthy
- print: **** about to restart mon.c
- ceph.restart:
  - daemons:
    - mon.c
  - wait-for-healthy: True
- print: **** mon.c is healthy
- print: **** about to restart mgr.x
- ceph.restart:
  - daemons:
    - mgr.x
  - wait-for-healthy: True
- print: **** mgr.x is healthy
- print: **** about to restart mgr.y
- ceph.restart:
  - daemons:
    - mgr.y
  - wait-for-healthy: True
- print: **** mgr.y is healthy
- print: **** about to restart osd.0
- ceph.restart:
  - daemons:
    - osd.0
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** osd.0 is healthy
- print: **** about to restart osd.1
- ceph.restart:
  - daemons:
    - osd.1
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** osd.1 is healthy
- print: **** about to restart osd.2
- ceph.restart:
  - daemons:
    - osd.2
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** osd.2 is healthy
- print: **** about to restart osd.3
- ceph.restart:
  - daemons:
    - osd.3
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** osd.3 is healthy
- print: **** about to restart mds.a
- ceph.restart:
  - daemons:
    - mds.a
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** mds.a is healthy
- print: **** about to restart mds.b
- ceph.restart:
  - daemons:
    - mds.b
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** mds.b is healthy
- print: **** about to restart mds.c
- ceph.restart:
  - daemons:
    - mds.c
  - wait-for-healthy: True
  - wait-for-osds-up: True
- print: **** mds.c is healthy
- ceph.healthy:
- print: **** we have a healthy system!
- exec:
  - mon.a:
    - ceph osd require-osd-release pacific --yes_i_really_mean_it
- ceph-fuse:
  - client.0:
- parallel:
  - workunit:
    - clients:
      - client.0:
        
        kernel_untar_build.sh
  - exec:
    - mon.a:
      - for ((i = 0; i < 15; i++)); do ceph --cluster ceph -s --format=json; sleep 60; done
  - exec:
    - client.0:
      - for ((i = 1; i <= 1260; i++)); do mkdir /home/ubuntu/cephtest/mnt.0/.snap/snap${i}; sleep 5; done
- exec:
  - client.0:
    - for ((i = 1; i <= 1260; i++)); do rmdir /home/ubuntu/cephtest/mnt.0/.snap/snap${i}; done
  - mon.a:
    - pgrep -a ceph
- sleep:
  - duration: 120
teuthology_branch: master
verbose: False
pcp_grafana_url:
priority:
user:
queue:
posted: 2021-10-19 12:02:58
started: 2021-10-19 12:05:03
updated: 2021-10-19 14:28:50
status_class: danger
runtime: 2:23:47
wait_time: 0:11:07