1eb0570c7SDamien Le Moal // SPDX-License-Identifier: GPL-2.0-only 2eb0570c7SDamien Le Moal /* 3eb0570c7SDamien Le Moal * Copyright (c) 2025, Christoph Hellwig. 4eb0570c7SDamien Le Moal * Copyright (c) 2025, Western Digital Corporation or its affiliates. 5eb0570c7SDamien Le Moal * 6eb0570c7SDamien Le Moal * Zoned Loop Device driver - exports a zoned block device using one file per 7eb0570c7SDamien Le Moal * zone as backing storage. 8eb0570c7SDamien Le Moal */ 9eb0570c7SDamien Le Moal #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt 10eb0570c7SDamien Le Moal 11eb0570c7SDamien Le Moal #include <linux/module.h> 12eb0570c7SDamien Le Moal #include <linux/blk-mq.h> 13eb0570c7SDamien Le Moal #include <linux/blkzoned.h> 14eb0570c7SDamien Le Moal #include <linux/pagemap.h> 15eb0570c7SDamien Le Moal #include <linux/miscdevice.h> 16eb0570c7SDamien Le Moal #include <linux/falloc.h> 17eb0570c7SDamien Le Moal #include <linux/mutex.h> 18eb0570c7SDamien Le Moal #include <linux/parser.h> 19eb0570c7SDamien Le Moal #include <linux/seq_file.h> 20*829def1eSChristoph Hellwig #include <linux/xattr.h> 21eb0570c7SDamien Le Moal 22eb0570c7SDamien Le Moal /* 23eb0570c7SDamien Le Moal * Options for adding (and removing) a device. 24eb0570c7SDamien Le Moal */ 25eb0570c7SDamien Le Moal enum { 26eb0570c7SDamien Le Moal ZLOOP_OPT_ERR = 0, 27eb0570c7SDamien Le Moal ZLOOP_OPT_ID = (1 << 0), 28eb0570c7SDamien Le Moal ZLOOP_OPT_CAPACITY = (1 << 1), 29eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_SIZE = (1 << 2), 30eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_CAPACITY = (1 << 3), 31eb0570c7SDamien Le Moal ZLOOP_OPT_NR_CONV_ZONES = (1 << 4), 32eb0570c7SDamien Le Moal ZLOOP_OPT_BASE_DIR = (1 << 5), 33eb0570c7SDamien Le Moal ZLOOP_OPT_NR_QUEUES = (1 << 6), 34eb0570c7SDamien Le Moal ZLOOP_OPT_QUEUE_DEPTH = (1 << 7), 35eb0570c7SDamien Le Moal ZLOOP_OPT_BUFFERED_IO = (1 << 8), 369236c5fdSDamien Le Moal ZLOOP_OPT_ZONE_APPEND = (1 << 9), 37fcc6eaa3SDamien Le Moal ZLOOP_OPT_ORDERED_ZONE_APPEND = (1 << 10), 38*829def1eSChristoph Hellwig ZLOOP_OPT_DISCARD_WRITE_CACHE = (1 << 11), 39eb0570c7SDamien Le Moal }; 40eb0570c7SDamien Le Moal 41eb0570c7SDamien Le Moal static const match_table_t zloop_opt_tokens = { 42eb0570c7SDamien Le Moal { ZLOOP_OPT_ID, "id=%d" }, 43eb0570c7SDamien Le Moal { ZLOOP_OPT_CAPACITY, "capacity_mb=%u" }, 44eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_SIZE, "zone_size_mb=%u" }, 45eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_CAPACITY, "zone_capacity_mb=%u" }, 46eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_CONV_ZONES, "conv_zones=%u" }, 47eb0570c7SDamien Le Moal { ZLOOP_OPT_BASE_DIR, "base_dir=%s" }, 48eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_QUEUES, "nr_queues=%u" }, 49eb0570c7SDamien Le Moal { ZLOOP_OPT_QUEUE_DEPTH, "queue_depth=%u" }, 50eb0570c7SDamien Le Moal { ZLOOP_OPT_BUFFERED_IO, "buffered_io" }, 519236c5fdSDamien Le Moal { ZLOOP_OPT_ZONE_APPEND, "zone_append=%u" }, 52fcc6eaa3SDamien Le Moal { ZLOOP_OPT_ORDERED_ZONE_APPEND, "ordered_zone_append" }, 53*829def1eSChristoph Hellwig { ZLOOP_OPT_DISCARD_WRITE_CACHE, "discard_write_cache" }, 54eb0570c7SDamien Le Moal { ZLOOP_OPT_ERR, NULL } 55eb0570c7SDamien Le Moal }; 56eb0570c7SDamien Le Moal 57eb0570c7SDamien Le Moal /* Default values for the "add" operation. */ 58eb0570c7SDamien Le Moal #define ZLOOP_DEF_ID -1 59eb0570c7SDamien Le Moal #define ZLOOP_DEF_ZONE_SIZE ((256ULL * SZ_1M) >> SECTOR_SHIFT) 60eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_ZONES 64 61eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_CONV_ZONES 8 62eb0570c7SDamien Le Moal #define ZLOOP_DEF_BASE_DIR "/var/local/zloop" 63eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_QUEUES 1 64eb0570c7SDamien Le Moal #define ZLOOP_DEF_QUEUE_DEPTH 128 65eb0570c7SDamien Le Moal #define ZLOOP_DEF_BUFFERED_IO false 669236c5fdSDamien Le Moal #define ZLOOP_DEF_ZONE_APPEND true 67fcc6eaa3SDamien Le Moal #define ZLOOP_DEF_ORDERED_ZONE_APPEND false 68eb0570c7SDamien Le Moal 69eb0570c7SDamien Le Moal /* Arbitrary limit on the zone size (16GB). */ 70eb0570c7SDamien Le Moal #define ZLOOP_MAX_ZONE_SIZE_MB 16384 71eb0570c7SDamien Le Moal 72eb0570c7SDamien Le Moal struct zloop_options { 73eb0570c7SDamien Le Moal unsigned int mask; 74eb0570c7SDamien Le Moal int id; 75eb0570c7SDamien Le Moal sector_t capacity; 76eb0570c7SDamien Le Moal sector_t zone_size; 77eb0570c7SDamien Le Moal sector_t zone_capacity; 78eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 79eb0570c7SDamien Le Moal char *base_dir; 80eb0570c7SDamien Le Moal unsigned int nr_queues; 81eb0570c7SDamien Le Moal unsigned int queue_depth; 82eb0570c7SDamien Le Moal bool buffered_io; 839236c5fdSDamien Le Moal bool zone_append; 84fcc6eaa3SDamien Le Moal bool ordered_zone_append; 85*829def1eSChristoph Hellwig bool discard_write_cache; 86eb0570c7SDamien Le Moal }; 87eb0570c7SDamien Le Moal 88eb0570c7SDamien Le Moal /* 89eb0570c7SDamien Le Moal * Device states. 90eb0570c7SDamien Le Moal */ 91eb0570c7SDamien Le Moal enum { 92eb0570c7SDamien Le Moal Zlo_creating = 0, 93eb0570c7SDamien Le Moal Zlo_live, 94eb0570c7SDamien Le Moal Zlo_deleting, 95eb0570c7SDamien Le Moal }; 96eb0570c7SDamien Le Moal 97eb0570c7SDamien Le Moal enum zloop_zone_flags { 98eb0570c7SDamien Le Moal ZLOOP_ZONE_CONV = 0, 99eb0570c7SDamien Le Moal ZLOOP_ZONE_SEQ_ERROR, 100eb0570c7SDamien Le Moal }; 101eb0570c7SDamien Le Moal 102eb0570c7SDamien Le Moal struct zloop_zone { 103eb0570c7SDamien Le Moal struct file *file; 104eb0570c7SDamien Le Moal 105eb0570c7SDamien Le Moal unsigned long flags; 106eb0570c7SDamien Le Moal struct mutex lock; 107fcc6eaa3SDamien Le Moal spinlock_t wp_lock; 108eb0570c7SDamien Le Moal enum blk_zone_cond cond; 109eb0570c7SDamien Le Moal sector_t start; 110eb0570c7SDamien Le Moal sector_t wp; 111eb0570c7SDamien Le Moal 112eb0570c7SDamien Le Moal gfp_t old_gfp_mask; 113eb0570c7SDamien Le Moal }; 114eb0570c7SDamien Le Moal 115eb0570c7SDamien Le Moal struct zloop_device { 116eb0570c7SDamien Le Moal unsigned int id; 117eb0570c7SDamien Le Moal unsigned int state; 118eb0570c7SDamien Le Moal 119eb0570c7SDamien Le Moal struct blk_mq_tag_set tag_set; 120eb0570c7SDamien Le Moal struct gendisk *disk; 121eb0570c7SDamien Le Moal 122eb0570c7SDamien Le Moal struct workqueue_struct *workqueue; 123eb0570c7SDamien Le Moal bool buffered_io; 1249236c5fdSDamien Le Moal bool zone_append; 125fcc6eaa3SDamien Le Moal bool ordered_zone_append; 126*829def1eSChristoph Hellwig bool discard_write_cache; 127eb0570c7SDamien Le Moal 128eb0570c7SDamien Le Moal const char *base_dir; 129eb0570c7SDamien Le Moal struct file *data_dir; 130eb0570c7SDamien Le Moal 131eb0570c7SDamien Le Moal unsigned int zone_shift; 132eb0570c7SDamien Le Moal sector_t zone_size; 133eb0570c7SDamien Le Moal sector_t zone_capacity; 134eb0570c7SDamien Le Moal unsigned int nr_zones; 135eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 136eb0570c7SDamien Le Moal unsigned int block_size; 137eb0570c7SDamien Le Moal 138eb0570c7SDamien Le Moal struct zloop_zone zones[] __counted_by(nr_zones); 139eb0570c7SDamien Le Moal }; 140eb0570c7SDamien Le Moal 141eb0570c7SDamien Le Moal struct zloop_cmd { 142eb0570c7SDamien Le Moal struct work_struct work; 143eb0570c7SDamien Le Moal atomic_t ref; 144eb0570c7SDamien Le Moal sector_t sector; 145eb0570c7SDamien Le Moal sector_t nr_sectors; 146eb0570c7SDamien Le Moal long ret; 147eb0570c7SDamien Le Moal struct kiocb iocb; 148eb0570c7SDamien Le Moal struct bio_vec *bvec; 149eb0570c7SDamien Le Moal }; 150eb0570c7SDamien Le Moal 151eb0570c7SDamien Le Moal static DEFINE_IDR(zloop_index_idr); 152eb0570c7SDamien Le Moal static DEFINE_MUTEX(zloop_ctl_mutex); 153eb0570c7SDamien Le Moal 154eb0570c7SDamien Le Moal static unsigned int rq_zone_no(struct request *rq) 155eb0570c7SDamien Le Moal { 156eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 157eb0570c7SDamien Le Moal 158eb0570c7SDamien Le Moal return blk_rq_pos(rq) >> zlo->zone_shift; 159eb0570c7SDamien Le Moal } 160eb0570c7SDamien Le Moal 161eb0570c7SDamien Le Moal static int zloop_update_seq_zone(struct zloop_device *zlo, unsigned int zone_no) 162eb0570c7SDamien Le Moal { 163eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 164eb0570c7SDamien Le Moal struct kstat stat; 165eb0570c7SDamien Le Moal sector_t file_sectors; 166fcc6eaa3SDamien Le Moal unsigned long flags; 167eb0570c7SDamien Le Moal int ret; 168eb0570c7SDamien Le Moal 169eb0570c7SDamien Le Moal lockdep_assert_held(&zone->lock); 170eb0570c7SDamien Le Moal 171eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 172eb0570c7SDamien Le Moal if (ret < 0) { 173eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat (err=%d)\n", 174eb0570c7SDamien Le Moal zone_no, ret); 175eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 176eb0570c7SDamien Le Moal return ret; 177eb0570c7SDamien Le Moal } 178eb0570c7SDamien Le Moal 179eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 180eb0570c7SDamien Le Moal if (file_sectors > zlo->zone_capacity) { 181eb0570c7SDamien Le Moal pr_err("Zone %u file too large (%llu sectors > %llu)\n", 182eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 183eb0570c7SDamien Le Moal return -EINVAL; 184eb0570c7SDamien Le Moal } 185eb0570c7SDamien Le Moal 186eb0570c7SDamien Le Moal if (file_sectors & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 187eb0570c7SDamien Le Moal pr_err("Zone %u file size not aligned to block size %u\n", 188eb0570c7SDamien Le Moal zone_no, zlo->block_size); 189eb0570c7SDamien Le Moal return -EINVAL; 190eb0570c7SDamien Le Moal } 191eb0570c7SDamien Le Moal 192fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 193eb0570c7SDamien Le Moal if (!file_sectors) { 194eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 195eb0570c7SDamien Le Moal zone->wp = zone->start; 196eb0570c7SDamien Le Moal } else if (file_sectors == zlo->zone_capacity) { 197eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 198866d6574SDamien Le Moal zone->wp = ULLONG_MAX; 199eb0570c7SDamien Le Moal } else { 200eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 201eb0570c7SDamien Le Moal zone->wp = zone->start + file_sectors; 202eb0570c7SDamien Le Moal } 203fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 204eb0570c7SDamien Le Moal 205eb0570c7SDamien Le Moal return 0; 206eb0570c7SDamien Le Moal } 207eb0570c7SDamien Le Moal 208eb0570c7SDamien Le Moal static int zloop_open_zone(struct zloop_device *zlo, unsigned int zone_no) 209eb0570c7SDamien Le Moal { 210eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 211eb0570c7SDamien Le Moal int ret = 0; 212eb0570c7SDamien Le Moal 213eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 214eb0570c7SDamien Le Moal return -EIO; 215eb0570c7SDamien Le Moal 216eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 217eb0570c7SDamien Le Moal 218eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 219eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 220eb0570c7SDamien Le Moal if (ret) 221eb0570c7SDamien Le Moal goto unlock; 222eb0570c7SDamien Le Moal } 223eb0570c7SDamien Le Moal 224eb0570c7SDamien Le Moal switch (zone->cond) { 225eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 226eb0570c7SDamien Le Moal break; 227eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 228eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 229eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 230eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EXP_OPEN; 231eb0570c7SDamien Le Moal break; 232eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 233eb0570c7SDamien Le Moal default: 234eb0570c7SDamien Le Moal ret = -EIO; 235eb0570c7SDamien Le Moal break; 236eb0570c7SDamien Le Moal } 237eb0570c7SDamien Le Moal 238eb0570c7SDamien Le Moal unlock: 239eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 240eb0570c7SDamien Le Moal 241eb0570c7SDamien Le Moal return ret; 242eb0570c7SDamien Le Moal } 243eb0570c7SDamien Le Moal 244eb0570c7SDamien Le Moal static int zloop_close_zone(struct zloop_device *zlo, unsigned int zone_no) 245eb0570c7SDamien Le Moal { 246eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 247fcc6eaa3SDamien Le Moal unsigned long flags; 248eb0570c7SDamien Le Moal int ret = 0; 249eb0570c7SDamien Le Moal 250eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 251eb0570c7SDamien Le Moal return -EIO; 252eb0570c7SDamien Le Moal 253eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 254eb0570c7SDamien Le Moal 255eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 256eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 257eb0570c7SDamien Le Moal if (ret) 258eb0570c7SDamien Le Moal goto unlock; 259eb0570c7SDamien Le Moal } 260eb0570c7SDamien Le Moal 261eb0570c7SDamien Le Moal switch (zone->cond) { 262eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 263eb0570c7SDamien Le Moal break; 264eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 265eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 266fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 267eb0570c7SDamien Le Moal if (zone->wp == zone->start) 268eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 269eb0570c7SDamien Le Moal else 270eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 271fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 272eb0570c7SDamien Le Moal break; 273eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 274eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 275eb0570c7SDamien Le Moal default: 276eb0570c7SDamien Le Moal ret = -EIO; 277eb0570c7SDamien Le Moal break; 278eb0570c7SDamien Le Moal } 279eb0570c7SDamien Le Moal 280eb0570c7SDamien Le Moal unlock: 281eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 282eb0570c7SDamien Le Moal 283eb0570c7SDamien Le Moal return ret; 284eb0570c7SDamien Le Moal } 285eb0570c7SDamien Le Moal 286eb0570c7SDamien Le Moal static int zloop_reset_zone(struct zloop_device *zlo, unsigned int zone_no) 287eb0570c7SDamien Le Moal { 288eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 289fcc6eaa3SDamien Le Moal unsigned long flags; 290eb0570c7SDamien Le Moal int ret = 0; 291eb0570c7SDamien Le Moal 292eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 293eb0570c7SDamien Le Moal return -EIO; 294eb0570c7SDamien Le Moal 295eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 296eb0570c7SDamien Le Moal 297eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 298eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_EMPTY) 299eb0570c7SDamien Le Moal goto unlock; 300eb0570c7SDamien Le Moal 301eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, 0)) { 302eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 303eb0570c7SDamien Le Moal ret = -EIO; 304eb0570c7SDamien Le Moal goto unlock; 305eb0570c7SDamien Le Moal } 306eb0570c7SDamien Le Moal 307fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 308eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 309eb0570c7SDamien Le Moal zone->wp = zone->start; 310eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 311fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 312eb0570c7SDamien Le Moal 313eb0570c7SDamien Le Moal unlock: 314eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 315eb0570c7SDamien Le Moal 316eb0570c7SDamien Le Moal return ret; 317eb0570c7SDamien Le Moal } 318eb0570c7SDamien Le Moal 319eb0570c7SDamien Le Moal static int zloop_reset_all_zones(struct zloop_device *zlo) 320eb0570c7SDamien Le Moal { 321eb0570c7SDamien Le Moal unsigned int i; 322eb0570c7SDamien Le Moal int ret; 323eb0570c7SDamien Le Moal 324eb0570c7SDamien Le Moal for (i = zlo->nr_conv_zones; i < zlo->nr_zones; i++) { 325eb0570c7SDamien Le Moal ret = zloop_reset_zone(zlo, i); 326eb0570c7SDamien Le Moal if (ret) 327eb0570c7SDamien Le Moal return ret; 328eb0570c7SDamien Le Moal } 329eb0570c7SDamien Le Moal 330eb0570c7SDamien Le Moal return 0; 331eb0570c7SDamien Le Moal } 332eb0570c7SDamien Le Moal 333eb0570c7SDamien Le Moal static int zloop_finish_zone(struct zloop_device *zlo, unsigned int zone_no) 334eb0570c7SDamien Le Moal { 335eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 336fcc6eaa3SDamien Le Moal unsigned long flags; 337eb0570c7SDamien Le Moal int ret = 0; 338eb0570c7SDamien Le Moal 339eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 340eb0570c7SDamien Le Moal return -EIO; 341eb0570c7SDamien Le Moal 342eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 343eb0570c7SDamien Le Moal 344eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 345eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_FULL) 346eb0570c7SDamien Le Moal goto unlock; 347eb0570c7SDamien Le Moal 348eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, zlo->zone_size << SECTOR_SHIFT)) { 349eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 350eb0570c7SDamien Le Moal ret = -EIO; 351eb0570c7SDamien Le Moal goto unlock; 352eb0570c7SDamien Le Moal } 353eb0570c7SDamien Le Moal 354fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 355eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 356866d6574SDamien Le Moal zone->wp = ULLONG_MAX; 357eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 358fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 359eb0570c7SDamien Le Moal 360eb0570c7SDamien Le Moal unlock: 361eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 362eb0570c7SDamien Le Moal 363eb0570c7SDamien Le Moal return ret; 364eb0570c7SDamien Le Moal } 365eb0570c7SDamien Le Moal 366eb0570c7SDamien Le Moal static void zloop_put_cmd(struct zloop_cmd *cmd) 367eb0570c7SDamien Le Moal { 368eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 369eb0570c7SDamien Le Moal 370eb0570c7SDamien Le Moal if (!atomic_dec_and_test(&cmd->ref)) 371eb0570c7SDamien Le Moal return; 372eb0570c7SDamien Le Moal kfree(cmd->bvec); 373eb0570c7SDamien Le Moal cmd->bvec = NULL; 374eb0570c7SDamien Le Moal if (likely(!blk_should_fake_timeout(rq->q))) 375eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 376eb0570c7SDamien Le Moal } 377eb0570c7SDamien Le Moal 378eb0570c7SDamien Le Moal static void zloop_rw_complete(struct kiocb *iocb, long ret) 379eb0570c7SDamien Le Moal { 380eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(iocb, struct zloop_cmd, iocb); 381eb0570c7SDamien Le Moal 382eb0570c7SDamien Le Moal cmd->ret = ret; 383eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 384eb0570c7SDamien Le Moal } 385eb0570c7SDamien Le Moal 386eff8d165SChristoph Hellwig static int zloop_do_rw(struct zloop_cmd *cmd) 387eb0570c7SDamien Le Moal { 388eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 389eff8d165SChristoph Hellwig int rw = req_op(rq) == REQ_OP_READ ? ITER_DEST : ITER_SOURCE; 390eff8d165SChristoph Hellwig unsigned int nr_bvec = blk_rq_nr_bvec(rq); 391eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 392eff8d165SChristoph Hellwig struct zloop_zone *zone = &zlo->zones[rq_zone_no(rq)]; 393eb0570c7SDamien Le Moal struct req_iterator rq_iter; 394eb0570c7SDamien Le Moal struct iov_iter iter; 395eb0570c7SDamien Le Moal 396eb0570c7SDamien Le Moal if (rq->bio != rq->biotail) { 397eff8d165SChristoph Hellwig struct bio_vec tmp, *bvec; 398eb0570c7SDamien Le Moal 39969050f8dSKees Cook cmd->bvec = kmalloc_objs(*cmd->bvec, nr_bvec, GFP_NOIO); 400eff8d165SChristoph Hellwig if (!cmd->bvec) 401eff8d165SChristoph Hellwig return -EIO; 402eb0570c7SDamien Le Moal 403eb0570c7SDamien Le Moal /* 404eb0570c7SDamien Le Moal * The bios of the request may be started from the middle of 405eb0570c7SDamien Le Moal * the 'bvec' because of bio splitting, so we can't directly 406eb0570c7SDamien Le Moal * copy bio->bi_iov_vec to new bvec. The rq_for_each_bvec 407eb0570c7SDamien Le Moal * API will take care of all details for us. 408eb0570c7SDamien Le Moal */ 409eb0570c7SDamien Le Moal bvec = cmd->bvec; 410eb0570c7SDamien Le Moal rq_for_each_bvec(tmp, rq, rq_iter) { 411eb0570c7SDamien Le Moal *bvec = tmp; 412eb0570c7SDamien Le Moal bvec++; 413eb0570c7SDamien Le Moal } 414eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, cmd->bvec, nr_bvec, blk_rq_bytes(rq)); 415eb0570c7SDamien Le Moal } else { 416eb0570c7SDamien Le Moal /* 417eb0570c7SDamien Le Moal * Same here, this bio may be started from the middle of the 418eb0570c7SDamien Le Moal * 'bvec' because of bio splitting, so offset from the bvec 419eb0570c7SDamien Le Moal * must be passed to iov iterator 420eb0570c7SDamien Le Moal */ 421eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, 422eb0570c7SDamien Le Moal __bvec_iter_bvec(rq->bio->bi_io_vec, rq->bio->bi_iter), 423eb0570c7SDamien Le Moal nr_bvec, blk_rq_bytes(rq)); 424eb0570c7SDamien Le Moal iter.iov_offset = rq->bio->bi_iter.bi_bvec_done; 425eb0570c7SDamien Le Moal } 426eb0570c7SDamien Le Moal 427eff8d165SChristoph Hellwig cmd->iocb.ki_pos = (cmd->sector - zone->start) << SECTOR_SHIFT; 428eb0570c7SDamien Le Moal cmd->iocb.ki_filp = zone->file; 429eb0570c7SDamien Le Moal cmd->iocb.ki_complete = zloop_rw_complete; 430eb0570c7SDamien Le Moal if (!zlo->buffered_io) 431eb0570c7SDamien Le Moal cmd->iocb.ki_flags = IOCB_DIRECT; 432eb0570c7SDamien Le Moal cmd->iocb.ki_ioprio = IOPRIO_PRIO_VALUE(IOPRIO_CLASS_NONE, 0); 433eb0570c7SDamien Le Moal 434eb0570c7SDamien Le Moal if (rw == ITER_SOURCE) 435eff8d165SChristoph Hellwig return zone->file->f_op->write_iter(&cmd->iocb, &iter); 436eff8d165SChristoph Hellwig return zone->file->f_op->read_iter(&cmd->iocb, &iter); 437eff8d165SChristoph Hellwig } 438eff8d165SChristoph Hellwig 439eff8d165SChristoph Hellwig static int zloop_seq_write_prep(struct zloop_cmd *cmd) 440eff8d165SChristoph Hellwig { 441eff8d165SChristoph Hellwig struct request *rq = blk_mq_rq_from_pdu(cmd); 442eff8d165SChristoph Hellwig struct zloop_device *zlo = rq->q->queuedata; 443eff8d165SChristoph Hellwig unsigned int zone_no = rq_zone_no(rq); 444eff8d165SChristoph Hellwig sector_t nr_sectors = blk_rq_sectors(rq); 445eff8d165SChristoph Hellwig bool is_append = req_op(rq) == REQ_OP_ZONE_APPEND; 446eff8d165SChristoph Hellwig struct zloop_zone *zone = &zlo->zones[zone_no]; 447eff8d165SChristoph Hellwig sector_t zone_end = zone->start + zlo->zone_capacity; 448eff8d165SChristoph Hellwig unsigned long flags; 449eff8d165SChristoph Hellwig int ret = 0; 450eff8d165SChristoph Hellwig 451eff8d165SChristoph Hellwig spin_lock_irqsave(&zone->wp_lock, flags); 452eff8d165SChristoph Hellwig 453eff8d165SChristoph Hellwig /* 454eff8d165SChristoph Hellwig * Zone append operations always go at the current write pointer, but 455eff8d165SChristoph Hellwig * regular write operations must already be aligned to the write pointer 456eff8d165SChristoph Hellwig * when submitted. 457eff8d165SChristoph Hellwig */ 458eff8d165SChristoph Hellwig if (is_append) { 459eff8d165SChristoph Hellwig /* 460eff8d165SChristoph Hellwig * If ordered zone append is in use, we already checked and set 461eff8d165SChristoph Hellwig * the target sector in zloop_queue_rq(). 462eff8d165SChristoph Hellwig */ 463eff8d165SChristoph Hellwig if (!zlo->ordered_zone_append) { 464eff8d165SChristoph Hellwig if (zone->cond == BLK_ZONE_COND_FULL || 465eff8d165SChristoph Hellwig zone->wp + nr_sectors > zone_end) { 466eff8d165SChristoph Hellwig ret = -EIO; 467eff8d165SChristoph Hellwig goto out_unlock; 468eff8d165SChristoph Hellwig } 469eff8d165SChristoph Hellwig cmd->sector = zone->wp; 470eff8d165SChristoph Hellwig } 471eff8d165SChristoph Hellwig } else { 472eff8d165SChristoph Hellwig if (cmd->sector != zone->wp) { 473eff8d165SChristoph Hellwig pr_err("Zone %u: unaligned write: sect %llu, wp %llu\n", 474eff8d165SChristoph Hellwig zone_no, cmd->sector, zone->wp); 475eff8d165SChristoph Hellwig ret = -EIO; 476eff8d165SChristoph Hellwig goto out_unlock; 477eff8d165SChristoph Hellwig } 478eff8d165SChristoph Hellwig } 479eff8d165SChristoph Hellwig 480eff8d165SChristoph Hellwig /* Implicitly open the target zone. */ 481eff8d165SChristoph Hellwig if (zone->cond == BLK_ZONE_COND_CLOSED || 482eff8d165SChristoph Hellwig zone->cond == BLK_ZONE_COND_EMPTY) 483eff8d165SChristoph Hellwig zone->cond = BLK_ZONE_COND_IMP_OPEN; 484eff8d165SChristoph Hellwig 485eff8d165SChristoph Hellwig /* 486eff8d165SChristoph Hellwig * Advance the write pointer, unless ordered zone append is in use. If 487eff8d165SChristoph Hellwig * the write fails, the write pointer position will be corrected when 488eff8d165SChristoph Hellwig * the next I/O starts execution. 489eff8d165SChristoph Hellwig */ 490eff8d165SChristoph Hellwig if (!is_append || !zlo->ordered_zone_append) { 491eff8d165SChristoph Hellwig zone->wp += nr_sectors; 492eff8d165SChristoph Hellwig if (zone->wp == zone_end) { 493eff8d165SChristoph Hellwig zone->cond = BLK_ZONE_COND_FULL; 494eff8d165SChristoph Hellwig zone->wp = ULLONG_MAX; 495eff8d165SChristoph Hellwig } 496eff8d165SChristoph Hellwig } 497eff8d165SChristoph Hellwig out_unlock: 498eff8d165SChristoph Hellwig spin_unlock_irqrestore(&zone->wp_lock, flags); 499eff8d165SChristoph Hellwig return ret; 500eff8d165SChristoph Hellwig } 501eff8d165SChristoph Hellwig 502eff8d165SChristoph Hellwig static void zloop_rw(struct zloop_cmd *cmd) 503eff8d165SChristoph Hellwig { 504eff8d165SChristoph Hellwig struct request *rq = blk_mq_rq_from_pdu(cmd); 505eff8d165SChristoph Hellwig struct zloop_device *zlo = rq->q->queuedata; 506eff8d165SChristoph Hellwig unsigned int zone_no = rq_zone_no(rq); 507eff8d165SChristoph Hellwig sector_t nr_sectors = blk_rq_sectors(rq); 508eff8d165SChristoph Hellwig bool is_append = req_op(rq) == REQ_OP_ZONE_APPEND; 509eff8d165SChristoph Hellwig bool is_write = req_op(rq) == REQ_OP_WRITE || is_append; 510eff8d165SChristoph Hellwig struct zloop_zone *zone; 511eff8d165SChristoph Hellwig int ret = -EIO; 512eff8d165SChristoph Hellwig 513eff8d165SChristoph Hellwig atomic_set(&cmd->ref, 2); 514eff8d165SChristoph Hellwig cmd->sector = blk_rq_pos(rq); 515eff8d165SChristoph Hellwig cmd->nr_sectors = nr_sectors; 516eff8d165SChristoph Hellwig cmd->ret = 0; 517eff8d165SChristoph Hellwig 518eff8d165SChristoph Hellwig if (WARN_ON_ONCE(is_append && !zlo->zone_append)) 519eff8d165SChristoph Hellwig goto out; 520eff8d165SChristoph Hellwig 521eff8d165SChristoph Hellwig /* We should never get an I/O beyond the device capacity. */ 522eff8d165SChristoph Hellwig if (WARN_ON_ONCE(zone_no >= zlo->nr_zones)) 523eff8d165SChristoph Hellwig goto out; 524eff8d165SChristoph Hellwig 525eff8d165SChristoph Hellwig zone = &zlo->zones[zone_no]; 526eff8d165SChristoph Hellwig 527eff8d165SChristoph Hellwig /* 528eff8d165SChristoph Hellwig * The block layer should never send requests that are not fully 529eff8d165SChristoph Hellwig * contained within the zone. 530eff8d165SChristoph Hellwig */ 531eff8d165SChristoph Hellwig if (WARN_ON_ONCE(cmd->sector + nr_sectors > 532eff8d165SChristoph Hellwig zone->start + zlo->zone_size)) 533eff8d165SChristoph Hellwig goto out; 534eff8d165SChristoph Hellwig 535eff8d165SChristoph Hellwig if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 536eff8d165SChristoph Hellwig mutex_lock(&zone->lock); 537eff8d165SChristoph Hellwig ret = zloop_update_seq_zone(zlo, zone_no); 538eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 539eff8d165SChristoph Hellwig if (ret) 540eff8d165SChristoph Hellwig goto out; 541eff8d165SChristoph Hellwig } 542eff8d165SChristoph Hellwig 543eff8d165SChristoph Hellwig if (!test_bit(ZLOOP_ZONE_CONV, &zone->flags) && is_write) { 544eff8d165SChristoph Hellwig mutex_lock(&zone->lock); 545eff8d165SChristoph Hellwig ret = zloop_seq_write_prep(cmd); 546eff8d165SChristoph Hellwig if (!ret) 547eff8d165SChristoph Hellwig ret = zloop_do_rw(cmd); 548eff8d165SChristoph Hellwig mutex_unlock(&zone->lock); 549eff8d165SChristoph Hellwig } else { 550eff8d165SChristoph Hellwig ret = zloop_do_rw(cmd); 551eff8d165SChristoph Hellwig } 552eb0570c7SDamien Le Moal out: 553eb0570c7SDamien Le Moal if (ret != -EIOCBQUEUED) 554eb0570c7SDamien Le Moal zloop_rw_complete(&cmd->iocb, ret); 555eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 556eb0570c7SDamien Le Moal } 557eb0570c7SDamien Le Moal 558*829def1eSChristoph Hellwig static inline bool zloop_zone_is_active(struct zloop_zone *zone) 559*829def1eSChristoph Hellwig { 560*829def1eSChristoph Hellwig switch (zone->cond) { 561*829def1eSChristoph Hellwig case BLK_ZONE_COND_EXP_OPEN: 562*829def1eSChristoph Hellwig case BLK_ZONE_COND_IMP_OPEN: 563*829def1eSChristoph Hellwig case BLK_ZONE_COND_CLOSED: 564*829def1eSChristoph Hellwig return true; 565*829def1eSChristoph Hellwig default: 566*829def1eSChristoph Hellwig return false; 567*829def1eSChristoph Hellwig } 568*829def1eSChristoph Hellwig } 569*829def1eSChristoph Hellwig 570*829def1eSChristoph Hellwig static int zloop_record_safe_wps(struct zloop_device *zlo) 571*829def1eSChristoph Hellwig { 572*829def1eSChristoph Hellwig unsigned int i; 573*829def1eSChristoph Hellwig int ret; 574*829def1eSChristoph Hellwig 575*829def1eSChristoph Hellwig for (i = 0; i < zlo->nr_zones; i++) { 576*829def1eSChristoph Hellwig struct zloop_zone *zone = &zlo->zones[i]; 577*829def1eSChristoph Hellwig struct file *file = zone->file; 578*829def1eSChristoph Hellwig 579*829def1eSChristoph Hellwig if (!zloop_zone_is_active(zone)) 580*829def1eSChristoph Hellwig continue; 581*829def1eSChristoph Hellwig ret = vfs_setxattr(file_mnt_idmap(file), file_dentry(file), 582*829def1eSChristoph Hellwig "user.zloop.wp", &zone->wp, sizeof(zone->wp), 0); 583*829def1eSChristoph Hellwig if (ret) { 584*829def1eSChristoph Hellwig pr_err("%pg: failed to record write pointer (%d)\n", 585*829def1eSChristoph Hellwig zlo->disk->part0, ret); 586*829def1eSChristoph Hellwig return ret; 587*829def1eSChristoph Hellwig } 588*829def1eSChristoph Hellwig } 589*829def1eSChristoph Hellwig 590*829def1eSChristoph Hellwig return 0; 591*829def1eSChristoph Hellwig } 592*829def1eSChristoph Hellwig 5936acf7860SChristoph Hellwig /* 5946acf7860SChristoph Hellwig * Sync the entire FS containing the zone files instead of walking all files. 5956acf7860SChristoph Hellwig */ 5966acf7860SChristoph Hellwig static int zloop_flush(struct zloop_device *zlo) 5976acf7860SChristoph Hellwig { 5986acf7860SChristoph Hellwig struct super_block *sb = file_inode(zlo->data_dir)->i_sb; 5996acf7860SChristoph Hellwig int ret; 6006acf7860SChristoph Hellwig 601*829def1eSChristoph Hellwig if (zlo->discard_write_cache) { 602*829def1eSChristoph Hellwig ret = zloop_record_safe_wps(zlo); 603*829def1eSChristoph Hellwig if (ret) 604*829def1eSChristoph Hellwig return ret; 605*829def1eSChristoph Hellwig } 606*829def1eSChristoph Hellwig 6076acf7860SChristoph Hellwig down_read(&sb->s_umount); 6086acf7860SChristoph Hellwig ret = sync_filesystem(sb); 6096acf7860SChristoph Hellwig up_read(&sb->s_umount); 6106acf7860SChristoph Hellwig 6116acf7860SChristoph Hellwig return ret; 6126acf7860SChristoph Hellwig } 6136acf7860SChristoph Hellwig 614eb0570c7SDamien Le Moal static void zloop_handle_cmd(struct zloop_cmd *cmd) 615eb0570c7SDamien Le Moal { 616eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 617eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 618eb0570c7SDamien Le Moal 619e8f0abddSChaitanya Kulkarni /* We can block in this context, so ignore REQ_NOWAIT. */ 620e8f0abddSChaitanya Kulkarni if (rq->cmd_flags & REQ_NOWAIT) 621e8f0abddSChaitanya Kulkarni rq->cmd_flags &= ~REQ_NOWAIT; 622e8f0abddSChaitanya Kulkarni 623eb0570c7SDamien Le Moal switch (req_op(rq)) { 624eb0570c7SDamien Le Moal case REQ_OP_READ: 625eb0570c7SDamien Le Moal case REQ_OP_WRITE: 626eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 627eb0570c7SDamien Le Moal /* 628eb0570c7SDamien Le Moal * zloop_rw() always executes asynchronously or completes 629eb0570c7SDamien Le Moal * directly. 630eb0570c7SDamien Le Moal */ 631eb0570c7SDamien Le Moal zloop_rw(cmd); 632eb0570c7SDamien Le Moal return; 633eb0570c7SDamien Le Moal case REQ_OP_FLUSH: 6346acf7860SChristoph Hellwig cmd->ret = zloop_flush(zlo); 635eb0570c7SDamien Le Moal break; 636eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET: 637eb0570c7SDamien Le Moal cmd->ret = zloop_reset_zone(zlo, rq_zone_no(rq)); 638eb0570c7SDamien Le Moal break; 639eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET_ALL: 640eb0570c7SDamien Le Moal cmd->ret = zloop_reset_all_zones(zlo); 641eb0570c7SDamien Le Moal break; 642eb0570c7SDamien Le Moal case REQ_OP_ZONE_FINISH: 643eb0570c7SDamien Le Moal cmd->ret = zloop_finish_zone(zlo, rq_zone_no(rq)); 644eb0570c7SDamien Le Moal break; 645eb0570c7SDamien Le Moal case REQ_OP_ZONE_OPEN: 646eb0570c7SDamien Le Moal cmd->ret = zloop_open_zone(zlo, rq_zone_no(rq)); 647eb0570c7SDamien Le Moal break; 648eb0570c7SDamien Le Moal case REQ_OP_ZONE_CLOSE: 649eb0570c7SDamien Le Moal cmd->ret = zloop_close_zone(zlo, rq_zone_no(rq)); 650eb0570c7SDamien Le Moal break; 651eb0570c7SDamien Le Moal default: 652eb0570c7SDamien Le Moal WARN_ON_ONCE(1); 653eb0570c7SDamien Le Moal pr_err("Unsupported operation %d\n", req_op(rq)); 654eb0570c7SDamien Le Moal cmd->ret = -EOPNOTSUPP; 655eb0570c7SDamien Le Moal break; 656eb0570c7SDamien Le Moal } 657eb0570c7SDamien Le Moal 658eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 659eb0570c7SDamien Le Moal } 660eb0570c7SDamien Le Moal 661eb0570c7SDamien Le Moal static void zloop_cmd_workfn(struct work_struct *work) 662eb0570c7SDamien Le Moal { 663eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(work, struct zloop_cmd, work); 664eb0570c7SDamien Le Moal int orig_flags = current->flags; 665eb0570c7SDamien Le Moal 666eb0570c7SDamien Le Moal current->flags |= PF_LOCAL_THROTTLE | PF_MEMALLOC_NOIO; 667eb0570c7SDamien Le Moal zloop_handle_cmd(cmd); 668eb0570c7SDamien Le Moal current->flags = orig_flags; 669eb0570c7SDamien Le Moal } 670eb0570c7SDamien Le Moal 671eb0570c7SDamien Le Moal static void zloop_complete_rq(struct request *rq) 672eb0570c7SDamien Le Moal { 673eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 674eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 675eb0570c7SDamien Le Moal unsigned int zone_no = cmd->sector >> zlo->zone_shift; 676eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 677eb0570c7SDamien Le Moal blk_status_t sts = BLK_STS_OK; 678eb0570c7SDamien Le Moal 679eb0570c7SDamien Le Moal switch (req_op(rq)) { 680eb0570c7SDamien Le Moal case REQ_OP_READ: 681eb0570c7SDamien Le Moal if (cmd->ret < 0) 682eb0570c7SDamien Le Moal pr_err("Zone %u: failed read sector %llu, %llu sectors\n", 683eb0570c7SDamien Le Moal zone_no, cmd->sector, cmd->nr_sectors); 684eb0570c7SDamien Le Moal 685eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 686eb0570c7SDamien Le Moal /* short read */ 687eb0570c7SDamien Le Moal struct bio *bio; 688eb0570c7SDamien Le Moal 689eb0570c7SDamien Le Moal __rq_for_each_bio(bio, rq) 690eb0570c7SDamien Le Moal zero_fill_bio(bio); 691eb0570c7SDamien Le Moal } 692eb0570c7SDamien Le Moal break; 693eb0570c7SDamien Le Moal case REQ_OP_WRITE: 694eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 695eb0570c7SDamien Le Moal if (cmd->ret < 0) 696eb0570c7SDamien Le Moal pr_err("Zone %u: failed %swrite sector %llu, %llu sectors\n", 697eb0570c7SDamien Le Moal zone_no, 698eb0570c7SDamien Le Moal req_op(rq) == REQ_OP_WRITE ? "" : "append ", 699eb0570c7SDamien Le Moal cmd->sector, cmd->nr_sectors); 700eb0570c7SDamien Le Moal 701eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 702eb0570c7SDamien Le Moal pr_err("Zone %u: partial write %ld/%u B\n", 703eb0570c7SDamien Le Moal zone_no, cmd->ret, blk_rq_bytes(rq)); 704eb0570c7SDamien Le Moal cmd->ret = -EIO; 705eb0570c7SDamien Le Moal } 706eb0570c7SDamien Le Moal 707eb0570c7SDamien Le Moal if (cmd->ret < 0 && !test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 708eb0570c7SDamien Le Moal /* 709eb0570c7SDamien Le Moal * A write to a sequential zone file failed: mark the 710eb0570c7SDamien Le Moal * zone as having an error. This will be corrected and 711eb0570c7SDamien Le Moal * cleared when the next IO is submitted. 712eb0570c7SDamien Le Moal */ 713eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 714eb0570c7SDamien Le Moal break; 715eb0570c7SDamien Le Moal } 716eb0570c7SDamien Le Moal if (req_op(rq) == REQ_OP_ZONE_APPEND) 717eb0570c7SDamien Le Moal rq->__sector = cmd->sector; 718eb0570c7SDamien Le Moal 719eb0570c7SDamien Le Moal break; 720eb0570c7SDamien Le Moal default: 721eb0570c7SDamien Le Moal break; 722eb0570c7SDamien Le Moal } 723eb0570c7SDamien Le Moal 724eb0570c7SDamien Le Moal if (cmd->ret < 0) 725eb0570c7SDamien Le Moal sts = errno_to_blk_status(cmd->ret); 726eb0570c7SDamien Le Moal blk_mq_end_request(rq, sts); 727eb0570c7SDamien Le Moal } 728eb0570c7SDamien Le Moal 729fcc6eaa3SDamien Le Moal static bool zloop_set_zone_append_sector(struct request *rq) 730fcc6eaa3SDamien Le Moal { 731fcc6eaa3SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 732fcc6eaa3SDamien Le Moal unsigned int zone_no = rq_zone_no(rq); 733fcc6eaa3SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 734fcc6eaa3SDamien Le Moal sector_t zone_end = zone->start + zlo->zone_capacity; 735fcc6eaa3SDamien Le Moal sector_t nr_sectors = blk_rq_sectors(rq); 736fcc6eaa3SDamien Le Moal unsigned long flags; 737fcc6eaa3SDamien Le Moal 738fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 739fcc6eaa3SDamien Le Moal 740fcc6eaa3SDamien Le Moal if (zone->cond == BLK_ZONE_COND_FULL || 741fcc6eaa3SDamien Le Moal zone->wp + nr_sectors > zone_end) { 742fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 743fcc6eaa3SDamien Le Moal return false; 744fcc6eaa3SDamien Le Moal } 745fcc6eaa3SDamien Le Moal 746fcc6eaa3SDamien Le Moal rq->__sector = zone->wp; 747fcc6eaa3SDamien Le Moal zone->wp += blk_rq_sectors(rq); 748fcc6eaa3SDamien Le Moal if (zone->wp >= zone_end) { 749fcc6eaa3SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 750fcc6eaa3SDamien Le Moal zone->wp = ULLONG_MAX; 751fcc6eaa3SDamien Le Moal } 752fcc6eaa3SDamien Le Moal 753fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 754fcc6eaa3SDamien Le Moal 755fcc6eaa3SDamien Le Moal return true; 756fcc6eaa3SDamien Le Moal } 757fcc6eaa3SDamien Le Moal 758eb0570c7SDamien Le Moal static blk_status_t zloop_queue_rq(struct blk_mq_hw_ctx *hctx, 759eb0570c7SDamien Le Moal const struct blk_mq_queue_data *bd) 760eb0570c7SDamien Le Moal { 761eb0570c7SDamien Le Moal struct request *rq = bd->rq; 762eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 763eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 764eb0570c7SDamien Le Moal 7654b2b0315SYongpeng Yang if (data_race(READ_ONCE(zlo->state)) == Zlo_deleting) 766eb0570c7SDamien Le Moal return BLK_STS_IOERR; 767eb0570c7SDamien Le Moal 768fcc6eaa3SDamien Le Moal /* 769fcc6eaa3SDamien Le Moal * If we need to strongly order zone append operations, set the request 770fcc6eaa3SDamien Le Moal * sector to the zone write pointer location now instead of when the 771fcc6eaa3SDamien Le Moal * command work runs. 772fcc6eaa3SDamien Le Moal */ 773fcc6eaa3SDamien Le Moal if (zlo->ordered_zone_append && req_op(rq) == REQ_OP_ZONE_APPEND) { 774fcc6eaa3SDamien Le Moal if (!zloop_set_zone_append_sector(rq)) 775fcc6eaa3SDamien Le Moal return BLK_STS_IOERR; 776fcc6eaa3SDamien Le Moal } 777fcc6eaa3SDamien Le Moal 778eb0570c7SDamien Le Moal blk_mq_start_request(rq); 779eb0570c7SDamien Le Moal 780eb0570c7SDamien Le Moal INIT_WORK(&cmd->work, zloop_cmd_workfn); 781eb0570c7SDamien Le Moal queue_work(zlo->workqueue, &cmd->work); 782eb0570c7SDamien Le Moal 783eb0570c7SDamien Le Moal return BLK_STS_OK; 784eb0570c7SDamien Le Moal } 785eb0570c7SDamien Le Moal 786eb0570c7SDamien Le Moal static const struct blk_mq_ops zloop_mq_ops = { 787eb0570c7SDamien Le Moal .queue_rq = zloop_queue_rq, 788eb0570c7SDamien Le Moal .complete = zloop_complete_rq, 789eb0570c7SDamien Le Moal }; 790eb0570c7SDamien Le Moal 791eb0570c7SDamien Le Moal static int zloop_open(struct gendisk *disk, blk_mode_t mode) 792eb0570c7SDamien Le Moal { 793eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 794eb0570c7SDamien Le Moal int ret; 795eb0570c7SDamien Le Moal 796eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 797eb0570c7SDamien Le Moal if (ret) 798eb0570c7SDamien Le Moal return ret; 799eb0570c7SDamien Le Moal 800eb0570c7SDamien Le Moal if (zlo->state != Zlo_live) 801eb0570c7SDamien Le Moal ret = -ENXIO; 802eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 803eb0570c7SDamien Le Moal return ret; 804eb0570c7SDamien Le Moal } 805eb0570c7SDamien Le Moal 806eb0570c7SDamien Le Moal static int zloop_report_zones(struct gendisk *disk, sector_t sector, 807fdb9aed8SDamien Le Moal unsigned int nr_zones, struct blk_report_zones_args *args) 808eb0570c7SDamien Le Moal { 809eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 810eb0570c7SDamien Le Moal struct blk_zone blkz = {}; 811eb0570c7SDamien Le Moal unsigned int first, i; 812fcc6eaa3SDamien Le Moal unsigned long flags; 813eb0570c7SDamien Le Moal int ret; 814eb0570c7SDamien Le Moal 815eb0570c7SDamien Le Moal first = disk_zone_no(disk, sector); 816eb0570c7SDamien Le Moal if (first >= zlo->nr_zones) 817eb0570c7SDamien Le Moal return 0; 818eb0570c7SDamien Le Moal nr_zones = min(nr_zones, zlo->nr_zones - first); 819eb0570c7SDamien Le Moal 820eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 821eb0570c7SDamien Le Moal unsigned int zone_no = first + i; 822eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 823eb0570c7SDamien Le Moal 824eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 825eb0570c7SDamien Le Moal 826eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 827eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 828eb0570c7SDamien Le Moal if (ret) { 829eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 830eb0570c7SDamien Le Moal return ret; 831eb0570c7SDamien Le Moal } 832eb0570c7SDamien Le Moal } 833eb0570c7SDamien Le Moal 834eb0570c7SDamien Le Moal blkz.start = zone->start; 835eb0570c7SDamien Le Moal blkz.len = zlo->zone_size; 836fcc6eaa3SDamien Le Moal spin_lock_irqsave(&zone->wp_lock, flags); 837eb0570c7SDamien Le Moal blkz.wp = zone->wp; 838fcc6eaa3SDamien Le Moal spin_unlock_irqrestore(&zone->wp_lock, flags); 839eb0570c7SDamien Le Moal blkz.cond = zone->cond; 840eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 841eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_CONVENTIONAL; 842eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_size; 843eb0570c7SDamien Le Moal } else { 844eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_SEQWRITE_REQ; 845eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_capacity; 846eb0570c7SDamien Le Moal } 847eb0570c7SDamien Le Moal 848eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 849eb0570c7SDamien Le Moal 850fdb9aed8SDamien Le Moal ret = disk_report_zone(disk, &blkz, i, args); 851eb0570c7SDamien Le Moal if (ret) 852eb0570c7SDamien Le Moal return ret; 853eb0570c7SDamien Le Moal } 854eb0570c7SDamien Le Moal 855eb0570c7SDamien Le Moal return nr_zones; 856eb0570c7SDamien Le Moal } 857eb0570c7SDamien Le Moal 858eb0570c7SDamien Le Moal static void zloop_free_disk(struct gendisk *disk) 859eb0570c7SDamien Le Moal { 860eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 861eb0570c7SDamien Le Moal unsigned int i; 862eb0570c7SDamien Le Moal 86376576185SShin'ichiro Kawasaki blk_mq_free_tag_set(&zlo->tag_set); 86476576185SShin'ichiro Kawasaki 865eb0570c7SDamien Le Moal for (i = 0; i < zlo->nr_zones; i++) { 866eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[i]; 867eb0570c7SDamien Le Moal 868eb0570c7SDamien Le Moal mapping_set_gfp_mask(zone->file->f_mapping, 869eb0570c7SDamien Le Moal zone->old_gfp_mask); 870eb0570c7SDamien Le Moal fput(zone->file); 871eb0570c7SDamien Le Moal } 872eb0570c7SDamien Le Moal 873eb0570c7SDamien Le Moal fput(zlo->data_dir); 874eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 875eb0570c7SDamien Le Moal kfree(zlo->base_dir); 876eb0570c7SDamien Le Moal kvfree(zlo); 877eb0570c7SDamien Le Moal } 878eb0570c7SDamien Le Moal 879eb0570c7SDamien Le Moal static const struct block_device_operations zloop_fops = { 880eb0570c7SDamien Le Moal .owner = THIS_MODULE, 881eb0570c7SDamien Le Moal .open = zloop_open, 882eb0570c7SDamien Le Moal .report_zones = zloop_report_zones, 883eb0570c7SDamien Le Moal .free_disk = zloop_free_disk, 884eb0570c7SDamien Le Moal }; 885eb0570c7SDamien Le Moal 886eb0570c7SDamien Le Moal __printf(3, 4) 887eb0570c7SDamien Le Moal static struct file *zloop_filp_open_fmt(int oflags, umode_t mode, 888eb0570c7SDamien Le Moal const char *fmt, ...) 889eb0570c7SDamien Le Moal { 890eb0570c7SDamien Le Moal struct file *file; 891eb0570c7SDamien Le Moal va_list ap; 892eb0570c7SDamien Le Moal char *p; 893eb0570c7SDamien Le Moal 894eb0570c7SDamien Le Moal va_start(ap, fmt); 895eb0570c7SDamien Le Moal p = kvasprintf(GFP_KERNEL, fmt, ap); 896eb0570c7SDamien Le Moal va_end(ap); 897eb0570c7SDamien Le Moal 898eb0570c7SDamien Le Moal if (!p) 899eb0570c7SDamien Le Moal return ERR_PTR(-ENOMEM); 900eb0570c7SDamien Le Moal file = filp_open(p, oflags, mode); 901eb0570c7SDamien Le Moal kfree(p); 902eb0570c7SDamien Le Moal return file; 903eb0570c7SDamien Le Moal } 904eb0570c7SDamien Le Moal 905eb0570c7SDamien Le Moal static int zloop_get_block_size(struct zloop_device *zlo, 906eb0570c7SDamien Le Moal struct zloop_zone *zone) 907eb0570c7SDamien Le Moal { 908eb0570c7SDamien Le Moal struct block_device *sb_bdev = zone->file->f_mapping->host->i_sb->s_bdev; 909eb0570c7SDamien Le Moal struct kstat st; 910eb0570c7SDamien Le Moal 911eb0570c7SDamien Le Moal /* 912eb0570c7SDamien Le Moal * If the FS block size is lower than or equal to 4K, use that as the 913eb0570c7SDamien Le Moal * device block size. Otherwise, fallback to the FS direct IO alignment 914eb0570c7SDamien Le Moal * constraint if that is provided, and to the FS underlying device 915eb0570c7SDamien Le Moal * physical block size if the direct IO alignment is unknown. 916eb0570c7SDamien Le Moal */ 917eb0570c7SDamien Le Moal if (file_inode(zone->file)->i_sb->s_blocksize <= SZ_4K) 918eb0570c7SDamien Le Moal zlo->block_size = file_inode(zone->file)->i_sb->s_blocksize; 919eb0570c7SDamien Le Moal else if (!vfs_getattr(&zone->file->f_path, &st, STATX_DIOALIGN, 0) && 920eb0570c7SDamien Le Moal (st.result_mask & STATX_DIOALIGN)) 921eb0570c7SDamien Le Moal zlo->block_size = st.dio_offset_align; 922eb0570c7SDamien Le Moal else if (sb_bdev) 923eb0570c7SDamien Le Moal zlo->block_size = bdev_physical_block_size(sb_bdev); 924eb0570c7SDamien Le Moal else 925eb0570c7SDamien Le Moal zlo->block_size = SECTOR_SIZE; 926eb0570c7SDamien Le Moal 927eb0570c7SDamien Le Moal if (zlo->zone_capacity & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 928eb0570c7SDamien Le Moal pr_err("Zone capacity is not aligned to block size %u\n", 929eb0570c7SDamien Le Moal zlo->block_size); 930eb0570c7SDamien Le Moal return -EINVAL; 931eb0570c7SDamien Le Moal } 932eb0570c7SDamien Le Moal 933eb0570c7SDamien Le Moal return 0; 934eb0570c7SDamien Le Moal } 935eb0570c7SDamien Le Moal 936eb0570c7SDamien Le Moal static int zloop_init_zone(struct zloop_device *zlo, struct zloop_options *opts, 937eb0570c7SDamien Le Moal unsigned int zone_no, bool restore) 938eb0570c7SDamien Le Moal { 939eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 940eb0570c7SDamien Le Moal int oflags = O_RDWR; 941eb0570c7SDamien Le Moal struct kstat stat; 942eb0570c7SDamien Le Moal sector_t file_sectors; 943eb0570c7SDamien Le Moal int ret; 944eb0570c7SDamien Le Moal 945eb0570c7SDamien Le Moal mutex_init(&zone->lock); 946fcc6eaa3SDamien Le Moal spin_lock_init(&zone->wp_lock); 947eb0570c7SDamien Le Moal zone->start = (sector_t)zone_no << zlo->zone_shift; 948eb0570c7SDamien Le Moal 949eb0570c7SDamien Le Moal if (!restore) 950eb0570c7SDamien Le Moal oflags |= O_CREAT; 951eb0570c7SDamien Le Moal 952eb0570c7SDamien Le Moal if (!opts->buffered_io) 953eb0570c7SDamien Le Moal oflags |= O_DIRECT; 954eb0570c7SDamien Le Moal 955eb0570c7SDamien Le Moal if (zone_no < zlo->nr_conv_zones) { 956eb0570c7SDamien Le Moal /* Conventional zone file. */ 957eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_CONV, &zone->flags); 958eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_NOT_WP; 959eb0570c7SDamien Le Moal zone->wp = U64_MAX; 960eb0570c7SDamien Le Moal 961eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/cnv-%06u", 962eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 963eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 964eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/cnv-%06u (err=%ld)", 965eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 966eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 967eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 968eb0570c7SDamien Le Moal } 969eb0570c7SDamien Le Moal 970eb0570c7SDamien Le Moal if (!zlo->block_size) { 971eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 972eb0570c7SDamien Le Moal if (ret) 973eb0570c7SDamien Le Moal return ret; 974eb0570c7SDamien Le Moal } 975eb0570c7SDamien Le Moal 976eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 977eb0570c7SDamien Le Moal if (ret < 0) { 978eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat\n", zone_no); 979eb0570c7SDamien Le Moal return ret; 980eb0570c7SDamien Le Moal } 981eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 982eb0570c7SDamien Le Moal 983eb0570c7SDamien Le Moal if (restore && file_sectors != zlo->zone_size) { 984eb0570c7SDamien Le Moal pr_err("Invalid conventional zone %u file size (%llu sectors != %llu)\n", 985eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 986eb0570c7SDamien Le Moal return ret; 987eb0570c7SDamien Le Moal } 988eb0570c7SDamien Le Moal 989eb0570c7SDamien Le Moal ret = vfs_truncate(&zone->file->f_path, 990eb0570c7SDamien Le Moal zlo->zone_size << SECTOR_SHIFT); 991eb0570c7SDamien Le Moal if (ret < 0) { 992eb0570c7SDamien Le Moal pr_err("Failed to truncate zone %u file (err=%d)\n", 993eb0570c7SDamien Le Moal zone_no, ret); 994eb0570c7SDamien Le Moal return ret; 995eb0570c7SDamien Le Moal } 996eb0570c7SDamien Le Moal 997eb0570c7SDamien Le Moal return 0; 998eb0570c7SDamien Le Moal } 999eb0570c7SDamien Le Moal 1000eb0570c7SDamien Le Moal /* Sequential zone file. */ 1001eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/seq-%06u", 1002eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 1003eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 1004eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/seq-%06u (err=%ld)", 1005eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 1006eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 1007eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 1008eb0570c7SDamien Le Moal } 1009eb0570c7SDamien Le Moal 1010eb0570c7SDamien Le Moal if (!zlo->block_size) { 1011eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 1012eb0570c7SDamien Le Moal if (ret) 1013eb0570c7SDamien Le Moal return ret; 1014eb0570c7SDamien Le Moal } 1015eb0570c7SDamien Le Moal 1016eb0570c7SDamien Le Moal zloop_get_block_size(zlo, zone); 1017eb0570c7SDamien Le Moal 1018eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 1019eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 1020eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 1021eb0570c7SDamien Le Moal 1022eb0570c7SDamien Le Moal return ret; 1023eb0570c7SDamien Le Moal } 1024eb0570c7SDamien Le Moal 1025eb0570c7SDamien Le Moal static bool zloop_dev_exists(struct zloop_device *zlo) 1026eb0570c7SDamien Le Moal { 1027eb0570c7SDamien Le Moal struct file *cnv, *seq; 1028eb0570c7SDamien Le Moal bool exists; 1029eb0570c7SDamien Le Moal 1030eb0570c7SDamien Le Moal cnv = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/cnv-%06u", 1031eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 1032eb0570c7SDamien Le Moal seq = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/seq-%06u", 1033eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 1034eb0570c7SDamien Le Moal exists = !IS_ERR(cnv) || !IS_ERR(seq); 1035eb0570c7SDamien Le Moal 1036eb0570c7SDamien Le Moal if (!IS_ERR(cnv)) 1037eb0570c7SDamien Le Moal fput(cnv); 1038eb0570c7SDamien Le Moal if (!IS_ERR(seq)) 1039eb0570c7SDamien Le Moal fput(seq); 1040eb0570c7SDamien Le Moal 1041eb0570c7SDamien Le Moal return exists; 1042eb0570c7SDamien Le Moal } 1043eb0570c7SDamien Le Moal 1044eb0570c7SDamien Le Moal static int zloop_ctl_add(struct zloop_options *opts) 1045eb0570c7SDamien Le Moal { 1046eb0570c7SDamien Le Moal struct queue_limits lim = { 1047eb0570c7SDamien Le Moal .max_hw_sectors = SZ_1M >> SECTOR_SHIFT, 1048eb0570c7SDamien Le Moal .chunk_sectors = opts->zone_size, 10496acf7860SChristoph Hellwig .features = BLK_FEAT_ZONED | BLK_FEAT_WRITE_CACHE, 10506acf7860SChristoph Hellwig 1051eb0570c7SDamien Le Moal }; 1052eb0570c7SDamien Le Moal unsigned int nr_zones, i, j; 1053eb0570c7SDamien Le Moal struct zloop_device *zlo; 1054eb0570c7SDamien Le Moal int ret = -EINVAL; 1055eb0570c7SDamien Le Moal bool restore; 1056eb0570c7SDamien Le Moal 1057eb0570c7SDamien Le Moal __module_get(THIS_MODULE); 1058eb0570c7SDamien Le Moal 1059eb0570c7SDamien Le Moal nr_zones = opts->capacity >> ilog2(opts->zone_size); 1060eb0570c7SDamien Le Moal if (opts->nr_conv_zones >= nr_zones) { 1061eb0570c7SDamien Le Moal pr_err("Invalid number of conventional zones %u\n", 1062eb0570c7SDamien Le Moal opts->nr_conv_zones); 1063eb0570c7SDamien Le Moal goto out; 1064eb0570c7SDamien Le Moal } 1065eb0570c7SDamien Le Moal 1066323bbfcfSLinus Torvalds zlo = kvzalloc_flex(*zlo, zones, nr_zones); 1067eb0570c7SDamien Le Moal if (!zlo) { 1068eb0570c7SDamien Le Moal ret = -ENOMEM; 1069eb0570c7SDamien Le Moal goto out; 1070eb0570c7SDamien Le Moal } 10714b2b0315SYongpeng Yang WRITE_ONCE(zlo->state, Zlo_creating); 1072eb0570c7SDamien Le Moal 1073eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 1074eb0570c7SDamien Le Moal if (ret) 1075eb0570c7SDamien Le Moal goto out_free_dev; 1076eb0570c7SDamien Le Moal 1077eb0570c7SDamien Le Moal /* Allocate id, if @opts->id >= 0, we're requesting that specific id */ 1078eb0570c7SDamien Le Moal if (opts->id >= 0) { 1079eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 1080eb0570c7SDamien Le Moal opts->id, opts->id + 1, GFP_KERNEL); 1081eb0570c7SDamien Le Moal if (ret == -ENOSPC) 1082eb0570c7SDamien Le Moal ret = -EEXIST; 1083eb0570c7SDamien Le Moal } else { 1084eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 0, 0, GFP_KERNEL); 1085eb0570c7SDamien Le Moal } 1086eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1087eb0570c7SDamien Le Moal if (ret < 0) 1088eb0570c7SDamien Le Moal goto out_free_dev; 1089eb0570c7SDamien Le Moal 1090eb0570c7SDamien Le Moal zlo->id = ret; 1091eb0570c7SDamien Le Moal zlo->zone_shift = ilog2(opts->zone_size); 1092eb0570c7SDamien Le Moal zlo->zone_size = opts->zone_size; 1093eb0570c7SDamien Le Moal if (opts->zone_capacity) 1094eb0570c7SDamien Le Moal zlo->zone_capacity = opts->zone_capacity; 1095eb0570c7SDamien Le Moal else 1096eb0570c7SDamien Le Moal zlo->zone_capacity = zlo->zone_size; 1097eb0570c7SDamien Le Moal zlo->nr_zones = nr_zones; 1098eb0570c7SDamien Le Moal zlo->nr_conv_zones = opts->nr_conv_zones; 1099eb0570c7SDamien Le Moal zlo->buffered_io = opts->buffered_io; 11009236c5fdSDamien Le Moal zlo->zone_append = opts->zone_append; 1101fcc6eaa3SDamien Le Moal if (zlo->zone_append) 1102fcc6eaa3SDamien Le Moal zlo->ordered_zone_append = opts->ordered_zone_append; 1103*829def1eSChristoph Hellwig zlo->discard_write_cache = opts->discard_write_cache; 1104eb0570c7SDamien Le Moal 1105eb0570c7SDamien Le Moal zlo->workqueue = alloc_workqueue("zloop%d", WQ_UNBOUND | WQ_FREEZABLE, 1106eb0570c7SDamien Le Moal opts->nr_queues * opts->queue_depth, zlo->id); 1107eb0570c7SDamien Le Moal if (!zlo->workqueue) { 1108eb0570c7SDamien Le Moal ret = -ENOMEM; 1109eb0570c7SDamien Le Moal goto out_free_idr; 1110eb0570c7SDamien Le Moal } 1111eb0570c7SDamien Le Moal 1112eb0570c7SDamien Le Moal if (opts->base_dir) 1113eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(opts->base_dir, GFP_KERNEL); 1114eb0570c7SDamien Le Moal else 1115eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(ZLOOP_DEF_BASE_DIR, GFP_KERNEL); 1116eb0570c7SDamien Le Moal if (!zlo->base_dir) { 1117eb0570c7SDamien Le Moal ret = -ENOMEM; 1118eb0570c7SDamien Le Moal goto out_destroy_workqueue; 1119eb0570c7SDamien Le Moal } 1120eb0570c7SDamien Le Moal 1121eb0570c7SDamien Le Moal zlo->data_dir = zloop_filp_open_fmt(O_RDONLY | O_DIRECTORY, 0, "%s/%u", 1122eb0570c7SDamien Le Moal zlo->base_dir, zlo->id); 1123eb0570c7SDamien Le Moal if (IS_ERR(zlo->data_dir)) { 1124eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->data_dir); 1125eb0570c7SDamien Le Moal pr_warn("Failed to open directory %s/%u (err=%d)\n", 1126eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, ret); 1127eb0570c7SDamien Le Moal goto out_free_base_dir; 1128eb0570c7SDamien Le Moal } 1129eb0570c7SDamien Le Moal 1130eb0570c7SDamien Le Moal /* 1131eb0570c7SDamien Le Moal * If we already have zone files, we are restoring a device created by a 1132eb0570c7SDamien Le Moal * previous add operation. In this case, zloop_init_zone() will check 1133eb0570c7SDamien Le Moal * that the zone files are consistent with the zone configuration given. 1134eb0570c7SDamien Le Moal */ 1135eb0570c7SDamien Le Moal restore = zloop_dev_exists(zlo); 1136eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 1137eb0570c7SDamien Le Moal ret = zloop_init_zone(zlo, opts, i, restore); 1138eb0570c7SDamien Le Moal if (ret) 1139eb0570c7SDamien Le Moal goto out_close_files; 1140eb0570c7SDamien Le Moal } 1141eb0570c7SDamien Le Moal 1142eb0570c7SDamien Le Moal lim.physical_block_size = zlo->block_size; 1143eb0570c7SDamien Le Moal lim.logical_block_size = zlo->block_size; 11449236c5fdSDamien Le Moal if (zlo->zone_append) 11459236c5fdSDamien Le Moal lim.max_hw_zone_append_sectors = lim.max_hw_sectors; 1146eb0570c7SDamien Le Moal 1147eb0570c7SDamien Le Moal zlo->tag_set.ops = &zloop_mq_ops; 1148eb0570c7SDamien Le Moal zlo->tag_set.nr_hw_queues = opts->nr_queues; 1149eb0570c7SDamien Le Moal zlo->tag_set.queue_depth = opts->queue_depth; 1150eb0570c7SDamien Le Moal zlo->tag_set.numa_node = NUMA_NO_NODE; 1151eb0570c7SDamien Le Moal zlo->tag_set.cmd_size = sizeof(struct zloop_cmd); 1152eb0570c7SDamien Le Moal zlo->tag_set.driver_data = zlo; 1153eb0570c7SDamien Le Moal 1154eb0570c7SDamien Le Moal ret = blk_mq_alloc_tag_set(&zlo->tag_set); 1155eb0570c7SDamien Le Moal if (ret) { 1156eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_tag_set failed (err=%d)\n", ret); 1157eb0570c7SDamien Le Moal goto out_close_files; 1158eb0570c7SDamien Le Moal } 1159eb0570c7SDamien Le Moal 1160eb0570c7SDamien Le Moal zlo->disk = blk_mq_alloc_disk(&zlo->tag_set, &lim, zlo); 1161eb0570c7SDamien Le Moal if (IS_ERR(zlo->disk)) { 1162eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_disk failed (err=%d)\n", ret); 1163eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->disk); 1164eb0570c7SDamien Le Moal goto out_cleanup_tags; 1165eb0570c7SDamien Le Moal } 1166eb0570c7SDamien Le Moal zlo->disk->flags = GENHD_FL_NO_PART; 1167eb0570c7SDamien Le Moal zlo->disk->fops = &zloop_fops; 1168eb0570c7SDamien Le Moal zlo->disk->private_data = zlo; 1169eb0570c7SDamien Le Moal sprintf(zlo->disk->disk_name, "zloop%d", zlo->id); 1170eb0570c7SDamien Le Moal set_capacity(zlo->disk, (u64)lim.chunk_sectors * zlo->nr_zones); 1171eb0570c7SDamien Le Moal 1172eb0570c7SDamien Le Moal ret = blk_revalidate_disk_zones(zlo->disk); 1173eb0570c7SDamien Le Moal if (ret) 1174eb0570c7SDamien Le Moal goto out_cleanup_disk; 1175eb0570c7SDamien Le Moal 1176eb0570c7SDamien Le Moal ret = add_disk(zlo->disk); 1177eb0570c7SDamien Le Moal if (ret) { 1178eb0570c7SDamien Le Moal pr_err("add_disk failed (err=%d)\n", ret); 1179eb0570c7SDamien Le Moal goto out_cleanup_disk; 1180eb0570c7SDamien Le Moal } 1181eb0570c7SDamien Le Moal 1182eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 11834b2b0315SYongpeng Yang WRITE_ONCE(zlo->state, Zlo_live); 1184eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1185eb0570c7SDamien Le Moal 11869236c5fdSDamien Le Moal pr_info("zloop: device %d, %u zones of %llu MiB, %u B block size\n", 1187eb0570c7SDamien Le Moal zlo->id, zlo->nr_zones, 1188eb0570c7SDamien Le Moal ((sector_t)zlo->zone_size << SECTOR_SHIFT) >> 20, 1189eb0570c7SDamien Le Moal zlo->block_size); 1190fcc6eaa3SDamien Le Moal pr_info("zloop%d: using %s%s zone append\n", 11919236c5fdSDamien Le Moal zlo->id, 1192fcc6eaa3SDamien Le Moal zlo->ordered_zone_append ? "ordered " : "", 11939236c5fdSDamien Le Moal zlo->zone_append ? "native" : "emulated"); 1194eb0570c7SDamien Le Moal 1195eb0570c7SDamien Le Moal return 0; 1196eb0570c7SDamien Le Moal 1197eb0570c7SDamien Le Moal out_cleanup_disk: 1198eb0570c7SDamien Le Moal put_disk(zlo->disk); 1199eb0570c7SDamien Le Moal out_cleanup_tags: 1200eb0570c7SDamien Le Moal blk_mq_free_tag_set(&zlo->tag_set); 1201eb0570c7SDamien Le Moal out_close_files: 1202eb0570c7SDamien Le Moal for (j = 0; j < i; j++) { 1203eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[j]; 1204eb0570c7SDamien Le Moal 1205eb0570c7SDamien Le Moal if (!IS_ERR_OR_NULL(zone->file)) 1206eb0570c7SDamien Le Moal fput(zone->file); 1207eb0570c7SDamien Le Moal } 1208eb0570c7SDamien Le Moal fput(zlo->data_dir); 1209eb0570c7SDamien Le Moal out_free_base_dir: 1210eb0570c7SDamien Le Moal kfree(zlo->base_dir); 1211eb0570c7SDamien Le Moal out_destroy_workqueue: 1212eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 1213eb0570c7SDamien Le Moal out_free_idr: 1214eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 1215eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 1216eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1217eb0570c7SDamien Le Moal out_free_dev: 1218eb0570c7SDamien Le Moal kvfree(zlo); 1219eb0570c7SDamien Le Moal out: 1220eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1221eb0570c7SDamien Le Moal if (ret == -ENOENT) 1222eb0570c7SDamien Le Moal ret = -EINVAL; 1223eb0570c7SDamien Le Moal return ret; 1224eb0570c7SDamien Le Moal } 1225eb0570c7SDamien Le Moal 1226*829def1eSChristoph Hellwig static void zloop_truncate(struct file *file, loff_t pos) 1227*829def1eSChristoph Hellwig { 1228*829def1eSChristoph Hellwig struct mnt_idmap *idmap = file_mnt_idmap(file); 1229*829def1eSChristoph Hellwig struct dentry *dentry = file_dentry(file); 1230*829def1eSChristoph Hellwig struct iattr newattrs; 1231*829def1eSChristoph Hellwig 1232*829def1eSChristoph Hellwig newattrs.ia_size = pos; 1233*829def1eSChristoph Hellwig newattrs.ia_valid = ATTR_SIZE; 1234*829def1eSChristoph Hellwig 1235*829def1eSChristoph Hellwig inode_lock(dentry->d_inode); 1236*829def1eSChristoph Hellwig notify_change(idmap, dentry, &newattrs, NULL); 1237*829def1eSChristoph Hellwig inode_unlock(dentry->d_inode); 1238*829def1eSChristoph Hellwig } 1239*829def1eSChristoph Hellwig 1240*829def1eSChristoph Hellwig static void zloop_forget_cache(struct zloop_device *zlo) 1241*829def1eSChristoph Hellwig { 1242*829def1eSChristoph Hellwig unsigned int i; 1243*829def1eSChristoph Hellwig int ret; 1244*829def1eSChristoph Hellwig 1245*829def1eSChristoph Hellwig pr_info("%pg: discarding volatile write cache\n", zlo->disk->part0); 1246*829def1eSChristoph Hellwig 1247*829def1eSChristoph Hellwig for (i = 0; i < zlo->nr_zones; i++) { 1248*829def1eSChristoph Hellwig struct zloop_zone *zone = &zlo->zones[i]; 1249*829def1eSChristoph Hellwig struct file *file = zone->file; 1250*829def1eSChristoph Hellwig sector_t old_wp; 1251*829def1eSChristoph Hellwig 1252*829def1eSChristoph Hellwig if (!zloop_zone_is_active(zone)) 1253*829def1eSChristoph Hellwig continue; 1254*829def1eSChristoph Hellwig 1255*829def1eSChristoph Hellwig ret = vfs_getxattr(file_mnt_idmap(file), file_dentry(file), 1256*829def1eSChristoph Hellwig "user.zloop.wp", &old_wp, sizeof(old_wp)); 1257*829def1eSChristoph Hellwig if (ret == -ENODATA) { 1258*829def1eSChristoph Hellwig old_wp = 0; 1259*829def1eSChristoph Hellwig } else if (ret != sizeof(old_wp)) { 1260*829def1eSChristoph Hellwig pr_err("%pg: failed to retrieve write pointer (%d)\n", 1261*829def1eSChristoph Hellwig zlo->disk->part0, ret); 1262*829def1eSChristoph Hellwig continue; 1263*829def1eSChristoph Hellwig } 1264*829def1eSChristoph Hellwig if (old_wp < zone->wp) 1265*829def1eSChristoph Hellwig zloop_truncate(file, old_wp); 1266*829def1eSChristoph Hellwig } 1267*829def1eSChristoph Hellwig } 1268*829def1eSChristoph Hellwig 1269eb0570c7SDamien Le Moal static int zloop_ctl_remove(struct zloop_options *opts) 1270eb0570c7SDamien Le Moal { 1271eb0570c7SDamien Le Moal struct zloop_device *zlo; 1272eb0570c7SDamien Le Moal int ret; 1273eb0570c7SDamien Le Moal 1274eb0570c7SDamien Le Moal if (!(opts->mask & ZLOOP_OPT_ID)) { 12753c461711SChristoph Hellwig pr_err("No ID specified for remove\n"); 12763c461711SChristoph Hellwig return -EINVAL; 12773c461711SChristoph Hellwig } 12783c461711SChristoph Hellwig 12793c461711SChristoph Hellwig if (opts->mask & ~ZLOOP_OPT_ID) { 12803c461711SChristoph Hellwig pr_err("Invalid option specified for remove\n"); 1281eb0570c7SDamien Le Moal return -EINVAL; 1282eb0570c7SDamien Le Moal } 1283eb0570c7SDamien Le Moal 1284eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 1285eb0570c7SDamien Le Moal if (ret) 1286eb0570c7SDamien Le Moal return ret; 1287eb0570c7SDamien Le Moal 1288eb0570c7SDamien Le Moal zlo = idr_find(&zloop_index_idr, opts->id); 1289eb0570c7SDamien Le Moal if (!zlo || zlo->state == Zlo_creating) { 1290eb0570c7SDamien Le Moal ret = -ENODEV; 1291eb0570c7SDamien Le Moal } else if (zlo->state == Zlo_deleting) { 1292eb0570c7SDamien Le Moal ret = -EINVAL; 1293eb0570c7SDamien Le Moal } else { 1294eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 12954b2b0315SYongpeng Yang WRITE_ONCE(zlo->state, Zlo_deleting); 1296eb0570c7SDamien Le Moal } 1297eb0570c7SDamien Le Moal 1298eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1299eb0570c7SDamien Le Moal if (ret) 1300eb0570c7SDamien Le Moal return ret; 1301eb0570c7SDamien Le Moal 1302eb0570c7SDamien Le Moal del_gendisk(zlo->disk); 1303*829def1eSChristoph Hellwig 1304*829def1eSChristoph Hellwig if (zlo->discard_write_cache) 1305*829def1eSChristoph Hellwig zloop_forget_cache(zlo); 1306*829def1eSChristoph Hellwig 1307eb0570c7SDamien Le Moal put_disk(zlo->disk); 1308eb0570c7SDamien Le Moal 1309eb0570c7SDamien Le Moal pr_info("Removed device %d\n", opts->id); 1310eb0570c7SDamien Le Moal 1311eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1312eb0570c7SDamien Le Moal 1313eb0570c7SDamien Le Moal return 0; 1314eb0570c7SDamien Le Moal } 1315eb0570c7SDamien Le Moal 1316eb0570c7SDamien Le Moal static int zloop_parse_options(struct zloop_options *opts, const char *buf) 1317eb0570c7SDamien Le Moal { 1318eb0570c7SDamien Le Moal substring_t args[MAX_OPT_ARGS]; 1319eb0570c7SDamien Le Moal char *options, *o, *p; 1320eb0570c7SDamien Le Moal unsigned int token; 1321eb0570c7SDamien Le Moal int ret = 0; 1322eb0570c7SDamien Le Moal 1323eb0570c7SDamien Le Moal /* Set defaults. */ 1324eb0570c7SDamien Le Moal opts->mask = 0; 1325eb0570c7SDamien Le Moal opts->id = ZLOOP_DEF_ID; 1326eb0570c7SDamien Le Moal opts->capacity = ZLOOP_DEF_ZONE_SIZE * ZLOOP_DEF_NR_ZONES; 1327eb0570c7SDamien Le Moal opts->zone_size = ZLOOP_DEF_ZONE_SIZE; 1328eb0570c7SDamien Le Moal opts->nr_conv_zones = ZLOOP_DEF_NR_CONV_ZONES; 1329eb0570c7SDamien Le Moal opts->nr_queues = ZLOOP_DEF_NR_QUEUES; 1330eb0570c7SDamien Le Moal opts->queue_depth = ZLOOP_DEF_QUEUE_DEPTH; 1331eb0570c7SDamien Le Moal opts->buffered_io = ZLOOP_DEF_BUFFERED_IO; 13329236c5fdSDamien Le Moal opts->zone_append = ZLOOP_DEF_ZONE_APPEND; 1333fcc6eaa3SDamien Le Moal opts->ordered_zone_append = ZLOOP_DEF_ORDERED_ZONE_APPEND; 1334eb0570c7SDamien Le Moal 1335eb0570c7SDamien Le Moal if (!buf) 1336eb0570c7SDamien Le Moal return 0; 1337eb0570c7SDamien Le Moal 1338eb0570c7SDamien Le Moal /* Skip leading spaces before the options. */ 1339eb0570c7SDamien Le Moal while (isspace(*buf)) 1340eb0570c7SDamien Le Moal buf++; 1341eb0570c7SDamien Le Moal 1342eb0570c7SDamien Le Moal options = o = kstrdup(buf, GFP_KERNEL); 1343eb0570c7SDamien Le Moal if (!options) 1344eb0570c7SDamien Le Moal return -ENOMEM; 1345eb0570c7SDamien Le Moal 1346eb0570c7SDamien Le Moal /* Parse the options, doing only some light invalid value checks. */ 1347eb0570c7SDamien Le Moal while ((p = strsep(&o, ",\n")) != NULL) { 1348eb0570c7SDamien Le Moal if (!*p) 1349eb0570c7SDamien Le Moal continue; 1350eb0570c7SDamien Le Moal 1351eb0570c7SDamien Le Moal token = match_token(p, zloop_opt_tokens, args); 1352eb0570c7SDamien Le Moal opts->mask |= token; 1353eb0570c7SDamien Le Moal switch (token) { 1354eb0570c7SDamien Le Moal case ZLOOP_OPT_ID: 1355eb0570c7SDamien Le Moal if (match_int(args, &opts->id)) { 1356eb0570c7SDamien Le Moal ret = -EINVAL; 1357eb0570c7SDamien Le Moal goto out; 1358eb0570c7SDamien Le Moal } 1359eb0570c7SDamien Le Moal break; 1360eb0570c7SDamien Le Moal case ZLOOP_OPT_CAPACITY: 1361eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1362eb0570c7SDamien Le Moal ret = -EINVAL; 1363eb0570c7SDamien Le Moal goto out; 1364eb0570c7SDamien Le Moal } 1365eb0570c7SDamien Le Moal if (!token) { 1366eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1367eb0570c7SDamien Le Moal ret = -EINVAL; 1368eb0570c7SDamien Le Moal goto out; 1369eb0570c7SDamien Le Moal } 1370eb0570c7SDamien Le Moal opts->capacity = 1371eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1372eb0570c7SDamien Le Moal break; 1373eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_SIZE: 1374eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1375eb0570c7SDamien Le Moal ret = -EINVAL; 1376eb0570c7SDamien Le Moal goto out; 1377eb0570c7SDamien Le Moal } 1378eb0570c7SDamien Le Moal if (!token || token > ZLOOP_MAX_ZONE_SIZE_MB || 1379eb0570c7SDamien Le Moal !is_power_of_2(token)) { 1380eb0570c7SDamien Le Moal pr_err("Invalid zone size %u\n", token); 1381eb0570c7SDamien Le Moal ret = -EINVAL; 1382eb0570c7SDamien Le Moal goto out; 1383eb0570c7SDamien Le Moal } 1384eb0570c7SDamien Le Moal opts->zone_size = 1385eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1386eb0570c7SDamien Le Moal break; 1387eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_CAPACITY: 1388eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1389eb0570c7SDamien Le Moal ret = -EINVAL; 1390eb0570c7SDamien Le Moal goto out; 1391eb0570c7SDamien Le Moal } 1392eb0570c7SDamien Le Moal if (!token) { 1393eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1394eb0570c7SDamien Le Moal ret = -EINVAL; 1395eb0570c7SDamien Le Moal goto out; 1396eb0570c7SDamien Le Moal } 1397eb0570c7SDamien Le Moal opts->zone_capacity = 1398eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1399eb0570c7SDamien Le Moal break; 1400eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_CONV_ZONES: 1401eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1402eb0570c7SDamien Le Moal ret = -EINVAL; 1403eb0570c7SDamien Le Moal goto out; 1404eb0570c7SDamien Le Moal } 1405eb0570c7SDamien Le Moal opts->nr_conv_zones = token; 1406eb0570c7SDamien Le Moal break; 1407eb0570c7SDamien Le Moal case ZLOOP_OPT_BASE_DIR: 1408eb0570c7SDamien Le Moal p = match_strdup(args); 1409eb0570c7SDamien Le Moal if (!p) { 1410eb0570c7SDamien Le Moal ret = -ENOMEM; 1411eb0570c7SDamien Le Moal goto out; 1412eb0570c7SDamien Le Moal } 1413eb0570c7SDamien Le Moal kfree(opts->base_dir); 1414eb0570c7SDamien Le Moal opts->base_dir = p; 1415eb0570c7SDamien Le Moal break; 1416eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_QUEUES: 1417eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1418eb0570c7SDamien Le Moal ret = -EINVAL; 1419eb0570c7SDamien Le Moal goto out; 1420eb0570c7SDamien Le Moal } 1421eb0570c7SDamien Le Moal if (!token) { 1422eb0570c7SDamien Le Moal pr_err("Invalid number of queues\n"); 1423eb0570c7SDamien Le Moal ret = -EINVAL; 1424eb0570c7SDamien Le Moal goto out; 1425eb0570c7SDamien Le Moal } 1426eb0570c7SDamien Le Moal opts->nr_queues = min(token, num_online_cpus()); 1427eb0570c7SDamien Le Moal break; 1428eb0570c7SDamien Le Moal case ZLOOP_OPT_QUEUE_DEPTH: 1429eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1430eb0570c7SDamien Le Moal ret = -EINVAL; 1431eb0570c7SDamien Le Moal goto out; 1432eb0570c7SDamien Le Moal } 1433eb0570c7SDamien Le Moal if (!token) { 1434eb0570c7SDamien Le Moal pr_err("Invalid queue depth\n"); 1435eb0570c7SDamien Le Moal ret = -EINVAL; 1436eb0570c7SDamien Le Moal goto out; 1437eb0570c7SDamien Le Moal } 1438eb0570c7SDamien Le Moal opts->queue_depth = token; 1439eb0570c7SDamien Le Moal break; 1440eb0570c7SDamien Le Moal case ZLOOP_OPT_BUFFERED_IO: 1441eb0570c7SDamien Le Moal opts->buffered_io = true; 1442eb0570c7SDamien Le Moal break; 14439236c5fdSDamien Le Moal case ZLOOP_OPT_ZONE_APPEND: 14449236c5fdSDamien Le Moal if (match_uint(args, &token)) { 14459236c5fdSDamien Le Moal ret = -EINVAL; 14469236c5fdSDamien Le Moal goto out; 14479236c5fdSDamien Le Moal } 14489236c5fdSDamien Le Moal if (token != 0 && token != 1) { 14499236c5fdSDamien Le Moal pr_err("Invalid zone_append value\n"); 14509236c5fdSDamien Le Moal ret = -EINVAL; 14519236c5fdSDamien Le Moal goto out; 14529236c5fdSDamien Le Moal } 14539236c5fdSDamien Le Moal opts->zone_append = token; 14549236c5fdSDamien Le Moal break; 1455fcc6eaa3SDamien Le Moal case ZLOOP_OPT_ORDERED_ZONE_APPEND: 1456fcc6eaa3SDamien Le Moal opts->ordered_zone_append = true; 1457fcc6eaa3SDamien Le Moal break; 1458*829def1eSChristoph Hellwig case ZLOOP_OPT_DISCARD_WRITE_CACHE: 1459*829def1eSChristoph Hellwig opts->discard_write_cache = true; 1460*829def1eSChristoph Hellwig break; 1461eb0570c7SDamien Le Moal case ZLOOP_OPT_ERR: 1462eb0570c7SDamien Le Moal default: 1463eb0570c7SDamien Le Moal pr_warn("unknown parameter or missing value '%s'\n", p); 1464eb0570c7SDamien Le Moal ret = -EINVAL; 1465eb0570c7SDamien Le Moal goto out; 1466eb0570c7SDamien Le Moal } 1467eb0570c7SDamien Le Moal } 1468eb0570c7SDamien Le Moal 1469eb0570c7SDamien Le Moal ret = -EINVAL; 1470eb0570c7SDamien Le Moal if (opts->capacity <= opts->zone_size) { 1471eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1472eb0570c7SDamien Le Moal goto out; 1473eb0570c7SDamien Le Moal } 1474eb0570c7SDamien Le Moal 1475eb0570c7SDamien Le Moal if (opts->zone_capacity > opts->zone_size) { 1476eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1477eb0570c7SDamien Le Moal goto out; 1478eb0570c7SDamien Le Moal } 1479eb0570c7SDamien Le Moal 1480eb0570c7SDamien Le Moal ret = 0; 1481eb0570c7SDamien Le Moal out: 1482eb0570c7SDamien Le Moal kfree(options); 1483eb0570c7SDamien Le Moal return ret; 1484eb0570c7SDamien Le Moal } 1485eb0570c7SDamien Le Moal 1486eb0570c7SDamien Le Moal enum { 1487eb0570c7SDamien Le Moal ZLOOP_CTL_ADD, 1488eb0570c7SDamien Le Moal ZLOOP_CTL_REMOVE, 1489eb0570c7SDamien Le Moal }; 1490eb0570c7SDamien Le Moal 1491eb0570c7SDamien Le Moal static struct zloop_ctl_op { 1492eb0570c7SDamien Le Moal int code; 1493eb0570c7SDamien Le Moal const char *name; 1494eb0570c7SDamien Le Moal } zloop_ctl_ops[] = { 1495eb0570c7SDamien Le Moal { ZLOOP_CTL_ADD, "add" }, 1496eb0570c7SDamien Le Moal { ZLOOP_CTL_REMOVE, "remove" }, 1497eb0570c7SDamien Le Moal { -1, NULL }, 1498eb0570c7SDamien Le Moal }; 1499eb0570c7SDamien Le Moal 1500eb0570c7SDamien Le Moal static ssize_t zloop_ctl_write(struct file *file, const char __user *ubuf, 1501eb0570c7SDamien Le Moal size_t count, loff_t *pos) 1502eb0570c7SDamien Le Moal { 1503eb0570c7SDamien Le Moal struct zloop_options opts = { }; 1504eb0570c7SDamien Le Moal struct zloop_ctl_op *op; 1505eb0570c7SDamien Le Moal const char *buf, *opts_buf; 1506eb0570c7SDamien Le Moal int i, ret; 1507eb0570c7SDamien Le Moal 1508eb0570c7SDamien Le Moal if (count > PAGE_SIZE) 1509eb0570c7SDamien Le Moal return -ENOMEM; 1510eb0570c7SDamien Le Moal 1511eb0570c7SDamien Le Moal buf = memdup_user_nul(ubuf, count); 1512eb0570c7SDamien Le Moal if (IS_ERR(buf)) 1513eb0570c7SDamien Le Moal return PTR_ERR(buf); 1514eb0570c7SDamien Le Moal 1515eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_ctl_ops); i++) { 1516eb0570c7SDamien Le Moal op = &zloop_ctl_ops[i]; 1517eb0570c7SDamien Le Moal if (!op->name) { 1518eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1519eb0570c7SDamien Le Moal ret = -EINVAL; 1520eb0570c7SDamien Le Moal goto out; 1521eb0570c7SDamien Le Moal } 1522eb0570c7SDamien Le Moal if (!strncmp(buf, op->name, strlen(op->name))) 1523eb0570c7SDamien Le Moal break; 1524eb0570c7SDamien Le Moal } 1525eb0570c7SDamien Le Moal 1526eb0570c7SDamien Le Moal if (count <= strlen(op->name)) 1527eb0570c7SDamien Le Moal opts_buf = NULL; 1528eb0570c7SDamien Le Moal else 1529eb0570c7SDamien Le Moal opts_buf = buf + strlen(op->name); 1530eb0570c7SDamien Le Moal 1531eb0570c7SDamien Le Moal ret = zloop_parse_options(&opts, opts_buf); 1532eb0570c7SDamien Le Moal if (ret) { 1533eb0570c7SDamien Le Moal pr_err("Failed to parse options\n"); 1534eb0570c7SDamien Le Moal goto out; 1535eb0570c7SDamien Le Moal } 1536eb0570c7SDamien Le Moal 1537eb0570c7SDamien Le Moal switch (op->code) { 1538eb0570c7SDamien Le Moal case ZLOOP_CTL_ADD: 1539eb0570c7SDamien Le Moal ret = zloop_ctl_add(&opts); 1540eb0570c7SDamien Le Moal break; 1541eb0570c7SDamien Le Moal case ZLOOP_CTL_REMOVE: 1542eb0570c7SDamien Le Moal ret = zloop_ctl_remove(&opts); 1543eb0570c7SDamien Le Moal break; 1544eb0570c7SDamien Le Moal default: 1545eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1546eb0570c7SDamien Le Moal ret = -EINVAL; 1547eb0570c7SDamien Le Moal goto out; 1548eb0570c7SDamien Le Moal } 1549eb0570c7SDamien Le Moal 1550eb0570c7SDamien Le Moal out: 1551eb0570c7SDamien Le Moal kfree(opts.base_dir); 1552eb0570c7SDamien Le Moal kfree(buf); 1553eb0570c7SDamien Le Moal return ret ? ret : count; 1554eb0570c7SDamien Le Moal } 1555eb0570c7SDamien Le Moal 1556eb0570c7SDamien Le Moal static int zloop_ctl_show(struct seq_file *seq_file, void *private) 1557eb0570c7SDamien Le Moal { 1558eb0570c7SDamien Le Moal const struct match_token *tok; 1559eb0570c7SDamien Le Moal int i; 1560eb0570c7SDamien Le Moal 1561eb0570c7SDamien Le Moal /* Add operation */ 1562eb0570c7SDamien Le Moal seq_printf(seq_file, "%s ", zloop_ctl_ops[0].name); 1563eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_opt_tokens); i++) { 1564eb0570c7SDamien Le Moal tok = &zloop_opt_tokens[i]; 1565eb0570c7SDamien Le Moal if (!tok->pattern) 1566eb0570c7SDamien Le Moal break; 1567eb0570c7SDamien Le Moal if (i) 1568eb0570c7SDamien Le Moal seq_putc(seq_file, ','); 1569eb0570c7SDamien Le Moal seq_puts(seq_file, tok->pattern); 1570eb0570c7SDamien Le Moal } 1571eb0570c7SDamien Le Moal seq_putc(seq_file, '\n'); 1572eb0570c7SDamien Le Moal 1573eb0570c7SDamien Le Moal /* Remove operation */ 1574eb0570c7SDamien Le Moal seq_puts(seq_file, zloop_ctl_ops[1].name); 1575eb0570c7SDamien Le Moal seq_puts(seq_file, " id=%d\n"); 1576eb0570c7SDamien Le Moal 1577eb0570c7SDamien Le Moal return 0; 1578eb0570c7SDamien Le Moal } 1579eb0570c7SDamien Le Moal 1580eb0570c7SDamien Le Moal static int zloop_ctl_open(struct inode *inode, struct file *file) 1581eb0570c7SDamien Le Moal { 1582eb0570c7SDamien Le Moal file->private_data = NULL; 1583eb0570c7SDamien Le Moal return single_open(file, zloop_ctl_show, NULL); 1584eb0570c7SDamien Le Moal } 1585eb0570c7SDamien Le Moal 1586eb0570c7SDamien Le Moal static int zloop_ctl_release(struct inode *inode, struct file *file) 1587eb0570c7SDamien Le Moal { 1588eb0570c7SDamien Le Moal return single_release(inode, file); 1589eb0570c7SDamien Le Moal } 1590eb0570c7SDamien Le Moal 1591eb0570c7SDamien Le Moal static const struct file_operations zloop_ctl_fops = { 1592eb0570c7SDamien Le Moal .owner = THIS_MODULE, 1593eb0570c7SDamien Le Moal .open = zloop_ctl_open, 1594eb0570c7SDamien Le Moal .release = zloop_ctl_release, 1595eb0570c7SDamien Le Moal .write = zloop_ctl_write, 1596eb0570c7SDamien Le Moal .read = seq_read, 1597eb0570c7SDamien Le Moal }; 1598eb0570c7SDamien Le Moal 1599eb0570c7SDamien Le Moal static struct miscdevice zloop_misc = { 1600eb0570c7SDamien Le Moal .minor = MISC_DYNAMIC_MINOR, 1601eb0570c7SDamien Le Moal .name = "zloop-control", 1602eb0570c7SDamien Le Moal .fops = &zloop_ctl_fops, 1603eb0570c7SDamien Le Moal }; 1604eb0570c7SDamien Le Moal 1605eb0570c7SDamien Le Moal static int __init zloop_init(void) 1606eb0570c7SDamien Le Moal { 1607eb0570c7SDamien Le Moal int ret; 1608eb0570c7SDamien Le Moal 1609eb0570c7SDamien Le Moal ret = misc_register(&zloop_misc); 1610eb0570c7SDamien Le Moal if (ret) { 1611eb0570c7SDamien Le Moal pr_err("Failed to register misc device: %d\n", ret); 1612eb0570c7SDamien Le Moal return ret; 1613eb0570c7SDamien Le Moal } 1614eb0570c7SDamien Le Moal pr_info("Module loaded\n"); 1615eb0570c7SDamien Le Moal 1616eb0570c7SDamien Le Moal return 0; 1617eb0570c7SDamien Le Moal } 1618eb0570c7SDamien Le Moal 1619eb0570c7SDamien Le Moal static void __exit zloop_exit(void) 1620eb0570c7SDamien Le Moal { 1621eb0570c7SDamien Le Moal misc_deregister(&zloop_misc); 1622eb0570c7SDamien Le Moal idr_destroy(&zloop_index_idr); 1623eb0570c7SDamien Le Moal } 1624eb0570c7SDamien Le Moal 1625eb0570c7SDamien Le Moal module_init(zloop_init); 1626eb0570c7SDamien Le Moal module_exit(zloop_exit); 1627eb0570c7SDamien Le Moal 1628eb0570c7SDamien Le Moal MODULE_DESCRIPTION("Zoned loopback device"); 1629eb0570c7SDamien Le Moal MODULE_LICENSE("GPL"); 1630