1eb0570c7SDamien Le Moal // SPDX-License-Identifier: GPL-2.0-only 2eb0570c7SDamien Le Moal /* 3eb0570c7SDamien Le Moal * Copyright (c) 2025, Christoph Hellwig. 4eb0570c7SDamien Le Moal * Copyright (c) 2025, Western Digital Corporation or its affiliates. 5eb0570c7SDamien Le Moal * 6eb0570c7SDamien Le Moal * Zoned Loop Device driver - exports a zoned block device using one file per 7eb0570c7SDamien Le Moal * zone as backing storage. 8eb0570c7SDamien Le Moal */ 9eb0570c7SDamien Le Moal #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt 10eb0570c7SDamien Le Moal 11eb0570c7SDamien Le Moal #include <linux/module.h> 12eb0570c7SDamien Le Moal #include <linux/blk-mq.h> 13eb0570c7SDamien Le Moal #include <linux/blkzoned.h> 14eb0570c7SDamien Le Moal #include <linux/pagemap.h> 15eb0570c7SDamien Le Moal #include <linux/miscdevice.h> 16eb0570c7SDamien Le Moal #include <linux/falloc.h> 17eb0570c7SDamien Le Moal #include <linux/mutex.h> 18eb0570c7SDamien Le Moal #include <linux/parser.h> 19eb0570c7SDamien Le Moal #include <linux/seq_file.h> 20eb0570c7SDamien Le Moal 21eb0570c7SDamien Le Moal /* 22eb0570c7SDamien Le Moal * Options for adding (and removing) a device. 23eb0570c7SDamien Le Moal */ 24eb0570c7SDamien Le Moal enum { 25eb0570c7SDamien Le Moal ZLOOP_OPT_ERR = 0, 26eb0570c7SDamien Le Moal ZLOOP_OPT_ID = (1 << 0), 27eb0570c7SDamien Le Moal ZLOOP_OPT_CAPACITY = (1 << 1), 28eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_SIZE = (1 << 2), 29eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_CAPACITY = (1 << 3), 30eb0570c7SDamien Le Moal ZLOOP_OPT_NR_CONV_ZONES = (1 << 4), 31eb0570c7SDamien Le Moal ZLOOP_OPT_BASE_DIR = (1 << 5), 32eb0570c7SDamien Le Moal ZLOOP_OPT_NR_QUEUES = (1 << 6), 33eb0570c7SDamien Le Moal ZLOOP_OPT_QUEUE_DEPTH = (1 << 7), 34eb0570c7SDamien Le Moal ZLOOP_OPT_BUFFERED_IO = (1 << 8), 35eb0570c7SDamien Le Moal }; 36eb0570c7SDamien Le Moal 37eb0570c7SDamien Le Moal static const match_table_t zloop_opt_tokens = { 38eb0570c7SDamien Le Moal { ZLOOP_OPT_ID, "id=%d" }, 39eb0570c7SDamien Le Moal { ZLOOP_OPT_CAPACITY, "capacity_mb=%u" }, 40eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_SIZE, "zone_size_mb=%u" }, 41eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_CAPACITY, "zone_capacity_mb=%u" }, 42eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_CONV_ZONES, "conv_zones=%u" }, 43eb0570c7SDamien Le Moal { ZLOOP_OPT_BASE_DIR, "base_dir=%s" }, 44eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_QUEUES, "nr_queues=%u" }, 45eb0570c7SDamien Le Moal { ZLOOP_OPT_QUEUE_DEPTH, "queue_depth=%u" }, 46eb0570c7SDamien Le Moal { ZLOOP_OPT_BUFFERED_IO, "buffered_io" }, 47eb0570c7SDamien Le Moal { ZLOOP_OPT_ERR, NULL } 48eb0570c7SDamien Le Moal }; 49eb0570c7SDamien Le Moal 50eb0570c7SDamien Le Moal /* Default values for the "add" operation. */ 51eb0570c7SDamien Le Moal #define ZLOOP_DEF_ID -1 52eb0570c7SDamien Le Moal #define ZLOOP_DEF_ZONE_SIZE ((256ULL * SZ_1M) >> SECTOR_SHIFT) 53eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_ZONES 64 54eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_CONV_ZONES 8 55eb0570c7SDamien Le Moal #define ZLOOP_DEF_BASE_DIR "/var/local/zloop" 56eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_QUEUES 1 57eb0570c7SDamien Le Moal #define ZLOOP_DEF_QUEUE_DEPTH 128 58eb0570c7SDamien Le Moal #define ZLOOP_DEF_BUFFERED_IO false 59eb0570c7SDamien Le Moal 60eb0570c7SDamien Le Moal /* Arbitrary limit on the zone size (16GB). */ 61eb0570c7SDamien Le Moal #define ZLOOP_MAX_ZONE_SIZE_MB 16384 62eb0570c7SDamien Le Moal 63eb0570c7SDamien Le Moal struct zloop_options { 64eb0570c7SDamien Le Moal unsigned int mask; 65eb0570c7SDamien Le Moal int id; 66eb0570c7SDamien Le Moal sector_t capacity; 67eb0570c7SDamien Le Moal sector_t zone_size; 68eb0570c7SDamien Le Moal sector_t zone_capacity; 69eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 70eb0570c7SDamien Le Moal char *base_dir; 71eb0570c7SDamien Le Moal unsigned int nr_queues; 72eb0570c7SDamien Le Moal unsigned int queue_depth; 73eb0570c7SDamien Le Moal bool buffered_io; 74eb0570c7SDamien Le Moal }; 75eb0570c7SDamien Le Moal 76eb0570c7SDamien Le Moal /* 77eb0570c7SDamien Le Moal * Device states. 78eb0570c7SDamien Le Moal */ 79eb0570c7SDamien Le Moal enum { 80eb0570c7SDamien Le Moal Zlo_creating = 0, 81eb0570c7SDamien Le Moal Zlo_live, 82eb0570c7SDamien Le Moal Zlo_deleting, 83eb0570c7SDamien Le Moal }; 84eb0570c7SDamien Le Moal 85eb0570c7SDamien Le Moal enum zloop_zone_flags { 86eb0570c7SDamien Le Moal ZLOOP_ZONE_CONV = 0, 87eb0570c7SDamien Le Moal ZLOOP_ZONE_SEQ_ERROR, 88eb0570c7SDamien Le Moal }; 89eb0570c7SDamien Le Moal 90eb0570c7SDamien Le Moal struct zloop_zone { 91eb0570c7SDamien Le Moal struct file *file; 92eb0570c7SDamien Le Moal 93eb0570c7SDamien Le Moal unsigned long flags; 94eb0570c7SDamien Le Moal struct mutex lock; 95eb0570c7SDamien Le Moal enum blk_zone_cond cond; 96eb0570c7SDamien Le Moal sector_t start; 97eb0570c7SDamien Le Moal sector_t wp; 98eb0570c7SDamien Le Moal 99eb0570c7SDamien Le Moal gfp_t old_gfp_mask; 100eb0570c7SDamien Le Moal }; 101eb0570c7SDamien Le Moal 102eb0570c7SDamien Le Moal struct zloop_device { 103eb0570c7SDamien Le Moal unsigned int id; 104eb0570c7SDamien Le Moal unsigned int state; 105eb0570c7SDamien Le Moal 106eb0570c7SDamien Le Moal struct blk_mq_tag_set tag_set; 107eb0570c7SDamien Le Moal struct gendisk *disk; 108eb0570c7SDamien Le Moal 109eb0570c7SDamien Le Moal struct workqueue_struct *workqueue; 110eb0570c7SDamien Le Moal bool buffered_io; 111eb0570c7SDamien Le Moal 112eb0570c7SDamien Le Moal const char *base_dir; 113eb0570c7SDamien Le Moal struct file *data_dir; 114eb0570c7SDamien Le Moal 115eb0570c7SDamien Le Moal unsigned int zone_shift; 116eb0570c7SDamien Le Moal sector_t zone_size; 117eb0570c7SDamien Le Moal sector_t zone_capacity; 118eb0570c7SDamien Le Moal unsigned int nr_zones; 119eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 120eb0570c7SDamien Le Moal unsigned int block_size; 121eb0570c7SDamien Le Moal 122eb0570c7SDamien Le Moal struct zloop_zone zones[] __counted_by(nr_zones); 123eb0570c7SDamien Le Moal }; 124eb0570c7SDamien Le Moal 125eb0570c7SDamien Le Moal struct zloop_cmd { 126eb0570c7SDamien Le Moal struct work_struct work; 127eb0570c7SDamien Le Moal atomic_t ref; 128eb0570c7SDamien Le Moal sector_t sector; 129eb0570c7SDamien Le Moal sector_t nr_sectors; 130eb0570c7SDamien Le Moal long ret; 131eb0570c7SDamien Le Moal struct kiocb iocb; 132eb0570c7SDamien Le Moal struct bio_vec *bvec; 133eb0570c7SDamien Le Moal }; 134eb0570c7SDamien Le Moal 135eb0570c7SDamien Le Moal static DEFINE_IDR(zloop_index_idr); 136eb0570c7SDamien Le Moal static DEFINE_MUTEX(zloop_ctl_mutex); 137eb0570c7SDamien Le Moal 138eb0570c7SDamien Le Moal static unsigned int rq_zone_no(struct request *rq) 139eb0570c7SDamien Le Moal { 140eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 141eb0570c7SDamien Le Moal 142eb0570c7SDamien Le Moal return blk_rq_pos(rq) >> zlo->zone_shift; 143eb0570c7SDamien Le Moal } 144eb0570c7SDamien Le Moal 145eb0570c7SDamien Le Moal static int zloop_update_seq_zone(struct zloop_device *zlo, unsigned int zone_no) 146eb0570c7SDamien Le Moal { 147eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 148eb0570c7SDamien Le Moal struct kstat stat; 149eb0570c7SDamien Le Moal sector_t file_sectors; 150eb0570c7SDamien Le Moal int ret; 151eb0570c7SDamien Le Moal 152eb0570c7SDamien Le Moal lockdep_assert_held(&zone->lock); 153eb0570c7SDamien Le Moal 154eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 155eb0570c7SDamien Le Moal if (ret < 0) { 156eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat (err=%d)\n", 157eb0570c7SDamien Le Moal zone_no, ret); 158eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 159eb0570c7SDamien Le Moal return ret; 160eb0570c7SDamien Le Moal } 161eb0570c7SDamien Le Moal 162eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 163eb0570c7SDamien Le Moal if (file_sectors > zlo->zone_capacity) { 164eb0570c7SDamien Le Moal pr_err("Zone %u file too large (%llu sectors > %llu)\n", 165eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 166eb0570c7SDamien Le Moal return -EINVAL; 167eb0570c7SDamien Le Moal } 168eb0570c7SDamien Le Moal 169eb0570c7SDamien Le Moal if (file_sectors & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 170eb0570c7SDamien Le Moal pr_err("Zone %u file size not aligned to block size %u\n", 171eb0570c7SDamien Le Moal zone_no, zlo->block_size); 172eb0570c7SDamien Le Moal return -EINVAL; 173eb0570c7SDamien Le Moal } 174eb0570c7SDamien Le Moal 175eb0570c7SDamien Le Moal if (!file_sectors) { 176eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 177eb0570c7SDamien Le Moal zone->wp = zone->start; 178eb0570c7SDamien Le Moal } else if (file_sectors == zlo->zone_capacity) { 179eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 180866d6574SDamien Le Moal zone->wp = ULLONG_MAX; 181eb0570c7SDamien Le Moal } else { 182eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 183eb0570c7SDamien Le Moal zone->wp = zone->start + file_sectors; 184eb0570c7SDamien Le Moal } 185eb0570c7SDamien Le Moal 186eb0570c7SDamien Le Moal return 0; 187eb0570c7SDamien Le Moal } 188eb0570c7SDamien Le Moal 189eb0570c7SDamien Le Moal static int zloop_open_zone(struct zloop_device *zlo, unsigned int zone_no) 190eb0570c7SDamien Le Moal { 191eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 192eb0570c7SDamien Le Moal int ret = 0; 193eb0570c7SDamien Le Moal 194eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 195eb0570c7SDamien Le Moal return -EIO; 196eb0570c7SDamien Le Moal 197eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 198eb0570c7SDamien Le Moal 199eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 200eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 201eb0570c7SDamien Le Moal if (ret) 202eb0570c7SDamien Le Moal goto unlock; 203eb0570c7SDamien Le Moal } 204eb0570c7SDamien Le Moal 205eb0570c7SDamien Le Moal switch (zone->cond) { 206eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 207eb0570c7SDamien Le Moal break; 208eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 209eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 210eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 211eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EXP_OPEN; 212eb0570c7SDamien Le Moal break; 213eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 214eb0570c7SDamien Le Moal default: 215eb0570c7SDamien Le Moal ret = -EIO; 216eb0570c7SDamien Le Moal break; 217eb0570c7SDamien Le Moal } 218eb0570c7SDamien Le Moal 219eb0570c7SDamien Le Moal unlock: 220eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 221eb0570c7SDamien Le Moal 222eb0570c7SDamien Le Moal return ret; 223eb0570c7SDamien Le Moal } 224eb0570c7SDamien Le Moal 225eb0570c7SDamien Le Moal static int zloop_close_zone(struct zloop_device *zlo, unsigned int zone_no) 226eb0570c7SDamien Le Moal { 227eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 228eb0570c7SDamien Le Moal int ret = 0; 229eb0570c7SDamien Le Moal 230eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 231eb0570c7SDamien Le Moal return -EIO; 232eb0570c7SDamien Le Moal 233eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 234eb0570c7SDamien Le Moal 235eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 236eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 237eb0570c7SDamien Le Moal if (ret) 238eb0570c7SDamien Le Moal goto unlock; 239eb0570c7SDamien Le Moal } 240eb0570c7SDamien Le Moal 241eb0570c7SDamien Le Moal switch (zone->cond) { 242eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 243eb0570c7SDamien Le Moal break; 244eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 245eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 246eb0570c7SDamien Le Moal if (zone->wp == zone->start) 247eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 248eb0570c7SDamien Le Moal else 249eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 250eb0570c7SDamien Le Moal break; 251eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 252eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 253eb0570c7SDamien Le Moal default: 254eb0570c7SDamien Le Moal ret = -EIO; 255eb0570c7SDamien Le Moal break; 256eb0570c7SDamien Le Moal } 257eb0570c7SDamien Le Moal 258eb0570c7SDamien Le Moal unlock: 259eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 260eb0570c7SDamien Le Moal 261eb0570c7SDamien Le Moal return ret; 262eb0570c7SDamien Le Moal } 263eb0570c7SDamien Le Moal 264eb0570c7SDamien Le Moal static int zloop_reset_zone(struct zloop_device *zlo, unsigned int zone_no) 265eb0570c7SDamien Le Moal { 266eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 267eb0570c7SDamien Le Moal int ret = 0; 268eb0570c7SDamien Le Moal 269eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 270eb0570c7SDamien Le Moal return -EIO; 271eb0570c7SDamien Le Moal 272eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 273eb0570c7SDamien Le Moal 274eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 275eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_EMPTY) 276eb0570c7SDamien Le Moal goto unlock; 277eb0570c7SDamien Le Moal 278eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, 0)) { 279eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 280eb0570c7SDamien Le Moal ret = -EIO; 281eb0570c7SDamien Le Moal goto unlock; 282eb0570c7SDamien Le Moal } 283eb0570c7SDamien Le Moal 284eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 285eb0570c7SDamien Le Moal zone->wp = zone->start; 286eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 287eb0570c7SDamien Le Moal 288eb0570c7SDamien Le Moal unlock: 289eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 290eb0570c7SDamien Le Moal 291eb0570c7SDamien Le Moal return ret; 292eb0570c7SDamien Le Moal } 293eb0570c7SDamien Le Moal 294eb0570c7SDamien Le Moal static int zloop_reset_all_zones(struct zloop_device *zlo) 295eb0570c7SDamien Le Moal { 296eb0570c7SDamien Le Moal unsigned int i; 297eb0570c7SDamien Le Moal int ret; 298eb0570c7SDamien Le Moal 299eb0570c7SDamien Le Moal for (i = zlo->nr_conv_zones; i < zlo->nr_zones; i++) { 300eb0570c7SDamien Le Moal ret = zloop_reset_zone(zlo, i); 301eb0570c7SDamien Le Moal if (ret) 302eb0570c7SDamien Le Moal return ret; 303eb0570c7SDamien Le Moal } 304eb0570c7SDamien Le Moal 305eb0570c7SDamien Le Moal return 0; 306eb0570c7SDamien Le Moal } 307eb0570c7SDamien Le Moal 308eb0570c7SDamien Le Moal static int zloop_finish_zone(struct zloop_device *zlo, unsigned int zone_no) 309eb0570c7SDamien Le Moal { 310eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 311eb0570c7SDamien Le Moal int ret = 0; 312eb0570c7SDamien Le Moal 313eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 314eb0570c7SDamien Le Moal return -EIO; 315eb0570c7SDamien Le Moal 316eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 317eb0570c7SDamien Le Moal 318eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 319eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_FULL) 320eb0570c7SDamien Le Moal goto unlock; 321eb0570c7SDamien Le Moal 322eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, zlo->zone_size << SECTOR_SHIFT)) { 323eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 324eb0570c7SDamien Le Moal ret = -EIO; 325eb0570c7SDamien Le Moal goto unlock; 326eb0570c7SDamien Le Moal } 327eb0570c7SDamien Le Moal 328eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 329866d6574SDamien Le Moal zone->wp = ULLONG_MAX; 330eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 331eb0570c7SDamien Le Moal 332eb0570c7SDamien Le Moal unlock: 333eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 334eb0570c7SDamien Le Moal 335eb0570c7SDamien Le Moal return ret; 336eb0570c7SDamien Le Moal } 337eb0570c7SDamien Le Moal 338eb0570c7SDamien Le Moal static void zloop_put_cmd(struct zloop_cmd *cmd) 339eb0570c7SDamien Le Moal { 340eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 341eb0570c7SDamien Le Moal 342eb0570c7SDamien Le Moal if (!atomic_dec_and_test(&cmd->ref)) 343eb0570c7SDamien Le Moal return; 344eb0570c7SDamien Le Moal kfree(cmd->bvec); 345eb0570c7SDamien Le Moal cmd->bvec = NULL; 346eb0570c7SDamien Le Moal if (likely(!blk_should_fake_timeout(rq->q))) 347eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 348eb0570c7SDamien Le Moal } 349eb0570c7SDamien Le Moal 350eb0570c7SDamien Le Moal static void zloop_rw_complete(struct kiocb *iocb, long ret) 351eb0570c7SDamien Le Moal { 352eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(iocb, struct zloop_cmd, iocb); 353eb0570c7SDamien Le Moal 354eb0570c7SDamien Le Moal cmd->ret = ret; 355eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 356eb0570c7SDamien Le Moal } 357eb0570c7SDamien Le Moal 358eb0570c7SDamien Le Moal static void zloop_rw(struct zloop_cmd *cmd) 359eb0570c7SDamien Le Moal { 360eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 361eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 362eb0570c7SDamien Le Moal unsigned int zone_no = rq_zone_no(rq); 363eb0570c7SDamien Le Moal sector_t sector = blk_rq_pos(rq); 364eb0570c7SDamien Le Moal sector_t nr_sectors = blk_rq_sectors(rq); 365eb0570c7SDamien Le Moal bool is_append = req_op(rq) == REQ_OP_ZONE_APPEND; 366eb0570c7SDamien Le Moal bool is_write = req_op(rq) == REQ_OP_WRITE || is_append; 367eb0570c7SDamien Le Moal int rw = is_write ? ITER_SOURCE : ITER_DEST; 368eb0570c7SDamien Le Moal struct req_iterator rq_iter; 369eb0570c7SDamien Le Moal struct zloop_zone *zone; 370eb0570c7SDamien Le Moal struct iov_iter iter; 371eb0570c7SDamien Le Moal struct bio_vec tmp; 372eb0570c7SDamien Le Moal sector_t zone_end; 373eb0570c7SDamien Le Moal int nr_bvec = 0; 374eb0570c7SDamien Le Moal int ret; 375eb0570c7SDamien Le Moal 376eb0570c7SDamien Le Moal atomic_set(&cmd->ref, 2); 377eb0570c7SDamien Le Moal cmd->sector = sector; 378eb0570c7SDamien Le Moal cmd->nr_sectors = nr_sectors; 379eb0570c7SDamien Le Moal cmd->ret = 0; 380eb0570c7SDamien Le Moal 381eb0570c7SDamien Le Moal /* We should never get an I/O beyond the device capacity. */ 382eb0570c7SDamien Le Moal if (WARN_ON_ONCE(zone_no >= zlo->nr_zones)) { 383eb0570c7SDamien Le Moal ret = -EIO; 384eb0570c7SDamien Le Moal goto out; 385eb0570c7SDamien Le Moal } 386eb0570c7SDamien Le Moal zone = &zlo->zones[zone_no]; 387eb0570c7SDamien Le Moal zone_end = zone->start + zlo->zone_capacity; 388eb0570c7SDamien Le Moal 389eb0570c7SDamien Le Moal /* 390eb0570c7SDamien Le Moal * The block layer should never send requests that are not fully 391eb0570c7SDamien Le Moal * contained within the zone. 392eb0570c7SDamien Le Moal */ 393eb0570c7SDamien Le Moal if (WARN_ON_ONCE(sector + nr_sectors > zone->start + zlo->zone_size)) { 394eb0570c7SDamien Le Moal ret = -EIO; 395eb0570c7SDamien Le Moal goto out; 396eb0570c7SDamien Le Moal } 397eb0570c7SDamien Le Moal 398eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 399eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 400eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 401eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 402eb0570c7SDamien Le Moal if (ret) 403eb0570c7SDamien Le Moal goto out; 404eb0570c7SDamien Le Moal } 405eb0570c7SDamien Le Moal 406eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_CONV, &zone->flags) && is_write) { 407eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 408eb0570c7SDamien Le Moal 409eb0570c7SDamien Le Moal if (is_append) { 410*cf28f6f9SDamien Le Moal if (zone->cond == BLK_ZONE_COND_FULL) { 411*cf28f6f9SDamien Le Moal ret = -EIO; 412*cf28f6f9SDamien Le Moal goto unlock; 413*cf28f6f9SDamien Le Moal } 414eb0570c7SDamien Le Moal sector = zone->wp; 415eb0570c7SDamien Le Moal cmd->sector = sector; 416eb0570c7SDamien Le Moal } 417eb0570c7SDamien Le Moal 418eb0570c7SDamien Le Moal /* 419eb0570c7SDamien Le Moal * Write operations must be aligned to the write pointer and 420eb0570c7SDamien Le Moal * fully contained within the zone capacity. 421eb0570c7SDamien Le Moal */ 422eb0570c7SDamien Le Moal if (sector != zone->wp || zone->wp + nr_sectors > zone_end) { 423eb0570c7SDamien Le Moal pr_err("Zone %u: unaligned write: sect %llu, wp %llu\n", 424eb0570c7SDamien Le Moal zone_no, sector, zone->wp); 425eb0570c7SDamien Le Moal ret = -EIO; 426eb0570c7SDamien Le Moal goto unlock; 427eb0570c7SDamien Le Moal } 428eb0570c7SDamien Le Moal 429eb0570c7SDamien Le Moal /* Implicitly open the target zone. */ 430eb0570c7SDamien Le Moal if (zone->cond == BLK_ZONE_COND_CLOSED || 431eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_EMPTY) 432eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_IMP_OPEN; 433eb0570c7SDamien Le Moal 434eb0570c7SDamien Le Moal /* 435eb0570c7SDamien Le Moal * Advance the write pointer of sequential zones. If the write 436eb0570c7SDamien Le Moal * fails, the wp position will be corrected when the next I/O 437eb0570c7SDamien Le Moal * copmpletes. 438eb0570c7SDamien Le Moal */ 439eb0570c7SDamien Le Moal zone->wp += nr_sectors; 440866d6574SDamien Le Moal if (zone->wp == zone_end) { 441eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 442866d6574SDamien Le Moal zone->wp = ULLONG_MAX; 443866d6574SDamien Le Moal } 444eb0570c7SDamien Le Moal } 445eb0570c7SDamien Le Moal 446eb0570c7SDamien Le Moal rq_for_each_bvec(tmp, rq, rq_iter) 447eb0570c7SDamien Le Moal nr_bvec++; 448eb0570c7SDamien Le Moal 449eb0570c7SDamien Le Moal if (rq->bio != rq->biotail) { 450eb0570c7SDamien Le Moal struct bio_vec *bvec; 451eb0570c7SDamien Le Moal 452eb0570c7SDamien Le Moal cmd->bvec = kmalloc_array(nr_bvec, sizeof(*cmd->bvec), GFP_NOIO); 453eb0570c7SDamien Le Moal if (!cmd->bvec) { 454eb0570c7SDamien Le Moal ret = -EIO; 455eb0570c7SDamien Le Moal goto unlock; 456eb0570c7SDamien Le Moal } 457eb0570c7SDamien Le Moal 458eb0570c7SDamien Le Moal /* 459eb0570c7SDamien Le Moal * The bios of the request may be started from the middle of 460eb0570c7SDamien Le Moal * the 'bvec' because of bio splitting, so we can't directly 461eb0570c7SDamien Le Moal * copy bio->bi_iov_vec to new bvec. The rq_for_each_bvec 462eb0570c7SDamien Le Moal * API will take care of all details for us. 463eb0570c7SDamien Le Moal */ 464eb0570c7SDamien Le Moal bvec = cmd->bvec; 465eb0570c7SDamien Le Moal rq_for_each_bvec(tmp, rq, rq_iter) { 466eb0570c7SDamien Le Moal *bvec = tmp; 467eb0570c7SDamien Le Moal bvec++; 468eb0570c7SDamien Le Moal } 469eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, cmd->bvec, nr_bvec, blk_rq_bytes(rq)); 470eb0570c7SDamien Le Moal } else { 471eb0570c7SDamien Le Moal /* 472eb0570c7SDamien Le Moal * Same here, this bio may be started from the middle of the 473eb0570c7SDamien Le Moal * 'bvec' because of bio splitting, so offset from the bvec 474eb0570c7SDamien Le Moal * must be passed to iov iterator 475eb0570c7SDamien Le Moal */ 476eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, 477eb0570c7SDamien Le Moal __bvec_iter_bvec(rq->bio->bi_io_vec, rq->bio->bi_iter), 478eb0570c7SDamien Le Moal nr_bvec, blk_rq_bytes(rq)); 479eb0570c7SDamien Le Moal iter.iov_offset = rq->bio->bi_iter.bi_bvec_done; 480eb0570c7SDamien Le Moal } 481eb0570c7SDamien Le Moal 482eb0570c7SDamien Le Moal cmd->iocb.ki_pos = (sector - zone->start) << SECTOR_SHIFT; 483eb0570c7SDamien Le Moal cmd->iocb.ki_filp = zone->file; 484eb0570c7SDamien Le Moal cmd->iocb.ki_complete = zloop_rw_complete; 485eb0570c7SDamien Le Moal if (!zlo->buffered_io) 486eb0570c7SDamien Le Moal cmd->iocb.ki_flags = IOCB_DIRECT; 487eb0570c7SDamien Le Moal cmd->iocb.ki_ioprio = IOPRIO_PRIO_VALUE(IOPRIO_CLASS_NONE, 0); 488eb0570c7SDamien Le Moal 489eb0570c7SDamien Le Moal if (rw == ITER_SOURCE) 490eb0570c7SDamien Le Moal ret = zone->file->f_op->write_iter(&cmd->iocb, &iter); 491eb0570c7SDamien Le Moal else 492eb0570c7SDamien Le Moal ret = zone->file->f_op->read_iter(&cmd->iocb, &iter); 493eb0570c7SDamien Le Moal unlock: 494eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_CONV, &zone->flags) && is_write) 495eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 496eb0570c7SDamien Le Moal out: 497eb0570c7SDamien Le Moal if (ret != -EIOCBQUEUED) 498eb0570c7SDamien Le Moal zloop_rw_complete(&cmd->iocb, ret); 499eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 500eb0570c7SDamien Le Moal } 501eb0570c7SDamien Le Moal 502eb0570c7SDamien Le Moal static void zloop_handle_cmd(struct zloop_cmd *cmd) 503eb0570c7SDamien Le Moal { 504eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 505eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 506eb0570c7SDamien Le Moal 507eb0570c7SDamien Le Moal switch (req_op(rq)) { 508eb0570c7SDamien Le Moal case REQ_OP_READ: 509eb0570c7SDamien Le Moal case REQ_OP_WRITE: 510eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 511eb0570c7SDamien Le Moal /* 512eb0570c7SDamien Le Moal * zloop_rw() always executes asynchronously or completes 513eb0570c7SDamien Le Moal * directly. 514eb0570c7SDamien Le Moal */ 515eb0570c7SDamien Le Moal zloop_rw(cmd); 516eb0570c7SDamien Le Moal return; 517eb0570c7SDamien Le Moal case REQ_OP_FLUSH: 518eb0570c7SDamien Le Moal /* 519eb0570c7SDamien Le Moal * Sync the entire FS containing the zone files instead of 520eb0570c7SDamien Le Moal * walking all files 521eb0570c7SDamien Le Moal */ 522eb0570c7SDamien Le Moal cmd->ret = sync_filesystem(file_inode(zlo->data_dir)->i_sb); 523eb0570c7SDamien Le Moal break; 524eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET: 525eb0570c7SDamien Le Moal cmd->ret = zloop_reset_zone(zlo, rq_zone_no(rq)); 526eb0570c7SDamien Le Moal break; 527eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET_ALL: 528eb0570c7SDamien Le Moal cmd->ret = zloop_reset_all_zones(zlo); 529eb0570c7SDamien Le Moal break; 530eb0570c7SDamien Le Moal case REQ_OP_ZONE_FINISH: 531eb0570c7SDamien Le Moal cmd->ret = zloop_finish_zone(zlo, rq_zone_no(rq)); 532eb0570c7SDamien Le Moal break; 533eb0570c7SDamien Le Moal case REQ_OP_ZONE_OPEN: 534eb0570c7SDamien Le Moal cmd->ret = zloop_open_zone(zlo, rq_zone_no(rq)); 535eb0570c7SDamien Le Moal break; 536eb0570c7SDamien Le Moal case REQ_OP_ZONE_CLOSE: 537eb0570c7SDamien Le Moal cmd->ret = zloop_close_zone(zlo, rq_zone_no(rq)); 538eb0570c7SDamien Le Moal break; 539eb0570c7SDamien Le Moal default: 540eb0570c7SDamien Le Moal WARN_ON_ONCE(1); 541eb0570c7SDamien Le Moal pr_err("Unsupported operation %d\n", req_op(rq)); 542eb0570c7SDamien Le Moal cmd->ret = -EOPNOTSUPP; 543eb0570c7SDamien Le Moal break; 544eb0570c7SDamien Le Moal } 545eb0570c7SDamien Le Moal 546eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 547eb0570c7SDamien Le Moal } 548eb0570c7SDamien Le Moal 549eb0570c7SDamien Le Moal static void zloop_cmd_workfn(struct work_struct *work) 550eb0570c7SDamien Le Moal { 551eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(work, struct zloop_cmd, work); 552eb0570c7SDamien Le Moal int orig_flags = current->flags; 553eb0570c7SDamien Le Moal 554eb0570c7SDamien Le Moal current->flags |= PF_LOCAL_THROTTLE | PF_MEMALLOC_NOIO; 555eb0570c7SDamien Le Moal zloop_handle_cmd(cmd); 556eb0570c7SDamien Le Moal current->flags = orig_flags; 557eb0570c7SDamien Le Moal } 558eb0570c7SDamien Le Moal 559eb0570c7SDamien Le Moal static void zloop_complete_rq(struct request *rq) 560eb0570c7SDamien Le Moal { 561eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 562eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 563eb0570c7SDamien Le Moal unsigned int zone_no = cmd->sector >> zlo->zone_shift; 564eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 565eb0570c7SDamien Le Moal blk_status_t sts = BLK_STS_OK; 566eb0570c7SDamien Le Moal 567eb0570c7SDamien Le Moal switch (req_op(rq)) { 568eb0570c7SDamien Le Moal case REQ_OP_READ: 569eb0570c7SDamien Le Moal if (cmd->ret < 0) 570eb0570c7SDamien Le Moal pr_err("Zone %u: failed read sector %llu, %llu sectors\n", 571eb0570c7SDamien Le Moal zone_no, cmd->sector, cmd->nr_sectors); 572eb0570c7SDamien Le Moal 573eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 574eb0570c7SDamien Le Moal /* short read */ 575eb0570c7SDamien Le Moal struct bio *bio; 576eb0570c7SDamien Le Moal 577eb0570c7SDamien Le Moal __rq_for_each_bio(bio, rq) 578eb0570c7SDamien Le Moal zero_fill_bio(bio); 579eb0570c7SDamien Le Moal } 580eb0570c7SDamien Le Moal break; 581eb0570c7SDamien Le Moal case REQ_OP_WRITE: 582eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 583eb0570c7SDamien Le Moal if (cmd->ret < 0) 584eb0570c7SDamien Le Moal pr_err("Zone %u: failed %swrite sector %llu, %llu sectors\n", 585eb0570c7SDamien Le Moal zone_no, 586eb0570c7SDamien Le Moal req_op(rq) == REQ_OP_WRITE ? "" : "append ", 587eb0570c7SDamien Le Moal cmd->sector, cmd->nr_sectors); 588eb0570c7SDamien Le Moal 589eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 590eb0570c7SDamien Le Moal pr_err("Zone %u: partial write %ld/%u B\n", 591eb0570c7SDamien Le Moal zone_no, cmd->ret, blk_rq_bytes(rq)); 592eb0570c7SDamien Le Moal cmd->ret = -EIO; 593eb0570c7SDamien Le Moal } 594eb0570c7SDamien Le Moal 595eb0570c7SDamien Le Moal if (cmd->ret < 0 && !test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 596eb0570c7SDamien Le Moal /* 597eb0570c7SDamien Le Moal * A write to a sequential zone file failed: mark the 598eb0570c7SDamien Le Moal * zone as having an error. This will be corrected and 599eb0570c7SDamien Le Moal * cleared when the next IO is submitted. 600eb0570c7SDamien Le Moal */ 601eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 602eb0570c7SDamien Le Moal break; 603eb0570c7SDamien Le Moal } 604eb0570c7SDamien Le Moal if (req_op(rq) == REQ_OP_ZONE_APPEND) 605eb0570c7SDamien Le Moal rq->__sector = cmd->sector; 606eb0570c7SDamien Le Moal 607eb0570c7SDamien Le Moal break; 608eb0570c7SDamien Le Moal default: 609eb0570c7SDamien Le Moal break; 610eb0570c7SDamien Le Moal } 611eb0570c7SDamien Le Moal 612eb0570c7SDamien Le Moal if (cmd->ret < 0) 613eb0570c7SDamien Le Moal sts = errno_to_blk_status(cmd->ret); 614eb0570c7SDamien Le Moal blk_mq_end_request(rq, sts); 615eb0570c7SDamien Le Moal } 616eb0570c7SDamien Le Moal 617eb0570c7SDamien Le Moal static blk_status_t zloop_queue_rq(struct blk_mq_hw_ctx *hctx, 618eb0570c7SDamien Le Moal const struct blk_mq_queue_data *bd) 619eb0570c7SDamien Le Moal { 620eb0570c7SDamien Le Moal struct request *rq = bd->rq; 621eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 622eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 623eb0570c7SDamien Le Moal 624eb0570c7SDamien Le Moal if (zlo->state == Zlo_deleting) 625eb0570c7SDamien Le Moal return BLK_STS_IOERR; 626eb0570c7SDamien Le Moal 627eb0570c7SDamien Le Moal blk_mq_start_request(rq); 628eb0570c7SDamien Le Moal 629eb0570c7SDamien Le Moal INIT_WORK(&cmd->work, zloop_cmd_workfn); 630eb0570c7SDamien Le Moal queue_work(zlo->workqueue, &cmd->work); 631eb0570c7SDamien Le Moal 632eb0570c7SDamien Le Moal return BLK_STS_OK; 633eb0570c7SDamien Le Moal } 634eb0570c7SDamien Le Moal 635eb0570c7SDamien Le Moal static const struct blk_mq_ops zloop_mq_ops = { 636eb0570c7SDamien Le Moal .queue_rq = zloop_queue_rq, 637eb0570c7SDamien Le Moal .complete = zloop_complete_rq, 638eb0570c7SDamien Le Moal }; 639eb0570c7SDamien Le Moal 640eb0570c7SDamien Le Moal static int zloop_open(struct gendisk *disk, blk_mode_t mode) 641eb0570c7SDamien Le Moal { 642eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 643eb0570c7SDamien Le Moal int ret; 644eb0570c7SDamien Le Moal 645eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 646eb0570c7SDamien Le Moal if (ret) 647eb0570c7SDamien Le Moal return ret; 648eb0570c7SDamien Le Moal 649eb0570c7SDamien Le Moal if (zlo->state != Zlo_live) 650eb0570c7SDamien Le Moal ret = -ENXIO; 651eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 652eb0570c7SDamien Le Moal return ret; 653eb0570c7SDamien Le Moal } 654eb0570c7SDamien Le Moal 655eb0570c7SDamien Le Moal static int zloop_report_zones(struct gendisk *disk, sector_t sector, 656fdb9aed8SDamien Le Moal unsigned int nr_zones, struct blk_report_zones_args *args) 657eb0570c7SDamien Le Moal { 658eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 659eb0570c7SDamien Le Moal struct blk_zone blkz = {}; 660eb0570c7SDamien Le Moal unsigned int first, i; 661eb0570c7SDamien Le Moal int ret; 662eb0570c7SDamien Le Moal 663eb0570c7SDamien Le Moal first = disk_zone_no(disk, sector); 664eb0570c7SDamien Le Moal if (first >= zlo->nr_zones) 665eb0570c7SDamien Le Moal return 0; 666eb0570c7SDamien Le Moal nr_zones = min(nr_zones, zlo->nr_zones - first); 667eb0570c7SDamien Le Moal 668eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 669eb0570c7SDamien Le Moal unsigned int zone_no = first + i; 670eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 671eb0570c7SDamien Le Moal 672eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 673eb0570c7SDamien Le Moal 674eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 675eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 676eb0570c7SDamien Le Moal if (ret) { 677eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 678eb0570c7SDamien Le Moal return ret; 679eb0570c7SDamien Le Moal } 680eb0570c7SDamien Le Moal } 681eb0570c7SDamien Le Moal 682eb0570c7SDamien Le Moal blkz.start = zone->start; 683eb0570c7SDamien Le Moal blkz.len = zlo->zone_size; 684eb0570c7SDamien Le Moal blkz.wp = zone->wp; 685eb0570c7SDamien Le Moal blkz.cond = zone->cond; 686eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 687eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_CONVENTIONAL; 688eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_size; 689eb0570c7SDamien Le Moal } else { 690eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_SEQWRITE_REQ; 691eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_capacity; 692eb0570c7SDamien Le Moal } 693eb0570c7SDamien Le Moal 694eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 695eb0570c7SDamien Le Moal 696fdb9aed8SDamien Le Moal ret = disk_report_zone(disk, &blkz, i, args); 697eb0570c7SDamien Le Moal if (ret) 698eb0570c7SDamien Le Moal return ret; 699eb0570c7SDamien Le Moal } 700eb0570c7SDamien Le Moal 701eb0570c7SDamien Le Moal return nr_zones; 702eb0570c7SDamien Le Moal } 703eb0570c7SDamien Le Moal 704eb0570c7SDamien Le Moal static void zloop_free_disk(struct gendisk *disk) 705eb0570c7SDamien Le Moal { 706eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 707eb0570c7SDamien Le Moal unsigned int i; 708eb0570c7SDamien Le Moal 70976576185SShin'ichiro Kawasaki blk_mq_free_tag_set(&zlo->tag_set); 71076576185SShin'ichiro Kawasaki 711eb0570c7SDamien Le Moal for (i = 0; i < zlo->nr_zones; i++) { 712eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[i]; 713eb0570c7SDamien Le Moal 714eb0570c7SDamien Le Moal mapping_set_gfp_mask(zone->file->f_mapping, 715eb0570c7SDamien Le Moal zone->old_gfp_mask); 716eb0570c7SDamien Le Moal fput(zone->file); 717eb0570c7SDamien Le Moal } 718eb0570c7SDamien Le Moal 719eb0570c7SDamien Le Moal fput(zlo->data_dir); 720eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 721eb0570c7SDamien Le Moal kfree(zlo->base_dir); 722eb0570c7SDamien Le Moal kvfree(zlo); 723eb0570c7SDamien Le Moal } 724eb0570c7SDamien Le Moal 725eb0570c7SDamien Le Moal static const struct block_device_operations zloop_fops = { 726eb0570c7SDamien Le Moal .owner = THIS_MODULE, 727eb0570c7SDamien Le Moal .open = zloop_open, 728eb0570c7SDamien Le Moal .report_zones = zloop_report_zones, 729eb0570c7SDamien Le Moal .free_disk = zloop_free_disk, 730eb0570c7SDamien Le Moal }; 731eb0570c7SDamien Le Moal 732eb0570c7SDamien Le Moal __printf(3, 4) 733eb0570c7SDamien Le Moal static struct file *zloop_filp_open_fmt(int oflags, umode_t mode, 734eb0570c7SDamien Le Moal const char *fmt, ...) 735eb0570c7SDamien Le Moal { 736eb0570c7SDamien Le Moal struct file *file; 737eb0570c7SDamien Le Moal va_list ap; 738eb0570c7SDamien Le Moal char *p; 739eb0570c7SDamien Le Moal 740eb0570c7SDamien Le Moal va_start(ap, fmt); 741eb0570c7SDamien Le Moal p = kvasprintf(GFP_KERNEL, fmt, ap); 742eb0570c7SDamien Le Moal va_end(ap); 743eb0570c7SDamien Le Moal 744eb0570c7SDamien Le Moal if (!p) 745eb0570c7SDamien Le Moal return ERR_PTR(-ENOMEM); 746eb0570c7SDamien Le Moal file = filp_open(p, oflags, mode); 747eb0570c7SDamien Le Moal kfree(p); 748eb0570c7SDamien Le Moal return file; 749eb0570c7SDamien Le Moal } 750eb0570c7SDamien Le Moal 751eb0570c7SDamien Le Moal static int zloop_get_block_size(struct zloop_device *zlo, 752eb0570c7SDamien Le Moal struct zloop_zone *zone) 753eb0570c7SDamien Le Moal { 754eb0570c7SDamien Le Moal struct block_device *sb_bdev = zone->file->f_mapping->host->i_sb->s_bdev; 755eb0570c7SDamien Le Moal struct kstat st; 756eb0570c7SDamien Le Moal 757eb0570c7SDamien Le Moal /* 758eb0570c7SDamien Le Moal * If the FS block size is lower than or equal to 4K, use that as the 759eb0570c7SDamien Le Moal * device block size. Otherwise, fallback to the FS direct IO alignment 760eb0570c7SDamien Le Moal * constraint if that is provided, and to the FS underlying device 761eb0570c7SDamien Le Moal * physical block size if the direct IO alignment is unknown. 762eb0570c7SDamien Le Moal */ 763eb0570c7SDamien Le Moal if (file_inode(zone->file)->i_sb->s_blocksize <= SZ_4K) 764eb0570c7SDamien Le Moal zlo->block_size = file_inode(zone->file)->i_sb->s_blocksize; 765eb0570c7SDamien Le Moal else if (!vfs_getattr(&zone->file->f_path, &st, STATX_DIOALIGN, 0) && 766eb0570c7SDamien Le Moal (st.result_mask & STATX_DIOALIGN)) 767eb0570c7SDamien Le Moal zlo->block_size = st.dio_offset_align; 768eb0570c7SDamien Le Moal else if (sb_bdev) 769eb0570c7SDamien Le Moal zlo->block_size = bdev_physical_block_size(sb_bdev); 770eb0570c7SDamien Le Moal else 771eb0570c7SDamien Le Moal zlo->block_size = SECTOR_SIZE; 772eb0570c7SDamien Le Moal 773eb0570c7SDamien Le Moal if (zlo->zone_capacity & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 774eb0570c7SDamien Le Moal pr_err("Zone capacity is not aligned to block size %u\n", 775eb0570c7SDamien Le Moal zlo->block_size); 776eb0570c7SDamien Le Moal return -EINVAL; 777eb0570c7SDamien Le Moal } 778eb0570c7SDamien Le Moal 779eb0570c7SDamien Le Moal return 0; 780eb0570c7SDamien Le Moal } 781eb0570c7SDamien Le Moal 782eb0570c7SDamien Le Moal static int zloop_init_zone(struct zloop_device *zlo, struct zloop_options *opts, 783eb0570c7SDamien Le Moal unsigned int zone_no, bool restore) 784eb0570c7SDamien Le Moal { 785eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 786eb0570c7SDamien Le Moal int oflags = O_RDWR; 787eb0570c7SDamien Le Moal struct kstat stat; 788eb0570c7SDamien Le Moal sector_t file_sectors; 789eb0570c7SDamien Le Moal int ret; 790eb0570c7SDamien Le Moal 791eb0570c7SDamien Le Moal mutex_init(&zone->lock); 792eb0570c7SDamien Le Moal zone->start = (sector_t)zone_no << zlo->zone_shift; 793eb0570c7SDamien Le Moal 794eb0570c7SDamien Le Moal if (!restore) 795eb0570c7SDamien Le Moal oflags |= O_CREAT; 796eb0570c7SDamien Le Moal 797eb0570c7SDamien Le Moal if (!opts->buffered_io) 798eb0570c7SDamien Le Moal oflags |= O_DIRECT; 799eb0570c7SDamien Le Moal 800eb0570c7SDamien Le Moal if (zone_no < zlo->nr_conv_zones) { 801eb0570c7SDamien Le Moal /* Conventional zone file. */ 802eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_CONV, &zone->flags); 803eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_NOT_WP; 804eb0570c7SDamien Le Moal zone->wp = U64_MAX; 805eb0570c7SDamien Le Moal 806eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/cnv-%06u", 807eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 808eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 809eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/cnv-%06u (err=%ld)", 810eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 811eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 812eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 813eb0570c7SDamien Le Moal } 814eb0570c7SDamien Le Moal 815eb0570c7SDamien Le Moal if (!zlo->block_size) { 816eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 817eb0570c7SDamien Le Moal if (ret) 818eb0570c7SDamien Le Moal return ret; 819eb0570c7SDamien Le Moal } 820eb0570c7SDamien Le Moal 821eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 822eb0570c7SDamien Le Moal if (ret < 0) { 823eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat\n", zone_no); 824eb0570c7SDamien Le Moal return ret; 825eb0570c7SDamien Le Moal } 826eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 827eb0570c7SDamien Le Moal 828eb0570c7SDamien Le Moal if (restore && file_sectors != zlo->zone_size) { 829eb0570c7SDamien Le Moal pr_err("Invalid conventional zone %u file size (%llu sectors != %llu)\n", 830eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 831eb0570c7SDamien Le Moal return ret; 832eb0570c7SDamien Le Moal } 833eb0570c7SDamien Le Moal 834eb0570c7SDamien Le Moal ret = vfs_truncate(&zone->file->f_path, 835eb0570c7SDamien Le Moal zlo->zone_size << SECTOR_SHIFT); 836eb0570c7SDamien Le Moal if (ret < 0) { 837eb0570c7SDamien Le Moal pr_err("Failed to truncate zone %u file (err=%d)\n", 838eb0570c7SDamien Le Moal zone_no, ret); 839eb0570c7SDamien Le Moal return ret; 840eb0570c7SDamien Le Moal } 841eb0570c7SDamien Le Moal 842eb0570c7SDamien Le Moal return 0; 843eb0570c7SDamien Le Moal } 844eb0570c7SDamien Le Moal 845eb0570c7SDamien Le Moal /* Sequential zone file. */ 846eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/seq-%06u", 847eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 848eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 849eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/seq-%06u (err=%ld)", 850eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 851eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 852eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 853eb0570c7SDamien Le Moal } 854eb0570c7SDamien Le Moal 855eb0570c7SDamien Le Moal if (!zlo->block_size) { 856eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 857eb0570c7SDamien Le Moal if (ret) 858eb0570c7SDamien Le Moal return ret; 859eb0570c7SDamien Le Moal } 860eb0570c7SDamien Le Moal 861eb0570c7SDamien Le Moal zloop_get_block_size(zlo, zone); 862eb0570c7SDamien Le Moal 863eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 864eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 865eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 866eb0570c7SDamien Le Moal 867eb0570c7SDamien Le Moal return ret; 868eb0570c7SDamien Le Moal } 869eb0570c7SDamien Le Moal 870eb0570c7SDamien Le Moal static bool zloop_dev_exists(struct zloop_device *zlo) 871eb0570c7SDamien Le Moal { 872eb0570c7SDamien Le Moal struct file *cnv, *seq; 873eb0570c7SDamien Le Moal bool exists; 874eb0570c7SDamien Le Moal 875eb0570c7SDamien Le Moal cnv = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/cnv-%06u", 876eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 877eb0570c7SDamien Le Moal seq = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/seq-%06u", 878eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 879eb0570c7SDamien Le Moal exists = !IS_ERR(cnv) || !IS_ERR(seq); 880eb0570c7SDamien Le Moal 881eb0570c7SDamien Le Moal if (!IS_ERR(cnv)) 882eb0570c7SDamien Le Moal fput(cnv); 883eb0570c7SDamien Le Moal if (!IS_ERR(seq)) 884eb0570c7SDamien Le Moal fput(seq); 885eb0570c7SDamien Le Moal 886eb0570c7SDamien Le Moal return exists; 887eb0570c7SDamien Le Moal } 888eb0570c7SDamien Le Moal 889eb0570c7SDamien Le Moal static int zloop_ctl_add(struct zloop_options *opts) 890eb0570c7SDamien Le Moal { 891eb0570c7SDamien Le Moal struct queue_limits lim = { 892eb0570c7SDamien Le Moal .max_hw_sectors = SZ_1M >> SECTOR_SHIFT, 893eb0570c7SDamien Le Moal .max_hw_zone_append_sectors = SZ_1M >> SECTOR_SHIFT, 894eb0570c7SDamien Le Moal .chunk_sectors = opts->zone_size, 895eb0570c7SDamien Le Moal .features = BLK_FEAT_ZONED, 896eb0570c7SDamien Le Moal }; 897eb0570c7SDamien Le Moal unsigned int nr_zones, i, j; 898eb0570c7SDamien Le Moal struct zloop_device *zlo; 899eb0570c7SDamien Le Moal int ret = -EINVAL; 900eb0570c7SDamien Le Moal bool restore; 901eb0570c7SDamien Le Moal 902eb0570c7SDamien Le Moal __module_get(THIS_MODULE); 903eb0570c7SDamien Le Moal 904eb0570c7SDamien Le Moal nr_zones = opts->capacity >> ilog2(opts->zone_size); 905eb0570c7SDamien Le Moal if (opts->nr_conv_zones >= nr_zones) { 906eb0570c7SDamien Le Moal pr_err("Invalid number of conventional zones %u\n", 907eb0570c7SDamien Le Moal opts->nr_conv_zones); 908eb0570c7SDamien Le Moal goto out; 909eb0570c7SDamien Le Moal } 910eb0570c7SDamien Le Moal 911eb0570c7SDamien Le Moal zlo = kvzalloc(struct_size(zlo, zones, nr_zones), GFP_KERNEL); 912eb0570c7SDamien Le Moal if (!zlo) { 913eb0570c7SDamien Le Moal ret = -ENOMEM; 914eb0570c7SDamien Le Moal goto out; 915eb0570c7SDamien Le Moal } 916eb0570c7SDamien Le Moal zlo->state = Zlo_creating; 917eb0570c7SDamien Le Moal 918eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 919eb0570c7SDamien Le Moal if (ret) 920eb0570c7SDamien Le Moal goto out_free_dev; 921eb0570c7SDamien Le Moal 922eb0570c7SDamien Le Moal /* Allocate id, if @opts->id >= 0, we're requesting that specific id */ 923eb0570c7SDamien Le Moal if (opts->id >= 0) { 924eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 925eb0570c7SDamien Le Moal opts->id, opts->id + 1, GFP_KERNEL); 926eb0570c7SDamien Le Moal if (ret == -ENOSPC) 927eb0570c7SDamien Le Moal ret = -EEXIST; 928eb0570c7SDamien Le Moal } else { 929eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 0, 0, GFP_KERNEL); 930eb0570c7SDamien Le Moal } 931eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 932eb0570c7SDamien Le Moal if (ret < 0) 933eb0570c7SDamien Le Moal goto out_free_dev; 934eb0570c7SDamien Le Moal 935eb0570c7SDamien Le Moal zlo->id = ret; 936eb0570c7SDamien Le Moal zlo->zone_shift = ilog2(opts->zone_size); 937eb0570c7SDamien Le Moal zlo->zone_size = opts->zone_size; 938eb0570c7SDamien Le Moal if (opts->zone_capacity) 939eb0570c7SDamien Le Moal zlo->zone_capacity = opts->zone_capacity; 940eb0570c7SDamien Le Moal else 941eb0570c7SDamien Le Moal zlo->zone_capacity = zlo->zone_size; 942eb0570c7SDamien Le Moal zlo->nr_zones = nr_zones; 943eb0570c7SDamien Le Moal zlo->nr_conv_zones = opts->nr_conv_zones; 944eb0570c7SDamien Le Moal zlo->buffered_io = opts->buffered_io; 945eb0570c7SDamien Le Moal 946eb0570c7SDamien Le Moal zlo->workqueue = alloc_workqueue("zloop%d", WQ_UNBOUND | WQ_FREEZABLE, 947eb0570c7SDamien Le Moal opts->nr_queues * opts->queue_depth, zlo->id); 948eb0570c7SDamien Le Moal if (!zlo->workqueue) { 949eb0570c7SDamien Le Moal ret = -ENOMEM; 950eb0570c7SDamien Le Moal goto out_free_idr; 951eb0570c7SDamien Le Moal } 952eb0570c7SDamien Le Moal 953eb0570c7SDamien Le Moal if (opts->base_dir) 954eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(opts->base_dir, GFP_KERNEL); 955eb0570c7SDamien Le Moal else 956eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(ZLOOP_DEF_BASE_DIR, GFP_KERNEL); 957eb0570c7SDamien Le Moal if (!zlo->base_dir) { 958eb0570c7SDamien Le Moal ret = -ENOMEM; 959eb0570c7SDamien Le Moal goto out_destroy_workqueue; 960eb0570c7SDamien Le Moal } 961eb0570c7SDamien Le Moal 962eb0570c7SDamien Le Moal zlo->data_dir = zloop_filp_open_fmt(O_RDONLY | O_DIRECTORY, 0, "%s/%u", 963eb0570c7SDamien Le Moal zlo->base_dir, zlo->id); 964eb0570c7SDamien Le Moal if (IS_ERR(zlo->data_dir)) { 965eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->data_dir); 966eb0570c7SDamien Le Moal pr_warn("Failed to open directory %s/%u (err=%d)\n", 967eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, ret); 968eb0570c7SDamien Le Moal goto out_free_base_dir; 969eb0570c7SDamien Le Moal } 970eb0570c7SDamien Le Moal 971eb0570c7SDamien Le Moal /* 972eb0570c7SDamien Le Moal * If we already have zone files, we are restoring a device created by a 973eb0570c7SDamien Le Moal * previous add operation. In this case, zloop_init_zone() will check 974eb0570c7SDamien Le Moal * that the zone files are consistent with the zone configuration given. 975eb0570c7SDamien Le Moal */ 976eb0570c7SDamien Le Moal restore = zloop_dev_exists(zlo); 977eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 978eb0570c7SDamien Le Moal ret = zloop_init_zone(zlo, opts, i, restore); 979eb0570c7SDamien Le Moal if (ret) 980eb0570c7SDamien Le Moal goto out_close_files; 981eb0570c7SDamien Le Moal } 982eb0570c7SDamien Le Moal 983eb0570c7SDamien Le Moal lim.physical_block_size = zlo->block_size; 984eb0570c7SDamien Le Moal lim.logical_block_size = zlo->block_size; 985eb0570c7SDamien Le Moal 986eb0570c7SDamien Le Moal zlo->tag_set.ops = &zloop_mq_ops; 987eb0570c7SDamien Le Moal zlo->tag_set.nr_hw_queues = opts->nr_queues; 988eb0570c7SDamien Le Moal zlo->tag_set.queue_depth = opts->queue_depth; 989eb0570c7SDamien Le Moal zlo->tag_set.numa_node = NUMA_NO_NODE; 990eb0570c7SDamien Le Moal zlo->tag_set.cmd_size = sizeof(struct zloop_cmd); 991eb0570c7SDamien Le Moal zlo->tag_set.driver_data = zlo; 992eb0570c7SDamien Le Moal 993eb0570c7SDamien Le Moal ret = blk_mq_alloc_tag_set(&zlo->tag_set); 994eb0570c7SDamien Le Moal if (ret) { 995eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_tag_set failed (err=%d)\n", ret); 996eb0570c7SDamien Le Moal goto out_close_files; 997eb0570c7SDamien Le Moal } 998eb0570c7SDamien Le Moal 999eb0570c7SDamien Le Moal zlo->disk = blk_mq_alloc_disk(&zlo->tag_set, &lim, zlo); 1000eb0570c7SDamien Le Moal if (IS_ERR(zlo->disk)) { 1001eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_disk failed (err=%d)\n", ret); 1002eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->disk); 1003eb0570c7SDamien Le Moal goto out_cleanup_tags; 1004eb0570c7SDamien Le Moal } 1005eb0570c7SDamien Le Moal zlo->disk->flags = GENHD_FL_NO_PART; 1006eb0570c7SDamien Le Moal zlo->disk->fops = &zloop_fops; 1007eb0570c7SDamien Le Moal zlo->disk->private_data = zlo; 1008eb0570c7SDamien Le Moal sprintf(zlo->disk->disk_name, "zloop%d", zlo->id); 1009eb0570c7SDamien Le Moal set_capacity(zlo->disk, (u64)lim.chunk_sectors * zlo->nr_zones); 1010eb0570c7SDamien Le Moal 1011eb0570c7SDamien Le Moal ret = blk_revalidate_disk_zones(zlo->disk); 1012eb0570c7SDamien Le Moal if (ret) 1013eb0570c7SDamien Le Moal goto out_cleanup_disk; 1014eb0570c7SDamien Le Moal 1015eb0570c7SDamien Le Moal ret = add_disk(zlo->disk); 1016eb0570c7SDamien Le Moal if (ret) { 1017eb0570c7SDamien Le Moal pr_err("add_disk failed (err=%d)\n", ret); 1018eb0570c7SDamien Le Moal goto out_cleanup_disk; 1019eb0570c7SDamien Le Moal } 1020eb0570c7SDamien Le Moal 1021eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 1022eb0570c7SDamien Le Moal zlo->state = Zlo_live; 1023eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1024eb0570c7SDamien Le Moal 1025eb0570c7SDamien Le Moal pr_info("Added device %d: %u zones of %llu MB, %u B block size\n", 1026eb0570c7SDamien Le Moal zlo->id, zlo->nr_zones, 1027eb0570c7SDamien Le Moal ((sector_t)zlo->zone_size << SECTOR_SHIFT) >> 20, 1028eb0570c7SDamien Le Moal zlo->block_size); 1029eb0570c7SDamien Le Moal 1030eb0570c7SDamien Le Moal return 0; 1031eb0570c7SDamien Le Moal 1032eb0570c7SDamien Le Moal out_cleanup_disk: 1033eb0570c7SDamien Le Moal put_disk(zlo->disk); 1034eb0570c7SDamien Le Moal out_cleanup_tags: 1035eb0570c7SDamien Le Moal blk_mq_free_tag_set(&zlo->tag_set); 1036eb0570c7SDamien Le Moal out_close_files: 1037eb0570c7SDamien Le Moal for (j = 0; j < i; j++) { 1038eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[j]; 1039eb0570c7SDamien Le Moal 1040eb0570c7SDamien Le Moal if (!IS_ERR_OR_NULL(zone->file)) 1041eb0570c7SDamien Le Moal fput(zone->file); 1042eb0570c7SDamien Le Moal } 1043eb0570c7SDamien Le Moal fput(zlo->data_dir); 1044eb0570c7SDamien Le Moal out_free_base_dir: 1045eb0570c7SDamien Le Moal kfree(zlo->base_dir); 1046eb0570c7SDamien Le Moal out_destroy_workqueue: 1047eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 1048eb0570c7SDamien Le Moal out_free_idr: 1049eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 1050eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 1051eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1052eb0570c7SDamien Le Moal out_free_dev: 1053eb0570c7SDamien Le Moal kvfree(zlo); 1054eb0570c7SDamien Le Moal out: 1055eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1056eb0570c7SDamien Le Moal if (ret == -ENOENT) 1057eb0570c7SDamien Le Moal ret = -EINVAL; 1058eb0570c7SDamien Le Moal return ret; 1059eb0570c7SDamien Le Moal } 1060eb0570c7SDamien Le Moal 1061eb0570c7SDamien Le Moal static int zloop_ctl_remove(struct zloop_options *opts) 1062eb0570c7SDamien Le Moal { 1063eb0570c7SDamien Le Moal struct zloop_device *zlo; 1064eb0570c7SDamien Le Moal int ret; 1065eb0570c7SDamien Le Moal 1066eb0570c7SDamien Le Moal if (!(opts->mask & ZLOOP_OPT_ID)) { 1067eb0570c7SDamien Le Moal pr_err("No ID specified\n"); 1068eb0570c7SDamien Le Moal return -EINVAL; 1069eb0570c7SDamien Le Moal } 1070eb0570c7SDamien Le Moal 1071eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 1072eb0570c7SDamien Le Moal if (ret) 1073eb0570c7SDamien Le Moal return ret; 1074eb0570c7SDamien Le Moal 1075eb0570c7SDamien Le Moal zlo = idr_find(&zloop_index_idr, opts->id); 1076eb0570c7SDamien Le Moal if (!zlo || zlo->state == Zlo_creating) { 1077eb0570c7SDamien Le Moal ret = -ENODEV; 1078eb0570c7SDamien Le Moal } else if (zlo->state == Zlo_deleting) { 1079eb0570c7SDamien Le Moal ret = -EINVAL; 1080eb0570c7SDamien Le Moal } else { 1081eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 1082eb0570c7SDamien Le Moal zlo->state = Zlo_deleting; 1083eb0570c7SDamien Le Moal } 1084eb0570c7SDamien Le Moal 1085eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1086eb0570c7SDamien Le Moal if (ret) 1087eb0570c7SDamien Le Moal return ret; 1088eb0570c7SDamien Le Moal 1089eb0570c7SDamien Le Moal del_gendisk(zlo->disk); 1090eb0570c7SDamien Le Moal put_disk(zlo->disk); 1091eb0570c7SDamien Le Moal 1092eb0570c7SDamien Le Moal pr_info("Removed device %d\n", opts->id); 1093eb0570c7SDamien Le Moal 1094eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1095eb0570c7SDamien Le Moal 1096eb0570c7SDamien Le Moal return 0; 1097eb0570c7SDamien Le Moal } 1098eb0570c7SDamien Le Moal 1099eb0570c7SDamien Le Moal static int zloop_parse_options(struct zloop_options *opts, const char *buf) 1100eb0570c7SDamien Le Moal { 1101eb0570c7SDamien Le Moal substring_t args[MAX_OPT_ARGS]; 1102eb0570c7SDamien Le Moal char *options, *o, *p; 1103eb0570c7SDamien Le Moal unsigned int token; 1104eb0570c7SDamien Le Moal int ret = 0; 1105eb0570c7SDamien Le Moal 1106eb0570c7SDamien Le Moal /* Set defaults. */ 1107eb0570c7SDamien Le Moal opts->mask = 0; 1108eb0570c7SDamien Le Moal opts->id = ZLOOP_DEF_ID; 1109eb0570c7SDamien Le Moal opts->capacity = ZLOOP_DEF_ZONE_SIZE * ZLOOP_DEF_NR_ZONES; 1110eb0570c7SDamien Le Moal opts->zone_size = ZLOOP_DEF_ZONE_SIZE; 1111eb0570c7SDamien Le Moal opts->nr_conv_zones = ZLOOP_DEF_NR_CONV_ZONES; 1112eb0570c7SDamien Le Moal opts->nr_queues = ZLOOP_DEF_NR_QUEUES; 1113eb0570c7SDamien Le Moal opts->queue_depth = ZLOOP_DEF_QUEUE_DEPTH; 1114eb0570c7SDamien Le Moal opts->buffered_io = ZLOOP_DEF_BUFFERED_IO; 1115eb0570c7SDamien Le Moal 1116eb0570c7SDamien Le Moal if (!buf) 1117eb0570c7SDamien Le Moal return 0; 1118eb0570c7SDamien Le Moal 1119eb0570c7SDamien Le Moal /* Skip leading spaces before the options. */ 1120eb0570c7SDamien Le Moal while (isspace(*buf)) 1121eb0570c7SDamien Le Moal buf++; 1122eb0570c7SDamien Le Moal 1123eb0570c7SDamien Le Moal options = o = kstrdup(buf, GFP_KERNEL); 1124eb0570c7SDamien Le Moal if (!options) 1125eb0570c7SDamien Le Moal return -ENOMEM; 1126eb0570c7SDamien Le Moal 1127eb0570c7SDamien Le Moal /* Parse the options, doing only some light invalid value checks. */ 1128eb0570c7SDamien Le Moal while ((p = strsep(&o, ",\n")) != NULL) { 1129eb0570c7SDamien Le Moal if (!*p) 1130eb0570c7SDamien Le Moal continue; 1131eb0570c7SDamien Le Moal 1132eb0570c7SDamien Le Moal token = match_token(p, zloop_opt_tokens, args); 1133eb0570c7SDamien Le Moal opts->mask |= token; 1134eb0570c7SDamien Le Moal switch (token) { 1135eb0570c7SDamien Le Moal case ZLOOP_OPT_ID: 1136eb0570c7SDamien Le Moal if (match_int(args, &opts->id)) { 1137eb0570c7SDamien Le Moal ret = -EINVAL; 1138eb0570c7SDamien Le Moal goto out; 1139eb0570c7SDamien Le Moal } 1140eb0570c7SDamien Le Moal break; 1141eb0570c7SDamien Le Moal case ZLOOP_OPT_CAPACITY: 1142eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1143eb0570c7SDamien Le Moal ret = -EINVAL; 1144eb0570c7SDamien Le Moal goto out; 1145eb0570c7SDamien Le Moal } 1146eb0570c7SDamien Le Moal if (!token) { 1147eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1148eb0570c7SDamien Le Moal ret = -EINVAL; 1149eb0570c7SDamien Le Moal goto out; 1150eb0570c7SDamien Le Moal } 1151eb0570c7SDamien Le Moal opts->capacity = 1152eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1153eb0570c7SDamien Le Moal break; 1154eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_SIZE: 1155eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1156eb0570c7SDamien Le Moal ret = -EINVAL; 1157eb0570c7SDamien Le Moal goto out; 1158eb0570c7SDamien Le Moal } 1159eb0570c7SDamien Le Moal if (!token || token > ZLOOP_MAX_ZONE_SIZE_MB || 1160eb0570c7SDamien Le Moal !is_power_of_2(token)) { 1161eb0570c7SDamien Le Moal pr_err("Invalid zone size %u\n", token); 1162eb0570c7SDamien Le Moal ret = -EINVAL; 1163eb0570c7SDamien Le Moal goto out; 1164eb0570c7SDamien Le Moal } 1165eb0570c7SDamien Le Moal opts->zone_size = 1166eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1167eb0570c7SDamien Le Moal break; 1168eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_CAPACITY: 1169eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1170eb0570c7SDamien Le Moal ret = -EINVAL; 1171eb0570c7SDamien Le Moal goto out; 1172eb0570c7SDamien Le Moal } 1173eb0570c7SDamien Le Moal if (!token) { 1174eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1175eb0570c7SDamien Le Moal ret = -EINVAL; 1176eb0570c7SDamien Le Moal goto out; 1177eb0570c7SDamien Le Moal } 1178eb0570c7SDamien Le Moal opts->zone_capacity = 1179eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1180eb0570c7SDamien Le Moal break; 1181eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_CONV_ZONES: 1182eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1183eb0570c7SDamien Le Moal ret = -EINVAL; 1184eb0570c7SDamien Le Moal goto out; 1185eb0570c7SDamien Le Moal } 1186eb0570c7SDamien Le Moal opts->nr_conv_zones = token; 1187eb0570c7SDamien Le Moal break; 1188eb0570c7SDamien Le Moal case ZLOOP_OPT_BASE_DIR: 1189eb0570c7SDamien Le Moal p = match_strdup(args); 1190eb0570c7SDamien Le Moal if (!p) { 1191eb0570c7SDamien Le Moal ret = -ENOMEM; 1192eb0570c7SDamien Le Moal goto out; 1193eb0570c7SDamien Le Moal } 1194eb0570c7SDamien Le Moal kfree(opts->base_dir); 1195eb0570c7SDamien Le Moal opts->base_dir = p; 1196eb0570c7SDamien Le Moal break; 1197eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_QUEUES: 1198eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1199eb0570c7SDamien Le Moal ret = -EINVAL; 1200eb0570c7SDamien Le Moal goto out; 1201eb0570c7SDamien Le Moal } 1202eb0570c7SDamien Le Moal if (!token) { 1203eb0570c7SDamien Le Moal pr_err("Invalid number of queues\n"); 1204eb0570c7SDamien Le Moal ret = -EINVAL; 1205eb0570c7SDamien Le Moal goto out; 1206eb0570c7SDamien Le Moal } 1207eb0570c7SDamien Le Moal opts->nr_queues = min(token, num_online_cpus()); 1208eb0570c7SDamien Le Moal break; 1209eb0570c7SDamien Le Moal case ZLOOP_OPT_QUEUE_DEPTH: 1210eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1211eb0570c7SDamien Le Moal ret = -EINVAL; 1212eb0570c7SDamien Le Moal goto out; 1213eb0570c7SDamien Le Moal } 1214eb0570c7SDamien Le Moal if (!token) { 1215eb0570c7SDamien Le Moal pr_err("Invalid queue depth\n"); 1216eb0570c7SDamien Le Moal ret = -EINVAL; 1217eb0570c7SDamien Le Moal goto out; 1218eb0570c7SDamien Le Moal } 1219eb0570c7SDamien Le Moal opts->queue_depth = token; 1220eb0570c7SDamien Le Moal break; 1221eb0570c7SDamien Le Moal case ZLOOP_OPT_BUFFERED_IO: 1222eb0570c7SDamien Le Moal opts->buffered_io = true; 1223eb0570c7SDamien Le Moal break; 1224eb0570c7SDamien Le Moal case ZLOOP_OPT_ERR: 1225eb0570c7SDamien Le Moal default: 1226eb0570c7SDamien Le Moal pr_warn("unknown parameter or missing value '%s'\n", p); 1227eb0570c7SDamien Le Moal ret = -EINVAL; 1228eb0570c7SDamien Le Moal goto out; 1229eb0570c7SDamien Le Moal } 1230eb0570c7SDamien Le Moal } 1231eb0570c7SDamien Le Moal 1232eb0570c7SDamien Le Moal ret = -EINVAL; 1233eb0570c7SDamien Le Moal if (opts->capacity <= opts->zone_size) { 1234eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1235eb0570c7SDamien Le Moal goto out; 1236eb0570c7SDamien Le Moal } 1237eb0570c7SDamien Le Moal 1238eb0570c7SDamien Le Moal if (opts->zone_capacity > opts->zone_size) { 1239eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1240eb0570c7SDamien Le Moal goto out; 1241eb0570c7SDamien Le Moal } 1242eb0570c7SDamien Le Moal 1243eb0570c7SDamien Le Moal ret = 0; 1244eb0570c7SDamien Le Moal out: 1245eb0570c7SDamien Le Moal kfree(options); 1246eb0570c7SDamien Le Moal return ret; 1247eb0570c7SDamien Le Moal } 1248eb0570c7SDamien Le Moal 1249eb0570c7SDamien Le Moal enum { 1250eb0570c7SDamien Le Moal ZLOOP_CTL_ADD, 1251eb0570c7SDamien Le Moal ZLOOP_CTL_REMOVE, 1252eb0570c7SDamien Le Moal }; 1253eb0570c7SDamien Le Moal 1254eb0570c7SDamien Le Moal static struct zloop_ctl_op { 1255eb0570c7SDamien Le Moal int code; 1256eb0570c7SDamien Le Moal const char *name; 1257eb0570c7SDamien Le Moal } zloop_ctl_ops[] = { 1258eb0570c7SDamien Le Moal { ZLOOP_CTL_ADD, "add" }, 1259eb0570c7SDamien Le Moal { ZLOOP_CTL_REMOVE, "remove" }, 1260eb0570c7SDamien Le Moal { -1, NULL }, 1261eb0570c7SDamien Le Moal }; 1262eb0570c7SDamien Le Moal 1263eb0570c7SDamien Le Moal static ssize_t zloop_ctl_write(struct file *file, const char __user *ubuf, 1264eb0570c7SDamien Le Moal size_t count, loff_t *pos) 1265eb0570c7SDamien Le Moal { 1266eb0570c7SDamien Le Moal struct zloop_options opts = { }; 1267eb0570c7SDamien Le Moal struct zloop_ctl_op *op; 1268eb0570c7SDamien Le Moal const char *buf, *opts_buf; 1269eb0570c7SDamien Le Moal int i, ret; 1270eb0570c7SDamien Le Moal 1271eb0570c7SDamien Le Moal if (count > PAGE_SIZE) 1272eb0570c7SDamien Le Moal return -ENOMEM; 1273eb0570c7SDamien Le Moal 1274eb0570c7SDamien Le Moal buf = memdup_user_nul(ubuf, count); 1275eb0570c7SDamien Le Moal if (IS_ERR(buf)) 1276eb0570c7SDamien Le Moal return PTR_ERR(buf); 1277eb0570c7SDamien Le Moal 1278eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_ctl_ops); i++) { 1279eb0570c7SDamien Le Moal op = &zloop_ctl_ops[i]; 1280eb0570c7SDamien Le Moal if (!op->name) { 1281eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1282eb0570c7SDamien Le Moal ret = -EINVAL; 1283eb0570c7SDamien Le Moal goto out; 1284eb0570c7SDamien Le Moal } 1285eb0570c7SDamien Le Moal if (!strncmp(buf, op->name, strlen(op->name))) 1286eb0570c7SDamien Le Moal break; 1287eb0570c7SDamien Le Moal } 1288eb0570c7SDamien Le Moal 1289eb0570c7SDamien Le Moal if (count <= strlen(op->name)) 1290eb0570c7SDamien Le Moal opts_buf = NULL; 1291eb0570c7SDamien Le Moal else 1292eb0570c7SDamien Le Moal opts_buf = buf + strlen(op->name); 1293eb0570c7SDamien Le Moal 1294eb0570c7SDamien Le Moal ret = zloop_parse_options(&opts, opts_buf); 1295eb0570c7SDamien Le Moal if (ret) { 1296eb0570c7SDamien Le Moal pr_err("Failed to parse options\n"); 1297eb0570c7SDamien Le Moal goto out; 1298eb0570c7SDamien Le Moal } 1299eb0570c7SDamien Le Moal 1300eb0570c7SDamien Le Moal switch (op->code) { 1301eb0570c7SDamien Le Moal case ZLOOP_CTL_ADD: 1302eb0570c7SDamien Le Moal ret = zloop_ctl_add(&opts); 1303eb0570c7SDamien Le Moal break; 1304eb0570c7SDamien Le Moal case ZLOOP_CTL_REMOVE: 1305eb0570c7SDamien Le Moal ret = zloop_ctl_remove(&opts); 1306eb0570c7SDamien Le Moal break; 1307eb0570c7SDamien Le Moal default: 1308eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1309eb0570c7SDamien Le Moal ret = -EINVAL; 1310eb0570c7SDamien Le Moal goto out; 1311eb0570c7SDamien Le Moal } 1312eb0570c7SDamien Le Moal 1313eb0570c7SDamien Le Moal out: 1314eb0570c7SDamien Le Moal kfree(opts.base_dir); 1315eb0570c7SDamien Le Moal kfree(buf); 1316eb0570c7SDamien Le Moal return ret ? ret : count; 1317eb0570c7SDamien Le Moal } 1318eb0570c7SDamien Le Moal 1319eb0570c7SDamien Le Moal static int zloop_ctl_show(struct seq_file *seq_file, void *private) 1320eb0570c7SDamien Le Moal { 1321eb0570c7SDamien Le Moal const struct match_token *tok; 1322eb0570c7SDamien Le Moal int i; 1323eb0570c7SDamien Le Moal 1324eb0570c7SDamien Le Moal /* Add operation */ 1325eb0570c7SDamien Le Moal seq_printf(seq_file, "%s ", zloop_ctl_ops[0].name); 1326eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_opt_tokens); i++) { 1327eb0570c7SDamien Le Moal tok = &zloop_opt_tokens[i]; 1328eb0570c7SDamien Le Moal if (!tok->pattern) 1329eb0570c7SDamien Le Moal break; 1330eb0570c7SDamien Le Moal if (i) 1331eb0570c7SDamien Le Moal seq_putc(seq_file, ','); 1332eb0570c7SDamien Le Moal seq_puts(seq_file, tok->pattern); 1333eb0570c7SDamien Le Moal } 1334eb0570c7SDamien Le Moal seq_putc(seq_file, '\n'); 1335eb0570c7SDamien Le Moal 1336eb0570c7SDamien Le Moal /* Remove operation */ 1337eb0570c7SDamien Le Moal seq_puts(seq_file, zloop_ctl_ops[1].name); 1338eb0570c7SDamien Le Moal seq_puts(seq_file, " id=%d\n"); 1339eb0570c7SDamien Le Moal 1340eb0570c7SDamien Le Moal return 0; 1341eb0570c7SDamien Le Moal } 1342eb0570c7SDamien Le Moal 1343eb0570c7SDamien Le Moal static int zloop_ctl_open(struct inode *inode, struct file *file) 1344eb0570c7SDamien Le Moal { 1345eb0570c7SDamien Le Moal file->private_data = NULL; 1346eb0570c7SDamien Le Moal return single_open(file, zloop_ctl_show, NULL); 1347eb0570c7SDamien Le Moal } 1348eb0570c7SDamien Le Moal 1349eb0570c7SDamien Le Moal static int zloop_ctl_release(struct inode *inode, struct file *file) 1350eb0570c7SDamien Le Moal { 1351eb0570c7SDamien Le Moal return single_release(inode, file); 1352eb0570c7SDamien Le Moal } 1353eb0570c7SDamien Le Moal 1354eb0570c7SDamien Le Moal static const struct file_operations zloop_ctl_fops = { 1355eb0570c7SDamien Le Moal .owner = THIS_MODULE, 1356eb0570c7SDamien Le Moal .open = zloop_ctl_open, 1357eb0570c7SDamien Le Moal .release = zloop_ctl_release, 1358eb0570c7SDamien Le Moal .write = zloop_ctl_write, 1359eb0570c7SDamien Le Moal .read = seq_read, 1360eb0570c7SDamien Le Moal }; 1361eb0570c7SDamien Le Moal 1362eb0570c7SDamien Le Moal static struct miscdevice zloop_misc = { 1363eb0570c7SDamien Le Moal .minor = MISC_DYNAMIC_MINOR, 1364eb0570c7SDamien Le Moal .name = "zloop-control", 1365eb0570c7SDamien Le Moal .fops = &zloop_ctl_fops, 1366eb0570c7SDamien Le Moal }; 1367eb0570c7SDamien Le Moal 1368eb0570c7SDamien Le Moal static int __init zloop_init(void) 1369eb0570c7SDamien Le Moal { 1370eb0570c7SDamien Le Moal int ret; 1371eb0570c7SDamien Le Moal 1372eb0570c7SDamien Le Moal ret = misc_register(&zloop_misc); 1373eb0570c7SDamien Le Moal if (ret) { 1374eb0570c7SDamien Le Moal pr_err("Failed to register misc device: %d\n", ret); 1375eb0570c7SDamien Le Moal return ret; 1376eb0570c7SDamien Le Moal } 1377eb0570c7SDamien Le Moal pr_info("Module loaded\n"); 1378eb0570c7SDamien Le Moal 1379eb0570c7SDamien Le Moal return 0; 1380eb0570c7SDamien Le Moal } 1381eb0570c7SDamien Le Moal 1382eb0570c7SDamien Le Moal static void __exit zloop_exit(void) 1383eb0570c7SDamien Le Moal { 1384eb0570c7SDamien Le Moal misc_deregister(&zloop_misc); 1385eb0570c7SDamien Le Moal idr_destroy(&zloop_index_idr); 1386eb0570c7SDamien Le Moal } 1387eb0570c7SDamien Le Moal 1388eb0570c7SDamien Le Moal module_init(zloop_init); 1389eb0570c7SDamien Le Moal module_exit(zloop_exit); 1390eb0570c7SDamien Le Moal 1391eb0570c7SDamien Le Moal MODULE_DESCRIPTION("Zoned loopback device"); 1392eb0570c7SDamien Le Moal MODULE_LICENSE("GPL"); 1393