1eb0570c7SDamien Le Moal // SPDX-License-Identifier: GPL-2.0-only 2eb0570c7SDamien Le Moal /* 3eb0570c7SDamien Le Moal * Copyright (c) 2025, Christoph Hellwig. 4eb0570c7SDamien Le Moal * Copyright (c) 2025, Western Digital Corporation or its affiliates. 5eb0570c7SDamien Le Moal * 6eb0570c7SDamien Le Moal * Zoned Loop Device driver - exports a zoned block device using one file per 7eb0570c7SDamien Le Moal * zone as backing storage. 8eb0570c7SDamien Le Moal */ 9eb0570c7SDamien Le Moal #define pr_fmt(fmt) KBUILD_MODNAME ": " fmt 10eb0570c7SDamien Le Moal 11eb0570c7SDamien Le Moal #include <linux/module.h> 12eb0570c7SDamien Le Moal #include <linux/blk-mq.h> 13eb0570c7SDamien Le Moal #include <linux/blkzoned.h> 14eb0570c7SDamien Le Moal #include <linux/pagemap.h> 15eb0570c7SDamien Le Moal #include <linux/miscdevice.h> 16eb0570c7SDamien Le Moal #include <linux/falloc.h> 17eb0570c7SDamien Le Moal #include <linux/mutex.h> 18eb0570c7SDamien Le Moal #include <linux/parser.h> 19eb0570c7SDamien Le Moal #include <linux/seq_file.h> 20eb0570c7SDamien Le Moal 21eb0570c7SDamien Le Moal /* 22eb0570c7SDamien Le Moal * Options for adding (and removing) a device. 23eb0570c7SDamien Le Moal */ 24eb0570c7SDamien Le Moal enum { 25eb0570c7SDamien Le Moal ZLOOP_OPT_ERR = 0, 26eb0570c7SDamien Le Moal ZLOOP_OPT_ID = (1 << 0), 27eb0570c7SDamien Le Moal ZLOOP_OPT_CAPACITY = (1 << 1), 28eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_SIZE = (1 << 2), 29eb0570c7SDamien Le Moal ZLOOP_OPT_ZONE_CAPACITY = (1 << 3), 30eb0570c7SDamien Le Moal ZLOOP_OPT_NR_CONV_ZONES = (1 << 4), 31eb0570c7SDamien Le Moal ZLOOP_OPT_BASE_DIR = (1 << 5), 32eb0570c7SDamien Le Moal ZLOOP_OPT_NR_QUEUES = (1 << 6), 33eb0570c7SDamien Le Moal ZLOOP_OPT_QUEUE_DEPTH = (1 << 7), 34eb0570c7SDamien Le Moal ZLOOP_OPT_BUFFERED_IO = (1 << 8), 35eb0570c7SDamien Le Moal }; 36eb0570c7SDamien Le Moal 37eb0570c7SDamien Le Moal static const match_table_t zloop_opt_tokens = { 38eb0570c7SDamien Le Moal { ZLOOP_OPT_ID, "id=%d" }, 39eb0570c7SDamien Le Moal { ZLOOP_OPT_CAPACITY, "capacity_mb=%u" }, 40eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_SIZE, "zone_size_mb=%u" }, 41eb0570c7SDamien Le Moal { ZLOOP_OPT_ZONE_CAPACITY, "zone_capacity_mb=%u" }, 42eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_CONV_ZONES, "conv_zones=%u" }, 43eb0570c7SDamien Le Moal { ZLOOP_OPT_BASE_DIR, "base_dir=%s" }, 44eb0570c7SDamien Le Moal { ZLOOP_OPT_NR_QUEUES, "nr_queues=%u" }, 45eb0570c7SDamien Le Moal { ZLOOP_OPT_QUEUE_DEPTH, "queue_depth=%u" }, 46eb0570c7SDamien Le Moal { ZLOOP_OPT_BUFFERED_IO, "buffered_io" }, 47eb0570c7SDamien Le Moal { ZLOOP_OPT_ERR, NULL } 48eb0570c7SDamien Le Moal }; 49eb0570c7SDamien Le Moal 50eb0570c7SDamien Le Moal /* Default values for the "add" operation. */ 51eb0570c7SDamien Le Moal #define ZLOOP_DEF_ID -1 52eb0570c7SDamien Le Moal #define ZLOOP_DEF_ZONE_SIZE ((256ULL * SZ_1M) >> SECTOR_SHIFT) 53eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_ZONES 64 54eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_CONV_ZONES 8 55eb0570c7SDamien Le Moal #define ZLOOP_DEF_BASE_DIR "/var/local/zloop" 56eb0570c7SDamien Le Moal #define ZLOOP_DEF_NR_QUEUES 1 57eb0570c7SDamien Le Moal #define ZLOOP_DEF_QUEUE_DEPTH 128 58eb0570c7SDamien Le Moal #define ZLOOP_DEF_BUFFERED_IO false 59eb0570c7SDamien Le Moal 60eb0570c7SDamien Le Moal /* Arbitrary limit on the zone size (16GB). */ 61eb0570c7SDamien Le Moal #define ZLOOP_MAX_ZONE_SIZE_MB 16384 62eb0570c7SDamien Le Moal 63eb0570c7SDamien Le Moal struct zloop_options { 64eb0570c7SDamien Le Moal unsigned int mask; 65eb0570c7SDamien Le Moal int id; 66eb0570c7SDamien Le Moal sector_t capacity; 67eb0570c7SDamien Le Moal sector_t zone_size; 68eb0570c7SDamien Le Moal sector_t zone_capacity; 69eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 70eb0570c7SDamien Le Moal char *base_dir; 71eb0570c7SDamien Le Moal unsigned int nr_queues; 72eb0570c7SDamien Le Moal unsigned int queue_depth; 73eb0570c7SDamien Le Moal bool buffered_io; 74eb0570c7SDamien Le Moal }; 75eb0570c7SDamien Le Moal 76eb0570c7SDamien Le Moal /* 77eb0570c7SDamien Le Moal * Device states. 78eb0570c7SDamien Le Moal */ 79eb0570c7SDamien Le Moal enum { 80eb0570c7SDamien Le Moal Zlo_creating = 0, 81eb0570c7SDamien Le Moal Zlo_live, 82eb0570c7SDamien Le Moal Zlo_deleting, 83eb0570c7SDamien Le Moal }; 84eb0570c7SDamien Le Moal 85eb0570c7SDamien Le Moal enum zloop_zone_flags { 86eb0570c7SDamien Le Moal ZLOOP_ZONE_CONV = 0, 87eb0570c7SDamien Le Moal ZLOOP_ZONE_SEQ_ERROR, 88eb0570c7SDamien Le Moal }; 89eb0570c7SDamien Le Moal 90eb0570c7SDamien Le Moal struct zloop_zone { 91eb0570c7SDamien Le Moal struct file *file; 92eb0570c7SDamien Le Moal 93eb0570c7SDamien Le Moal unsigned long flags; 94eb0570c7SDamien Le Moal struct mutex lock; 95eb0570c7SDamien Le Moal enum blk_zone_cond cond; 96eb0570c7SDamien Le Moal sector_t start; 97eb0570c7SDamien Le Moal sector_t wp; 98eb0570c7SDamien Le Moal 99eb0570c7SDamien Le Moal gfp_t old_gfp_mask; 100eb0570c7SDamien Le Moal }; 101eb0570c7SDamien Le Moal 102eb0570c7SDamien Le Moal struct zloop_device { 103eb0570c7SDamien Le Moal unsigned int id; 104eb0570c7SDamien Le Moal unsigned int state; 105eb0570c7SDamien Le Moal 106eb0570c7SDamien Le Moal struct blk_mq_tag_set tag_set; 107eb0570c7SDamien Le Moal struct gendisk *disk; 108eb0570c7SDamien Le Moal 109eb0570c7SDamien Le Moal struct workqueue_struct *workqueue; 110eb0570c7SDamien Le Moal bool buffered_io; 111eb0570c7SDamien Le Moal 112eb0570c7SDamien Le Moal const char *base_dir; 113eb0570c7SDamien Le Moal struct file *data_dir; 114eb0570c7SDamien Le Moal 115eb0570c7SDamien Le Moal unsigned int zone_shift; 116eb0570c7SDamien Le Moal sector_t zone_size; 117eb0570c7SDamien Le Moal sector_t zone_capacity; 118eb0570c7SDamien Le Moal unsigned int nr_zones; 119eb0570c7SDamien Le Moal unsigned int nr_conv_zones; 120eb0570c7SDamien Le Moal unsigned int block_size; 121eb0570c7SDamien Le Moal 122eb0570c7SDamien Le Moal struct zloop_zone zones[] __counted_by(nr_zones); 123eb0570c7SDamien Le Moal }; 124eb0570c7SDamien Le Moal 125eb0570c7SDamien Le Moal struct zloop_cmd { 126eb0570c7SDamien Le Moal struct work_struct work; 127eb0570c7SDamien Le Moal atomic_t ref; 128eb0570c7SDamien Le Moal sector_t sector; 129eb0570c7SDamien Le Moal sector_t nr_sectors; 130eb0570c7SDamien Le Moal long ret; 131eb0570c7SDamien Le Moal struct kiocb iocb; 132eb0570c7SDamien Le Moal struct bio_vec *bvec; 133eb0570c7SDamien Le Moal }; 134eb0570c7SDamien Le Moal 135eb0570c7SDamien Le Moal static DEFINE_IDR(zloop_index_idr); 136eb0570c7SDamien Le Moal static DEFINE_MUTEX(zloop_ctl_mutex); 137eb0570c7SDamien Le Moal 138eb0570c7SDamien Le Moal static unsigned int rq_zone_no(struct request *rq) 139eb0570c7SDamien Le Moal { 140eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 141eb0570c7SDamien Le Moal 142eb0570c7SDamien Le Moal return blk_rq_pos(rq) >> zlo->zone_shift; 143eb0570c7SDamien Le Moal } 144eb0570c7SDamien Le Moal 145eb0570c7SDamien Le Moal static int zloop_update_seq_zone(struct zloop_device *zlo, unsigned int zone_no) 146eb0570c7SDamien Le Moal { 147eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 148eb0570c7SDamien Le Moal struct kstat stat; 149eb0570c7SDamien Le Moal sector_t file_sectors; 150eb0570c7SDamien Le Moal int ret; 151eb0570c7SDamien Le Moal 152eb0570c7SDamien Le Moal lockdep_assert_held(&zone->lock); 153eb0570c7SDamien Le Moal 154eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 155eb0570c7SDamien Le Moal if (ret < 0) { 156eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat (err=%d)\n", 157eb0570c7SDamien Le Moal zone_no, ret); 158eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 159eb0570c7SDamien Le Moal return ret; 160eb0570c7SDamien Le Moal } 161eb0570c7SDamien Le Moal 162eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 163eb0570c7SDamien Le Moal if (file_sectors > zlo->zone_capacity) { 164eb0570c7SDamien Le Moal pr_err("Zone %u file too large (%llu sectors > %llu)\n", 165eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 166eb0570c7SDamien Le Moal return -EINVAL; 167eb0570c7SDamien Le Moal } 168eb0570c7SDamien Le Moal 169eb0570c7SDamien Le Moal if (file_sectors & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 170eb0570c7SDamien Le Moal pr_err("Zone %u file size not aligned to block size %u\n", 171eb0570c7SDamien Le Moal zone_no, zlo->block_size); 172eb0570c7SDamien Le Moal return -EINVAL; 173eb0570c7SDamien Le Moal } 174eb0570c7SDamien Le Moal 175eb0570c7SDamien Le Moal if (!file_sectors) { 176eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 177eb0570c7SDamien Le Moal zone->wp = zone->start; 178eb0570c7SDamien Le Moal } else if (file_sectors == zlo->zone_capacity) { 179eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 180eb0570c7SDamien Le Moal zone->wp = zone->start + zlo->zone_size; 181eb0570c7SDamien Le Moal } else { 182eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 183eb0570c7SDamien Le Moal zone->wp = zone->start + file_sectors; 184eb0570c7SDamien Le Moal } 185eb0570c7SDamien Le Moal 186eb0570c7SDamien Le Moal return 0; 187eb0570c7SDamien Le Moal } 188eb0570c7SDamien Le Moal 189eb0570c7SDamien Le Moal static int zloop_open_zone(struct zloop_device *zlo, unsigned int zone_no) 190eb0570c7SDamien Le Moal { 191eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 192eb0570c7SDamien Le Moal int ret = 0; 193eb0570c7SDamien Le Moal 194eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 195eb0570c7SDamien Le Moal return -EIO; 196eb0570c7SDamien Le Moal 197eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 198eb0570c7SDamien Le Moal 199eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 200eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 201eb0570c7SDamien Le Moal if (ret) 202eb0570c7SDamien Le Moal goto unlock; 203eb0570c7SDamien Le Moal } 204eb0570c7SDamien Le Moal 205eb0570c7SDamien Le Moal switch (zone->cond) { 206eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 207eb0570c7SDamien Le Moal break; 208eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 209eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 210eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 211eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EXP_OPEN; 212eb0570c7SDamien Le Moal break; 213eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 214eb0570c7SDamien Le Moal default: 215eb0570c7SDamien Le Moal ret = -EIO; 216eb0570c7SDamien Le Moal break; 217eb0570c7SDamien Le Moal } 218eb0570c7SDamien Le Moal 219eb0570c7SDamien Le Moal unlock: 220eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 221eb0570c7SDamien Le Moal 222eb0570c7SDamien Le Moal return ret; 223eb0570c7SDamien Le Moal } 224eb0570c7SDamien Le Moal 225eb0570c7SDamien Le Moal static int zloop_close_zone(struct zloop_device *zlo, unsigned int zone_no) 226eb0570c7SDamien Le Moal { 227eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 228eb0570c7SDamien Le Moal int ret = 0; 229eb0570c7SDamien Le Moal 230eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 231eb0570c7SDamien Le Moal return -EIO; 232eb0570c7SDamien Le Moal 233eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 234eb0570c7SDamien Le Moal 235eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 236eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 237eb0570c7SDamien Le Moal if (ret) 238eb0570c7SDamien Le Moal goto unlock; 239eb0570c7SDamien Le Moal } 240eb0570c7SDamien Le Moal 241eb0570c7SDamien Le Moal switch (zone->cond) { 242eb0570c7SDamien Le Moal case BLK_ZONE_COND_CLOSED: 243eb0570c7SDamien Le Moal break; 244eb0570c7SDamien Le Moal case BLK_ZONE_COND_IMP_OPEN: 245eb0570c7SDamien Le Moal case BLK_ZONE_COND_EXP_OPEN: 246eb0570c7SDamien Le Moal if (zone->wp == zone->start) 247eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 248eb0570c7SDamien Le Moal else 249eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_CLOSED; 250eb0570c7SDamien Le Moal break; 251eb0570c7SDamien Le Moal case BLK_ZONE_COND_EMPTY: 252eb0570c7SDamien Le Moal case BLK_ZONE_COND_FULL: 253eb0570c7SDamien Le Moal default: 254eb0570c7SDamien Le Moal ret = -EIO; 255eb0570c7SDamien Le Moal break; 256eb0570c7SDamien Le Moal } 257eb0570c7SDamien Le Moal 258eb0570c7SDamien Le Moal unlock: 259eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 260eb0570c7SDamien Le Moal 261eb0570c7SDamien Le Moal return ret; 262eb0570c7SDamien Le Moal } 263eb0570c7SDamien Le Moal 264eb0570c7SDamien Le Moal static int zloop_reset_zone(struct zloop_device *zlo, unsigned int zone_no) 265eb0570c7SDamien Le Moal { 266eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 267eb0570c7SDamien Le Moal int ret = 0; 268eb0570c7SDamien Le Moal 269eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 270eb0570c7SDamien Le Moal return -EIO; 271eb0570c7SDamien Le Moal 272eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 273eb0570c7SDamien Le Moal 274eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 275eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_EMPTY) 276eb0570c7SDamien Le Moal goto unlock; 277eb0570c7SDamien Le Moal 278eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, 0)) { 279eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 280eb0570c7SDamien Le Moal ret = -EIO; 281eb0570c7SDamien Le Moal goto unlock; 282eb0570c7SDamien Le Moal } 283eb0570c7SDamien Le Moal 284eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_EMPTY; 285eb0570c7SDamien Le Moal zone->wp = zone->start; 286eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 287eb0570c7SDamien Le Moal 288eb0570c7SDamien Le Moal unlock: 289eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 290eb0570c7SDamien Le Moal 291eb0570c7SDamien Le Moal return ret; 292eb0570c7SDamien Le Moal } 293eb0570c7SDamien Le Moal 294eb0570c7SDamien Le Moal static int zloop_reset_all_zones(struct zloop_device *zlo) 295eb0570c7SDamien Le Moal { 296eb0570c7SDamien Le Moal unsigned int i; 297eb0570c7SDamien Le Moal int ret; 298eb0570c7SDamien Le Moal 299eb0570c7SDamien Le Moal for (i = zlo->nr_conv_zones; i < zlo->nr_zones; i++) { 300eb0570c7SDamien Le Moal ret = zloop_reset_zone(zlo, i); 301eb0570c7SDamien Le Moal if (ret) 302eb0570c7SDamien Le Moal return ret; 303eb0570c7SDamien Le Moal } 304eb0570c7SDamien Le Moal 305eb0570c7SDamien Le Moal return 0; 306eb0570c7SDamien Le Moal } 307eb0570c7SDamien Le Moal 308eb0570c7SDamien Le Moal static int zloop_finish_zone(struct zloop_device *zlo, unsigned int zone_no) 309eb0570c7SDamien Le Moal { 310eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 311eb0570c7SDamien Le Moal int ret = 0; 312eb0570c7SDamien Le Moal 313eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) 314eb0570c7SDamien Le Moal return -EIO; 315eb0570c7SDamien Le Moal 316eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 317eb0570c7SDamien Le Moal 318eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags) && 319eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_FULL) 320eb0570c7SDamien Le Moal goto unlock; 321eb0570c7SDamien Le Moal 322eb0570c7SDamien Le Moal if (vfs_truncate(&zone->file->f_path, zlo->zone_size << SECTOR_SHIFT)) { 323eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 324eb0570c7SDamien Le Moal ret = -EIO; 325eb0570c7SDamien Le Moal goto unlock; 326eb0570c7SDamien Le Moal } 327eb0570c7SDamien Le Moal 328eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 329eb0570c7SDamien Le Moal zone->wp = zone->start + zlo->zone_size; 330eb0570c7SDamien Le Moal clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 331eb0570c7SDamien Le Moal 332eb0570c7SDamien Le Moal unlock: 333eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 334eb0570c7SDamien Le Moal 335eb0570c7SDamien Le Moal return ret; 336eb0570c7SDamien Le Moal } 337eb0570c7SDamien Le Moal 338eb0570c7SDamien Le Moal static void zloop_put_cmd(struct zloop_cmd *cmd) 339eb0570c7SDamien Le Moal { 340eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 341eb0570c7SDamien Le Moal 342eb0570c7SDamien Le Moal if (!atomic_dec_and_test(&cmd->ref)) 343eb0570c7SDamien Le Moal return; 344eb0570c7SDamien Le Moal kfree(cmd->bvec); 345eb0570c7SDamien Le Moal cmd->bvec = NULL; 346eb0570c7SDamien Le Moal if (likely(!blk_should_fake_timeout(rq->q))) 347eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 348eb0570c7SDamien Le Moal } 349eb0570c7SDamien Le Moal 350eb0570c7SDamien Le Moal static void zloop_rw_complete(struct kiocb *iocb, long ret) 351eb0570c7SDamien Le Moal { 352eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(iocb, struct zloop_cmd, iocb); 353eb0570c7SDamien Le Moal 354eb0570c7SDamien Le Moal cmd->ret = ret; 355eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 356eb0570c7SDamien Le Moal } 357eb0570c7SDamien Le Moal 358eb0570c7SDamien Le Moal static void zloop_rw(struct zloop_cmd *cmd) 359eb0570c7SDamien Le Moal { 360eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 361eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 362eb0570c7SDamien Le Moal unsigned int zone_no = rq_zone_no(rq); 363eb0570c7SDamien Le Moal sector_t sector = blk_rq_pos(rq); 364eb0570c7SDamien Le Moal sector_t nr_sectors = blk_rq_sectors(rq); 365eb0570c7SDamien Le Moal bool is_append = req_op(rq) == REQ_OP_ZONE_APPEND; 366eb0570c7SDamien Le Moal bool is_write = req_op(rq) == REQ_OP_WRITE || is_append; 367eb0570c7SDamien Le Moal int rw = is_write ? ITER_SOURCE : ITER_DEST; 368eb0570c7SDamien Le Moal struct req_iterator rq_iter; 369eb0570c7SDamien Le Moal struct zloop_zone *zone; 370eb0570c7SDamien Le Moal struct iov_iter iter; 371eb0570c7SDamien Le Moal struct bio_vec tmp; 372eb0570c7SDamien Le Moal sector_t zone_end; 373eb0570c7SDamien Le Moal int nr_bvec = 0; 374eb0570c7SDamien Le Moal int ret; 375eb0570c7SDamien Le Moal 376eb0570c7SDamien Le Moal atomic_set(&cmd->ref, 2); 377eb0570c7SDamien Le Moal cmd->sector = sector; 378eb0570c7SDamien Le Moal cmd->nr_sectors = nr_sectors; 379eb0570c7SDamien Le Moal cmd->ret = 0; 380eb0570c7SDamien Le Moal 381eb0570c7SDamien Le Moal /* We should never get an I/O beyond the device capacity. */ 382eb0570c7SDamien Le Moal if (WARN_ON_ONCE(zone_no >= zlo->nr_zones)) { 383eb0570c7SDamien Le Moal ret = -EIO; 384eb0570c7SDamien Le Moal goto out; 385eb0570c7SDamien Le Moal } 386eb0570c7SDamien Le Moal zone = &zlo->zones[zone_no]; 387eb0570c7SDamien Le Moal zone_end = zone->start + zlo->zone_capacity; 388eb0570c7SDamien Le Moal 389eb0570c7SDamien Le Moal /* 390eb0570c7SDamien Le Moal * The block layer should never send requests that are not fully 391eb0570c7SDamien Le Moal * contained within the zone. 392eb0570c7SDamien Le Moal */ 393eb0570c7SDamien Le Moal if (WARN_ON_ONCE(sector + nr_sectors > zone->start + zlo->zone_size)) { 394eb0570c7SDamien Le Moal ret = -EIO; 395eb0570c7SDamien Le Moal goto out; 396eb0570c7SDamien Le Moal } 397eb0570c7SDamien Le Moal 398eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 399eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 400eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 401eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 402eb0570c7SDamien Le Moal if (ret) 403eb0570c7SDamien Le Moal goto out; 404eb0570c7SDamien Le Moal } 405eb0570c7SDamien Le Moal 406eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_CONV, &zone->flags) && is_write) { 407eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 408eb0570c7SDamien Le Moal 409eb0570c7SDamien Le Moal if (is_append) { 410eb0570c7SDamien Le Moal sector = zone->wp; 411eb0570c7SDamien Le Moal cmd->sector = sector; 412eb0570c7SDamien Le Moal } 413eb0570c7SDamien Le Moal 414eb0570c7SDamien Le Moal /* 415eb0570c7SDamien Le Moal * Write operations must be aligned to the write pointer and 416eb0570c7SDamien Le Moal * fully contained within the zone capacity. 417eb0570c7SDamien Le Moal */ 418eb0570c7SDamien Le Moal if (sector != zone->wp || zone->wp + nr_sectors > zone_end) { 419eb0570c7SDamien Le Moal pr_err("Zone %u: unaligned write: sect %llu, wp %llu\n", 420eb0570c7SDamien Le Moal zone_no, sector, zone->wp); 421eb0570c7SDamien Le Moal ret = -EIO; 422eb0570c7SDamien Le Moal goto unlock; 423eb0570c7SDamien Le Moal } 424eb0570c7SDamien Le Moal 425eb0570c7SDamien Le Moal /* Implicitly open the target zone. */ 426eb0570c7SDamien Le Moal if (zone->cond == BLK_ZONE_COND_CLOSED || 427eb0570c7SDamien Le Moal zone->cond == BLK_ZONE_COND_EMPTY) 428eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_IMP_OPEN; 429eb0570c7SDamien Le Moal 430eb0570c7SDamien Le Moal /* 431eb0570c7SDamien Le Moal * Advance the write pointer of sequential zones. If the write 432eb0570c7SDamien Le Moal * fails, the wp position will be corrected when the next I/O 433eb0570c7SDamien Le Moal * copmpletes. 434eb0570c7SDamien Le Moal */ 435eb0570c7SDamien Le Moal zone->wp += nr_sectors; 436eb0570c7SDamien Le Moal if (zone->wp == zone_end) 437eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_FULL; 438eb0570c7SDamien Le Moal } 439eb0570c7SDamien Le Moal 440eb0570c7SDamien Le Moal rq_for_each_bvec(tmp, rq, rq_iter) 441eb0570c7SDamien Le Moal nr_bvec++; 442eb0570c7SDamien Le Moal 443eb0570c7SDamien Le Moal if (rq->bio != rq->biotail) { 444eb0570c7SDamien Le Moal struct bio_vec *bvec; 445eb0570c7SDamien Le Moal 446eb0570c7SDamien Le Moal cmd->bvec = kmalloc_array(nr_bvec, sizeof(*cmd->bvec), GFP_NOIO); 447eb0570c7SDamien Le Moal if (!cmd->bvec) { 448eb0570c7SDamien Le Moal ret = -EIO; 449eb0570c7SDamien Le Moal goto unlock; 450eb0570c7SDamien Le Moal } 451eb0570c7SDamien Le Moal 452eb0570c7SDamien Le Moal /* 453eb0570c7SDamien Le Moal * The bios of the request may be started from the middle of 454eb0570c7SDamien Le Moal * the 'bvec' because of bio splitting, so we can't directly 455eb0570c7SDamien Le Moal * copy bio->bi_iov_vec to new bvec. The rq_for_each_bvec 456eb0570c7SDamien Le Moal * API will take care of all details for us. 457eb0570c7SDamien Le Moal */ 458eb0570c7SDamien Le Moal bvec = cmd->bvec; 459eb0570c7SDamien Le Moal rq_for_each_bvec(tmp, rq, rq_iter) { 460eb0570c7SDamien Le Moal *bvec = tmp; 461eb0570c7SDamien Le Moal bvec++; 462eb0570c7SDamien Le Moal } 463eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, cmd->bvec, nr_bvec, blk_rq_bytes(rq)); 464eb0570c7SDamien Le Moal } else { 465eb0570c7SDamien Le Moal /* 466eb0570c7SDamien Le Moal * Same here, this bio may be started from the middle of the 467eb0570c7SDamien Le Moal * 'bvec' because of bio splitting, so offset from the bvec 468eb0570c7SDamien Le Moal * must be passed to iov iterator 469eb0570c7SDamien Le Moal */ 470eb0570c7SDamien Le Moal iov_iter_bvec(&iter, rw, 471eb0570c7SDamien Le Moal __bvec_iter_bvec(rq->bio->bi_io_vec, rq->bio->bi_iter), 472eb0570c7SDamien Le Moal nr_bvec, blk_rq_bytes(rq)); 473eb0570c7SDamien Le Moal iter.iov_offset = rq->bio->bi_iter.bi_bvec_done; 474eb0570c7SDamien Le Moal } 475eb0570c7SDamien Le Moal 476eb0570c7SDamien Le Moal cmd->iocb.ki_pos = (sector - zone->start) << SECTOR_SHIFT; 477eb0570c7SDamien Le Moal cmd->iocb.ki_filp = zone->file; 478eb0570c7SDamien Le Moal cmd->iocb.ki_complete = zloop_rw_complete; 479eb0570c7SDamien Le Moal if (!zlo->buffered_io) 480eb0570c7SDamien Le Moal cmd->iocb.ki_flags = IOCB_DIRECT; 481eb0570c7SDamien Le Moal cmd->iocb.ki_ioprio = IOPRIO_PRIO_VALUE(IOPRIO_CLASS_NONE, 0); 482eb0570c7SDamien Le Moal 483eb0570c7SDamien Le Moal if (rw == ITER_SOURCE) 484eb0570c7SDamien Le Moal ret = zone->file->f_op->write_iter(&cmd->iocb, &iter); 485eb0570c7SDamien Le Moal else 486eb0570c7SDamien Le Moal ret = zone->file->f_op->read_iter(&cmd->iocb, &iter); 487eb0570c7SDamien Le Moal unlock: 488eb0570c7SDamien Le Moal if (!test_bit(ZLOOP_ZONE_CONV, &zone->flags) && is_write) 489eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 490eb0570c7SDamien Le Moal out: 491eb0570c7SDamien Le Moal if (ret != -EIOCBQUEUED) 492eb0570c7SDamien Le Moal zloop_rw_complete(&cmd->iocb, ret); 493eb0570c7SDamien Le Moal zloop_put_cmd(cmd); 494eb0570c7SDamien Le Moal } 495eb0570c7SDamien Le Moal 496eb0570c7SDamien Le Moal static void zloop_handle_cmd(struct zloop_cmd *cmd) 497eb0570c7SDamien Le Moal { 498eb0570c7SDamien Le Moal struct request *rq = blk_mq_rq_from_pdu(cmd); 499eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 500eb0570c7SDamien Le Moal 501eb0570c7SDamien Le Moal switch (req_op(rq)) { 502eb0570c7SDamien Le Moal case REQ_OP_READ: 503eb0570c7SDamien Le Moal case REQ_OP_WRITE: 504eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 505eb0570c7SDamien Le Moal /* 506eb0570c7SDamien Le Moal * zloop_rw() always executes asynchronously or completes 507eb0570c7SDamien Le Moal * directly. 508eb0570c7SDamien Le Moal */ 509eb0570c7SDamien Le Moal zloop_rw(cmd); 510eb0570c7SDamien Le Moal return; 511eb0570c7SDamien Le Moal case REQ_OP_FLUSH: 512eb0570c7SDamien Le Moal /* 513eb0570c7SDamien Le Moal * Sync the entire FS containing the zone files instead of 514eb0570c7SDamien Le Moal * walking all files 515eb0570c7SDamien Le Moal */ 516eb0570c7SDamien Le Moal cmd->ret = sync_filesystem(file_inode(zlo->data_dir)->i_sb); 517eb0570c7SDamien Le Moal break; 518eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET: 519eb0570c7SDamien Le Moal cmd->ret = zloop_reset_zone(zlo, rq_zone_no(rq)); 520eb0570c7SDamien Le Moal break; 521eb0570c7SDamien Le Moal case REQ_OP_ZONE_RESET_ALL: 522eb0570c7SDamien Le Moal cmd->ret = zloop_reset_all_zones(zlo); 523eb0570c7SDamien Le Moal break; 524eb0570c7SDamien Le Moal case REQ_OP_ZONE_FINISH: 525eb0570c7SDamien Le Moal cmd->ret = zloop_finish_zone(zlo, rq_zone_no(rq)); 526eb0570c7SDamien Le Moal break; 527eb0570c7SDamien Le Moal case REQ_OP_ZONE_OPEN: 528eb0570c7SDamien Le Moal cmd->ret = zloop_open_zone(zlo, rq_zone_no(rq)); 529eb0570c7SDamien Le Moal break; 530eb0570c7SDamien Le Moal case REQ_OP_ZONE_CLOSE: 531eb0570c7SDamien Le Moal cmd->ret = zloop_close_zone(zlo, rq_zone_no(rq)); 532eb0570c7SDamien Le Moal break; 533eb0570c7SDamien Le Moal default: 534eb0570c7SDamien Le Moal WARN_ON_ONCE(1); 535eb0570c7SDamien Le Moal pr_err("Unsupported operation %d\n", req_op(rq)); 536eb0570c7SDamien Le Moal cmd->ret = -EOPNOTSUPP; 537eb0570c7SDamien Le Moal break; 538eb0570c7SDamien Le Moal } 539eb0570c7SDamien Le Moal 540eb0570c7SDamien Le Moal blk_mq_complete_request(rq); 541eb0570c7SDamien Le Moal } 542eb0570c7SDamien Le Moal 543eb0570c7SDamien Le Moal static void zloop_cmd_workfn(struct work_struct *work) 544eb0570c7SDamien Le Moal { 545eb0570c7SDamien Le Moal struct zloop_cmd *cmd = container_of(work, struct zloop_cmd, work); 546eb0570c7SDamien Le Moal int orig_flags = current->flags; 547eb0570c7SDamien Le Moal 548eb0570c7SDamien Le Moal current->flags |= PF_LOCAL_THROTTLE | PF_MEMALLOC_NOIO; 549eb0570c7SDamien Le Moal zloop_handle_cmd(cmd); 550eb0570c7SDamien Le Moal current->flags = orig_flags; 551eb0570c7SDamien Le Moal } 552eb0570c7SDamien Le Moal 553eb0570c7SDamien Le Moal static void zloop_complete_rq(struct request *rq) 554eb0570c7SDamien Le Moal { 555eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 556eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 557eb0570c7SDamien Le Moal unsigned int zone_no = cmd->sector >> zlo->zone_shift; 558eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 559eb0570c7SDamien Le Moal blk_status_t sts = BLK_STS_OK; 560eb0570c7SDamien Le Moal 561eb0570c7SDamien Le Moal switch (req_op(rq)) { 562eb0570c7SDamien Le Moal case REQ_OP_READ: 563eb0570c7SDamien Le Moal if (cmd->ret < 0) 564eb0570c7SDamien Le Moal pr_err("Zone %u: failed read sector %llu, %llu sectors\n", 565eb0570c7SDamien Le Moal zone_no, cmd->sector, cmd->nr_sectors); 566eb0570c7SDamien Le Moal 567eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 568eb0570c7SDamien Le Moal /* short read */ 569eb0570c7SDamien Le Moal struct bio *bio; 570eb0570c7SDamien Le Moal 571eb0570c7SDamien Le Moal __rq_for_each_bio(bio, rq) 572eb0570c7SDamien Le Moal zero_fill_bio(bio); 573eb0570c7SDamien Le Moal } 574eb0570c7SDamien Le Moal break; 575eb0570c7SDamien Le Moal case REQ_OP_WRITE: 576eb0570c7SDamien Le Moal case REQ_OP_ZONE_APPEND: 577eb0570c7SDamien Le Moal if (cmd->ret < 0) 578eb0570c7SDamien Le Moal pr_err("Zone %u: failed %swrite sector %llu, %llu sectors\n", 579eb0570c7SDamien Le Moal zone_no, 580eb0570c7SDamien Le Moal req_op(rq) == REQ_OP_WRITE ? "" : "append ", 581eb0570c7SDamien Le Moal cmd->sector, cmd->nr_sectors); 582eb0570c7SDamien Le Moal 583eb0570c7SDamien Le Moal if (cmd->ret >= 0 && cmd->ret != blk_rq_bytes(rq)) { 584eb0570c7SDamien Le Moal pr_err("Zone %u: partial write %ld/%u B\n", 585eb0570c7SDamien Le Moal zone_no, cmd->ret, blk_rq_bytes(rq)); 586eb0570c7SDamien Le Moal cmd->ret = -EIO; 587eb0570c7SDamien Le Moal } 588eb0570c7SDamien Le Moal 589eb0570c7SDamien Le Moal if (cmd->ret < 0 && !test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 590eb0570c7SDamien Le Moal /* 591eb0570c7SDamien Le Moal * A write to a sequential zone file failed: mark the 592eb0570c7SDamien Le Moal * zone as having an error. This will be corrected and 593eb0570c7SDamien Le Moal * cleared when the next IO is submitted. 594eb0570c7SDamien Le Moal */ 595eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags); 596eb0570c7SDamien Le Moal break; 597eb0570c7SDamien Le Moal } 598eb0570c7SDamien Le Moal if (req_op(rq) == REQ_OP_ZONE_APPEND) 599eb0570c7SDamien Le Moal rq->__sector = cmd->sector; 600eb0570c7SDamien Le Moal 601eb0570c7SDamien Le Moal break; 602eb0570c7SDamien Le Moal default: 603eb0570c7SDamien Le Moal break; 604eb0570c7SDamien Le Moal } 605eb0570c7SDamien Le Moal 606eb0570c7SDamien Le Moal if (cmd->ret < 0) 607eb0570c7SDamien Le Moal sts = errno_to_blk_status(cmd->ret); 608eb0570c7SDamien Le Moal blk_mq_end_request(rq, sts); 609eb0570c7SDamien Le Moal } 610eb0570c7SDamien Le Moal 611eb0570c7SDamien Le Moal static blk_status_t zloop_queue_rq(struct blk_mq_hw_ctx *hctx, 612eb0570c7SDamien Le Moal const struct blk_mq_queue_data *bd) 613eb0570c7SDamien Le Moal { 614eb0570c7SDamien Le Moal struct request *rq = bd->rq; 615eb0570c7SDamien Le Moal struct zloop_cmd *cmd = blk_mq_rq_to_pdu(rq); 616eb0570c7SDamien Le Moal struct zloop_device *zlo = rq->q->queuedata; 617eb0570c7SDamien Le Moal 618eb0570c7SDamien Le Moal if (zlo->state == Zlo_deleting) 619eb0570c7SDamien Le Moal return BLK_STS_IOERR; 620eb0570c7SDamien Le Moal 621eb0570c7SDamien Le Moal blk_mq_start_request(rq); 622eb0570c7SDamien Le Moal 623eb0570c7SDamien Le Moal INIT_WORK(&cmd->work, zloop_cmd_workfn); 624eb0570c7SDamien Le Moal queue_work(zlo->workqueue, &cmd->work); 625eb0570c7SDamien Le Moal 626eb0570c7SDamien Le Moal return BLK_STS_OK; 627eb0570c7SDamien Le Moal } 628eb0570c7SDamien Le Moal 629eb0570c7SDamien Le Moal static const struct blk_mq_ops zloop_mq_ops = { 630eb0570c7SDamien Le Moal .queue_rq = zloop_queue_rq, 631eb0570c7SDamien Le Moal .complete = zloop_complete_rq, 632eb0570c7SDamien Le Moal }; 633eb0570c7SDamien Le Moal 634eb0570c7SDamien Le Moal static int zloop_open(struct gendisk *disk, blk_mode_t mode) 635eb0570c7SDamien Le Moal { 636eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 637eb0570c7SDamien Le Moal int ret; 638eb0570c7SDamien Le Moal 639eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 640eb0570c7SDamien Le Moal if (ret) 641eb0570c7SDamien Le Moal return ret; 642eb0570c7SDamien Le Moal 643eb0570c7SDamien Le Moal if (zlo->state != Zlo_live) 644eb0570c7SDamien Le Moal ret = -ENXIO; 645eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 646eb0570c7SDamien Le Moal return ret; 647eb0570c7SDamien Le Moal } 648eb0570c7SDamien Le Moal 649eb0570c7SDamien Le Moal static int zloop_report_zones(struct gendisk *disk, sector_t sector, 650*fdb9aed8SDamien Le Moal unsigned int nr_zones, struct blk_report_zones_args *args) 651eb0570c7SDamien Le Moal { 652eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 653eb0570c7SDamien Le Moal struct blk_zone blkz = {}; 654eb0570c7SDamien Le Moal unsigned int first, i; 655eb0570c7SDamien Le Moal int ret; 656eb0570c7SDamien Le Moal 657eb0570c7SDamien Le Moal first = disk_zone_no(disk, sector); 658eb0570c7SDamien Le Moal if (first >= zlo->nr_zones) 659eb0570c7SDamien Le Moal return 0; 660eb0570c7SDamien Le Moal nr_zones = min(nr_zones, zlo->nr_zones - first); 661eb0570c7SDamien Le Moal 662eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 663eb0570c7SDamien Le Moal unsigned int zone_no = first + i; 664eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 665eb0570c7SDamien Le Moal 666eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 667eb0570c7SDamien Le Moal 668eb0570c7SDamien Le Moal if (test_and_clear_bit(ZLOOP_ZONE_SEQ_ERROR, &zone->flags)) { 669eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 670eb0570c7SDamien Le Moal if (ret) { 671eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 672eb0570c7SDamien Le Moal return ret; 673eb0570c7SDamien Le Moal } 674eb0570c7SDamien Le Moal } 675eb0570c7SDamien Le Moal 676eb0570c7SDamien Le Moal blkz.start = zone->start; 677eb0570c7SDamien Le Moal blkz.len = zlo->zone_size; 678eb0570c7SDamien Le Moal blkz.wp = zone->wp; 679eb0570c7SDamien Le Moal blkz.cond = zone->cond; 680eb0570c7SDamien Le Moal if (test_bit(ZLOOP_ZONE_CONV, &zone->flags)) { 681eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_CONVENTIONAL; 682eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_size; 683eb0570c7SDamien Le Moal } else { 684eb0570c7SDamien Le Moal blkz.type = BLK_ZONE_TYPE_SEQWRITE_REQ; 685eb0570c7SDamien Le Moal blkz.capacity = zlo->zone_capacity; 686eb0570c7SDamien Le Moal } 687eb0570c7SDamien Le Moal 688eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 689eb0570c7SDamien Le Moal 690*fdb9aed8SDamien Le Moal ret = disk_report_zone(disk, &blkz, i, args); 691eb0570c7SDamien Le Moal if (ret) 692eb0570c7SDamien Le Moal return ret; 693eb0570c7SDamien Le Moal } 694eb0570c7SDamien Le Moal 695eb0570c7SDamien Le Moal return nr_zones; 696eb0570c7SDamien Le Moal } 697eb0570c7SDamien Le Moal 698eb0570c7SDamien Le Moal static void zloop_free_disk(struct gendisk *disk) 699eb0570c7SDamien Le Moal { 700eb0570c7SDamien Le Moal struct zloop_device *zlo = disk->private_data; 701eb0570c7SDamien Le Moal unsigned int i; 702eb0570c7SDamien Le Moal 70376576185SShin'ichiro Kawasaki blk_mq_free_tag_set(&zlo->tag_set); 70476576185SShin'ichiro Kawasaki 705eb0570c7SDamien Le Moal for (i = 0; i < zlo->nr_zones; i++) { 706eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[i]; 707eb0570c7SDamien Le Moal 708eb0570c7SDamien Le Moal mapping_set_gfp_mask(zone->file->f_mapping, 709eb0570c7SDamien Le Moal zone->old_gfp_mask); 710eb0570c7SDamien Le Moal fput(zone->file); 711eb0570c7SDamien Le Moal } 712eb0570c7SDamien Le Moal 713eb0570c7SDamien Le Moal fput(zlo->data_dir); 714eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 715eb0570c7SDamien Le Moal kfree(zlo->base_dir); 716eb0570c7SDamien Le Moal kvfree(zlo); 717eb0570c7SDamien Le Moal } 718eb0570c7SDamien Le Moal 719eb0570c7SDamien Le Moal static const struct block_device_operations zloop_fops = { 720eb0570c7SDamien Le Moal .owner = THIS_MODULE, 721eb0570c7SDamien Le Moal .open = zloop_open, 722eb0570c7SDamien Le Moal .report_zones = zloop_report_zones, 723eb0570c7SDamien Le Moal .free_disk = zloop_free_disk, 724eb0570c7SDamien Le Moal }; 725eb0570c7SDamien Le Moal 726eb0570c7SDamien Le Moal __printf(3, 4) 727eb0570c7SDamien Le Moal static struct file *zloop_filp_open_fmt(int oflags, umode_t mode, 728eb0570c7SDamien Le Moal const char *fmt, ...) 729eb0570c7SDamien Le Moal { 730eb0570c7SDamien Le Moal struct file *file; 731eb0570c7SDamien Le Moal va_list ap; 732eb0570c7SDamien Le Moal char *p; 733eb0570c7SDamien Le Moal 734eb0570c7SDamien Le Moal va_start(ap, fmt); 735eb0570c7SDamien Le Moal p = kvasprintf(GFP_KERNEL, fmt, ap); 736eb0570c7SDamien Le Moal va_end(ap); 737eb0570c7SDamien Le Moal 738eb0570c7SDamien Le Moal if (!p) 739eb0570c7SDamien Le Moal return ERR_PTR(-ENOMEM); 740eb0570c7SDamien Le Moal file = filp_open(p, oflags, mode); 741eb0570c7SDamien Le Moal kfree(p); 742eb0570c7SDamien Le Moal return file; 743eb0570c7SDamien Le Moal } 744eb0570c7SDamien Le Moal 745eb0570c7SDamien Le Moal static int zloop_get_block_size(struct zloop_device *zlo, 746eb0570c7SDamien Le Moal struct zloop_zone *zone) 747eb0570c7SDamien Le Moal { 748eb0570c7SDamien Le Moal struct block_device *sb_bdev = zone->file->f_mapping->host->i_sb->s_bdev; 749eb0570c7SDamien Le Moal struct kstat st; 750eb0570c7SDamien Le Moal 751eb0570c7SDamien Le Moal /* 752eb0570c7SDamien Le Moal * If the FS block size is lower than or equal to 4K, use that as the 753eb0570c7SDamien Le Moal * device block size. Otherwise, fallback to the FS direct IO alignment 754eb0570c7SDamien Le Moal * constraint if that is provided, and to the FS underlying device 755eb0570c7SDamien Le Moal * physical block size if the direct IO alignment is unknown. 756eb0570c7SDamien Le Moal */ 757eb0570c7SDamien Le Moal if (file_inode(zone->file)->i_sb->s_blocksize <= SZ_4K) 758eb0570c7SDamien Le Moal zlo->block_size = file_inode(zone->file)->i_sb->s_blocksize; 759eb0570c7SDamien Le Moal else if (!vfs_getattr(&zone->file->f_path, &st, STATX_DIOALIGN, 0) && 760eb0570c7SDamien Le Moal (st.result_mask & STATX_DIOALIGN)) 761eb0570c7SDamien Le Moal zlo->block_size = st.dio_offset_align; 762eb0570c7SDamien Le Moal else if (sb_bdev) 763eb0570c7SDamien Le Moal zlo->block_size = bdev_physical_block_size(sb_bdev); 764eb0570c7SDamien Le Moal else 765eb0570c7SDamien Le Moal zlo->block_size = SECTOR_SIZE; 766eb0570c7SDamien Le Moal 767eb0570c7SDamien Le Moal if (zlo->zone_capacity & ((zlo->block_size >> SECTOR_SHIFT) - 1)) { 768eb0570c7SDamien Le Moal pr_err("Zone capacity is not aligned to block size %u\n", 769eb0570c7SDamien Le Moal zlo->block_size); 770eb0570c7SDamien Le Moal return -EINVAL; 771eb0570c7SDamien Le Moal } 772eb0570c7SDamien Le Moal 773eb0570c7SDamien Le Moal return 0; 774eb0570c7SDamien Le Moal } 775eb0570c7SDamien Le Moal 776eb0570c7SDamien Le Moal static int zloop_init_zone(struct zloop_device *zlo, struct zloop_options *opts, 777eb0570c7SDamien Le Moal unsigned int zone_no, bool restore) 778eb0570c7SDamien Le Moal { 779eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[zone_no]; 780eb0570c7SDamien Le Moal int oflags = O_RDWR; 781eb0570c7SDamien Le Moal struct kstat stat; 782eb0570c7SDamien Le Moal sector_t file_sectors; 783eb0570c7SDamien Le Moal int ret; 784eb0570c7SDamien Le Moal 785eb0570c7SDamien Le Moal mutex_init(&zone->lock); 786eb0570c7SDamien Le Moal zone->start = (sector_t)zone_no << zlo->zone_shift; 787eb0570c7SDamien Le Moal 788eb0570c7SDamien Le Moal if (!restore) 789eb0570c7SDamien Le Moal oflags |= O_CREAT; 790eb0570c7SDamien Le Moal 791eb0570c7SDamien Le Moal if (!opts->buffered_io) 792eb0570c7SDamien Le Moal oflags |= O_DIRECT; 793eb0570c7SDamien Le Moal 794eb0570c7SDamien Le Moal if (zone_no < zlo->nr_conv_zones) { 795eb0570c7SDamien Le Moal /* Conventional zone file. */ 796eb0570c7SDamien Le Moal set_bit(ZLOOP_ZONE_CONV, &zone->flags); 797eb0570c7SDamien Le Moal zone->cond = BLK_ZONE_COND_NOT_WP; 798eb0570c7SDamien Le Moal zone->wp = U64_MAX; 799eb0570c7SDamien Le Moal 800eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/cnv-%06u", 801eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 802eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 803eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/cnv-%06u (err=%ld)", 804eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 805eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 806eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 807eb0570c7SDamien Le Moal } 808eb0570c7SDamien Le Moal 809eb0570c7SDamien Le Moal if (!zlo->block_size) { 810eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 811eb0570c7SDamien Le Moal if (ret) 812eb0570c7SDamien Le Moal return ret; 813eb0570c7SDamien Le Moal } 814eb0570c7SDamien Le Moal 815eb0570c7SDamien Le Moal ret = vfs_getattr(&zone->file->f_path, &stat, STATX_SIZE, 0); 816eb0570c7SDamien Le Moal if (ret < 0) { 817eb0570c7SDamien Le Moal pr_err("Failed to get zone %u file stat\n", zone_no); 818eb0570c7SDamien Le Moal return ret; 819eb0570c7SDamien Le Moal } 820eb0570c7SDamien Le Moal file_sectors = stat.size >> SECTOR_SHIFT; 821eb0570c7SDamien Le Moal 822eb0570c7SDamien Le Moal if (restore && file_sectors != zlo->zone_size) { 823eb0570c7SDamien Le Moal pr_err("Invalid conventional zone %u file size (%llu sectors != %llu)\n", 824eb0570c7SDamien Le Moal zone_no, file_sectors, zlo->zone_capacity); 825eb0570c7SDamien Le Moal return ret; 826eb0570c7SDamien Le Moal } 827eb0570c7SDamien Le Moal 828eb0570c7SDamien Le Moal ret = vfs_truncate(&zone->file->f_path, 829eb0570c7SDamien Le Moal zlo->zone_size << SECTOR_SHIFT); 830eb0570c7SDamien Le Moal if (ret < 0) { 831eb0570c7SDamien Le Moal pr_err("Failed to truncate zone %u file (err=%d)\n", 832eb0570c7SDamien Le Moal zone_no, ret); 833eb0570c7SDamien Le Moal return ret; 834eb0570c7SDamien Le Moal } 835eb0570c7SDamien Le Moal 836eb0570c7SDamien Le Moal return 0; 837eb0570c7SDamien Le Moal } 838eb0570c7SDamien Le Moal 839eb0570c7SDamien Le Moal /* Sequential zone file. */ 840eb0570c7SDamien Le Moal zone->file = zloop_filp_open_fmt(oflags, 0600, "%s/%u/seq-%06u", 841eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, zone_no); 842eb0570c7SDamien Le Moal if (IS_ERR(zone->file)) { 843eb0570c7SDamien Le Moal pr_err("Failed to open zone %u file %s/%u/seq-%06u (err=%ld)", 844eb0570c7SDamien Le Moal zone_no, zlo->base_dir, zlo->id, zone_no, 845eb0570c7SDamien Le Moal PTR_ERR(zone->file)); 846eb0570c7SDamien Le Moal return PTR_ERR(zone->file); 847eb0570c7SDamien Le Moal } 848eb0570c7SDamien Le Moal 849eb0570c7SDamien Le Moal if (!zlo->block_size) { 850eb0570c7SDamien Le Moal ret = zloop_get_block_size(zlo, zone); 851eb0570c7SDamien Le Moal if (ret) 852eb0570c7SDamien Le Moal return ret; 853eb0570c7SDamien Le Moal } 854eb0570c7SDamien Le Moal 855eb0570c7SDamien Le Moal zloop_get_block_size(zlo, zone); 856eb0570c7SDamien Le Moal 857eb0570c7SDamien Le Moal mutex_lock(&zone->lock); 858eb0570c7SDamien Le Moal ret = zloop_update_seq_zone(zlo, zone_no); 859eb0570c7SDamien Le Moal mutex_unlock(&zone->lock); 860eb0570c7SDamien Le Moal 861eb0570c7SDamien Le Moal return ret; 862eb0570c7SDamien Le Moal } 863eb0570c7SDamien Le Moal 864eb0570c7SDamien Le Moal static bool zloop_dev_exists(struct zloop_device *zlo) 865eb0570c7SDamien Le Moal { 866eb0570c7SDamien Le Moal struct file *cnv, *seq; 867eb0570c7SDamien Le Moal bool exists; 868eb0570c7SDamien Le Moal 869eb0570c7SDamien Le Moal cnv = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/cnv-%06u", 870eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 871eb0570c7SDamien Le Moal seq = zloop_filp_open_fmt(O_RDONLY, 0600, "%s/%u/seq-%06u", 872eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, 0); 873eb0570c7SDamien Le Moal exists = !IS_ERR(cnv) || !IS_ERR(seq); 874eb0570c7SDamien Le Moal 875eb0570c7SDamien Le Moal if (!IS_ERR(cnv)) 876eb0570c7SDamien Le Moal fput(cnv); 877eb0570c7SDamien Le Moal if (!IS_ERR(seq)) 878eb0570c7SDamien Le Moal fput(seq); 879eb0570c7SDamien Le Moal 880eb0570c7SDamien Le Moal return exists; 881eb0570c7SDamien Le Moal } 882eb0570c7SDamien Le Moal 883eb0570c7SDamien Le Moal static int zloop_ctl_add(struct zloop_options *opts) 884eb0570c7SDamien Le Moal { 885eb0570c7SDamien Le Moal struct queue_limits lim = { 886eb0570c7SDamien Le Moal .max_hw_sectors = SZ_1M >> SECTOR_SHIFT, 887eb0570c7SDamien Le Moal .max_hw_zone_append_sectors = SZ_1M >> SECTOR_SHIFT, 888eb0570c7SDamien Le Moal .chunk_sectors = opts->zone_size, 889eb0570c7SDamien Le Moal .features = BLK_FEAT_ZONED, 890eb0570c7SDamien Le Moal }; 891eb0570c7SDamien Le Moal unsigned int nr_zones, i, j; 892eb0570c7SDamien Le Moal struct zloop_device *zlo; 893eb0570c7SDamien Le Moal int ret = -EINVAL; 894eb0570c7SDamien Le Moal bool restore; 895eb0570c7SDamien Le Moal 896eb0570c7SDamien Le Moal __module_get(THIS_MODULE); 897eb0570c7SDamien Le Moal 898eb0570c7SDamien Le Moal nr_zones = opts->capacity >> ilog2(opts->zone_size); 899eb0570c7SDamien Le Moal if (opts->nr_conv_zones >= nr_zones) { 900eb0570c7SDamien Le Moal pr_err("Invalid number of conventional zones %u\n", 901eb0570c7SDamien Le Moal opts->nr_conv_zones); 902eb0570c7SDamien Le Moal goto out; 903eb0570c7SDamien Le Moal } 904eb0570c7SDamien Le Moal 905eb0570c7SDamien Le Moal zlo = kvzalloc(struct_size(zlo, zones, nr_zones), GFP_KERNEL); 906eb0570c7SDamien Le Moal if (!zlo) { 907eb0570c7SDamien Le Moal ret = -ENOMEM; 908eb0570c7SDamien Le Moal goto out; 909eb0570c7SDamien Le Moal } 910eb0570c7SDamien Le Moal zlo->state = Zlo_creating; 911eb0570c7SDamien Le Moal 912eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 913eb0570c7SDamien Le Moal if (ret) 914eb0570c7SDamien Le Moal goto out_free_dev; 915eb0570c7SDamien Le Moal 916eb0570c7SDamien Le Moal /* Allocate id, if @opts->id >= 0, we're requesting that specific id */ 917eb0570c7SDamien Le Moal if (opts->id >= 0) { 918eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 919eb0570c7SDamien Le Moal opts->id, opts->id + 1, GFP_KERNEL); 920eb0570c7SDamien Le Moal if (ret == -ENOSPC) 921eb0570c7SDamien Le Moal ret = -EEXIST; 922eb0570c7SDamien Le Moal } else { 923eb0570c7SDamien Le Moal ret = idr_alloc(&zloop_index_idr, zlo, 0, 0, GFP_KERNEL); 924eb0570c7SDamien Le Moal } 925eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 926eb0570c7SDamien Le Moal if (ret < 0) 927eb0570c7SDamien Le Moal goto out_free_dev; 928eb0570c7SDamien Le Moal 929eb0570c7SDamien Le Moal zlo->id = ret; 930eb0570c7SDamien Le Moal zlo->zone_shift = ilog2(opts->zone_size); 931eb0570c7SDamien Le Moal zlo->zone_size = opts->zone_size; 932eb0570c7SDamien Le Moal if (opts->zone_capacity) 933eb0570c7SDamien Le Moal zlo->zone_capacity = opts->zone_capacity; 934eb0570c7SDamien Le Moal else 935eb0570c7SDamien Le Moal zlo->zone_capacity = zlo->zone_size; 936eb0570c7SDamien Le Moal zlo->nr_zones = nr_zones; 937eb0570c7SDamien Le Moal zlo->nr_conv_zones = opts->nr_conv_zones; 938eb0570c7SDamien Le Moal zlo->buffered_io = opts->buffered_io; 939eb0570c7SDamien Le Moal 940eb0570c7SDamien Le Moal zlo->workqueue = alloc_workqueue("zloop%d", WQ_UNBOUND | WQ_FREEZABLE, 941eb0570c7SDamien Le Moal opts->nr_queues * opts->queue_depth, zlo->id); 942eb0570c7SDamien Le Moal if (!zlo->workqueue) { 943eb0570c7SDamien Le Moal ret = -ENOMEM; 944eb0570c7SDamien Le Moal goto out_free_idr; 945eb0570c7SDamien Le Moal } 946eb0570c7SDamien Le Moal 947eb0570c7SDamien Le Moal if (opts->base_dir) 948eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(opts->base_dir, GFP_KERNEL); 949eb0570c7SDamien Le Moal else 950eb0570c7SDamien Le Moal zlo->base_dir = kstrdup(ZLOOP_DEF_BASE_DIR, GFP_KERNEL); 951eb0570c7SDamien Le Moal if (!zlo->base_dir) { 952eb0570c7SDamien Le Moal ret = -ENOMEM; 953eb0570c7SDamien Le Moal goto out_destroy_workqueue; 954eb0570c7SDamien Le Moal } 955eb0570c7SDamien Le Moal 956eb0570c7SDamien Le Moal zlo->data_dir = zloop_filp_open_fmt(O_RDONLY | O_DIRECTORY, 0, "%s/%u", 957eb0570c7SDamien Le Moal zlo->base_dir, zlo->id); 958eb0570c7SDamien Le Moal if (IS_ERR(zlo->data_dir)) { 959eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->data_dir); 960eb0570c7SDamien Le Moal pr_warn("Failed to open directory %s/%u (err=%d)\n", 961eb0570c7SDamien Le Moal zlo->base_dir, zlo->id, ret); 962eb0570c7SDamien Le Moal goto out_free_base_dir; 963eb0570c7SDamien Le Moal } 964eb0570c7SDamien Le Moal 965eb0570c7SDamien Le Moal /* 966eb0570c7SDamien Le Moal * If we already have zone files, we are restoring a device created by a 967eb0570c7SDamien Le Moal * previous add operation. In this case, zloop_init_zone() will check 968eb0570c7SDamien Le Moal * that the zone files are consistent with the zone configuration given. 969eb0570c7SDamien Le Moal */ 970eb0570c7SDamien Le Moal restore = zloop_dev_exists(zlo); 971eb0570c7SDamien Le Moal for (i = 0; i < nr_zones; i++) { 972eb0570c7SDamien Le Moal ret = zloop_init_zone(zlo, opts, i, restore); 973eb0570c7SDamien Le Moal if (ret) 974eb0570c7SDamien Le Moal goto out_close_files; 975eb0570c7SDamien Le Moal } 976eb0570c7SDamien Le Moal 977eb0570c7SDamien Le Moal lim.physical_block_size = zlo->block_size; 978eb0570c7SDamien Le Moal lim.logical_block_size = zlo->block_size; 979eb0570c7SDamien Le Moal 980eb0570c7SDamien Le Moal zlo->tag_set.ops = &zloop_mq_ops; 981eb0570c7SDamien Le Moal zlo->tag_set.nr_hw_queues = opts->nr_queues; 982eb0570c7SDamien Le Moal zlo->tag_set.queue_depth = opts->queue_depth; 983eb0570c7SDamien Le Moal zlo->tag_set.numa_node = NUMA_NO_NODE; 984eb0570c7SDamien Le Moal zlo->tag_set.cmd_size = sizeof(struct zloop_cmd); 985eb0570c7SDamien Le Moal zlo->tag_set.driver_data = zlo; 986eb0570c7SDamien Le Moal 987eb0570c7SDamien Le Moal ret = blk_mq_alloc_tag_set(&zlo->tag_set); 988eb0570c7SDamien Le Moal if (ret) { 989eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_tag_set failed (err=%d)\n", ret); 990eb0570c7SDamien Le Moal goto out_close_files; 991eb0570c7SDamien Le Moal } 992eb0570c7SDamien Le Moal 993eb0570c7SDamien Le Moal zlo->disk = blk_mq_alloc_disk(&zlo->tag_set, &lim, zlo); 994eb0570c7SDamien Le Moal if (IS_ERR(zlo->disk)) { 995eb0570c7SDamien Le Moal pr_err("blk_mq_alloc_disk failed (err=%d)\n", ret); 996eb0570c7SDamien Le Moal ret = PTR_ERR(zlo->disk); 997eb0570c7SDamien Le Moal goto out_cleanup_tags; 998eb0570c7SDamien Le Moal } 999eb0570c7SDamien Le Moal zlo->disk->flags = GENHD_FL_NO_PART; 1000eb0570c7SDamien Le Moal zlo->disk->fops = &zloop_fops; 1001eb0570c7SDamien Le Moal zlo->disk->private_data = zlo; 1002eb0570c7SDamien Le Moal sprintf(zlo->disk->disk_name, "zloop%d", zlo->id); 1003eb0570c7SDamien Le Moal set_capacity(zlo->disk, (u64)lim.chunk_sectors * zlo->nr_zones); 1004eb0570c7SDamien Le Moal 1005eb0570c7SDamien Le Moal ret = blk_revalidate_disk_zones(zlo->disk); 1006eb0570c7SDamien Le Moal if (ret) 1007eb0570c7SDamien Le Moal goto out_cleanup_disk; 1008eb0570c7SDamien Le Moal 1009eb0570c7SDamien Le Moal ret = add_disk(zlo->disk); 1010eb0570c7SDamien Le Moal if (ret) { 1011eb0570c7SDamien Le Moal pr_err("add_disk failed (err=%d)\n", ret); 1012eb0570c7SDamien Le Moal goto out_cleanup_disk; 1013eb0570c7SDamien Le Moal } 1014eb0570c7SDamien Le Moal 1015eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 1016eb0570c7SDamien Le Moal zlo->state = Zlo_live; 1017eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1018eb0570c7SDamien Le Moal 1019eb0570c7SDamien Le Moal pr_info("Added device %d: %u zones of %llu MB, %u B block size\n", 1020eb0570c7SDamien Le Moal zlo->id, zlo->nr_zones, 1021eb0570c7SDamien Le Moal ((sector_t)zlo->zone_size << SECTOR_SHIFT) >> 20, 1022eb0570c7SDamien Le Moal zlo->block_size); 1023eb0570c7SDamien Le Moal 1024eb0570c7SDamien Le Moal return 0; 1025eb0570c7SDamien Le Moal 1026eb0570c7SDamien Le Moal out_cleanup_disk: 1027eb0570c7SDamien Le Moal put_disk(zlo->disk); 1028eb0570c7SDamien Le Moal out_cleanup_tags: 1029eb0570c7SDamien Le Moal blk_mq_free_tag_set(&zlo->tag_set); 1030eb0570c7SDamien Le Moal out_close_files: 1031eb0570c7SDamien Le Moal for (j = 0; j < i; j++) { 1032eb0570c7SDamien Le Moal struct zloop_zone *zone = &zlo->zones[j]; 1033eb0570c7SDamien Le Moal 1034eb0570c7SDamien Le Moal if (!IS_ERR_OR_NULL(zone->file)) 1035eb0570c7SDamien Le Moal fput(zone->file); 1036eb0570c7SDamien Le Moal } 1037eb0570c7SDamien Le Moal fput(zlo->data_dir); 1038eb0570c7SDamien Le Moal out_free_base_dir: 1039eb0570c7SDamien Le Moal kfree(zlo->base_dir); 1040eb0570c7SDamien Le Moal out_destroy_workqueue: 1041eb0570c7SDamien Le Moal destroy_workqueue(zlo->workqueue); 1042eb0570c7SDamien Le Moal out_free_idr: 1043eb0570c7SDamien Le Moal mutex_lock(&zloop_ctl_mutex); 1044eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 1045eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1046eb0570c7SDamien Le Moal out_free_dev: 1047eb0570c7SDamien Le Moal kvfree(zlo); 1048eb0570c7SDamien Le Moal out: 1049eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1050eb0570c7SDamien Le Moal if (ret == -ENOENT) 1051eb0570c7SDamien Le Moal ret = -EINVAL; 1052eb0570c7SDamien Le Moal return ret; 1053eb0570c7SDamien Le Moal } 1054eb0570c7SDamien Le Moal 1055eb0570c7SDamien Le Moal static int zloop_ctl_remove(struct zloop_options *opts) 1056eb0570c7SDamien Le Moal { 1057eb0570c7SDamien Le Moal struct zloop_device *zlo; 1058eb0570c7SDamien Le Moal int ret; 1059eb0570c7SDamien Le Moal 1060eb0570c7SDamien Le Moal if (!(opts->mask & ZLOOP_OPT_ID)) { 1061eb0570c7SDamien Le Moal pr_err("No ID specified\n"); 1062eb0570c7SDamien Le Moal return -EINVAL; 1063eb0570c7SDamien Le Moal } 1064eb0570c7SDamien Le Moal 1065eb0570c7SDamien Le Moal ret = mutex_lock_killable(&zloop_ctl_mutex); 1066eb0570c7SDamien Le Moal if (ret) 1067eb0570c7SDamien Le Moal return ret; 1068eb0570c7SDamien Le Moal 1069eb0570c7SDamien Le Moal zlo = idr_find(&zloop_index_idr, opts->id); 1070eb0570c7SDamien Le Moal if (!zlo || zlo->state == Zlo_creating) { 1071eb0570c7SDamien Le Moal ret = -ENODEV; 1072eb0570c7SDamien Le Moal } else if (zlo->state == Zlo_deleting) { 1073eb0570c7SDamien Le Moal ret = -EINVAL; 1074eb0570c7SDamien Le Moal } else { 1075eb0570c7SDamien Le Moal idr_remove(&zloop_index_idr, zlo->id); 1076eb0570c7SDamien Le Moal zlo->state = Zlo_deleting; 1077eb0570c7SDamien Le Moal } 1078eb0570c7SDamien Le Moal 1079eb0570c7SDamien Le Moal mutex_unlock(&zloop_ctl_mutex); 1080eb0570c7SDamien Le Moal if (ret) 1081eb0570c7SDamien Le Moal return ret; 1082eb0570c7SDamien Le Moal 1083eb0570c7SDamien Le Moal del_gendisk(zlo->disk); 1084eb0570c7SDamien Le Moal put_disk(zlo->disk); 1085eb0570c7SDamien Le Moal 1086eb0570c7SDamien Le Moal pr_info("Removed device %d\n", opts->id); 1087eb0570c7SDamien Le Moal 1088eb0570c7SDamien Le Moal module_put(THIS_MODULE); 1089eb0570c7SDamien Le Moal 1090eb0570c7SDamien Le Moal return 0; 1091eb0570c7SDamien Le Moal } 1092eb0570c7SDamien Le Moal 1093eb0570c7SDamien Le Moal static int zloop_parse_options(struct zloop_options *opts, const char *buf) 1094eb0570c7SDamien Le Moal { 1095eb0570c7SDamien Le Moal substring_t args[MAX_OPT_ARGS]; 1096eb0570c7SDamien Le Moal char *options, *o, *p; 1097eb0570c7SDamien Le Moal unsigned int token; 1098eb0570c7SDamien Le Moal int ret = 0; 1099eb0570c7SDamien Le Moal 1100eb0570c7SDamien Le Moal /* Set defaults. */ 1101eb0570c7SDamien Le Moal opts->mask = 0; 1102eb0570c7SDamien Le Moal opts->id = ZLOOP_DEF_ID; 1103eb0570c7SDamien Le Moal opts->capacity = ZLOOP_DEF_ZONE_SIZE * ZLOOP_DEF_NR_ZONES; 1104eb0570c7SDamien Le Moal opts->zone_size = ZLOOP_DEF_ZONE_SIZE; 1105eb0570c7SDamien Le Moal opts->nr_conv_zones = ZLOOP_DEF_NR_CONV_ZONES; 1106eb0570c7SDamien Le Moal opts->nr_queues = ZLOOP_DEF_NR_QUEUES; 1107eb0570c7SDamien Le Moal opts->queue_depth = ZLOOP_DEF_QUEUE_DEPTH; 1108eb0570c7SDamien Le Moal opts->buffered_io = ZLOOP_DEF_BUFFERED_IO; 1109eb0570c7SDamien Le Moal 1110eb0570c7SDamien Le Moal if (!buf) 1111eb0570c7SDamien Le Moal return 0; 1112eb0570c7SDamien Le Moal 1113eb0570c7SDamien Le Moal /* Skip leading spaces before the options. */ 1114eb0570c7SDamien Le Moal while (isspace(*buf)) 1115eb0570c7SDamien Le Moal buf++; 1116eb0570c7SDamien Le Moal 1117eb0570c7SDamien Le Moal options = o = kstrdup(buf, GFP_KERNEL); 1118eb0570c7SDamien Le Moal if (!options) 1119eb0570c7SDamien Le Moal return -ENOMEM; 1120eb0570c7SDamien Le Moal 1121eb0570c7SDamien Le Moal /* Parse the options, doing only some light invalid value checks. */ 1122eb0570c7SDamien Le Moal while ((p = strsep(&o, ",\n")) != NULL) { 1123eb0570c7SDamien Le Moal if (!*p) 1124eb0570c7SDamien Le Moal continue; 1125eb0570c7SDamien Le Moal 1126eb0570c7SDamien Le Moal token = match_token(p, zloop_opt_tokens, args); 1127eb0570c7SDamien Le Moal opts->mask |= token; 1128eb0570c7SDamien Le Moal switch (token) { 1129eb0570c7SDamien Le Moal case ZLOOP_OPT_ID: 1130eb0570c7SDamien Le Moal if (match_int(args, &opts->id)) { 1131eb0570c7SDamien Le Moal ret = -EINVAL; 1132eb0570c7SDamien Le Moal goto out; 1133eb0570c7SDamien Le Moal } 1134eb0570c7SDamien Le Moal break; 1135eb0570c7SDamien Le Moal case ZLOOP_OPT_CAPACITY: 1136eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1137eb0570c7SDamien Le Moal ret = -EINVAL; 1138eb0570c7SDamien Le Moal goto out; 1139eb0570c7SDamien Le Moal } 1140eb0570c7SDamien Le Moal if (!token) { 1141eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1142eb0570c7SDamien Le Moal ret = -EINVAL; 1143eb0570c7SDamien Le Moal goto out; 1144eb0570c7SDamien Le Moal } 1145eb0570c7SDamien Le Moal opts->capacity = 1146eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1147eb0570c7SDamien Le Moal break; 1148eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_SIZE: 1149eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1150eb0570c7SDamien Le Moal ret = -EINVAL; 1151eb0570c7SDamien Le Moal goto out; 1152eb0570c7SDamien Le Moal } 1153eb0570c7SDamien Le Moal if (!token || token > ZLOOP_MAX_ZONE_SIZE_MB || 1154eb0570c7SDamien Le Moal !is_power_of_2(token)) { 1155eb0570c7SDamien Le Moal pr_err("Invalid zone size %u\n", token); 1156eb0570c7SDamien Le Moal ret = -EINVAL; 1157eb0570c7SDamien Le Moal goto out; 1158eb0570c7SDamien Le Moal } 1159eb0570c7SDamien Le Moal opts->zone_size = 1160eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1161eb0570c7SDamien Le Moal break; 1162eb0570c7SDamien Le Moal case ZLOOP_OPT_ZONE_CAPACITY: 1163eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1164eb0570c7SDamien Le Moal ret = -EINVAL; 1165eb0570c7SDamien Le Moal goto out; 1166eb0570c7SDamien Le Moal } 1167eb0570c7SDamien Le Moal if (!token) { 1168eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1169eb0570c7SDamien Le Moal ret = -EINVAL; 1170eb0570c7SDamien Le Moal goto out; 1171eb0570c7SDamien Le Moal } 1172eb0570c7SDamien Le Moal opts->zone_capacity = 1173eb0570c7SDamien Le Moal ((sector_t)token * SZ_1M) >> SECTOR_SHIFT; 1174eb0570c7SDamien Le Moal break; 1175eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_CONV_ZONES: 1176eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1177eb0570c7SDamien Le Moal ret = -EINVAL; 1178eb0570c7SDamien Le Moal goto out; 1179eb0570c7SDamien Le Moal } 1180eb0570c7SDamien Le Moal opts->nr_conv_zones = token; 1181eb0570c7SDamien Le Moal break; 1182eb0570c7SDamien Le Moal case ZLOOP_OPT_BASE_DIR: 1183eb0570c7SDamien Le Moal p = match_strdup(args); 1184eb0570c7SDamien Le Moal if (!p) { 1185eb0570c7SDamien Le Moal ret = -ENOMEM; 1186eb0570c7SDamien Le Moal goto out; 1187eb0570c7SDamien Le Moal } 1188eb0570c7SDamien Le Moal kfree(opts->base_dir); 1189eb0570c7SDamien Le Moal opts->base_dir = p; 1190eb0570c7SDamien Le Moal break; 1191eb0570c7SDamien Le Moal case ZLOOP_OPT_NR_QUEUES: 1192eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1193eb0570c7SDamien Le Moal ret = -EINVAL; 1194eb0570c7SDamien Le Moal goto out; 1195eb0570c7SDamien Le Moal } 1196eb0570c7SDamien Le Moal if (!token) { 1197eb0570c7SDamien Le Moal pr_err("Invalid number of queues\n"); 1198eb0570c7SDamien Le Moal ret = -EINVAL; 1199eb0570c7SDamien Le Moal goto out; 1200eb0570c7SDamien Le Moal } 1201eb0570c7SDamien Le Moal opts->nr_queues = min(token, num_online_cpus()); 1202eb0570c7SDamien Le Moal break; 1203eb0570c7SDamien Le Moal case ZLOOP_OPT_QUEUE_DEPTH: 1204eb0570c7SDamien Le Moal if (match_uint(args, &token)) { 1205eb0570c7SDamien Le Moal ret = -EINVAL; 1206eb0570c7SDamien Le Moal goto out; 1207eb0570c7SDamien Le Moal } 1208eb0570c7SDamien Le Moal if (!token) { 1209eb0570c7SDamien Le Moal pr_err("Invalid queue depth\n"); 1210eb0570c7SDamien Le Moal ret = -EINVAL; 1211eb0570c7SDamien Le Moal goto out; 1212eb0570c7SDamien Le Moal } 1213eb0570c7SDamien Le Moal opts->queue_depth = token; 1214eb0570c7SDamien Le Moal break; 1215eb0570c7SDamien Le Moal case ZLOOP_OPT_BUFFERED_IO: 1216eb0570c7SDamien Le Moal opts->buffered_io = true; 1217eb0570c7SDamien Le Moal break; 1218eb0570c7SDamien Le Moal case ZLOOP_OPT_ERR: 1219eb0570c7SDamien Le Moal default: 1220eb0570c7SDamien Le Moal pr_warn("unknown parameter or missing value '%s'\n", p); 1221eb0570c7SDamien Le Moal ret = -EINVAL; 1222eb0570c7SDamien Le Moal goto out; 1223eb0570c7SDamien Le Moal } 1224eb0570c7SDamien Le Moal } 1225eb0570c7SDamien Le Moal 1226eb0570c7SDamien Le Moal ret = -EINVAL; 1227eb0570c7SDamien Le Moal if (opts->capacity <= opts->zone_size) { 1228eb0570c7SDamien Le Moal pr_err("Invalid capacity\n"); 1229eb0570c7SDamien Le Moal goto out; 1230eb0570c7SDamien Le Moal } 1231eb0570c7SDamien Le Moal 1232eb0570c7SDamien Le Moal if (opts->zone_capacity > opts->zone_size) { 1233eb0570c7SDamien Le Moal pr_err("Invalid zone capacity\n"); 1234eb0570c7SDamien Le Moal goto out; 1235eb0570c7SDamien Le Moal } 1236eb0570c7SDamien Le Moal 1237eb0570c7SDamien Le Moal ret = 0; 1238eb0570c7SDamien Le Moal out: 1239eb0570c7SDamien Le Moal kfree(options); 1240eb0570c7SDamien Le Moal return ret; 1241eb0570c7SDamien Le Moal } 1242eb0570c7SDamien Le Moal 1243eb0570c7SDamien Le Moal enum { 1244eb0570c7SDamien Le Moal ZLOOP_CTL_ADD, 1245eb0570c7SDamien Le Moal ZLOOP_CTL_REMOVE, 1246eb0570c7SDamien Le Moal }; 1247eb0570c7SDamien Le Moal 1248eb0570c7SDamien Le Moal static struct zloop_ctl_op { 1249eb0570c7SDamien Le Moal int code; 1250eb0570c7SDamien Le Moal const char *name; 1251eb0570c7SDamien Le Moal } zloop_ctl_ops[] = { 1252eb0570c7SDamien Le Moal { ZLOOP_CTL_ADD, "add" }, 1253eb0570c7SDamien Le Moal { ZLOOP_CTL_REMOVE, "remove" }, 1254eb0570c7SDamien Le Moal { -1, NULL }, 1255eb0570c7SDamien Le Moal }; 1256eb0570c7SDamien Le Moal 1257eb0570c7SDamien Le Moal static ssize_t zloop_ctl_write(struct file *file, const char __user *ubuf, 1258eb0570c7SDamien Le Moal size_t count, loff_t *pos) 1259eb0570c7SDamien Le Moal { 1260eb0570c7SDamien Le Moal struct zloop_options opts = { }; 1261eb0570c7SDamien Le Moal struct zloop_ctl_op *op; 1262eb0570c7SDamien Le Moal const char *buf, *opts_buf; 1263eb0570c7SDamien Le Moal int i, ret; 1264eb0570c7SDamien Le Moal 1265eb0570c7SDamien Le Moal if (count > PAGE_SIZE) 1266eb0570c7SDamien Le Moal return -ENOMEM; 1267eb0570c7SDamien Le Moal 1268eb0570c7SDamien Le Moal buf = memdup_user_nul(ubuf, count); 1269eb0570c7SDamien Le Moal if (IS_ERR(buf)) 1270eb0570c7SDamien Le Moal return PTR_ERR(buf); 1271eb0570c7SDamien Le Moal 1272eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_ctl_ops); i++) { 1273eb0570c7SDamien Le Moal op = &zloop_ctl_ops[i]; 1274eb0570c7SDamien Le Moal if (!op->name) { 1275eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1276eb0570c7SDamien Le Moal ret = -EINVAL; 1277eb0570c7SDamien Le Moal goto out; 1278eb0570c7SDamien Le Moal } 1279eb0570c7SDamien Le Moal if (!strncmp(buf, op->name, strlen(op->name))) 1280eb0570c7SDamien Le Moal break; 1281eb0570c7SDamien Le Moal } 1282eb0570c7SDamien Le Moal 1283eb0570c7SDamien Le Moal if (count <= strlen(op->name)) 1284eb0570c7SDamien Le Moal opts_buf = NULL; 1285eb0570c7SDamien Le Moal else 1286eb0570c7SDamien Le Moal opts_buf = buf + strlen(op->name); 1287eb0570c7SDamien Le Moal 1288eb0570c7SDamien Le Moal ret = zloop_parse_options(&opts, opts_buf); 1289eb0570c7SDamien Le Moal if (ret) { 1290eb0570c7SDamien Le Moal pr_err("Failed to parse options\n"); 1291eb0570c7SDamien Le Moal goto out; 1292eb0570c7SDamien Le Moal } 1293eb0570c7SDamien Le Moal 1294eb0570c7SDamien Le Moal switch (op->code) { 1295eb0570c7SDamien Le Moal case ZLOOP_CTL_ADD: 1296eb0570c7SDamien Le Moal ret = zloop_ctl_add(&opts); 1297eb0570c7SDamien Le Moal break; 1298eb0570c7SDamien Le Moal case ZLOOP_CTL_REMOVE: 1299eb0570c7SDamien Le Moal ret = zloop_ctl_remove(&opts); 1300eb0570c7SDamien Le Moal break; 1301eb0570c7SDamien Le Moal default: 1302eb0570c7SDamien Le Moal pr_err("Invalid operation\n"); 1303eb0570c7SDamien Le Moal ret = -EINVAL; 1304eb0570c7SDamien Le Moal goto out; 1305eb0570c7SDamien Le Moal } 1306eb0570c7SDamien Le Moal 1307eb0570c7SDamien Le Moal out: 1308eb0570c7SDamien Le Moal kfree(opts.base_dir); 1309eb0570c7SDamien Le Moal kfree(buf); 1310eb0570c7SDamien Le Moal return ret ? ret : count; 1311eb0570c7SDamien Le Moal } 1312eb0570c7SDamien Le Moal 1313eb0570c7SDamien Le Moal static int zloop_ctl_show(struct seq_file *seq_file, void *private) 1314eb0570c7SDamien Le Moal { 1315eb0570c7SDamien Le Moal const struct match_token *tok; 1316eb0570c7SDamien Le Moal int i; 1317eb0570c7SDamien Le Moal 1318eb0570c7SDamien Le Moal /* Add operation */ 1319eb0570c7SDamien Le Moal seq_printf(seq_file, "%s ", zloop_ctl_ops[0].name); 1320eb0570c7SDamien Le Moal for (i = 0; i < ARRAY_SIZE(zloop_opt_tokens); i++) { 1321eb0570c7SDamien Le Moal tok = &zloop_opt_tokens[i]; 1322eb0570c7SDamien Le Moal if (!tok->pattern) 1323eb0570c7SDamien Le Moal break; 1324eb0570c7SDamien Le Moal if (i) 1325eb0570c7SDamien Le Moal seq_putc(seq_file, ','); 1326eb0570c7SDamien Le Moal seq_puts(seq_file, tok->pattern); 1327eb0570c7SDamien Le Moal } 1328eb0570c7SDamien Le Moal seq_putc(seq_file, '\n'); 1329eb0570c7SDamien Le Moal 1330eb0570c7SDamien Le Moal /* Remove operation */ 1331eb0570c7SDamien Le Moal seq_puts(seq_file, zloop_ctl_ops[1].name); 1332eb0570c7SDamien Le Moal seq_puts(seq_file, " id=%d\n"); 1333eb0570c7SDamien Le Moal 1334eb0570c7SDamien Le Moal return 0; 1335eb0570c7SDamien Le Moal } 1336eb0570c7SDamien Le Moal 1337eb0570c7SDamien Le Moal static int zloop_ctl_open(struct inode *inode, struct file *file) 1338eb0570c7SDamien Le Moal { 1339eb0570c7SDamien Le Moal file->private_data = NULL; 1340eb0570c7SDamien Le Moal return single_open(file, zloop_ctl_show, NULL); 1341eb0570c7SDamien Le Moal } 1342eb0570c7SDamien Le Moal 1343eb0570c7SDamien Le Moal static int zloop_ctl_release(struct inode *inode, struct file *file) 1344eb0570c7SDamien Le Moal { 1345eb0570c7SDamien Le Moal return single_release(inode, file); 1346eb0570c7SDamien Le Moal } 1347eb0570c7SDamien Le Moal 1348eb0570c7SDamien Le Moal static const struct file_operations zloop_ctl_fops = { 1349eb0570c7SDamien Le Moal .owner = THIS_MODULE, 1350eb0570c7SDamien Le Moal .open = zloop_ctl_open, 1351eb0570c7SDamien Le Moal .release = zloop_ctl_release, 1352eb0570c7SDamien Le Moal .write = zloop_ctl_write, 1353eb0570c7SDamien Le Moal .read = seq_read, 1354eb0570c7SDamien Le Moal }; 1355eb0570c7SDamien Le Moal 1356eb0570c7SDamien Le Moal static struct miscdevice zloop_misc = { 1357eb0570c7SDamien Le Moal .minor = MISC_DYNAMIC_MINOR, 1358eb0570c7SDamien Le Moal .name = "zloop-control", 1359eb0570c7SDamien Le Moal .fops = &zloop_ctl_fops, 1360eb0570c7SDamien Le Moal }; 1361eb0570c7SDamien Le Moal 1362eb0570c7SDamien Le Moal static int __init zloop_init(void) 1363eb0570c7SDamien Le Moal { 1364eb0570c7SDamien Le Moal int ret; 1365eb0570c7SDamien Le Moal 1366eb0570c7SDamien Le Moal ret = misc_register(&zloop_misc); 1367eb0570c7SDamien Le Moal if (ret) { 1368eb0570c7SDamien Le Moal pr_err("Failed to register misc device: %d\n", ret); 1369eb0570c7SDamien Le Moal return ret; 1370eb0570c7SDamien Le Moal } 1371eb0570c7SDamien Le Moal pr_info("Module loaded\n"); 1372eb0570c7SDamien Le Moal 1373eb0570c7SDamien Le Moal return 0; 1374eb0570c7SDamien Le Moal } 1375eb0570c7SDamien Le Moal 1376eb0570c7SDamien Le Moal static void __exit zloop_exit(void) 1377eb0570c7SDamien Le Moal { 1378eb0570c7SDamien Le Moal misc_deregister(&zloop_misc); 1379eb0570c7SDamien Le Moal idr_destroy(&zloop_index_idr); 1380eb0570c7SDamien Le Moal } 1381eb0570c7SDamien Le Moal 1382eb0570c7SDamien Le Moal module_init(zloop_init); 1383eb0570c7SDamien Le Moal module_exit(zloop_exit); 1384eb0570c7SDamien Le Moal 1385eb0570c7SDamien Le Moal MODULE_DESCRIPTION("Zoned loopback device"); 1386eb0570c7SDamien Le Moal MODULE_LICENSE("GPL"); 1387