include/rdma/iter.h

*6094ea64SLeon Romanovsky/* SPDX-License-Identifier: GPL-2.0 OR Linux-OpenIB */
*6094ea64SLeon Romanovsky/* Copyright (c) 2026, NVIDIA CORPORATION & AFFILIATES. */
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky#ifndef _RDMA_ITER_H_
*6094ea64SLeon Romanovsky#define _RDMA_ITER_H_
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky#include <linux/scatterlist.h>
*6094ea64SLeon Romanovsky#include <rdma/ib_umem.h>
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky/**
*6094ea64SLeon Romanovsky * IB block DMA iterator
*6094ea64SLeon Romanovsky *
*6094ea64SLeon Romanovsky * Iterates the DMA-mapped SGL in contiguous memory blocks aligned
*6094ea64SLeon Romanovsky * to a HW supported page size.
*6094ea64SLeon Romanovsky */
*6094ea64SLeon Romanovskystruct ib_block_iter {
*6094ea64SLeon Romanovsky	/* internal states */
*6094ea64SLeon Romanovsky	struct scatterlist *__sg;	/* sg holding the current aligned block */
*6094ea64SLeon Romanovsky	dma_addr_t __dma_addr;		/* unaligned DMA address of this block */
*6094ea64SLeon Romanovsky	size_t __sg_numblocks;		/* ib_umem_num_dma_blocks() */
*6094ea64SLeon Romanovsky	unsigned int __sg_nents;	/* number of SG entries */
*6094ea64SLeon Romanovsky	unsigned int __sg_advance;	/* number of bytes to advance in sg in next step */
*6094ea64SLeon Romanovsky	unsigned int __pg_bit;		/* alignment of current block */
*6094ea64SLeon Romanovsky};
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovskyvoid __rdma_block_iter_start(struct ib_block_iter *biter,
*6094ea64SLeon Romanovsky			     struct scatterlist *sglist,
*6094ea64SLeon Romanovsky			     unsigned int nents,
*6094ea64SLeon Romanovsky			     unsigned long pgsz);
*6094ea64SLeon Romanovskybool __rdma_block_iter_next(struct ib_block_iter *biter);
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky/**
*6094ea64SLeon Romanovsky * rdma_block_iter_dma_address - get the aligned dma address of the current
*6094ea64SLeon Romanovsky * block held by the block iterator.
*6094ea64SLeon Romanovsky * @biter: block iterator holding the memory block
*6094ea64SLeon Romanovsky */
*6094ea64SLeon Romanovskystatic inline dma_addr_t
*6094ea64SLeon Romanovskyrdma_block_iter_dma_address(struct ib_block_iter *biter)
*6094ea64SLeon Romanovsky{
*6094ea64SLeon Romanovsky	return biter->__dma_addr & ~(BIT_ULL(biter->__pg_bit) - 1);
*6094ea64SLeon Romanovsky}
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky/**
*6094ea64SLeon Romanovsky * rdma_for_each_block - iterate over contiguous memory blocks of the sg list
*6094ea64SLeon Romanovsky * @sglist: sglist to iterate over
*6094ea64SLeon Romanovsky * @biter: block iterator holding the memory block
*6094ea64SLeon Romanovsky * @nents: maximum number of sg entries to iterate over
*6094ea64SLeon Romanovsky * @pgsz: best HW supported page size to use
*6094ea64SLeon Romanovsky *
*6094ea64SLeon Romanovsky * Callers may use rdma_block_iter_dma_address() to get each
*6094ea64SLeon Romanovsky * blocks aligned DMA address.
*6094ea64SLeon Romanovsky */
*6094ea64SLeon Romanovsky#define rdma_for_each_block(sglist, biter, nents, pgsz)		\
*6094ea64SLeon Romanovsky	for (__rdma_block_iter_start(biter, sglist, nents,	\
*6094ea64SLeon Romanovsky				     pgsz);			\
*6094ea64SLeon Romanovsky	     __rdma_block_iter_next(biter);)
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovskystatic inline void __rdma_umem_block_iter_start(struct ib_block_iter *biter,
*6094ea64SLeon Romanovsky						struct ib_umem *umem,
*6094ea64SLeon Romanovsky						unsigned long pgsz)
*6094ea64SLeon Romanovsky{
*6094ea64SLeon Romanovsky	__rdma_block_iter_start(biter, umem->sgt_append.sgt.sgl,
*6094ea64SLeon Romanovsky				umem->sgt_append.sgt.nents, pgsz);
*6094ea64SLeon Romanovsky	biter->__sg_advance = ib_umem_offset(umem) & ~(pgsz - 1);
*6094ea64SLeon Romanovsky	biter->__sg_numblocks = ib_umem_num_dma_blocks(umem, pgsz);
*6094ea64SLeon Romanovsky}
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovskystatic inline bool __rdma_umem_block_iter_next(struct ib_block_iter *biter)
*6094ea64SLeon Romanovsky{
*6094ea64SLeon Romanovsky	return __rdma_block_iter_next(biter) && biter->__sg_numblocks--;
*6094ea64SLeon Romanovsky}
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky/**
*6094ea64SLeon Romanovsky * rdma_umem_for_each_dma_block - iterate over contiguous DMA blocks of the umem
*6094ea64SLeon Romanovsky * @umem: umem to iterate over
*6094ea64SLeon Romanovsky * @pgsz: Page size to split the list into
*6094ea64SLeon Romanovsky *
*6094ea64SLeon Romanovsky * pgsz must be <= PAGE_SIZE or computed by ib_umem_find_best_pgsz(). The
*6094ea64SLeon Romanovsky * returned DMA blocks will be aligned to pgsz and span the range:
*6094ea64SLeon Romanovsky * ALIGN_DOWN(umem->address, pgsz) to ALIGN(umem->address + umem->length, pgsz)
*6094ea64SLeon Romanovsky *
*6094ea64SLeon Romanovsky * Performs exactly ib_umem_num_dma_blocks() iterations.
*6094ea64SLeon Romanovsky */
*6094ea64SLeon Romanovsky#define rdma_umem_for_each_dma_block(umem, biter, pgsz)                        \
*6094ea64SLeon Romanovsky	for (__rdma_umem_block_iter_start(biter, umem, pgsz);                  \
*6094ea64SLeon Romanovsky	     __rdma_umem_block_iter_next(biter);)
*6094ea64SLeon Romanovsky
*6094ea64SLeon Romanovsky#endif /* _RDMA_ITER_H_ */