gpu/tests/gpu_buddy_test.c

4a9671a0SJoel Fernandes// SPDX-License-Identifier: MIT
4a9671a0SJoel Fernandes/*
4a9671a0SJoel Fernandes * Copyright © 2019 Intel Corporation
4a9671a0SJoel Fernandes * Copyright © 2022 Maíra Canal <mairacanal@riseup.net>
4a9671a0SJoel Fernandes */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes#include <kunit/test.h>
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes#include <linux/prime_numbers.h>
4a9671a0SJoel Fernandes#include <linux/sched/signal.h>
4a9671a0SJoel Fernandes#include <linux/sizes.h>
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes#include <linux/gpu_buddy.h>
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes#include "gpu_random.h"
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandesstatic unsigned int random_seed;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandesstatic inline u64 get_size(int order, u64 chunk_size)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	return (1 << order) * chunk_size;
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
f5bd7da0SArunpravin Paneer Selvamstatic void gpu_test_buddy_subtree_offset_alignment_stress(struct kunit *test)
f5bd7da0SArunpravin Paneer Selvam{
f5bd7da0SArunpravin Paneer Selvam	struct gpu_buddy_block *block;
f5bd7da0SArunpravin Paneer Selvam	struct rb_node *node = NULL;
f5bd7da0SArunpravin Paneer Selvam	const u64 mm_size = SZ_2M;
f5bd7da0SArunpravin Paneer Selvam	const u64 alignments[] = {
f5bd7da0SArunpravin Paneer Selvam		SZ_1M,
f5bd7da0SArunpravin Paneer Selvam		SZ_512K,
f5bd7da0SArunpravin Paneer Selvam		SZ_256K,
f5bd7da0SArunpravin Paneer Selvam		SZ_128K,
f5bd7da0SArunpravin Paneer Selvam		SZ_64K,
f5bd7da0SArunpravin Paneer Selvam		SZ_32K,
f5bd7da0SArunpravin Paneer Selvam		SZ_16K,
f5bd7da0SArunpravin Paneer Selvam		SZ_8K,
f5bd7da0SArunpravin Paneer Selvam	};
f5bd7da0SArunpravin Paneer Selvam	struct list_head allocated[ARRAY_SIZE(alignments)];
f5bd7da0SArunpravin Paneer Selvam	unsigned int i, max_subtree_align = 0;
f5bd7da0SArunpravin Paneer Selvam	int ret, tree, order;
f5bd7da0SArunpravin Paneer Selvam	struct gpu_buddy mm;
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
f5bd7da0SArunpravin Paneer Selvam			       "buddy_init failed\n");
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	for (i = 0; i < ARRAY_SIZE(allocated); i++)
f5bd7da0SArunpravin Paneer Selvam		INIT_LIST_HEAD(&allocated[i]);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	/*
f5bd7da0SArunpravin Paneer Selvam	 * Exercise subtree_max_alignment tracking by allocating blocks with descending
f5bd7da0SArunpravin Paneer Selvam	 * alignment constraints and freeing them in reverse order. This verifies that
f5bd7da0SArunpravin Paneer Selvam	 * free-tree augmentation correctly propagates the maximum offset alignment
f5bd7da0SArunpravin Paneer Selvam	 * present in each subtree at every stage.
f5bd7da0SArunpravin Paneer Selvam	 */
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	for (i = 0; i < ARRAY_SIZE(alignments); i++) {
f5bd7da0SArunpravin Paneer Selvam		struct gpu_buddy_block *root = NULL;
f5bd7da0SArunpravin Paneer Selvam		unsigned int expected;
f5bd7da0SArunpravin Paneer Selvam		u64 align;
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		align = alignments[i];
f5bd7da0SArunpravin Paneer Selvam		expected = ilog2(align) - 1;
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		for (;;) {
f5bd7da0SArunpravin Paneer Selvam			ret = gpu_buddy_alloc_blocks(&mm,
f5bd7da0SArunpravin Paneer Selvam						     0, mm_size,
f5bd7da0SArunpravin Paneer Selvam						     SZ_4K, align,
f5bd7da0SArunpravin Paneer Selvam						     &allocated[i],
f5bd7da0SArunpravin Paneer Selvam						     0);
f5bd7da0SArunpravin Paneer Selvam			if (ret)
f5bd7da0SArunpravin Paneer Selvam				break;
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam			block = list_last_entry(&allocated[i],
f5bd7da0SArunpravin Paneer Selvam						struct gpu_buddy_block,
f5bd7da0SArunpravin Paneer Selvam						link);
f5bd7da0SArunpravin Paneer Selvam			KUNIT_EXPECT_TRUE(test, IS_ALIGNED(gpu_buddy_block_offset(block), align));
f5bd7da0SArunpravin Paneer Selvam		}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		for (order = mm.max_order; order >= 0 && !root; order--) {
f5bd7da0SArunpravin Paneer Selvam			for (tree = 0; tree < 2; tree++) {
f5bd7da0SArunpravin Paneer Selvam				node = mm.free_trees[tree][order].rb_node;
f5bd7da0SArunpravin Paneer Selvam				if (node) {
f5bd7da0SArunpravin Paneer Selvam					root = container_of(node,
f5bd7da0SArunpravin Paneer Selvam							    struct gpu_buddy_block,
f5bd7da0SArunpravin Paneer Selvam							    rb);
f5bd7da0SArunpravin Paneer Selvam					break;
f5bd7da0SArunpravin Paneer Selvam				}
f5bd7da0SArunpravin Paneer Selvam			}
f5bd7da0SArunpravin Paneer Selvam		}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		KUNIT_ASSERT_NOT_NULL(test, root);
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_EQ(test, root->subtree_max_alignment, expected);
f5bd7da0SArunpravin Paneer Selvam	}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	for (i = ARRAY_SIZE(alignments); i-- > 0; ) {
f5bd7da0SArunpravin Paneer Selvam		gpu_buddy_free_list(&mm, &allocated[i], 0);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		for (order = 0; order <= mm.max_order; order++) {
f5bd7da0SArunpravin Paneer Selvam			for (tree = 0; tree < 2; tree++) {
f5bd7da0SArunpravin Paneer Selvam				node = mm.free_trees[tree][order].rb_node;
f5bd7da0SArunpravin Paneer Selvam				if (!node)
f5bd7da0SArunpravin Paneer Selvam					continue;
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam				block = container_of(node, struct gpu_buddy_block, rb);
f5bd7da0SArunpravin Paneer Selvam				max_subtree_align = max(max_subtree_align,
f5bd7da0SArunpravin Paneer Selvam							block->subtree_max_alignment);
f5bd7da0SArunpravin Paneer Selvam			}
f5bd7da0SArunpravin Paneer Selvam		}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_GE(test, max_subtree_align, ilog2(alignments[i]));
f5bd7da0SArunpravin Paneer Selvam	}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	gpu_buddy_fini(&mm);
f5bd7da0SArunpravin Paneer Selvam}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvamstatic void gpu_test_buddy_offset_aligned_allocation(struct kunit *test)
f5bd7da0SArunpravin Paneer Selvam{
f5bd7da0SArunpravin Paneer Selvam	struct gpu_buddy_block *block, *tmp;
f5bd7da0SArunpravin Paneer Selvam	int num_blocks, i, count = 0;
f5bd7da0SArunpravin Paneer Selvam	LIST_HEAD(allocated);
f5bd7da0SArunpravin Paneer Selvam	struct gpu_buddy mm;
f5bd7da0SArunpravin Paneer Selvam	u64 mm_size = SZ_4M;
f5bd7da0SArunpravin Paneer Selvam	LIST_HEAD(freed);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
f5bd7da0SArunpravin Paneer Selvam			       "buddy_init failed\n");
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	num_blocks = mm_size / SZ_256K;
f5bd7da0SArunpravin Paneer Selvam	/*
f5bd7da0SArunpravin Paneer Selvam	 * Allocate multiple sizes under a fixed offset alignment.
f5bd7da0SArunpravin Paneer Selvam	 * Ensures alignment handling is independent of allocation size and
f5bd7da0SArunpravin Paneer Selvam	 * exercises subtree max-alignment pruning for small requests.
f5bd7da0SArunpravin Paneer Selvam	 */
f5bd7da0SArunpravin Paneer Selvam	for (i = 0; i < num_blocks; i++)
f5bd7da0SArunpravin Paneer Selvam		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_8K, SZ_256K,
f5bd7da0SArunpravin Paneer Selvam								    &allocated, 0),
f5bd7da0SArunpravin Paneer Selvam					"buddy_alloc hit an error size=%u\n", SZ_8K);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	list_for_each_entry(block, &allocated, link) {
f5bd7da0SArunpravin Paneer Selvam		/* Ensure the allocated block uses the expected 8 KB size */
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_EQ(test, gpu_buddy_block_size(&mm, block), SZ_8K);
f5bd7da0SArunpravin Paneer Selvam		/* Ensure the block starts at a 256 KB-aligned offset for proper alignment */
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_TRUE(test, IS_ALIGNED(gpu_buddy_block_offset(block), SZ_256K));
f5bd7da0SArunpravin Paneer Selvam	}
f5bd7da0SArunpravin Paneer Selvam	gpu_buddy_free_list(&mm, &allocated, 0);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	for (i = 0; i < num_blocks; i++)
f5bd7da0SArunpravin Paneer Selvam		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_16K, SZ_256K,
f5bd7da0SArunpravin Paneer Selvam								    &allocated, 0),
f5bd7da0SArunpravin Paneer Selvam					"buddy_alloc hit an error size=%u\n", SZ_16K);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	list_for_each_entry(block, &allocated, link) {
f5bd7da0SArunpravin Paneer Selvam		/* Ensure the allocated block uses the expected 16 KB size */
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_EQ(test, gpu_buddy_block_size(&mm, block), SZ_16K);
f5bd7da0SArunpravin Paneer Selvam		/* Ensure the block starts at a 256 KB-aligned offset for proper alignment */
f5bd7da0SArunpravin Paneer Selvam		KUNIT_EXPECT_TRUE(test, IS_ALIGNED(gpu_buddy_block_offset(block), SZ_256K));
f5bd7da0SArunpravin Paneer Selvam	}
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	/*
f5bd7da0SArunpravin Paneer Selvam	 * Free alternating aligned blocks to introduce fragmentation.
f5bd7da0SArunpravin Paneer Selvam	 * Ensures offset-aligned allocations remain valid after frees and
f5bd7da0SArunpravin Paneer Selvam	 * verifies subtree max-alignment metadata is correctly maintained.
f5bd7da0SArunpravin Paneer Selvam	 */
f5bd7da0SArunpravin Paneer Selvam	list_for_each_entry_safe(block, tmp, &allocated, link) {
f5bd7da0SArunpravin Paneer Selvam		if (count % 2 == 0)
f5bd7da0SArunpravin Paneer Selvam			list_move_tail(&block->link, &freed);
f5bd7da0SArunpravin Paneer Selvam		count++;
f5bd7da0SArunpravin Paneer Selvam	}
f5bd7da0SArunpravin Paneer Selvam	gpu_buddy_free_list(&mm, &freed, 0);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	for (i = 0; i < num_blocks / 2; i++)
f5bd7da0SArunpravin Paneer Selvam		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_16K, SZ_256K,
f5bd7da0SArunpravin Paneer Selvam								    &allocated, 0),
f5bd7da0SArunpravin Paneer Selvam					"buddy_alloc hit an error size=%u\n", SZ_16K);
f5bd7da0SArunpravin Paneer Selvam
f5bd7da0SArunpravin Paneer Selvam	/*
f5bd7da0SArunpravin Paneer Selvam	 * Allocate with offset alignment after all slots are used; must fail.
f5bd7da0SArunpravin Paneer Selvam	 * Confirms that no aligned offsets remain.
f5bd7da0SArunpravin Paneer Selvam	 */
f5bd7da0SArunpravin Paneer Selvam	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_16K, SZ_256K,
f5bd7da0SArunpravin Paneer Selvam							   &allocated, 0),
f5bd7da0SArunpravin Paneer Selvam			       "buddy_alloc hit an error size=%u\n", SZ_16K);
f5bd7da0SArunpravin Paneer Selvam	gpu_buddy_free_list(&mm, &allocated, 0);
f5bd7da0SArunpravin Paneer Selvam	gpu_buddy_fini(&mm);
f5bd7da0SArunpravin Paneer Selvam}
f5bd7da0SArunpravin Paneer Selvam
ba110db8SJoel Fernandesstatic void gpu_test_buddy_fragmentation_performance(struct kunit *test)
4a9671a0SJoel Fernandes{
ba110db8SJoel Fernandes	struct gpu_buddy_block *block, *tmp;
4a9671a0SJoel Fernandes	int num_blocks, i, ret, count = 0;
4a9671a0SJoel Fernandes	LIST_HEAD(allocated_blocks);
4a9671a0SJoel Fernandes	unsigned long elapsed_ms;
4a9671a0SJoel Fernandes	LIST_HEAD(reverse_list);
4a9671a0SJoel Fernandes	LIST_HEAD(test_blocks);
4a9671a0SJoel Fernandes	LIST_HEAD(clear_list);
4a9671a0SJoel Fernandes	LIST_HEAD(dirty_list);
4a9671a0SJoel Fernandes	LIST_HEAD(free_list);
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	u64 mm_size = SZ_4G;
4a9671a0SJoel Fernandes	ktime_t start, end;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Allocation under severe fragmentation
4a9671a0SJoel Fernandes	 *
4a9671a0SJoel Fernandes	 * Create severe fragmentation by allocating the entire 4 GiB address space
4a9671a0SJoel Fernandes	 * as tiny 8 KiB blocks but forcing a 64 KiB alignment. The resulting pattern
4a9671a0SJoel Fernandes	 * leaves many scattered holes. Split the allocations into two groups and
4a9671a0SJoel Fernandes	 * return them with different flags to block coalescing, then repeatedly
4a9671a0SJoel Fernandes	 * allocate and free 64 KiB blocks while timing the loop. This stresses how
4a9671a0SJoel Fernandes	 * quickly the allocator can satisfy larger, aligned requests from a pool of
4a9671a0SJoel Fernandes	 * highly fragmented space.
4a9671a0SJoel Fernandes	 */
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	num_blocks = mm_size / SZ_64K;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	start = ktime_get();
4a9671a0SJoel Fernandes	/* Allocate with maximum fragmentation - 8K blocks with 64K alignment */
4a9671a0SJoel Fernandes	for (i = 0; i < num_blocks; i++)
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_8K, SZ_64K,
4a9671a0SJoel Fernandes								    &allocated_blocks, 0),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%u\n", SZ_8K);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry_safe(block, tmp, &allocated_blocks, link) {
4a9671a0SJoel Fernandes		if (count % 4 == 0 || count % 4 == 3)
4a9671a0SJoel Fernandes			list_move_tail(&block->link, &clear_list);
4a9671a0SJoel Fernandes		else
4a9671a0SJoel Fernandes			list_move_tail(&block->link, &dirty_list);
4a9671a0SJoel Fernandes		count++;
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Free with different flags to ensure no coalescing */
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &clear_list, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &dirty_list, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	for (i = 0; i < num_blocks; i++)
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_64K, SZ_64K,
4a9671a0SJoel Fernandes								    &test_blocks, 0),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%u\n", SZ_64K);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &test_blocks, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	end = ktime_get();
4a9671a0SJoel Fernandes	elapsed_ms = ktime_to_ms(ktime_sub(end, start));
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	kunit_info(test, "Fragmented allocation took %lu ms\n", elapsed_ms);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Reverse free order under fragmentation
4a9671a0SJoel Fernandes	 *
4a9671a0SJoel Fernandes	 * Construct a fragmented 4 GiB space by allocating every 8 KiB block with
4a9671a0SJoel Fernandes	 * 64 KiB alignment, creating a dense scatter of small regions. Half of the
4a9671a0SJoel Fernandes	 * blocks are selectively freed to form sparse gaps, while the remaining
4a9671a0SJoel Fernandes	 * allocations are preserved, reordered in reverse, and released back with
4a9671a0SJoel Fernandes	 * the cleared flag. This models a pathological reverse-ordered free pattern
4a9671a0SJoel Fernandes	 * and measures how quickly the allocator can merge and reclaim space when
4a9671a0SJoel Fernandes	 * deallocation occurs in the opposite order of allocation, exposing the
4a9671a0SJoel Fernandes	 * cost difference between a linear freelist scan and an ordered tree lookup.
4a9671a0SJoel Fernandes	 */
ba110db8SJoel Fernandes	ret = gpu_buddy_init(&mm, mm_size, SZ_4K);
4a9671a0SJoel Fernandes	KUNIT_ASSERT_EQ(test, ret, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	start = ktime_get();
4a9671a0SJoel Fernandes	/* Allocate maximum fragmentation */
4a9671a0SJoel Fernandes	for (i = 0; i < num_blocks; i++)
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, SZ_8K, SZ_64K,
4a9671a0SJoel Fernandes								    &allocated_blocks, 0),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%u\n", SZ_8K);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry_safe(block, tmp, &allocated_blocks, link) {
4a9671a0SJoel Fernandes		if (count % 2 == 0)
4a9671a0SJoel Fernandes			list_move_tail(&block->link, &free_list);
4a9671a0SJoel Fernandes		count++;
4a9671a0SJoel Fernandes	}
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &free_list, GPU_BUDDY_CLEARED);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry_safe_reverse(block, tmp, &allocated_blocks, link)
4a9671a0SJoel Fernandes		list_move(&block->link, &reverse_list);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &reverse_list, GPU_BUDDY_CLEARED);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	end = ktime_get();
4a9671a0SJoel Fernandes	elapsed_ms = ktime_to_ms(ktime_sub(end, start));
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	kunit_info(test, "Reverse-ordered free took %lu ms\n", elapsed_ms);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_range_bias(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u32 mm_size, size, ps, bias_size, bias_start, bias_end, bias_rem;
ba110db8SJoel Fernandes	GPU_RND_STATE(prng, random_seed);
4a9671a0SJoel Fernandes	unsigned int i, count, *order;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
4a9671a0SJoel Fernandes	unsigned long flags;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	LIST_HEAD(allocated);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	bias_size = SZ_1M;
4a9671a0SJoel Fernandes	ps = roundup_pow_of_two(prandom_u32_state(&prng) % bias_size);
4a9671a0SJoel Fernandes	ps = max(SZ_4K, ps);
4a9671a0SJoel Fernandes	mm_size = (SZ_8M-1) & ~(ps-1); /* Multiple roots */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	kunit_info(test, "mm_size=%u, ps=%u\n", mm_size, ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, ps),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	count = mm_size / bias_size;
ba110db8SJoel Fernandes	order = gpu_random_order(count, &prng);
4a9671a0SJoel Fernandes	KUNIT_EXPECT_TRUE(test, order);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Idea is to split the address space into uniform bias ranges, and then
4a9671a0SJoel Fernandes	 * in some random order allocate within each bias, using various
4a9671a0SJoel Fernandes	 * patterns within. This should detect if allocations leak out from a
4a9671a0SJoel Fernandes	 * given bias, for example.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	for (i = 0; i < count; i++) {
4a9671a0SJoel Fernandes		LIST_HEAD(tmp);
4a9671a0SJoel Fernandes		u32 size;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		bias_start = order[i] * bias_size;
4a9671a0SJoel Fernandes		bias_end = bias_start + bias_size;
4a9671a0SJoel Fernandes		bias_rem = bias_size;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* internal round_up too big */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes				      gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							     bias_end, bias_size + ps, bias_size,
4a9671a0SJoel Fernandes							     &allocated,
ba110db8SJoel Fernandes							     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				      "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				      bias_start, bias_end, bias_size, bias_size);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* size too big */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes				      gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							     bias_end, bias_size + ps, ps,
4a9671a0SJoel Fernandes							     &allocated,
ba110db8SJoel Fernandes							     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				      "buddy_alloc didn't fail with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				      bias_start, bias_end, bias_size + ps, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* bias range too small for size */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes				      gpu_buddy_alloc_blocks(&mm, bias_start + ps,
4a9671a0SJoel Fernandes							     bias_end, bias_size, ps,
4a9671a0SJoel Fernandes							     &allocated,
ba110db8SJoel Fernandes							     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				      "buddy_alloc didn't fail with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				      bias_start + ps, bias_end, bias_size, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* bias misaligned */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes				      gpu_buddy_alloc_blocks(&mm, bias_start + ps,
4a9671a0SJoel Fernandes							     bias_end - ps,
4a9671a0SJoel Fernandes							     bias_size >> 1, bias_size >> 1,
4a9671a0SJoel Fernandes							     &allocated,
ba110db8SJoel Fernandes							     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				      "buddy_alloc h didn't fail with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				      bias_start + ps, bias_end - ps, bias_size >> 1, bias_size >> 1);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* single big page */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes				       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							      bias_end, bias_size, bias_size,
4a9671a0SJoel Fernandes							      &tmp,
ba110db8SJoel Fernandes							      GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				       "buddy_alloc i failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				       bias_start, bias_end, bias_size, bias_size);
ba110db8SJoel Fernandes		gpu_buddy_free_list(&mm, &tmp, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* single page with internal round_up */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes				       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							      bias_end, ps, bias_size,
4a9671a0SJoel Fernandes							      &tmp,
ba110db8SJoel Fernandes							      GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				       "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				       bias_start, bias_end, ps, bias_size);
ba110db8SJoel Fernandes		gpu_buddy_free_list(&mm, &tmp, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* random size within */
4a9671a0SJoel Fernandes		size = max(round_up(prandom_u32_state(&prng) % bias_rem, ps), ps);
4a9671a0SJoel Fernandes		if (size)
4a9671a0SJoel Fernandes			KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes					       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes								      bias_end, size, ps,
4a9671a0SJoel Fernandes								      &tmp,
ba110db8SJoel Fernandes								      GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes					       "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes					       bias_start, bias_end, size, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		bias_rem -= size;
4a9671a0SJoel Fernandes		/* too big for current avail */
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes				      gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							     bias_end, bias_rem + ps, ps,
4a9671a0SJoel Fernandes							     &allocated,
ba110db8SJoel Fernandes							     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				      "buddy_alloc didn't fail with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				      bias_start, bias_end, bias_rem + ps, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		if (bias_rem) {
4a9671a0SJoel Fernandes			/* random fill of the remainder */
4a9671a0SJoel Fernandes			size = max(round_up(prandom_u32_state(&prng) % bias_rem, ps), ps);
4a9671a0SJoel Fernandes			size = max(size, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes			KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes					       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes								      bias_end, size, ps,
4a9671a0SJoel Fernandes								      &allocated,
ba110db8SJoel Fernandes								      GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes					       "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes					       bias_start, bias_end, size, ps);
4a9671a0SJoel Fernandes			/*
4a9671a0SJoel Fernandes			 * Intentionally allow some space to be left
4a9671a0SJoel Fernandes			 * unallocated, and ideally not always on the bias
4a9671a0SJoel Fernandes			 * boundaries.
4a9671a0SJoel Fernandes			 */
ba110db8SJoel Fernandes			gpu_buddy_free_list(&mm, &tmp, 0);
4a9671a0SJoel Fernandes		} else {
4a9671a0SJoel Fernandes			list_splice_tail(&tmp, &allocated);
4a9671a0SJoel Fernandes		}
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	kfree(order);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Something more free-form. Idea is to pick a random starting bias
4a9671a0SJoel Fernandes	 * range within the address space and then start filling it up. Also
4a9671a0SJoel Fernandes	 * randomly grow the bias range in both directions as we go along. This
4a9671a0SJoel Fernandes	 * should give us bias start/end which is not always uniform like above,
4a9671a0SJoel Fernandes	 * and in some cases will require the allocator to jump over already
4a9671a0SJoel Fernandes	 * allocated nodes in the middle of the address space.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, ps),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	bias_start = round_up(prandom_u32_state(&prng) % (mm_size - ps), ps);
4a9671a0SJoel Fernandes	bias_end = round_up(bias_start + prandom_u32_state(&prng) % (mm_size - bias_start), ps);
4a9671a0SJoel Fernandes	bias_end = max(bias_end, bias_start + ps);
4a9671a0SJoel Fernandes	bias_rem = bias_end - bias_start;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	do {
4a9671a0SJoel Fernandes		u32 size = max(round_up(prandom_u32_state(&prng) % bias_rem, ps), ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes				       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes							      bias_end, size, ps,
4a9671a0SJoel Fernandes							      &allocated,
ba110db8SJoel Fernandes							      GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				       "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes				       bias_start, bias_end, size, ps);
4a9671a0SJoel Fernandes		bias_rem -= size;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/*
4a9671a0SJoel Fernandes		 * Try to randomly grow the bias range in both directions, or
4a9671a0SJoel Fernandes		 * only one, or perhaps don't grow at all.
4a9671a0SJoel Fernandes		 */
4a9671a0SJoel Fernandes		do {
4a9671a0SJoel Fernandes			u32 old_bias_start = bias_start;
4a9671a0SJoel Fernandes			u32 old_bias_end = bias_end;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes			if (bias_start)
4a9671a0SJoel Fernandes				bias_start -= round_up(prandom_u32_state(&prng) % bias_start, ps);
4a9671a0SJoel Fernandes			if (bias_end != mm_size)
4a9671a0SJoel Fernandes				bias_end += round_up(prandom_u32_state(&prng) % (mm_size - bias_end), ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes			bias_rem += old_bias_start - bias_start;
4a9671a0SJoel Fernandes			bias_rem += bias_end - old_bias_end;
4a9671a0SJoel Fernandes		} while (!bias_rem && (bias_start || bias_end != mm_size));
4a9671a0SJoel Fernandes	} while (bias_rem);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_ASSERT_EQ(test, bias_start, 0);
4a9671a0SJoel Fernandes	KUNIT_ASSERT_EQ(test, bias_end, mm_size);
4a9671a0SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test,
ba110db8SJoel Fernandes			      gpu_buddy_alloc_blocks(&mm, bias_start, bias_end,
4a9671a0SJoel Fernandes						     ps, ps,
4a9671a0SJoel Fernandes						     &allocated,
ba110db8SJoel Fernandes						     GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes			      "buddy_alloc passed with bias(%x-%x), size=%u\n",
4a9671a0SJoel Fernandes			      bias_start, bias_end, ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
ba110db8SJoel Fernandes	 * Allocate cleared blocks in the bias range when the GPU buddy's clear avail is
4a9671a0SJoel Fernandes	 * zero. This will validate the bias range allocation in scenarios like system boot
4a9671a0SJoel Fernandes	 * when no cleared blocks are available and exercise the fallback path too. The resulting
4a9671a0SJoel Fernandes	 * blocks should always be dirty.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, ps),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	bias_start = round_up(prandom_u32_state(&prng) % (mm_size - ps), ps);
4a9671a0SJoel Fernandes	bias_end = round_up(bias_start + prandom_u32_state(&prng) % (mm_size - bias_start), ps);
4a9671a0SJoel Fernandes	bias_end = max(bias_end, bias_start + ps);
4a9671a0SJoel Fernandes	bias_rem = bias_end - bias_start;
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	flags = GPU_BUDDY_CLEAR_ALLOCATION | GPU_BUDDY_RANGE_ALLOCATION;
4a9671a0SJoel Fernandes	size = max(round_up(prandom_u32_state(&prng) % bias_rem, ps), ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes			       gpu_buddy_alloc_blocks(&mm, bias_start,
4a9671a0SJoel Fernandes						      bias_end, size, ps,
4a9671a0SJoel Fernandes						      &allocated,
4a9671a0SJoel Fernandes						      flags),
4a9671a0SJoel Fernandes			       "buddy_alloc failed with bias(%x-%x), size=%u, ps=%u\n",
4a9671a0SJoel Fernandes			       bias_start, bias_end, size, ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry(block, &allocated, link)
ba110db8SJoel Fernandes		KUNIT_EXPECT_EQ(test, gpu_buddy_block_is_clear(block), false);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
*bdca18a6SSanjay Yadavstatic void gpu_test_buddy_alloc_range(struct kunit *test)
*bdca18a6SSanjay Yadav{
*bdca18a6SSanjay Yadav	GPU_RND_STATE(prng, random_seed);
*bdca18a6SSanjay Yadav	struct gpu_buddy_block *block;
*bdca18a6SSanjay Yadav	struct gpu_buddy mm;
*bdca18a6SSanjay Yadav	u32 mm_size, total;
*bdca18a6SSanjay Yadav	LIST_HEAD(blocks);
*bdca18a6SSanjay Yadav	LIST_HEAD(tmp);
*bdca18a6SSanjay Yadav	u32 ps = SZ_4K;
*bdca18a6SSanjay Yadav	int ret;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, ps),
*bdca18a6SSanjay Yadav			       "buddy_init failed\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Basic exact-range allocation.
*bdca18a6SSanjay Yadav	 * Allocate the entire mm as one exact range (start + size == end).
*bdca18a6SSanjay Yadav	 * This is the simplest case exercising __gpu_buddy_alloc_range.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, mm_size, mm_size, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav			    "exact-range alloc of full mm failed\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	total = 0;
*bdca18a6SSanjay Yadav	list_for_each_entry(block, &blocks, link) {
*bdca18a6SSanjay Yadav		u64 offset = gpu_buddy_block_offset(block);
*bdca18a6SSanjay Yadav		u64 bsize = gpu_buddy_block_size(&mm, block);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		KUNIT_EXPECT_TRUE_MSG(test, offset + bsize <= (u64)mm_size,
*bdca18a6SSanjay Yadav				      "block [%llx, %llx) outside mm\n", offset, offset + bsize);
*bdca18a6SSanjay Yadav		total += (u32)bsize;
*bdca18a6SSanjay Yadav	}
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, total, mm_size);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Full mm should be exhausted */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, ps, ps, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE_MSG(test, ret, 0, "alloc should fail when mm is full\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, mm.avail, (u64)mm_size);
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Exact-range allocation of sub-ranges.
*bdca18a6SSanjay Yadav	 * Split the mm into four equal quarters and allocate each as an exact
*bdca18a6SSanjay Yadav	 * range. Validates splitting and non-overlapping exact allocations.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	{
*bdca18a6SSanjay Yadav		u32 quarter = mm_size / 4;
*bdca18a6SSanjay Yadav		int i;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		for (i = 0; i < 4; i++) {
*bdca18a6SSanjay Yadav			u32 start = i * quarter;
*bdca18a6SSanjay Yadav			u32 end = start + quarter;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			ret = gpu_buddy_alloc_blocks(&mm, start, end, quarter, ps, &blocks, 0);
*bdca18a6SSanjay Yadav			KUNIT_ASSERT_EQ_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav					    "exact-range alloc quarter %d [%x, %x) failed\n",
*bdca18a6SSanjay Yadav					    i, start, end);
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav		KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav		gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Minimum chunk-size exact range at various offsets.
*bdca18a6SSanjay Yadav	 * Allocate single-page exact ranges at the start, middle and end.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, ps, ps, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, mm_size / 2, mm_size / 2 + ps, ps, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, mm_size - ps, mm_size, ps, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	total = 0;
*bdca18a6SSanjay Yadav	list_for_each_entry(block, &blocks, link)
*bdca18a6SSanjay Yadav		total += (u32)gpu_buddy_block_size(&mm, block);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, total, 3 * ps);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Non power-of-two mm size (multiple roots).
*bdca18a6SSanjay Yadav	 * Exact-range allocations that span root boundaries must still work.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_4M + SZ_2M + SZ_1M; /* 7 MiB, three roots */
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_GT(test, mm.n_roots, 1U);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate first 4M root exactly */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, SZ_4M, SZ_4M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate second root (4M-6M) exactly */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, SZ_4M, SZ_4M + SZ_2M, SZ_2M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate third root (6M-7M) exactly */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, SZ_4M + SZ_2M, mm_size, SZ_1M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Cross-root exact-range: the entire non-pot mm */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, mm_size, mm_size, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Randomized exact-range allocations.
*bdca18a6SSanjay Yadav	 * Divide the mm into N random-sized, contiguous, page-aligned slices
*bdca18a6SSanjay Yadav	 * and allocate each as an exact range in random order.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	{
*bdca18a6SSanjay Yadav#define N_RAND_RANGES 16
*bdca18a6SSanjay Yadav		u32 ranges[N_RAND_RANGES + 1]; /* boundaries */
*bdca18a6SSanjay Yadav		u32 order_arr[N_RAND_RANGES];
*bdca18a6SSanjay Yadav		u32 remaining = mm_size;
*bdca18a6SSanjay Yadav		int i;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		ranges[0] = 0;
*bdca18a6SSanjay Yadav		for (i = 0; i < N_RAND_RANGES - 1; i++) {
*bdca18a6SSanjay Yadav			u32 max_chunk = remaining - (N_RAND_RANGES - 1 - i) * ps;
*bdca18a6SSanjay Yadav			u32 sz = max(round_up(prandom_u32_state(&prng) % max_chunk, ps), ps);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			ranges[i + 1] = ranges[i] + sz;
*bdca18a6SSanjay Yadav			remaining -= sz;
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav		ranges[N_RAND_RANGES] = mm_size;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		/* Create a random order */
*bdca18a6SSanjay Yadav		for (i = 0; i < N_RAND_RANGES; i++)
*bdca18a6SSanjay Yadav			order_arr[i] = i;
*bdca18a6SSanjay Yadav		for (i = N_RAND_RANGES - 1; i > 0; i--) {
*bdca18a6SSanjay Yadav			u32 j = prandom_u32_state(&prng) % (i + 1);
*bdca18a6SSanjay Yadav			u32 tmp_val = order_arr[i];
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			order_arr[i] = order_arr[j];
*bdca18a6SSanjay Yadav			order_arr[j] = tmp_val;
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		for (i = 0; i < N_RAND_RANGES; i++) {
*bdca18a6SSanjay Yadav			u32 idx = order_arr[i];
*bdca18a6SSanjay Yadav			u32 start = ranges[idx];
*bdca18a6SSanjay Yadav			u32 end = ranges[idx + 1];
*bdca18a6SSanjay Yadav			u32 sz = end - start;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			ret = gpu_buddy_alloc_blocks(&mm, start, end, sz, ps, &blocks, 0);
*bdca18a6SSanjay Yadav			KUNIT_ASSERT_EQ_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav					    "random exact-range [%x, %x) sz=%x failed\n",
*bdca18a6SSanjay Yadav					    start, end, sz);
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav		gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav#undef N_RAND_RANGES
*bdca18a6SSanjay Yadav	}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Negative case - partially allocated range.
*bdca18a6SSanjay Yadav	 * Allocate the first half, then try to exact-range allocate the full
*bdca18a6SSanjay Yadav	 * mm. This must fail because the first half is already occupied.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, mm_size / 2, mm_size / 2, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, mm_size, mm_size, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav			    "exact-range alloc should fail when range is partially used\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Also try the already-occupied sub-range directly */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, mm_size / 2, mm_size / 2, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav			    "double alloc of same exact range should fail\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* The free second half should still be allocatable */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, mm_size / 2, mm_size, mm_size / 2, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, mm.avail, 0ULL);
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Negative case - checkerboard partial allocation.
*bdca18a6SSanjay Yadav	 * Allocate every other page-sized chunk in a small mm, then try to
*bdca18a6SSanjay Yadav	 * exact-range allocate a range covering two pages (one allocated, one
*bdca18a6SSanjay Yadav	 * free). This must fail.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_64K;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	{
*bdca18a6SSanjay Yadav		u32 off;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		for (off = 0; off < mm_size; off += 2 * ps) {
*bdca18a6SSanjay Yadav			ret = gpu_buddy_alloc_blocks(&mm, off, off + ps, ps, ps, &blocks, 0);
*bdca18a6SSanjay Yadav			KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		/* Try exact range over a pair [allocated, free] */
*bdca18a6SSanjay Yadav		ret = gpu_buddy_alloc_blocks(&mm, 0, 2 * ps, 2 * ps, ps, &tmp, 0);
*bdca18a6SSanjay Yadav		KUNIT_EXPECT_NE_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav				    "exact-range over partially allocated pair should fail\n");
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		/* The free pages individually should still work */
*bdca18a6SSanjay Yadav		ret = gpu_buddy_alloc_blocks(&mm, ps, 2 * ps, ps, ps, &blocks, 0);
*bdca18a6SSanjay Yadav		KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Negative case - misaligned start/end/size */
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* start not aligned to chunk_size */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, ps / 2, ps / 2 + ps, ps, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* size not aligned */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, ps + 1, ps + 1, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* end exceeds mm size */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, mm_size, mm_size + ps, ps, ps, &tmp, 0);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_NE(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Free and re-allocate the same exact range.
*bdca18a6SSanjay Yadav	 * This exercises merge-on-free followed by exact-range re-split.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	{
*bdca18a6SSanjay Yadav		int i;
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		for (i = 0; i < 5; i++) {
*bdca18a6SSanjay Yadav			ret = gpu_buddy_alloc_blocks(&mm, SZ_4M, SZ_4M + SZ_2M,
*bdca18a6SSanjay Yadav						     SZ_2M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav			KUNIT_ASSERT_EQ_MSG(test, ret, 0,
*bdca18a6SSanjay Yadav					    "re-alloc iteration %d failed\n", i);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			total = 0;
*bdca18a6SSanjay Yadav			list_for_each_entry(block, &blocks, link) {
*bdca18a6SSanjay Yadav				u64 offset = gpu_buddy_block_offset(block);
*bdca18a6SSanjay Yadav				u64 bsize = gpu_buddy_block_size(&mm, block);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav				KUNIT_EXPECT_GE(test, offset, (u64)SZ_4M);
*bdca18a6SSanjay Yadav				KUNIT_EXPECT_LE(test, offset + bsize, (u64)(SZ_4M + SZ_2M));
*bdca18a6SSanjay Yadav				total += (u32)bsize;
*bdca18a6SSanjay Yadav			}
*bdca18a6SSanjay Yadav			KUNIT_EXPECT_EQ(test, total, SZ_2M);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav			gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav		}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav		KUNIT_EXPECT_EQ(test, mm.avail, (u64)mm_size);
*bdca18a6SSanjay Yadav	}
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/*
*bdca18a6SSanjay Yadav	 * Various power-of-two exact ranges within a large mm.
*bdca18a6SSanjay Yadav	 * Allocate non-overlapping power-of-two exact ranges at their natural
*bdca18a6SSanjay Yadav	 * alignment, validating that the allocator handles different orders.
*bdca18a6SSanjay Yadav	 */
*bdca18a6SSanjay Yadav	mm_size = SZ_16M;
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate 4K at offset 0 */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, 0, SZ_4K, SZ_4K, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate 64K at offset 64K */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, SZ_64K, SZ_64K + SZ_64K, SZ_64K, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate 1M at offset 1M */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, SZ_1M, SZ_1M + SZ_1M, SZ_1M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	/* Allocate 4M at offset 4M */
*bdca18a6SSanjay Yadav	ret = gpu_buddy_alloc_blocks(&mm, SZ_4M, SZ_4M + SZ_4M, SZ_4M, ps, &blocks, 0);
*bdca18a6SSanjay Yadav	KUNIT_ASSERT_EQ(test, ret, 0);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	total = 0;
*bdca18a6SSanjay Yadav	list_for_each_entry(block, &blocks, link)
*bdca18a6SSanjay Yadav		total += (u32)gpu_buddy_block_size(&mm, block);
*bdca18a6SSanjay Yadav	KUNIT_EXPECT_EQ(test, total, SZ_4K + SZ_64K + SZ_1M + SZ_4M);
*bdca18a6SSanjay Yadav
*bdca18a6SSanjay Yadav	gpu_buddy_free_list(&mm, &blocks, 0);
*bdca18a6SSanjay Yadav	gpu_buddy_fini(&mm);
*bdca18a6SSanjay Yadav}
*bdca18a6SSanjay Yadav
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_clear(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	unsigned long n_pages, total, i = 0;
4a9671a0SJoel Fernandes	const unsigned long ps = SZ_4K;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
4a9671a0SJoel Fernandes	const int max_order = 12;
4a9671a0SJoel Fernandes	LIST_HEAD(allocated);
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	unsigned int order;
4a9671a0SJoel Fernandes	u32 mm_size, size;
4a9671a0SJoel Fernandes	LIST_HEAD(dirty);
4a9671a0SJoel Fernandes	LIST_HEAD(clean);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	mm_size = SZ_4K << max_order;
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, mm.max_order, max_order);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Idea is to allocate and free some random portion of the address space,
4a9671a0SJoel Fernandes	 * returning those pages as non-dirty and randomly alternate between
4a9671a0SJoel Fernandes	 * requesting dirty and non-dirty pages (not going over the limit
4a9671a0SJoel Fernandes	 * we freed as non-dirty), putting that into two separate lists.
4a9671a0SJoel Fernandes	 * Loop over both lists at the end checking that the dirty list
4a9671a0SJoel Fernandes	 * is indeed all dirty pages and vice versa. Free it all again,
4a9671a0SJoel Fernandes	 * keeping the dirty/clear status.
4a9671a0SJoel Fernandes	 */
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							    5 * ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_TOPDOWN_ALLOCATION),
4a9671a0SJoel Fernandes				"buddy_alloc hit an error size=%lu\n", 5 * ps);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, GPU_BUDDY_CLEARED);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	n_pages = 10;
4a9671a0SJoel Fernandes	do {
4a9671a0SJoel Fernandes		unsigned long flags;
4a9671a0SJoel Fernandes		struct list_head *list;
4a9671a0SJoel Fernandes		int slot = i % 2;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		if (slot == 0) {
4a9671a0SJoel Fernandes			list = &dirty;
4a9671a0SJoel Fernandes			flags = 0;
4a9671a0SJoel Fernandes		} else {
4a9671a0SJoel Fernandes			list = &clean;
ba110db8SJoel Fernandes			flags = GPU_BUDDY_CLEAR_ALLOCATION;
4a9671a0SJoel Fernandes		}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes								    ps, ps, list,
4a9671a0SJoel Fernandes								    flags),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%lu\n", ps);
4a9671a0SJoel Fernandes	} while (++i < n_pages);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry(block, &clean, link)
ba110db8SJoel Fernandes		KUNIT_EXPECT_EQ(test, gpu_buddy_block_is_clear(block), true);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_for_each_entry(block, &dirty, link)
ba110db8SJoel Fernandes		KUNIT_EXPECT_EQ(test, gpu_buddy_block_is_clear(block), false);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &clean, GPU_BUDDY_CLEARED);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Trying to go over the clear limit for some allocation.
4a9671a0SJoel Fernandes	 * The allocation should never fail with reasonable page-size.
4a9671a0SJoel Fernandes	 */
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							    10 * ps, ps, &clean,
ba110db8SJoel Fernandes							    GPU_BUDDY_CLEAR_ALLOCATION),
4a9671a0SJoel Fernandes				"buddy_alloc hit an error size=%lu\n", 10 * ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &clean, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &dirty, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Create a new mm. Intentionally fragment the address space by creating
4a9671a0SJoel Fernandes	 * two alternating lists. Free both lists, one as dirty the other as clean.
4a9671a0SJoel Fernandes	 * Try to allocate double the previous size with matching min_page_size. The
4a9671a0SJoel Fernandes	 * allocation should never fail as it calls the force_merge. Also check that
4a9671a0SJoel Fernandes	 * the page is always dirty after force_merge. Free the page as dirty, then
4a9671a0SJoel Fernandes	 * repeat the whole thing, increment the order until we hit the max_order.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	i = 0;
4a9671a0SJoel Fernandes	n_pages = mm_size / ps;
4a9671a0SJoel Fernandes	do {
4a9671a0SJoel Fernandes		struct list_head *list;
4a9671a0SJoel Fernandes		int slot = i % 2;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		if (slot == 0)
4a9671a0SJoel Fernandes			list = &dirty;
4a9671a0SJoel Fernandes		else
4a9671a0SJoel Fernandes			list = &clean;
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes								    ps, ps, list, 0),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%lu\n", ps);
4a9671a0SJoel Fernandes	} while (++i < n_pages);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &clean, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &dirty, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	order = 1;
4a9671a0SJoel Fernandes	do {
4a9671a0SJoel Fernandes		size = SZ_4K << order;
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes								    size, size, &allocated,
ba110db8SJoel Fernandes								    GPU_BUDDY_CLEAR_ALLOCATION),
4a9671a0SJoel Fernandes					"buddy_alloc hit an error size=%u\n", size);
4a9671a0SJoel Fernandes		total = 0;
4a9671a0SJoel Fernandes		list_for_each_entry(block, &allocated, link) {
4a9671a0SJoel Fernandes			if (size != mm_size)
ba110db8SJoel Fernandes				KUNIT_EXPECT_EQ(test, gpu_buddy_block_is_clear(block), false);
ba110db8SJoel Fernandes			total += gpu_buddy_block_size(&mm, block);
4a9671a0SJoel Fernandes		}
4a9671a0SJoel Fernandes		KUNIT_EXPECT_EQ(test, total, size);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		gpu_buddy_free_list(&mm, &allocated, 0);
4a9671a0SJoel Fernandes	} while (++order <= max_order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Create a new mm with a non power-of-two size. Allocate a random size from each
4a9671a0SJoel Fernandes	 * root, free as cleared and then call fini. This will ensure the multi-root
4a9671a0SJoel Fernandes	 * force merge during fini.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes	mm_size = (SZ_4K << max_order) + (SZ_4K << (max_order - 2));
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, mm.max_order, max_order);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, SZ_4K << max_order,
4a9671a0SJoel Fernandes							    4 * ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				"buddy_alloc hit an error size=%lu\n", 4 * ps);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, SZ_4K << max_order,
4a9671a0SJoel Fernandes							    2 * ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_CLEAR_ALLOCATION),
4a9671a0SJoel Fernandes				"buddy_alloc hit an error size=%lu\n", 2 * ps);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, SZ_4K << max_order, mm_size,
4a9671a0SJoel Fernandes							    ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_RANGE_ALLOCATION),
4a9671a0SJoel Fernandes				"buddy_alloc hit an error size=%lu\n", ps);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, GPU_BUDDY_CLEARED);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_contiguous(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	const unsigned long ps = SZ_4K, mm_size = 16 * 3 * SZ_4K;
4a9671a0SJoel Fernandes	unsigned long i, n_pages, total;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	LIST_HEAD(left);
4a9671a0SJoel Fernandes	LIST_HEAD(middle);
4a9671a0SJoel Fernandes	LIST_HEAD(right);
4a9671a0SJoel Fernandes	LIST_HEAD(allocated);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_init(&mm, mm_size, ps));
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Idea is to fragment the address space by alternating block
4a9671a0SJoel Fernandes	 * allocations between three different lists; one for left, middle and
4a9671a0SJoel Fernandes	 * right. We can then free a list to simulate fragmentation. In
ba110db8SJoel Fernandes	 * particular we want to exercise the GPU_BUDDY_CONTIGUOUS_ALLOCATION,
4a9671a0SJoel Fernandes	 * including the try_harder path.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	i = 0;
4a9671a0SJoel Fernandes	n_pages = mm_size / ps;
4a9671a0SJoel Fernandes	do {
4a9671a0SJoel Fernandes		struct list_head *list;
4a9671a0SJoel Fernandes		int slot = i % 3;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		if (slot == 0)
4a9671a0SJoel Fernandes			list = &left;
4a9671a0SJoel Fernandes		else if (slot == 1)
4a9671a0SJoel Fernandes			list = &middle;
4a9671a0SJoel Fernandes		else
4a9671a0SJoel Fernandes			list = &right;
4a9671a0SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test,
ba110db8SJoel Fernandes				       gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							      ps, ps, list, 0),
4a9671a0SJoel Fernandes				       "buddy_alloc hit an error size=%lu\n",
4a9671a0SJoel Fernandes				       ps);
4a9671a0SJoel Fernandes	} while (++i < n_pages);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							   3 * ps, ps, &allocated,
ba110db8SJoel Fernandes							   GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc didn't error size=%lu\n", 3 * ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &middle, 0);
ba110db8SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							   3 * ps, ps, &allocated,
ba110db8SJoel Fernandes							   GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc didn't error size=%lu\n", 3 * ps);
ba110db8SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							   2 * ps, ps, &allocated,
ba110db8SJoel Fernandes							   GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc didn't error size=%lu\n", 2 * ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &right, 0);
ba110db8SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							   3 * ps, ps, &allocated,
ba110db8SJoel Fernandes							   GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc didn't error size=%lu\n", 3 * ps);
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * At this point we should have enough contiguous space for 2 blocks,
4a9671a0SJoel Fernandes	 * however they are never buddies (since we freed middle and right) so
4a9671a0SJoel Fernandes	 * will require the try_harder logic to find them.
4a9671a0SJoel Fernandes	 */
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							    2 * ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc hit an error size=%lu\n", 2 * ps);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &left, 0);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size,
4a9671a0SJoel Fernandes							    3 * ps, ps, &allocated,
ba110db8SJoel Fernandes							    GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc hit an error size=%lu\n", 3 * ps);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	total = 0;
4a9671a0SJoel Fernandes	list_for_each_entry(block, &allocated, link)
ba110db8SJoel Fernandes		total += gpu_buddy_block_size(&mm, block);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_ASSERT_EQ(test, total, ps * 2 + ps * 3);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_pathological(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u64 mm_size, size, start = 0;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
4a9671a0SJoel Fernandes	const int max_order = 3;
4a9671a0SJoel Fernandes	unsigned long flags = 0;
4a9671a0SJoel Fernandes	int order, top;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	LIST_HEAD(blocks);
4a9671a0SJoel Fernandes	LIST_HEAD(holes);
4a9671a0SJoel Fernandes	LIST_HEAD(tmp);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Create a pot-sized mm, then allocate one of each possible
4a9671a0SJoel Fernandes	 * order within. This should leave the mm with exactly one
4a9671a0SJoel Fernandes	 * page left. Free the largest block, then whittle down again.
4a9671a0SJoel Fernandes	 * Eventually we will have a fully 50% fragmented mm.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	mm_size = SZ_4K << max_order;
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, mm.max_order, max_order);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	for (top = max_order; top; top--) {
4a9671a0SJoel Fernandes		/* Make room by freeing the largest allocated block */
4a9671a0SJoel Fernandes		block = list_first_entry_or_null(&blocks, typeof(*block), link);
4a9671a0SJoel Fernandes		if (block) {
4a9671a0SJoel Fernandes			list_del(&block->link);
ba110db8SJoel Fernandes			gpu_buddy_free_block(&mm, block);
4a9671a0SJoel Fernandes		}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		for (order = top; order--;) {
4a9671a0SJoel Fernandes			size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes			KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start,
4a9671a0SJoel Fernandes									    mm_size, size, size,
4a9671a0SJoel Fernandes										&tmp, flags),
4a9671a0SJoel Fernandes					"buddy_alloc hit -ENOMEM with order=%d, top=%d\n",
4a9671a0SJoel Fernandes					order, top);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes			block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes			KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes			list_move_tail(&block->link, &blocks);
4a9671a0SJoel Fernandes		}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		/* There should be one final page for this sub-allocation */
4a9671a0SJoel Fernandes		size = get_size(0, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								    size, size, &tmp, flags),
4a9671a0SJoel Fernandes							   "buddy_alloc hit -ENOMEM for hole\n");
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		list_move_tail(&block->link, &holes);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		size = get_size(top, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								   size, size, &tmp, flags),
4a9671a0SJoel Fernandes							  "buddy_alloc unexpectedly succeeded at top-order %d/%d, it should be full!",
4a9671a0SJoel Fernandes							  top, max_order);
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &holes, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Nothing larger than blocks of chunk_size now available */
4a9671a0SJoel Fernandes	for (order = 1; order <= max_order; order++) {
4a9671a0SJoel Fernandes		size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								   size, size, &tmp, flags),
4a9671a0SJoel Fernandes							  "buddy_alloc unexpectedly succeeded at order %d, it should be full!",
4a9671a0SJoel Fernandes							  order);
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_splice_tail(&holes, &blocks);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &blocks, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_pessimistic(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u64 mm_size, size, start = 0;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block, *bn;
4a9671a0SJoel Fernandes	const unsigned int max_order = 16;
4a9671a0SJoel Fernandes	unsigned long flags = 0;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	unsigned int order;
4a9671a0SJoel Fernandes	LIST_HEAD(blocks);
4a9671a0SJoel Fernandes	LIST_HEAD(tmp);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Create a pot-sized mm, then allocate one of each possible
4a9671a0SJoel Fernandes	 * order within. This should leave the mm with exactly one
4a9671a0SJoel Fernandes	 * page left.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	mm_size = SZ_4K << max_order;
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, mm.max_order, max_order);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	for (order = 0; order < max_order; order++) {
4a9671a0SJoel Fernandes		size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								    size, size, &tmp, flags),
4a9671a0SJoel Fernandes							   "buddy_alloc hit -ENOMEM with order=%d\n",
4a9671a0SJoel Fernandes							   order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		list_move_tail(&block->link, &blocks);
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* And now the last remaining block available */
4a9671a0SJoel Fernandes	size = get_size(0, mm.chunk_size);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes							    size, size, &tmp, flags),
4a9671a0SJoel Fernandes						   "buddy_alloc hit -ENOMEM on final alloc\n");
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_move_tail(&block->link, &blocks);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Should be completely full! */
4a9671a0SJoel Fernandes	for (order = max_order; order--;) {
4a9671a0SJoel Fernandes		size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								   size, size, &tmp, flags),
4a9671a0SJoel Fernandes							  "buddy_alloc unexpectedly succeeded, it should be full!");
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	block = list_last_entry(&blocks, typeof(*block), link);
4a9671a0SJoel Fernandes	list_del(&block->link);
ba110db8SJoel Fernandes	gpu_buddy_free_block(&mm, block);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* As we free in increasing size, we make available larger blocks */
4a9671a0SJoel Fernandes	order = 1;
4a9671a0SJoel Fernandes	list_for_each_entry_safe(block, bn, &blocks, link) {
4a9671a0SJoel Fernandes		list_del(&block->link);
ba110db8SJoel Fernandes		gpu_buddy_free_block(&mm, block);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								    size, size, &tmp, flags),
4a9671a0SJoel Fernandes							   "buddy_alloc hit -ENOMEM with order=%d\n",
4a9671a0SJoel Fernandes							   order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		list_del(&block->link);
ba110db8SJoel Fernandes		gpu_buddy_free_block(&mm, block);
4a9671a0SJoel Fernandes		order++;
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* To confirm, now the whole mm should be available */
4a9671a0SJoel Fernandes	size = get_size(max_order, mm.chunk_size);
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes							    size, size, &tmp, flags),
4a9671a0SJoel Fernandes						   "buddy_alloc (realloc) hit -ENOMEM with order=%d\n",
4a9671a0SJoel Fernandes						   max_order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	list_del(&block->link);
ba110db8SJoel Fernandes	gpu_buddy_free_block(&mm, block);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &blocks, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_optimistic(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u64 mm_size, size, start = 0;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
4a9671a0SJoel Fernandes	unsigned long flags = 0;
4a9671a0SJoel Fernandes	const int max_order = 16;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	LIST_HEAD(blocks);
4a9671a0SJoel Fernandes	LIST_HEAD(tmp);
4a9671a0SJoel Fernandes	int order;
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/*
4a9671a0SJoel Fernandes	 * Create a mm with one block of each order available, and
4a9671a0SJoel Fernandes	 * try to allocate them all.
4a9671a0SJoel Fernandes	 */
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	mm_size = SZ_4K * ((1 << (max_order + 1)) - 1);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, mm.max_order, max_order);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	for (order = 0; order <= max_order; order++) {
4a9671a0SJoel Fernandes		size = get_size(order, mm.chunk_size);
ba110db8SJoel Fernandes		KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes								    size, size, &tmp, flags),
4a9671a0SJoel Fernandes							   "buddy_alloc hit -ENOMEM with order=%d\n",
4a9671a0SJoel Fernandes							   order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes		block = list_first_entry_or_null(&tmp, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes		KUNIT_ASSERT_TRUE_MSG(test, block, "alloc_blocks has no blocks\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes		list_move_tail(&block->link, &blocks);
4a9671a0SJoel Fernandes	}
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Should be completely full! */
4a9671a0SJoel Fernandes	size = get_size(0, mm.chunk_size);
ba110db8SJoel Fernandes	KUNIT_ASSERT_TRUE_MSG(test, gpu_buddy_alloc_blocks(&mm, start, mm_size,
4a9671a0SJoel Fernandes							   size, size, &tmp, flags),
4a9671a0SJoel Fernandes						  "buddy_alloc unexpectedly succeeded, it should be full!");
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &blocks, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_limit(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u64 size = U64_MAX, start = 0;
ba110db8SJoel Fernandes	struct gpu_buddy_block *block;
4a9671a0SJoel Fernandes	unsigned long flags = 0;
4a9671a0SJoel Fernandes	LIST_HEAD(allocated);
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_init(&mm, size, SZ_4K));
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_EQ_MSG(test, mm.max_order, GPU_BUDDY_MAX_ORDER,
4a9671a0SJoel Fernandes			    "mm.max_order(%d) != %d\n", mm.max_order,
ba110db8SJoel Fernandes						GPU_BUDDY_MAX_ORDER);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	size = mm.chunk_size << mm.max_order;
ba110db8SJoel Fernandes	KUNIT_EXPECT_FALSE(test, gpu_buddy_alloc_blocks(&mm, start, size, size,
4a9671a0SJoel Fernandes							mm.chunk_size, &allocated, flags));
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	block = list_first_entry_or_null(&allocated, struct gpu_buddy_block, link);
4a9671a0SJoel Fernandes	KUNIT_EXPECT_TRUE(test, block);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_EQ_MSG(test, gpu_buddy_block_order(block), mm.max_order,
4a9671a0SJoel Fernandes			    "block order(%d) != %d\n",
ba110db8SJoel Fernandes						gpu_buddy_block_order(block), mm.max_order);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_EXPECT_EQ_MSG(test, gpu_buddy_block_size(&mm, block),
4a9671a0SJoel Fernandes			    BIT_ULL(mm.max_order) * mm.chunk_size,
4a9671a0SJoel Fernandes						"block size(%llu) != %llu\n",
ba110db8SJoel Fernandes						gpu_buddy_block_size(&mm, block),
4a9671a0SJoel Fernandes						BIT_ULL(mm.max_order) * mm.chunk_size);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &allocated, 0);
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic void gpu_test_buddy_alloc_exceeds_max_order(struct kunit *test)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	u64 mm_size = SZ_8G + SZ_2G, size = SZ_8G + SZ_1G, min_block_size = SZ_8G;
ba110db8SJoel Fernandes	struct gpu_buddy mm;
4a9671a0SJoel Fernandes	LIST_HEAD(blocks);
4a9671a0SJoel Fernandes	int err;
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_init(&mm, mm_size, SZ_4K),
4a9671a0SJoel Fernandes			       "buddy_init failed\n");
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* CONTIGUOUS allocation should succeed via try_harder fallback */
ba110db8SJoel Fernandes	KUNIT_ASSERT_FALSE_MSG(test, gpu_buddy_alloc_blocks(&mm, 0, mm_size, size,
4a9671a0SJoel Fernandes							    SZ_4K, &blocks,
ba110db8SJoel Fernandes							    GPU_BUDDY_CONTIGUOUS_ALLOCATION),
4a9671a0SJoel Fernandes			       "buddy_alloc hit an error size=%llu\n", size);
ba110db8SJoel Fernandes	gpu_buddy_free_list(&mm, &blocks, 0);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Non-CONTIGUOUS with large min_block_size should return -EINVAL */
ba110db8SJoel Fernandes	err = gpu_buddy_alloc_blocks(&mm, 0, mm_size, size, min_block_size, &blocks, 0);
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, err, -EINVAL);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* Non-CONTIGUOUS + RANGE with large min_block_size should return -EINVAL */
ba110db8SJoel Fernandes	err = gpu_buddy_alloc_blocks(&mm, 0, mm_size, size, min_block_size, &blocks,
ba110db8SJoel Fernandes				     GPU_BUDDY_RANGE_ALLOCATION);
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, err, -EINVAL);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	/* CONTIGUOUS + RANGE should return -EINVAL (no try_harder for RANGE) */
ba110db8SJoel Fernandes	err = gpu_buddy_alloc_blocks(&mm, 0, mm_size, size, SZ_4K, &blocks,
ba110db8SJoel Fernandes				     GPU_BUDDY_CONTIGUOUS_ALLOCATION | GPU_BUDDY_RANGE_ALLOCATION);
4a9671a0SJoel Fernandes	KUNIT_EXPECT_EQ(test, err, -EINVAL);
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	gpu_buddy_fini(&mm);
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic int gpu_buddy_suite_init(struct kunit_suite *suite)
4a9671a0SJoel Fernandes{
4a9671a0SJoel Fernandes	while (!random_seed)
4a9671a0SJoel Fernandes		random_seed = get_random_u32();
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandes	kunit_info(suite, "Testing GPU buddy manager, with random_seed=0x%x\n",
4a9671a0SJoel Fernandes		   random_seed);
4a9671a0SJoel Fernandes
4a9671a0SJoel Fernandes	return 0;
4a9671a0SJoel Fernandes}
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic struct kunit_case gpu_buddy_tests[] = {
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_limit),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_optimistic),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_pessimistic),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_pathological),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_contiguous),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_clear),
*bdca18a6SSanjay Yadav	KUNIT_CASE(gpu_test_buddy_alloc_range),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_range_bias),
5ea5b6ffSMaxime Ripard	KUNIT_CASE_SLOW(gpu_test_buddy_fragmentation_performance),
ba110db8SJoel Fernandes	KUNIT_CASE(gpu_test_buddy_alloc_exceeds_max_order),
f5bd7da0SArunpravin Paneer Selvam	KUNIT_CASE(gpu_test_buddy_offset_aligned_allocation),
f5bd7da0SArunpravin Paneer Selvam	KUNIT_CASE(gpu_test_buddy_subtree_offset_alignment_stress),
4a9671a0SJoel Fernandes	{}
4a9671a0SJoel Fernandes};
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandesstatic struct kunit_suite gpu_buddy_test_suite = {
ba110db8SJoel Fernandes	.name = "gpu_buddy",
ba110db8SJoel Fernandes	.suite_init = gpu_buddy_suite_init,
ba110db8SJoel Fernandes	.test_cases = gpu_buddy_tests,
4a9671a0SJoel Fernandes};
4a9671a0SJoel Fernandes
ba110db8SJoel Fernandeskunit_test_suite(gpu_buddy_test_suite);
4a9671a0SJoel Fernandes
4a9671a0SJoel FernandesMODULE_AUTHOR("Intel Corporation");
ba110db8SJoel FernandesMODULE_DESCRIPTION("Kunit test for gpu_buddy functions");
4a9671a0SJoel FernandesMODULE_LICENSE("GPL");