include/asm/xor.h

*75ded18aSWANG Xuerui/* SPDX-License-Identifier: GPL-2.0-or-later */
*75ded18aSWANG Xuerui/*
*75ded18aSWANG Xuerui * Copyright (C) 2023 WANG Xuerui <git@xen0n.name>
*75ded18aSWANG Xuerui */
*75ded18aSWANG Xuerui#ifndef _ASM_LOONGARCH_XOR_H
*75ded18aSWANG Xuerui#define _ASM_LOONGARCH_XOR_H
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#include <asm/cpu-features.h>
*75ded18aSWANG Xuerui#include <asm/xor_simd.h>
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#ifdef CONFIG_CPU_HAS_LSX
*75ded18aSWANG Xueruistatic struct xor_block_template xor_block_lsx = {
*75ded18aSWANG Xuerui	.name = "lsx",
*75ded18aSWANG Xuerui	.do_2 = xor_lsx_2,
*75ded18aSWANG Xuerui	.do_3 = xor_lsx_3,
*75ded18aSWANG Xuerui	.do_4 = xor_lsx_4,
*75ded18aSWANG Xuerui	.do_5 = xor_lsx_5,
*75ded18aSWANG Xuerui};
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#define XOR_SPEED_LSX()					\
*75ded18aSWANG Xuerui	do {						\
*75ded18aSWANG Xuerui		if (cpu_has_lsx)			\
*75ded18aSWANG Xuerui			xor_speed(&xor_block_lsx);	\
*75ded18aSWANG Xuerui	} while (0)
*75ded18aSWANG Xuerui#else /* CONFIG_CPU_HAS_LSX */
*75ded18aSWANG Xuerui#define XOR_SPEED_LSX()
*75ded18aSWANG Xuerui#endif /* CONFIG_CPU_HAS_LSX */
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#ifdef CONFIG_CPU_HAS_LASX
*75ded18aSWANG Xueruistatic struct xor_block_template xor_block_lasx = {
*75ded18aSWANG Xuerui	.name = "lasx",
*75ded18aSWANG Xuerui	.do_2 = xor_lasx_2,
*75ded18aSWANG Xuerui	.do_3 = xor_lasx_3,
*75ded18aSWANG Xuerui	.do_4 = xor_lasx_4,
*75ded18aSWANG Xuerui	.do_5 = xor_lasx_5,
*75ded18aSWANG Xuerui};
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#define XOR_SPEED_LASX()					\
*75ded18aSWANG Xuerui	do {							\
*75ded18aSWANG Xuerui		if (cpu_has_lasx)				\
*75ded18aSWANG Xuerui			xor_speed(&xor_block_lasx);		\
*75ded18aSWANG Xuerui	} while (0)
*75ded18aSWANG Xuerui#else /* CONFIG_CPU_HAS_LASX */
*75ded18aSWANG Xuerui#define XOR_SPEED_LASX()
*75ded18aSWANG Xuerui#endif /* CONFIG_CPU_HAS_LASX */
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui/*
*75ded18aSWANG Xuerui * For grins, also test the generic routines.
*75ded18aSWANG Xuerui *
*75ded18aSWANG Xuerui * More importantly: it cannot be ruled out at this point of time, that some
*75ded18aSWANG Xuerui * future (maybe reduced) models could run the vector algorithms slower than
*75ded18aSWANG Xuerui * the scalar ones, maybe for errata or micro-op reasons. It may be
*75ded18aSWANG Xuerui * appropriate to revisit this after one or two more uarch generations.
*75ded18aSWANG Xuerui */
*75ded18aSWANG Xuerui#include <asm-generic/xor.h>
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#undef XOR_TRY_TEMPLATES
*75ded18aSWANG Xuerui#define XOR_TRY_TEMPLATES				\
*75ded18aSWANG Xueruido {							\
*75ded18aSWANG Xuerui	xor_speed(&xor_block_8regs);			\
*75ded18aSWANG Xuerui	xor_speed(&xor_block_8regs_p);			\
*75ded18aSWANG Xuerui	xor_speed(&xor_block_32regs);			\
*75ded18aSWANG Xuerui	xor_speed(&xor_block_32regs_p);			\
*75ded18aSWANG Xuerui	XOR_SPEED_LSX();				\
*75ded18aSWANG Xuerui	XOR_SPEED_LASX();				\
*75ded18aSWANG Xuerui} while (0)
*75ded18aSWANG Xuerui
*75ded18aSWANG Xuerui#endif /* _ASM_LOONGARCH_XOR_H */